VPU: 计算机视觉用于思考的大脑

人工智能从技术突破早期阶段到经济正循环的产业升级,有数据统计,未来 5 年内全世界范围里连接网络、产生数据的物联网设备数量将超过 500 亿,而与此同时,技术的发展使得物联网数据不再局限于简单的照明开关或电子器械设备的参数。计算机视觉就是这样一个全新的领域。从用于建筑测绘领域的手持设备三维机器视觉,再到智能汽车对周围环境的视觉观察和判断,再到整个智慧城市通过大量视觉数据来进行交通规划管理,计算机视觉技术有着广泛的使用场景和发展空间。整个互联网视频流量占据了所有消费者流量的 80%以上,这个比例还在持续增加。

让机器认识和理解这个世界,视觉是其中的关键信息来源。计算机视觉领域原来一些看似不可逾越的鸿沟,被深度学习轻松踏过,而深度学习天生对运算性能要求高的弊端也会随着硬件的成熟而解决。

随着 AI 技术的发展以及人们对之的重视,计算机视觉的应用场景不再局限于工业,开始慢慢走入大众市场,如行车记录仪的路牌、车道分析,基于手机的移动 VR 的手势识别等等,这些功能的高质量实现都需要在 CPU 和 GPU 性能有限的情况下运行深度学习的算法,以便在处理深度学习的问题时更加高效,可以针对卷积神经网络的训练特征从芯片级别进行优化,从而促进基于深度学习的计算机视觉算法在移动设备上的普及,应用场景下的芯片是趋势,这一年我们听到的 NPU、VPU、HPU 等等,这大概都是为了突出单一功能性需求所命名的半导体芯片。从物联网的角度看,VPU 的出现合情合理。

计算机视觉的大脑

英特尔拥有全球最精密绝伦及耗资巨大的芯片制造体系,Movidius 在计算机视觉方面有很强的技术积累,这家从 2006 年就成立的视觉计算芯片公司花了 9 年开发出了低价低功耗小体积高性能的视觉处理器芯片——Myriad 系列 VPU(VisionProcessing Unit)。 如果说摄像机镜头或各种视觉传感器是计算机视觉的眼镜的话,VPU 就是用于思考(视觉处理)的大脑。Myriad X 将会在同样功耗条件下提供 Myriad 2 十倍的深度神经网络(DNN)性能。

视觉处理方面优势使得 Movidius 早在两年前就被 Google Project Tango 主动找上作为技术合作伙伴,Myriad VPU 第一代在一年前已经进入了 Project Tango 的 3D 视觉手机和平板电脑。去年 7 月,Myriad 进化到了第二代,采用和 Myriad 一代完全不同的新架构,使得运算效能高出 20 倍——每秒 3 万亿次浮点运算,功耗不到 0.5 瓦。28 纳米制程的芯片将能够同时支持 6 个 60 帧 Full HD 视频内容输入。

Intel 全新的 Movidius Myriad X VPU 视觉处理单元是全球第一个配备专用神经网络计算引擎的片上系统芯片 (SoC) ,可用于加速端的深度学习推理,该神经网络计算引擎是芯片上集成的硬件模块,专为高速、低功耗且不牺牲精确度地运行基于深度学习的神经网络而设计,让设备能够实时地看到、理解和响应周围环境。 引入该神经计算引擎之后,Myriad X 架构能够为基于深度学习的神经网络推理提供 1 TOPS 的计算性能。

比如无人机、机器人、智能摄像头、虚拟现实、清洁机器人、增强现实用途的头戴显示设备、可穿戴智能设备、智能手机、平板电脑以及更多可嵌入式物联网设备都产生了对于 VPU 的需求。

云机器人技术的必备要素

包括大疆的最新 Phantom 4 无人机也使用了这枚芯片。无人机驾驶交通工具正展现的颠覆性力量。从时间和空间前所未有地快速精准地收集着各种数据。

无人机能随时随地提供精度匹敌激光扫描的俯视图像,带我们通往 “飞行物联网”。无人机第一波浪潮是技术,第二波是玩具,现在最重要的第三波已经到来:工具。物理世界数据的市场却像世界本身一样广阔。无人机已开始填补卫星和地面之间的空白地带,接近实时捕获整个地球的高清影像,成本远低于替代方案。

第三波的实现 VPU 的作用不容小视。

有数据显示到 2018 年,将有 10 万名操纵者使用 20 万架无人机完成各类工作。当无人机不仅取消驾驶员,也取消操纵者,它将获得更大的成本优势。完全自主控制将带来真正的突破。 支持无人机自主飞行的技术从单纯 GPS 导航转向真正的视觉导航。

无人机最突出的功能是收集。从独特、有价值的角度(离地面不远的空中)快速、低成本地积累大量数据是理想的收集工具。无人机战略必须在数据层面思考,而这意味着将创新带到云端。

云机器人技术(cloud robotics)即是连接云和机器人,使二者都更加智能化。脱胎自智能手机产业的机器人,“天生”具备互联结构。

数据从源头流向设备、接受分析的过程自动且隐蔽。设备越来越像纯粹的技术一样无须人类操心。

与此同时,这项技术将会让下一代无人驾驶汽车的夜视功能大幅提升,让汽车更智能的躲避障碍物,通过标准数字视频对目标进行检测、跟踪,识别人类或动物,并且改善图像的清晰度。通过传感器系统,Movidius 的新处理器可以将热成像摄像头提速,并且所有的分析工作都在传感器本地进行,减少了网络数据的共享量。 除了降低带宽要求之外,整个网络的传输要提升不少,而对无人驾驶汽车和无人机来说,可以降低延迟,提高安全性和性能。

尺寸迷你功耗低,精确度始终在线

该芯片的尺寸也非常迷你,长宽只有 8.8×8.1 毫米,而且功耗不到 1W,采用台积电 16nm FFC 工艺制造。

除了神经计算引擎,Myriad X 还通过独特地实时整合了成像、视觉处理和深度学习推理:

– 可编程的 128 位 VLIW 向量处理器:

通过为计算机视觉工作负载而优化的 16 个向量处理器,可同时运行多个成像和视觉应用流水线。

-增加可配置的 MIPI 通道 :

通过丰富接口和 16 个 MIPI 通道,可以将最多 8 个高清 RGB 摄像头直连到 MyriadX,图像信号处理吞吐量最高每秒 7 亿像素,还支持 USB 3.1、PCI-E 3.0。

– 强化的视觉加速器 :

利用 20 多个硬件加速器执行光流和立体深度等任务,不需要额外的计算开销。

– 2.5MB 多核异构同质片上内存:

集中化的芯片内存架构,最高支持 450GB/s 内部带宽,尽量减少芯片外部数据传输,最小化数据访问的延迟并降低功耗。

-4K 视频硬件编码 :

支持 4K/30Hz H.264/H.265、4K/60HzM/JPEG 格式。

X86 平台及 Raspberry Pi 的开发工具包。

英特尔 Movidius 加速人工智能设备产业化进程。

通过 VPU,无人机将无需通过摄像头回传图像给遥控者,摄像头的视觉将可以自主进行运算,判断周遭环境,实现自主导航定位的无人飞行;安装到虚拟现实或增强现实头戴显示设备当中的话,VPU 将可以提供更强大的视觉运算能力,对设备上的传感器传来的数据进行收集处理,让佩戴者头部动作和显示内容的变化之间的延迟更短,有效提高这类“头盔”的使用体验。VPU 放到扫地机器人里,它撞墙和需要手动重置的次数将大大减少……

让设备具备类似于人类的视觉与智能,是计算领域的下一波重大进步。 通过 Myriad X,我们正在重新定义 VPU 对于提供尽可能多的人工智能和视觉计算能力的意义,满足现代无线设备对功耗和散热的独特要求。

 

发布者:Cara,转载请注明出处:http://www.makercollider.com/post/5683

发表评论

登录后才能评论
QR code