从云端到终端 机器学习也能在嵌入式设备上实现
开发者需要能够快速开发出实施机器学习功能的深度学习神经网络,并将其转换到低功耗的嵌入式终端设备上,集成了神经网络算法的DSP芯片将成为这一难题的解决方案。终端设备智能化的需求催生本地智能化(local intelligence)当联网的终端设备越来越多时,产生的信息数据也将呈指数式增长。如果将所有数据和数据处理全部都交给云端,必然会产生通信拥堵、传输变慢、处理时延等问题,无用的数据也会浪费云端的存储资源。因此需要本地智能(local intelligence)让终端设备有能力判断数据的价值,只将真正有价值的数据传到云端存储。而终端设备也需要分析数据做出决策的智能化功能,尤其家庭中的图像识别和语音识别设备需要在本地实时处理信息,以保护用户的隐私。近来,具备深度学习功能的卷积神经网络(CNN)在图像处理和计算机视觉领域得到广泛的应用,其识别正确率也大大提高。在一些生活场景中,如无人机自动避障、家庭服务机器人路径规划等,需要将这些神经网络应用到嵌入式设备上,甚至是一些低功耗的嵌入式设备,以提高设备的智能化程度和与人的交互能力。http://cms-bucket.nosdn.127.net/c9ccc2b689834e13982442ec3f4610c320161205084804.jpeg?imageView&thumbnail=550x0▲深度学习技术取得显著成效与神经网络深度结合的DSP处理器将成为机器学习的实施方案目前,因为内存、功耗、计算能力等限制,在传统CPU+GPU架构的嵌入式设备上实施神经网络还有难度。业界需要一种将神经网络引入到低功耗嵌入式设备的方法。11月23日,全球领先的信号处理器IP授权公司CEVA在深圳召开了年度技术研讨会,并发布了专为在低功耗嵌入式设备上实现深度学习和人工智能应用的第五代图像处理器IP CEVA-XM6。其主要参数包括:最高频率1.5GHz;采用8路VLIW以提高并行计算能力;创新矢量处理单元架构,确保95%以上的MAC利用率;32路SIMD矢量浮点单元可选项,支持IEEE半精度标准及常用的非线性运算增强。为了让开发者更好的使用CEVA-XM6,CEVA还提供基于CEVA-XM6的软件开发平台,包括硬件加速器、神经网络软件框架、软件库、CDNN工具包。CDNN是CEVA的一套深度学习综合开发工具包,这次研讨会发布了其第二代产品。用户可以先在线下训练深度学习的神经网络模型,然后使用CEVA网络生成器将线下的网络模型转换成适用于CEVA-XM6处理器的实时嵌入式网络。
页:
[1]