Top
首页 > 智能制造 > 人工智能 > 正文

Cadence连续发布AI重磅产品 面向神经网络和语音处理

最近几个月,美国Cadence公司连续发布多款面向人工智能的先进产品,深度神经网络加速器Tensilica DNA 100处理器IP和面向音频和语音处理的Cadence Tensilica HiFi 5 DSP。
发布时间:2018-11-14 23:01        来源:赛迪网        作者:子山

【赛迪网讯】最近几个月美国Cadence公司连续发布多款面向人工智能的先进产品,深度神经网络加速器Tensilica DNA 100处理器IP和面向音频和语音处理的Cadence Tensilica HiFi 5 DSP。

Tensilica DNA 100是首款深度神经网络加速器(DNA)AI处理器IP,无论小至0.5 还是大到数百TeraMAC(TMAC),均可实现高性能和高能效。DNA 100处理器非常适用于自动驾驶汽车(AV)、ADAS、监视、机器人、无人机、增强现实(AR)/虚拟现实(VR)、智能手机、智能家居和物联网领域的设备端神经网络推理应用。较其他采用相似阵列尺寸大小的乘法累加运算(MAC)解决方案,DNA 100处理器性能提升达 4.7倍,每瓦特性能提升高达2.3倍。DNA 100处理器将于2018年12月面向部分客户出售,预计于2019年第一季度全面上市。

神经网络的特征在于权重和激活函数的固有稀疏度,加载和乘以零会造成其他处理器不必要的MAC消耗。DNA 100处理器的专属硬件计算引擎移除了上述两项任务,利用稀疏度提高能效并降低计算量。神经网络再训练有助于提高网络的稀疏度,并通过DNA 100处理器的稀疏计算引擎实现最高性能。DNA 100处理器能够利用更小的阵列实现最大吞吐量。作为例证,4K MAC配置环境下,ResNet 50推理性能预计能实现每秒高达2550帧(fps)和3.4TMAC /W(在16 nm工艺)。

DNA 100处理器配备完整的AI软件平台,兼容最新版本的Tensilica神经网络编译器(Tensilica Neural Network Compiler),支持Caffe、TensorFlow、TensorFlow Lite及包括卷积和循环网络在内的广泛神经网络等高级AI框架。因此,DNA 100处理器是视觉、语音、雷达、激光雷达和通信应用设备端推理的理想之选。Tensilica神经网络编译器利用全面优化的神经网络库函数,将任意神经网络映射为可执行且高度优化的高性能代码。因此,DNA 100处理器为不同网络类型提供了强大的软件生态系统支持,包括分类、对象检测、分割、重复和回归。 DNA 100处理器还支持安卓神经网络(ANN)API,可用于安卓设备端的AI推理。

DNA 100处理器可以在所有神经网络层运行,包括卷积、完全连接、LSTM、LRN和池化。单个DNA 100处理器可以轻松从0.5扩展到12有效TMAC;并可以通过堆叠多个DNA 100处理器,实现数百TMAC,适用于最计算密集型设备端的神经网络应用。 DNA 100处理器还集成了Tensilica DSP,以适应DNA 100处理器内部硬件引擎当前不支持的新神经网络层;同时使用Tensilica指令扩展(TIE)指令集实现Tensilica Xtensa核心的可扩展性和可编程性。由于DNA 100处理器拥有独立的直接存储器访问(DMA),因此无需新增控制器即可运行其他控制代码。

另一款面向音频和语音处理的Cadence Tensilica HiFi 5 DSP,是首款为高性能远场处理和人工智能语音识别处理量身优化的IP核。对比HiFi 4 DSP,第五代HiFi DSP的音频处理性能提高2倍,神经网络(NN)处理性能提高4倍,是数字家庭助手和车载娱乐系统语音控制用户界面的理想选择。

随着数字家庭助手普及度的快速上升,语音控制用户界面已经成为厂商开发创新消费产品的重要考量。高级DSP算法正在不断革新,消除噪音,从复杂环境分离并提取说话者的语音,以提高识别准确率。为此,更好的处理能力和能效必不可少。同时,因为延时,隐私保护和网络可用性等原因,基于神经网络的语音识别算法需要更多任务在本地运行,而非云端。

HiFi 5 DSP的关键特性如下:

采用5个超长指令字(VLIW)插槽架构,支持每循环发出2 个 128-bit 负载

对比HiFi 4 DSP,预处理和后处理的MAC性能提高2倍,具体包括:支持每周期 8个32x32-bit MACs 或 16个16x16-bit MACs可选每周期8个单精度浮点MACs

对比 HiFi 4 DSP,神经网络处理MAC性能提高4倍,具体包括:每周期32个16x8或16x4 MACs可选每周期16个半精度浮点MACs

全新的HiFi 神经网络库为神经网络处理(特别是语音任务)提供专门优化的库函数。这些库函数可以与主流机器学习框架轻松集成。

优秀的软件兼容性,完全兼容HiFi产品线拥有的超过300个为HiFi优化的音频语音编解码器以及语音增强软件包。

专题访谈

合作站点
stat