华为达芬奇计划揭露AI布局将全面走向自研,核心架构将来自外
2018-07-17 23:27:01 来源:易采站长站 作者:王丽
寒武纪 1M 延续了前代 1H/1A,可支持 CNN、RNN、SOM 等多种深度学习模型,此次又进一步支持了 SVM、k-NN、k-Means、决策树等经典机器学习算法的加速。这款芯片支持帮助终端设备进行本地训练,可为视觉、语音、自然语言处理等任务提供高效计算平台。而寒武纪 1M 也是款可扩展规模的核心,可通过多核配置来达到更高的性能表现。
而 MLU100 则是芯片方案,采用寒武纪最新的 MLUv01 架构和 TSMC 16nm 工艺,可工作在平衡模式(主频 1Ghz)和高性能模式(1.3GHz)主频下,等效理论峰值速度则分别可以达到 128 万亿次定点运算/166.4 万亿次定点运算,而其功耗为 80w/110w,能效极高。
华为即将在今年推出的麒麟 980,传言将采用寒武纪 1M。那么云端 AI 计算使用 MLU100,或是利用 MLUv1 架构深度定制化也是有可能。
另外,Arm 与中国合资成立 Arm mini China,除了提供更完整的服务,同时也扫除未来 IP 授权业务可能受到的外来因素干扰。

图|Arm 所推出的机器学习芯片方案。
Arm 在今年推出 ML 处理器方案,可在 7nm 工艺下以标准规模设定达到 4.6TOPs 的操作性能表现,每 W 可达 3TOPs 的能效,具备相当的竞争力。而 Arm 也强调他们的架构都可规模化定制,换言之,理论上客户需要什么等级的性能表现,就可以把规模扩充到所需要的程度,当然,规模的增加也代表功耗和成本的同步增长。Arm 虽强调其可扩充能力,但谈到可否将规模加大到与主流用于云端 AI 计算的 GPU 架构相提并论,仍语带保留。
而华为作为 Arm 传统忠实客户,Arm 也积极向华为推销相关的 AI 方案,业界也同样传出麒麟 980 可能改用 Arm 的 AI 方案的声音,云端 AI 方案 Arm 亦是可能选项。
而最后的可能性,就是华为放弃寒武纪与 Arm,采用全新研发的架构,但是在生态方面,寒武纪支持了主要框架的大部分算法模型,而 Arm 也花了数年的时间研发了 Arm NN 这个可以桥接大部分框架与算法模型、并可动态分配至 Arm 计算架构上进行计算工作的软件环境,芯片本身可能相对容易搞定,毕竟 AI 计算所需要的结构大同小异,除非搞光量子或者是深度神经网络计算架构,否则不会有太多意外的地方。但是在框架与生态的建构上,华为一时半刻还无法复制寒武纪以及 Arm 的工作。
而若要在短时间内取代目前业界拥有最强大生态支持,以及最完整软硬件环境的 NVIDIA,不寻求外力支持恐怕不太现实。
当然,在消息披露之后,华为并未对 D 计划内容进行回应。

实际上,国际市场对华为之所以戒慎恐惧,主要是因为华为虽然使用不少国外元器件,但核心部分通常都经过大幅修改,比如说电信设备,或者是智能手机的软件部分,就好像产品中藏了“黑盒子”,加上华为的背景,自然容易被严格检视。
而如果在云端计算同样采用自有架构来取代 NVIDIA 方案,那等于是增加了更多神秘的部分,当然,对华为而言是可以降低核心来源被中断的风险,但是就市场而言,以更不成熟的方案来替代,加上自有的部分比重增加,那可能同样会增加未来出口的困难度。
未雨绸缪是好事,但仍要考虑技术层次、生态经营,以及可能的市场挑战,自有只是手段,也不应该是最终目的。













闽公网安备 35020302000061号