华为云的“普惠 AI 理想国”
2018-07-10 22:09:39 来源:网络整理 作者:冬梅
当你说的“No”越多,你的“Yes”就越有重量。华为用近乎严苛的自我限制,使得各行各业天然相信它能提供稳定高效的产业工具。(这也是过去华为成功的经验之一。)
读懂这些,你就能感觉到:华为想为“AI 平民化”提供一个“稳定、高效、人人都能学会”的工具。

那位华为大牛告诉我,为了让这个“深度学习平台”稳定、高效和易学,技术团队做了很多技术努力:
首先,是软硬件结合的部分(智商)
每个人都会思考,但人和人的智商可是不一样的。
同样,每个人工智能都可以运作,但它们的“智商”也是不同的。
从脑科学来看,人类智商和每个人大脑神经元联动过程的强弱快慢有很大关系。对应到人工智能上,硬件之间的网络通信速率,网络带宽,都是影响它“智商”的重要因素。而“网络通信”这些底层硬件的优化,是华为在运营商时代就开始积累的传统强项。
在底层的硬件空间里,华为争取把技术做得更前卫,这也是他们最能和阿里云腾讯云拉开差异的地方。
(注意,我把这种优化定义为“软硬件结合部分”的优化。这种优化并不涉及“脑细胞”——也就是 GPU 本身——的优化。在计算芯片层面,华为和其他人工智能服务平台并没有区别。)
其次,是纯软件部分(学习技巧)
智商高的人并不一定成为人生赢家。如果把一个聪明的孩子放到山区的学校,一定不如他在北京四中接受顶级系统化教育学得好。这就是学习技巧的作用。
对应到人工智能平台上,同样有很多“技巧”。比如华为云开发了一个叫做“Moxing”的平台(这个平台有两个中文名字:模型、魔性),就添加了很多“特色服务”:
1)把深度学习的模型做成了不同的“套餐”,无论需要什么类型的图像识和语音识别,都可以像在麦当劳买套餐一样,直接拿来就吃。另外还有类似番茄酱、冰水这样的“辅助开发工具”提供,尽量提高人工智能训练的效率。
2)深度学习分为单机模式和分布式模式,以往如果想从单机模式切换到分布式模式,是需要重写代码的。而这对于很多企业来说非常不方便,Moxing 平台为这个事情也专门作了优化,一套代码既能跑单机,也可以跑分布式。这同样可以提升人工智能训练的效率。
类似这样的细节还有挺多,它们都可以提升使用者的感受。不过在我看来,想要真正实现“AI 平民化”这个宏伟的目标,还需要更劲爆的东西。

之前也说到,人工智能平台,从某个角度来说就是“共享经济”。共享经济能够发展的动力之一,就是不断把成本摊低。
而摊低成本有两条路:
1、吸引越来越多的人加入这个共享社群;
2、利用资金和技术进步直接把成本降低。
这两条路径,是鸡生蛋和蛋生鸡的关系。而作为技术流的厂商华为,显然会在第二条路上走得更远。
举个例子:
在大规模深度学习计算的时候,会需要非常多的 GPU 同时工作。而依靠现有的调度能力,在超过10枚GPU同时工作的时候,性能会出现很大程度的损耗(劣化)。简单来说就是,即使1000颗 GPU 同时工作,效果也和10颗 GPU 差不多。
华为云在做的,就是对软件进行改进。让他们引以为傲的一个数据是:在1000个 GPU 同时工作时,性能可以达到它们单独工作时的80%。这个数据,在人工智能界工业界应该算第一梯队。而减少损耗提高效能,就是标准的成本节省。
以至于这位华为的大牛羞涩地说:我们的优势是“性价比”。。。
而能效提高,从另一个方面看就是时间的节省:













闽公网安备 35020302000061号