中国用奇怪的计算机芯片充斥着人工智能的炒作
“自然”杂志的封面故事是关于一个中国芯片,它可以运行传统的深度学习代码,并在同一电路中执行“神经理性”操作。这项工作的价值似乎被大量关于“人工一般情报”的宣传所掩盖,这种宣传没有真正的理由。“人工一般情报”或AGI这个术语实际上并不是指任何东西,在这一点上,它只是一个占位符,一种Rorschach测试,人们用他们所拥有的任何概念填补空白。让机器像人一样“思考”。
尽管如此,或者也许正因为如此,AGI是一个理想的营销术语,可以为机器学习做出很多努力。例如,本周“自然”杂志的封面上刊登了一篇研究论文,内容涉及中国清华大学研究人员开发的一种可以“加速AGI发展”的新型计算机芯片。
芯片是一种奇怪的混合方法,并且很吸引人,但这项工作没有回答许多关于它是如何制造的问题,以及它如何实现研究人员所声称的。一些长期芯片观察家怀疑其影响将如建议的那样大。
“这篇论文是中国在AI中所做的出色工作的一个例子,”芯片分析公司The Linley Group的长期芯片行业观察员和首席分析师Linley Gwennap说。“但这个特殊的想法不会占领世界。”
中国清华大学学者在天际芯片中布局“FCore”计算核心。Pei等。
该论文的前提是“面向人工通用智能与混合天际芯片架构”,即实现AGI,计算机芯片需要改变。如今,这种想法得到了计算机芯片领域热情活动的支持,许多新芯片设计专门用于机器学习。
清华大学的作者明确提出,今天的主流机器学习需要在同一芯片中与所谓的“神经形态计算”合并。神经形态计算是加州理工学院教授Carver Mead在80年代初期首次提出的,多年来一直是包括IBM在内的公司的一种痴迷,几乎没有实际效果。
神经形态芯片通过电势“尖峰”转换输入数据,而今天的深度学习执行“矩阵乘法”操作,通过一组“权重”或参数转换输入数据,然后将它们传递给称为“非线性”的非线性操作“激活。”数据的两种不同路径是不可通约的,这就是为什么它们迄今为止被作为单独的技术追求的原因。
比较传统深度学习的数据流和计算的神经病学方法,作者试图融合到一个芯片中。Pei等。
由清华大脑启发计算研究中心的Jing Pei领导的中国研究人员声称,他们的“Tianjic”芯片已成功“融合”了这两种方法。早在2015年,Pei及其同事开发了一种严格的神经形态计算机。这次,他们将该芯片的一些方面与深度学习矩阵乘法相结合。Tianjic芯片具有许多并行操作的“核心”,每个核心都可以执行神经形态方法的尖峰或深度学习方法的矩阵运算。
关键在于Pei及其同事“对齐模型数据流”,意思是,他们组织了深度学习计算的哪些操作对应于神经形态计算中的哪些操作,以便核心可以在两者之间来回切换。
本文对芯片核心的各个领域提出了挑衅性的术语,这些术语来自大脑的生物学,如“轴突”,“躯体”,“树突”和“突触”。
自行车自行车设计,背面贴有Tianjic芯片。Pei等。
为了演示他们能做什么,他们对芯片进行编程,以执行许多实际任务,例如识别物体和确定在物体地形中移动的路线。他们通过将芯片连接到自行车上来证明这一点,没有骑手可以通过其环境自行移动,响应其主人的声音提示。您可以在文章随附的视频中看到该演示,并在YouTube上发布。
自行车通过计算具有不同神经形态或深度学习网络的许多东西来移动,“包括用于图像处理和物体检测的CNN,用于人类目标跟踪的CANN [连续吸引子神经网络],SNN [尖峰神经网络]语音命令识别,以及用于姿态平衡和方向控制的MLP [多层感知器]。“
此外:芯片世界试图掌握AI的承诺和危险
这个特技本周由媒体播出,很长一段时间,各种头条新闻都在播放这一壮举,其中包括关于自动自行车的“看,没有动手”的讽刺。纽约时报以“现在为没人为自己而建造的自行车”为标题。
问题是,这里有一些奇怪的遗漏。从AGI的概念开始:没有提供真正清晰的定义,更不用说理论上的建议,即组合函数在某种程度上是AGI的一种方法。这意味着让一个芯片做一堆事情在某种程度上是一种更“通用”的芯片。正如作者所写,“AGI系统[...]需要一个通用平台”,它支持在统一架构中进行大量处理。这听起来像是整合和整合,不一定像智能。
另一方面,关于如何训练两种类型的网络(神经和神经形态)的信息非常少,这对于任何一个网络来说都是一个重要的问题,在它们组合时更为重要。Pei及其同事在论文的“方法”部分写道,他们以正常方式训练深度学习部分,而对于神经形态部分,他们依赖于去年由一些研究人员引入的方法,称为“时空反向传播,“深度学习中常见的反向传播方法的一种形式。
关于芯片的制造还有一些缺失的细节。例如,该部件被称为具有“可重新配置”电路,但是从未指定如何重新配置电路。它可以是所谓的“现场可编程门阵列”,或FPGA,技术或其他东西。作者不提供项目代码,因为它通常用于此类研究;作者提议“在合理的要求下”提供代码。
机器学习,任务自动化和机器人技术已经广泛应用于商业领域。这些和其他人工智能技术即将繁衍,我们将研究组织如何最好地利用它们。
阅读更多
分析师格温纳普说,更重要的是芯片可能很难堆叠到很多竞争芯片上。在他看来,这些规格似乎并不令人满意。“Tianjic报告的1.28 TOPS /瓦特[每瓦特操作数万亿,这是一种常见的性能指标]与今天的GPU类似,”他指出,指的是Nvidia和Advanced Micro Devices制造的图形处理单元芯片。然而,他表示,性能“远远落后于更先进的新架构”。
Gwennap的同事Mike Demler表示赞同。他指出了论文中的一些不准确之处,例如尖峰神经元需要某些功能的“超高精度存储器”电路的论点。Demler对芯片巨头英特尔称为“Loihi”的神经形态芯片的评论表明情况并非如此。他说,由创业公司Brainchip,Inc。开发的芯片也证明这种说法是错误的。此外,由于Loihi芯片已经表明传统的神经网络,如卷积神经网络或CNN,可以实现为尖峰神经元,因此不需要清华大学作者声称的那种“统一”芯片。
对Gwennap来说,尝试将两件事合二为一,这是一个奇怪的目标。“这篇文章称ANN和SNN是解决类似问题的两种截然不同的方法,有点像旋转(直升机)和固定翼(飞机),用于航空,”Gwennap说。“最终,我希望ANN和SNN可以为不同的终端应用提供服务,但我认为不需要将它们组合在一个芯片中;你最终得到的芯片可以用于两件事,但对于任何事情都不是很好。”
但你也最终产生了很多嗡嗡声,而且考虑到美国和中国之间关于所有技术,特别是人工智能的紧张关系,中国在人工智能上偷走美国的观点 - 无论可能是什么 - 是一个标题的夏天s。