谷歌的AI正在训练自己计算食物照片中的卡路里
无论是出于意外还是设计,Google的人工智能(AI)计划的细节都难以捉摸。在某些情况下,没有真正的谜团,没有什么是令人兴奋的谈论。
人工智能技术是该公司搜索引擎的基础,而谷歌2014年以4亿美元高调收购DeepMind的最明显原因是利用英国公司在深度学习方面的专业知识 - 人工智能研究的一部分,但更多的是后来 - 加强核心能力。但Googleplex吸收了人工智能领域的其他聪明才智,以及一些最热门的机器人公司,其中只有一些集体智囊团正式分配给无人驾驶汽车,无人机或其他公开宣布的机器人或人工智能相关项目。确切地说,谷歌的AI专家到底是什么?
总之一句话:食物。
在本周在波士顿举行的返工深度学习峰会上,谷歌研究科学家凯文·墨菲推出了一个项目,该项目使用复杂的深度学习算法来分析食物的静态照片,并估计平板上有多少卡路里。它被称为Im2Calories,在一个例子中,系统查看图像,并计算两个鸡蛋,两个煎饼和三个培根条。由于这些不是通用的测量单位,系统会根据板材以及任何调味品来衡量每块食物的大小。Im2Calories不需要仔细捕获高分辨率图像。任何标准的Instagram质量镜头应该做。
那么最终的卡路里计算是多少?我太忙于从特定的演示幻灯片中删除其他数字来抓住它。Im2Calories的观点并不是因为对每日食物摄入量的惊人计算而使用户感到羞耻。墨菲只想简单地保存食物日记,识别食物,这样你就不必手动将它们插入应用程序中,并且可以通过唠叨变量(如服务大小)来消除猜测。“我们半自动化,”墨菲在他的演讲中说,并指出你可以使用下拉菜单来纠正软件,如果它混淆了煮鸡蛋的煎蛋,或完全误读了什么。“如果只有30%的时间工作,人们就会开始使用它,我们就会收集数据,而且随着时间的推移它会越来越好,”墨菲说。
虽然肥胖在美国仍然是危机,而Im2Calories的商业版本可能会非常受欢迎,但这个系统的运作方式值得仔细研究。像许多深度学习应用程序一样,它结合了视觉分析 - 在这种情况下,通过模式识别确定图像中每个像素的深度。Im2Calories可以在给定食物的外观和大量可用的热量数据之间建立联系。虽然最好不要过多地阅读“深度学习”这一术语,其中一个令人回想起的AI词语选择实际上非大胆的非研究人员恐慌,Im2Calories旨在通过使用来改善自身。许多深度学习系统的目的是最大限度地减少为一个软件提供或测验所花费的时间,从而提高其性能。如果Im2Calories发现一个汉堡,那是因为图像中的像素类似于汉堡现有照片中的像素,而不是因为研究人员握住系统的手,可以说,在各种练习中。为了使深度学习变得有用,主要是通过从音频,视频,静态图像和文本中提取意义,它必须至少在某种程度上是自我依赖的。
即使Im2Calories从未完全准确,Murphy认为它会产生影响。“对我来说很明显,人们真的很想要这个,这真的很有用,”他说。“好吧,也许我们可以减掉20%的卡路里。没关系。我们将平均超过一周,一个月或一年。现在我们可以开始潜在地加入来自多个人的信息并开始进行人口统计。我有流行病学和公共卫生方面的同事,他们真的很想要这些东西。“
谷歌最近才为Im2Calories申请了专利,而墨菲则不会分享有关它何时可用的详细信息。但这项技术的长期目标更为广泛。而且,坦率地说,谷歌更适合。墨菲说:“如果我们可以做这个食物,那就是杀手级的应用程序。” “假设我们进行了街景分析。我们不想只说这个交叉路口有车。那很无聊。我们希望做的事情包括本地化汽车,计算汽车,获得汽车的属性,以及他们面对的方式。然后我们可以做交通场景分析等事情,预测最可能的停车位。由于这些都是从数据中学到的,所以技术是一样的,你只需要改变数据。“
肥胖是一种祸害,值得谷歌可以集中进行语义图像分割和深度神经网络的所有复杂部署。但机器人汽车本能地知道哪个区块最有可能有免费停车位,从现在开始十分钟?深度学习引起了硅谷的浓厚兴趣,这并不奇怪。如果有的话,这是一个惊喜,它需要这么长时间。