机器学习制作出令人惊讶的美味沙拉
电视节目“Futurama”中的一个噱头是,机器人角色Bender喜欢做饭,但是因为他没有味觉或嗅觉,所以很可怕。他似乎也不太了解这些东西是什么。他经常为其他非机器人角色准备饭菜,每个人都会受苦 - 包括班德,当他意识到自己是个坏厨师的时候。
尽管本德尔的无能为力似乎既合情又有趣,但最近的研究表明,他们可能会将历史记载作为我们文化中对人工智能最偏执的误解之一。机器学习计划最近撰写了一些不寻常但令人惊讶的美味食谱。
这项研究 - 戴维森学院和数学博物馆的研究人员之间的合作 - 引入了一个程序,可以“自主生成”沙拉的良好食谱。“我们将注意力限制在沙拉上,”该报纸写道,“为了避免必须模拟烹饪过程可能引入的复杂化学转化。” 为了本研究的目的,“配方”只是一个成分列表,没有它们的比例或制备方法,尽管作者强调这些空间作为未来研究的途径。
首先,研究人员采集了所有沙拉配方,并进行了五次或更多次评论,并提取了这些成分。他们删除了拼写错误,品牌化,不可食用或未出现在6种或更多独特食谱中的成分。根据评论食谱的人喜欢它,每个食谱的评分为1到5分。由于该网站上的大多数食谱评级为4或5,研究人员还随机生成了6到12种成分的一系列组合。他们确定了那些他们肯定会得到最低评价的评论 - 消除那些似乎“甚至可以接受的”:
研究人员将这些明显不好的食谱分配为1分,并将其添加到语料库中。研究人员使用这个数据集来构建和训练一个分类器,该分类器可以获取两个沙拉中的成分列表,并正确地预测哪些分数在82%的时间内得分较高。
分类器依赖于在2012年由Lada Adamic建立的“风味网络”中分配成分特征。风味网络背后的基本原则是,在更高评分的食谱中,更美味的成分组合往往更频繁地出现在一起。正如NPR总结:
一个好的沙拉不难找到
研究人员感到满意的是,他们已经建立了一个可以区分人类食谱的程序,取得了很大的成功。如果它产生了自己的,那么它可以假设能够判断配方对人类的美味程度。
他们再次随机生成了新的成分组合 - 其中2,400种。这一次,他们让程序根据他们与训练集中的好与坏配方的比较来分配食谱分数,而不是手动标记坏的。
他们期望好的食谱稀疏,并且必须使用他们的分类器来迭代地改进计算机生成的食谱。但事实证明,按计算机排名的前20个新食谱的平均分数更高,最高分也比训练集中的前20个食谱更好。由此他们得出结论,可口的沙拉相对容易找到。
“这表明制作好沙拉的配料组合在整个配料空间中分布相当密集,”作者写道,“[并且]找到好的沙拉配方不是在大海捞针寻找问题的问题。换句话说:创造新颖的沙拉似乎并不需要特别大的创造性飞跃。“
在研究的最后部分,研究人员随机选择了前20种人类食谱中的3种,以及3种最好的计算机生成食谱,并将它们提交给盲品测试。根据三条规则,厨师被指示准备计算机生成的沙拉:
因此,尽管成分的比例和制备方法完全取决于人类,但计算机配方中没有“坏”成分可以“隐藏”。
虽然计算机生成的沙拉比人类沙拉更糟糕,但所有食谱得分相对较高,而得分最高的计算机生成的沙拉与人类沙拉相比具有竞争力。它有56%的时间被误认为人类沙拉。在六个沙拉中,62个品尝者中只有9个能够正确区分所有计算机生成的沙拉和人类沙拉。简而言之,这是计算创造力沙拉测试的第一次尝试 - 这是阿兰图灵可能从未想过的东西 - 令人震惊。
品尝者还将计算机生成的沙拉评为比人类生产的沙拉更新颖。
研究人员指出,在第一位机器人厨师获得米其林星级之前,还有很长的路要走。该计划没有规定成分的相对数量,也没有规定制备方法。但是也有很大的空间来改进算法,可能还有足够强大的功能来处理这些其他配方功能和其他类型的配方。
“在未来,我们希望将项目范围扩大到更广泛的食谱,”他们在论文中总结道,“汤,饮料,甜点等”。