Instagram解释了如何使用AI为探索选项卡选择内容

人工智能2020-08-01 18:26:08
导读Instagram已经分享了有关其应用程序如何使用机器学习为用户显示内容的新细节,并强调指出,在提出建议时,Instagram重点在于查找人们认为

Instagram已经分享了有关其应用程序如何使用机器学习为用户显示内容的新细节,并强调指出,在提出建议时,Instagram重点在于查找人们认为会喜欢的帐户,而不是单个帖子。

该博客文章本质上是技术性的,没有什么大的惊喜,但是在对算法推荐系统进行审查以将用户推向危险,仇恨和极端主义内容时,它提供了有趣的幕后观点。

算法建议正在审查中

尽管Instagram没有像YouTube(纽约时报称为“伟大的激进主义者”)那样残酷无礼地受到批评,但它肯定有很多问题。仇恨内容和错误信息在该平台上的兴起与其他社交网络一样,并且已显示该应用程序中的某些机制(如其建议的跟随功能)将用户推向极端观点,例如抗疫苗接种。

不过,Instagram的工程师在其博客文章中解释了“浏览”选项卡的操作,同时避免了棘手的政治问题。Instagram软件工程师Ivan Medvedev在电子邮件中告诉The Verge:“这是我们首次详细介绍可帮助我们大规模提供个性化内容的基础构建块。”(你可以阅读有关的Instagram如何组织对主要饲料内容这个故事的最后一年。)

该帖子强调,Instagram庞大,其中包含的内容千差万别,“主题从阿拉伯书法到火车模型到煤泥,一应俱全。”这对内容推荐提出了挑战,Instagram通过不关注用户可能发表的帖子来克服了这一挑战。喜欢看,但是对哪些帐户感兴趣。

Instagram通过采用一种称为“单词嵌入”的通用机器学习方法来识别彼此相似的帐户。单词嵌入系统研究单词在文本中出现的顺序以衡量它们之间的相关性。因此,例如,单词嵌入系统会指出,“火”一词通常出现在“警报”和“卡车”一词的旁边,而出现在“ pelican”或“三明治”一词的旁边的可能性较小。Instagram使用类似的词确定两个帐户之间的关联程度的过程。

为了提出建议,“浏览”系统首先查看“种子帐户”,即过去用户通过喜欢或保存其内容与之交互的帐户。它识别与这些帐户相似的帐户,并从中选择500项内容。对这些候选人进行过滤以删除垃圾邮件,错误信息和“可能违反政策的内容”,其余的帖子则根据用户与每个人互动的可能性进行排名。最后,前25个帖子将发送到用户“浏览”选项卡的首页。

这里有几件事要注意。首先,Instagram的流程并不完全透明。没有什么信号可以用来识别垃圾邮件或错误信息的详细信息,考虑到解释这将有助于希望传播此类内容的个人,也就不足为奇了。该公司还不清楚机器学习用于过滤不当内容的程度,这是一个关键细节,因为Facebook经常将AI视为节制的灵丹妙药(而专家不同意)。

尚不清楚AI是否真的可以解决错误信息

以反vax内容为例。Instagram已对此进行了严厉打击,但主要是利用手动方法。它会阻止包含诸如“ #vaccinescauseaids”之类的“可验证的虚假信息”的标签,并依靠世界卫生组织等卫生机构来标记危险帖子,并将其删除。

人工智能会有用吗?尚不清楚,但梅德韦杰夫说,该公司正在努力。他说:“我们还在训练AI模型,以主动检测疫苗错误信息并采取自动行动。”

从帖子中得出的第二个结论是,按照Instagram的说法,用户塑造他们在“浏览”选项卡中看到的内容的最佳方式是与自己喜欢的东西进行交互。(这是Instagram的好,我想!)如果你不希望看到某些种类的职位,那么你最好的选择是使用“看到较少的职位像这样”工具,您可以通过点击三访问每个帖子右上角的点菜单。该算法会注意。

免责声明:本文由用户上传,如有侵权请联系删除!