雅虎的新技术可以找出谁曾是垃圾邮件或好人
您的电子邮件方式:一种新技术可以仅使用“已发送”文件夹中的时间戳来区分人们。
在Twitter,博客和《魔兽世界》的交互式实时世界中,时间安排是社交行为最重要的方面之一。现在,西北大学和纽约Yahoo Research的研究人员表明,他们可以仅根据电子邮件的时间戳来对人们进行区分和分类,从而为更智能的广告,垃圾邮件过滤器和社交网站铺平了道路。
这项研究的主要作者,西北大学的Dean Malmgren说:“您无法追踪一个人每天每一小时的所有事情。”该研究于5月11日发布在出版前的物理学资料库arXiv上。“但是这表明,只要了解他们正在做的事情的快照-知道他们何时发送电子邮件,您实际上就能获得有意义的信息。”
雅虎特别感兴趣的是一种更有效的捕获垃圾邮件发送者的方法。全球所有电子邮件中有80%至90%是垃圾邮件。垃圾邮件不仅令人讨厌,还会占用带宽,存储空间和时间。2009年,垃圾邮件在美国可能造成420亿美元的损失,在全球造成1300亿美元的损失-这还不包括花旗集团这样易受骗的互联网用户所骗取的钱。
垃圾邮件过滤器和垃圾邮件发送者参与了永久性的军备竞赛,垃圾邮件发送者不断地更改其域和IP地址并伪装成脏话。但是,垃圾邮件发送者有一个主要限制:要发送数百万封电子邮件,他们需要机器人。如果电子邮件行为的时间模型可以区分不同的人,那么它也可以区分人和非人。
Yahoo Research的杰克·霍夫曼(Jake Hofman)说:“识别垃圾邮件发送者的任何新颖方法都做出了巨大贡献。“即使只减少一小部分,这也是一个巨大的胜利。”
Malmgren和Hofman使用来自两组大学生的数据测试了他们的模型:几年前的欧洲学生,当时家庭互联网访问很少,而美国学生的家庭互联网访问更为普遍。他们关注学生发送电子邮件的频率以及电子邮件会话的开始和结束时间。
尽管这些学生之间的时间顺序存在巨大差异(至少在电子邮件世界中如此),但Malmgren发现他们属于两类之一:“临时工”,他们在工作日发送了大部分电子邮件,或者“ e”。 -mailaholics”,他从早上到深夜一直发送电子邮件。
“这真是太神奇了,”马尔姆格伦说。“它不必分为两类。可能会有一个连续体。”
研究人员还发现,电子邮件行为在个人内部是稳定的,在不到两年的时间内,只有不到20%的美国学生偏离了电子邮件类别。这种稳定性可以使电子邮件服务能够识别垃圾邮件程序何时抢占了某个帐户,从而可以提醒用户或冻结该帐户。
霍夫曼(Hofman)设想了许多应用程序,除了电子邮件之外,还分析了互联网使用中与时间相关的方面,并说,这种对人进行强力分类的能力表明,他们的模型可以发挥多大的作用。
他说:“这只是我们的玩具示范。” “目前有大量来自电子邮件和网站访问的时间数据,但尚未用于任何有意义的分析。我们在这里提出的论据是,这些数据可以成为有关个人的令人惊讶的有用信息来源。”
霍夫曼说,该技术还可以使网站针对个人量身定制服务,因为网站访问的活动模式可能表明用户的品味。
他说:“事实证明,我应该向像您和我这样一天两次分散访问的用户推销黑莓和iPhone,而我应该向像我这样使用率较轻的用户推销书籍和报纸。爸。这可能会影响这些用户在我的网站上时向我显示的展示广告或文字广告。”
活动模式的详细描述对于流量大的网站(例如Twitter)也很有用,例如可以优化其服务器分配资源的网站以及依赖实时交互的Internet服务