利用Spotify的数据预测哪些歌曲将会流行

商业2020-07-27 15:08:00
导读旧金山大学(USF)的两名学生和研究人员最近试图利用机器学习模型来预测广告牌的点击率。在

旧金山大学(USF)的两名学生和研究人员最近试图利用机器学习模型来预测广告牌的点击率。在他们的研究中,他们在ARXIV发布前,对使用SpotifyWebAPI提取的歌曲相关数据进行了4个模型的培训,然后评估了他们在预测歌曲将被击中时的性能。

"我是个巨大的音乐迷,我整天听音乐,在我的通勤、工作和朋友之间,"KaiMiddrook,研究的研究人员之一,告诉TechXPlore。"去年春天,我在旧金山大学(USF)开始了一个关于自动音乐流派分类的研究项目。这个项目需要大量的音乐数据,流行的音乐流媒体服务正是我需要的那种数据。"

在他在与自动音乐流派分类相关的项目工作的同时,Middok发现Spotify允许开发者访问它的音乐数据。这使他开始尝试SpotifyWebAPI为他的研究收集数据。然而,一旦他完成了与体裁分类相关的研究,他就暂时搁置了API。

"几个月后,我的朋友Kian也是一个数据科学家,喜欢音乐,我讨论了音乐,"米德尔布鲁克说,"在谈话中的某一点上,通常保持的想法是,"所有的歌曲都是相同的"是被提起的。我们不一定相信这是真的,但是这个想法让我们感到奇怪:如果被击中的歌曲有一些相似之处的话呢?这似乎是可能的,因此Kian和我决定进一步调查。"

曾经合作过类型分类项目的Middrook和Sheik决定使用Spotify中提取的数据进行进一步调查。这个新项目也将是他们在USF的数据挖掘课程的最终任务。

"我们正在就各种课程的其他几个项目进行合作,因此有意义地团结在一起,"KianSheik,另一个参与研究的研究人员告诉TechXPlore,"LilNASX的命中"老城路"刚从哪儿冒出来,就在广告牌热100的顶部。Kai和我想知道电脑是否能预测他的崛起,或者如果它只是一个来自于左场的命中。当一个简单的最终项目结束时,我们在很大的数据集中排除了所有最新的监督学习模型,以回答一个简单的问题:这首歌会被击中吗?"

在他们的研究中,Middlebrook和Sheik使用SpotifyWe bAPI收集了180万首歌曲的数据,其中包括歌曲的节奏、键、价等特征。然后,他们还从Billboard热100图表中收集了大约30年的数据。

"我们的目标是看命中的歌曲是否共享类似的特征,如果是,那么这些特征是否可以被用来预测将来会有哪些歌曲被命中,"米德尔布鲁克说。

研究人员对四种不同的模型进行了训练和评价:Logistic回归、神经网络、支持向量机(SVM)和随机森林(RF)结构。在训练中,这些模型分析了各种歌曲特征,包括节奏、键、价、能量、声感、可调性和响度。

米德尔布鲁克解释说:“当我们的模特们给一首歌贴上一个或零的标签。”“一首标有“一”的歌曲意味着模型预测这首歌是一首热门歌曲。一首标有零的歌曲意味着模型预测这首歌不是热门歌曲。”.

由研究者训练的逻辑回归模型假设歌曲数据可以线性地分为两类:命中和非命中。模型将权重分配给每个歌曲特征,然后使用这些权重来预测歌曲是否落在"命中"或"未命中"类别中。

Logistic回归模型具有两个重要的优点:可解释性和速度。换句话说,这种类型的体系结构使得解释解释变量(即,歌曲特征)和响应变量(即,命中或非命中)之间的关系变得更容易,并且它也可以相对快速地训练。

研究人员训练的第二个模型是射频架构。该模型是通过组合大量的被称为决策树的构建块来工作的。

"本质上,决策树可以被认为是使用一系列“是/否”问题来分离数据的模型,"米德尔布鲁克说."它们是可解释的,但倾向于过度拟合数据。过度拟合意味着模型通过将训练数据拟合得太近而存储训练数据。过度拟合的问题在于,由于数据通常包含无关的噪声,所以模型可能不会学习歌曲特征与歌曲流行度之间的实际关系。"

为了避免过度拟合的问题,Middlebrook和Sheik使用的随机森林模型结合了数十万棵决策树,每棵决策树都在训练数据的不同子集和歌曲特征的不同子集上进行训练..然后,该模型通过平均每棵树的预测并将这些结果组合在一起,来进行预测(即决定一首歌是热门还是非热门)。

“在我们的用例中,随机森林模型的优点是它的灵活性,”米德布鲁克说。”它比线性模型更灵活。逻辑回归)。”.

由研究者训练的第三和第四模型,即SVM和神经网络结构都是非线性的,因此难以解释。SVM模型通过尝试查找最好将数据分成两类(即,命中或非命中)的"超平面"来工作。另一方面,神经网络结构使用具有十个滤波器的一个隐藏层,以从歌曲数据中学习。

在Middrook和Sheik所使用的四种模型中,Logistic回归模型是最容易解释的,而基于神经网络的模型是最难解释的。另外两个模特在中间的某个地方。

"通常,这些模型将基于它们通过训练发展的约束来预测,"酋长说."每个模型都在相同的一组声波分类器上进行了训练。根据来自广告牌API的历史真相来测试模型的输出,无论给定的轨迹是否已经出现在广告牌热100列表上。我们在USF上使用了一组计算机进行数字处理,经过几个星期的纯计算后,我们计算了每个模型的最佳参数。"

研究人员进行了一系列评价,以测试这四种模型如何预测广告牌的点击率。他们发现,SVM的体系结构达到了最高的准确率(99.53%),而随机森林模型达到了最佳的准确率(88%)和召回率(85.51%)。

"回想表达了在数据集中找到所有相关实例的能力,而精度表示我们的模型所表示的数据比例实际上是相关的,"米德尔布鲁克解释."换句话说,回想一下我们的模型有多有可能准确地预测作为命中的实际命中。精确告诉我们实际击中的预测命中的比例。"

据研究人员说,如果记录标签要使用这些模型中的任何一个来预测什么歌曲会更成功,他们可能会选择一个具有高准确率的模型,而不是一个具有高准确率的模型。这是因为获得高精度的模型假设较少的风险,因为不太可能预测不成功的歌曲将成为命中。

"记录标签具有有限的资源,"米德尔布鲁克说."如果他们将这些资源注入到模型预测将是命中的歌曲中,并且该歌曲永远不会变成一个歌曲,那么该标签可能会丢失大量的钱。因此,如果记录标签想要更多的风险,可能会发布更多的命中记录,他们可能会选择使用我们的随机森林模型。另一方面,如果记录标签想要在仍然释放一些命中的同时降低风险,他们应该使用我们的SVM模型。"

midebrook和Sheik发现,根据歌曲音频的特征预测广告牌的撞击实际上是可能的。在他们未来的研究中,研究人员计划调查其他可能有助于歌曲成功的因素,如社交媒体的存在、艺术家的经验和标签的影响。

Sheik说:“我们可以想象这样一个世界,唱片公司不断地寻找新的人才,却充斥着来自“下一个热门艺术家”的混合磁带和演示文稿。人们只有这么多的时间用人的耳朵听音乐,所以“人工耳朵”,比如我们的算法,可以使唱片公司为他们所追求的声音类型训练一个模型,并大大减少他们自己必须考虑的歌曲数量。”.

像由Middrook和Sheik开发的分类器最终可以帮助记录标签来决定要投资哪些歌曲。尽管使用机器学习去浏览演示的想法可能对音乐行业感兴趣,但酋长警告说,它也可能会带来不希望的后果。

"虽然这可能是一个有利的未来,但一个谚语的前景"砧板"艺术家必须测量到具有成为回声室的潜力,或者新音乐必须像旧音乐那样听起来以便在无线电上被释放的情况,"酋长说."诸如YouTube之类的平台上的内容创建者也使用算法来决定哪些视频被显示给大众,已经消除了强迫艺术家为机器工作的缺陷。"

根据酋长的说法,如果公司和生产者开始使用算法进行艺术决策,那么这些模型应该以不妨碍艺术进步的方式来设计。然而,由USF中的两个研究人员开发的体系结构还不能实现这一点。

希克总结道:“新颖性偏见和其他非正统特征必须被引入和发明,才能使整个音乐不再在权宜之计中接近文化奇点。”

免责声明:本文由用户上传,如有侵权请联系删除!