专家说不要单独做大数据分析

科技2020-08-20 08:36:44
导读 一名分析专家表示,从跳板上跳入大数据池不一定是一份孤独的工作。“不要单独行动,”加拿大健康信息公司(Canada Health Infoway)新兴

一名分析专家表示,从跳板上跳入大数据池不一定是一份孤独的工作。

“不要单独行动,”加拿大健康信息公司(Canada Health Infoway)新兴技术团队的架构总监亚历克斯·梅尔(Alex Mair)周四在多伦多举行的大数据会议上说。“有很多合作和成功的机会。”

Infoway是一家非盈利机构,为省级政府提供数据共享架构方面的建议。Mair在一次采访中说,虽然它的建议可能在卫生等部门更有意义,但它确实适用于没有大型it部门的企业。

Mair曾在私营部门和公共部门从事分析工作,他说组织需要在开始之前了解大数据分析可能意味着什么。

他说:“你需要找到能为我提供价值的用例。”然后问“我要如何衡量它,以便我可以开发一个未来的商业案例?”

与所有大型项目一样,他也敦促那些有兴趣的人在组织中寻找愿意支持它的高级人员。

大数据——一些人将其定义为比传统分析软件处理的数据更多,而另一些人,如Mair,将其定义为处理非结构化的、接近实时的数据——提供了一种可能性,可以更深入地了解客户的意图,并可能预测未来。

大会上的一位演讲者通过分析大数据来预测社交媒体的发展趋势。另一家刚刚推出了一款软件,可以预测哪些学生有失败的风险。

此次会议吸引了众多公共和私营部门的分析师,他们希望更多地了解如何处理海量数据。

与会者包括安大略省工作场所安全与保险委员会(Workplace Safety and Insurance Board)副总裁兼首席统计员尤金·温(Eugene Wen)博士,他在一次采访中表示,他希望更好地进行关键数据建模。

他说,这家向受伤工人支付赔偿金的机构拥有100年的数据,但没有使用先进的技术从数据中获得最大的好处。

泰朗斯福德,丹佛SendGrid高级商业情报分析员,开发人员所使用的电子邮件平台发送事务性的邮件在Web应用程序中,他承认部分是听到有竞争对手做演示,而且还学习如何分析可以更好地利用他的公司。

他说,自2009年以来,SendGrid已经发送了1,150亿封电子邮件。“有了这些数据,我们当然可以在分析方面做得更多”。

拥有公共卫生实验室的安大略省健康保护局(Ontario Agency for Health Protection)的数据库顾问米哈埃拉·斯莫奇纳(Mihaela Smochina)在那里学习其他人如何解决来自不同平台的数据集成问题,并提高预测能力。

他们和其他与会者得到的是来自加拿大和美国一些组织的简要案例研究。

总部位于多伦多的电子书零售商Kobo的大数据副总裁乔丹•克里斯滕森(Jordan Christensen)表示,他的公司去年决定利用读者搜索的大数据,帮助向买家提供推荐。

他们的策略来自IEEE杂志上的一篇文章,文章认为简单的模型和大型数据集胜过复杂的模型和较少的数据——这很有吸引力,因为Kobo只能组建一个5人的大数据分析团队。

此外,还决定该股应成为一个利润中心,至少从其建议中产生足够的收入来支付该司工作人员的费用。

网络旅游网站Expedia的数据工程师Arek Kaczmarek解释了该公司如何使用开源Hadoop框架来连接来自几个数据库的数百兆兆字节的数据。这使得分析师可以直接查询Hadoop,而不是创建单一用途的数据集市。为了提高查询速度,数据没有被规范化(即它包含数据的冗余副本)。

施乐公司(Xerox Inc.)的研究科学家拉卡什•库尔卡尼(Rakesh Kulkarni)讲述了他的公司如何为洛杉矶市创建了一种算法,该算法通过大量的停车数据,根据可用停车位的数量来设定该市每小时的停车价格。

整合了许多公司忠诚度计划的在线服务网站Points.com的首席数据科学家查鲁米特拉·普贾尔(Charumitra Pujar)表示,他的公司认为,大数据需要一种新的数据建模方式,这种方式不仅能让数据和业务团队紧密合作,还包括设置一个成功指标。

“大数据正在从根本上改变我们今天的决策方式,”他说。

“那些根据(传统)预测模型做出决策的营销人员和企业主现在面临挑战,因为他们有更多的可用信息。”


免责声明:本文由用户上传,如有侵权请联系删除!