印度的多样性可以为会话式AI产品提供大量素材
对话人工智能(AI)如今很难互动。这是最好的交易。两个主要的会话AI解决方案 - 基于文本(聊天机器人)和基于语音(个人助理) - 尚未提供的原因是,有效和高效的人机对话的技术仍然在发展,而不是技术行业让我们相信。
人机对话包括自然语言理解(NLU),这是对用户所说的内容的理解。自然语言生成(NLG)就是为用户制定合理的主题响应。但是,响应生成不仅仅是收集和分析大量数据的产物。
自然语言处理(NLP),其中NLU是一个子集,很难,因为语言学的任务需要包括人类心理学,文化和语言多样性的变化。此外,今天的大多数会话体验要么非常广泛而且很浅(例如,“时间是什么时候?”=“时间是上午10点”)或者非常狭窄但很深(例如,在测验游戏中的多转对话) 。
为了超越这些有限的经验,我们需要进入一个广泛而深入的对话世界。这将要求机器能够超越当前仅在几百个意图之间识别的技术限制。机器对话的另一个限制是个性化。在两个人之间的自然对话中,每个人通常会利用之前与另一个人的经历并相应地调整响应。不这样做的计算机对话往往会感觉不自然甚至烦人。长期解决这个问题需要解决诸如说话人识别之类的挑战,以便计算机知道你是谁,并且可以对你和其他人做出不同的反应。
在过去几年中,许多企业和会话AI解决方案开发人员一直忙于开发主要有两种类型的聊天机器人。第一类是企业聊天机器人,用于解决企业用例,例如客户支持,潜在客户生成等。第二类是直接面向消费者的机器人聊天机器人,它们直接针对特定应用程序联系消费者。但是,目前可用的大多数企业机器人都是常见问题解答(常见问题)的自动化版本,并且无法在几个交互式对话之外进行对话。
当机器智能接近人类智能时,消费者的兴趣将会实现。话虽如此,可以利用印度市场的多样性,规模和能力来提前做好准备。
考虑一下印度的互联网用户群,近年来增长迅速,从2012年的8400万用户增加到接近5亿用户。据报道,印度在2018年4月至6月期间消耗了22%的全球移动数据,而印度电信公司处理的数据流量更多据印度移动运营商协会称,它们与中国和美国的同行相比。这个庞大且迅速增长的互联网用户群正在生成可用于构建和微调会话AI产品的数据。
此外,印度有22种官方语言,在13.5亿人口中,不到10%的人能够理解英语。在目前的互联网用户群中,大多数是非英语用户。第四,嵌入式语言模型(ELMos)的最新NLP技术,其中在一种语言的数据集上训练的NLP算法可以在没有训练的情况下适应其他(相似的,相邻的)语言,在印度场景中可以最佳地工作。例如,基于ELMo的印地语语言数据集训练解决方案也可以适应马拉地语和旁遮普语,从而更快地扩展。
许多全球和国内公司都将重点放在印度,既是市场又是创新中心。例如,全球300多家微软认知服务公司的认知服务来自印度。亚马逊在该国开展业务的短短一年内,将开发人员(特定于Alexa技能)的数量从不到10,000增加到40,000。
对于亚马逊来说,印度是Alexa技能的第二大市场(仅次于美国)。此外,据创新数据库Tracxn称,截至2017年,印度有超过100家聊天机器人初创公司。虽然有许多公司如Haptik和Active.ai帮助他们为企业客户开发对话AI产品,但有些公司正在采用并在利基领域创建解决方案,如Niki.ai(数字助理),Fynd(时尚服装聊天机器人),Myprivatetutor(导师发现者),Lawrato(法律搜索)和Wysa(心理健康追踪器)等等。
除了聊天机器人开发之外,其他几家印度创业公司,如Liv.ai(被Flipkart收购)和Reverie Language Technologies(披露:我是顾问)正在通过开发印度语语音引擎解决印度语数字化问题,与全球技术巨头相比,先进的语言和声学模型。
目前,机器人可以继续帮助我们完成自动化,重复性,低级别的任务和查询;作为更大,更复杂系统中的齿轮。我们做了他们,而我们自己,太过期待太多了,这是一种伤害。利用印度的技能和语言市场可以纠正这种情况。