从头开始构建预测分析模型 这是为什么呢
关于AI可以为企业带来的潜在价值,现在有很多讨论,而物流业务 -由于其复杂性和电子商务对它的依赖程度-也不例外。
想象一下,您的电子商务业务需要从旧金山向西雅图发送订单,并且您已承诺2天交付。下午3:34,USPS,UPS,FedEx和Ontrac的分拣设施都有不同的截止时间。您的仓库将需要15至45分钟的时间来挑选和打包订单,今晚在旧金山发生雷暴的可能性高达62%。您是通过航空(快递)还是地面运输?
如果您选择空运,则会损失所有利润。如果您选择地面交易,您的保证金就可以了,但是可能要晚了,您可能会失去客户。对于不断增长的业务而言,每天实时进行数千次决策的唯一方法是预测未来。人类要考虑的变量和因素太多了,您需要AI。您需要一个预测模型。如果您没有竞争对手,您的竞争对手就会屈服于他们,并失去竞争优势。
这是AI和机器学习(ML)的承诺–收集大量数据,将其输入到预测模型中并获利!不幸的是,它并不是那么简单。即使是最好的神经网络,也很难提取出非常复杂的现实问题的准确预测。
2016年,DeepMind 使用自学成才的神经网络击败了18届世界冠军Go棋手,这是一款比国际象棋更为复杂的游戏。训练神经网络玩游戏(例如国际象棋或围棋)并不容易,但是它与现实世界的不同之处在于,您始终可以获取完美,准确的数据。您知道板上每个零件的位置和可能性,并且知道它们何时发生变化。为了获得竞争优势或降低成本,您想要回答的难题很难解决。
您的数据可能来自质量不同的多个来源,不能保证会实时发送给您,而且数据太多了–噪音多于信号。在开始将所有数据转储到Tensorflow或Google Cloud AutoML Table中之前, 您需要深入了解您的域并聘请数据科学家。
统计处理已经存在了数十年,只有受过训练的数据科学家才能处理您收集到的PB级数据并进行清理,以使您的预测准确无误。关于AI和ML的许多兴奋之处在于,我们将以更少的工作量获得更好的模型-不再需要繁琐的特征提取或选择变量!但是事实并非如此……。几乎没有任何原始数据将最适合于预测模型-对于每个特定的应用程序,所有原始数据都需要整理成多种格式。
对于刚接触该领域的新手来说,现代的AI和ML工具的易用性很容易使他们兴奋,但是细节在于魔鬼。即使是最简单的模型也可以为您提供预测,但是这些预测的准确性非常差,您将无法从中提取业务价值。不幸的是,天真模型与数据科学家开发的复杂模型之间的差异将在您对模型预测的准确性和信心中得到证实。
在EasyPost,我们尝试预测货件何时到达目的地,但是即使有关于过去货件的数百亿个数据点,这也极难做到。当我们开始尝试仅凭跟踪数据做出这些预测时,结果令人震惊。但是,当我们开始将数据科学家与运输专家配对时,我们就可以在速度和准确性上取得长足的进步。
人工智能可以辅助AI的一个例子是,我们的人类专家了解物流行业分拣设施中截止时间的重要性。通过添加来自领域专家的数据(在这种情况下,即运营商网络中每种设施类型的截止时间),我们能够极大地改善我们的结果。通过将特定领域的相关数据添加到科学家的工具包中,我们可以创建比仅使用AI更为智能的模型。
根据我们的经验,一个复杂的问题(如先前提出的有关运输时间的问题)包含了太多变量,以至于当今最好的神经网络无法自行学习和解决。幸运的是,他们不必这样做,但是您需要数据科学家与领域专家合作,以正确权衡湾区空气湿度水平的重要性!
预测模型的未来是光明的,但是请不要忽略过去!统计处理和数据科学是框架化和简化复杂业务问题的关键,以便最先进的AI和ML可以应对它们。