用于机器学习的最流行的编程语言框架和工具
如果你想知道哪一套日益增长的编程语言库和工具是实现机器学习模型的好选择,那么帮助就在眼前。
一项新的O‘Reilly调查显示,1300多名主要从事技术、金融和医疗保健工作的人披露了他们公司使用的机器学习技术。
该列表是数据科学最喜欢的Python、大数据平台和基于云的服务的软件框架和库的组合,它们处理机器学习管道的每个阶段。
当涉及到使用机器学习或AI作为报告所指的时候,大多数公司仍处于评估阶段,正在实施的最常见的工具是用于“模型可视化”和“自动模型搜索和超参数调优”的工具。
毫不奇怪,最常见的ML形式是监督学习,其中机器学习模型是使用大量标记数据进行训练的。 例如,一个计算机视觉模型,负责在视频中识别人,可能会被训练在带有注释的图像上,以指示它们是否包含一个人。
下面是企业说他们正在用于机器学习的库、框架、大数据平台和云服务。
谷歌广泛使用的机器学习框架,旨在处理训练机器学习模型时所需的数值计算,并能够在CPU、GPU和专门芯片(如谷歌的Tensor ProcessingUnits(TPU)之间进行计算。
一个流行的Python库,用于数据挖掘和数据分析,实现广泛的机器学习算法..
一个开源的深度学习框架,它的声誉是比一些竞争的框架,如TensorFlow更容易学习,并被设计用于机器学习管道的每个阶段。
一个深度学习框架,用于与神经网络合作,这是大脑启发的数学模型,支持深度学习,它的设计是为了使人们更容易与竞争的框架合作。
用Python编写,它能够运行在TensorFlow、Micros of t认知工具包(CNT K)和Python库Theano之上。
这套服务旨在帮助公司建立、培训和部署机器学习模型,无论是在微软的Azure云上,还是在靠近网络边缘的计算设备上。 工具帮助自动识别和调整适当的机器学习模型的过程,以及缩放底层计算以匹配需求。
与Azure ML Studio类似,GoogleCloud ML引擎还提供培训、评估、调优和部署机器学习模型的工具。
亚马逊Sage Maker同样提供了建立、培训和部署机器学习模型的服务,以使模型能够更快、更低成本地生产。
如果您对主要云平台的这些机器学习套件的相对优点感兴趣,请查看我们的姐妹站点ZDNet的比较。
一个开源的内存平台,可以在分布式系统中扩展机器学习的工作负载。
该平台旨在支持最广泛使用的统计和机器学习算法,并提供一定程度的自动化,以帮助数据科学家识别和调整适当的机器学习模型。
为了简化训练和评估机器学习模型的过程,Prodigy是帮助数据科学家对训练数据集进行适当注释的工具。
火花NLP提供了一个自然语言处理(NLP)库,旨在与运行内存中的大数据平台Apache Spark的分布式系统一起工作。
描述为开发和比较强化学习算法的工具包,这是一种机器学习,软件代理通过奖励导致预期结果的操作来学习如何执行任务。
分析动物园将一系列大数据和机器学习技术汇集到它所描述的统一分析和人工智能平台中。
该平台集成了Spark、TensorFlow、Keras和深度学习库BigDL,并可以在分布式Hadoop和Spark集群中扩展机器学习模型,用于培训和推理。
旨在简化设计和评估新的自然语言处理问题深度学习模型的过程。
该库包括核心NLP问题和NLP应用程序的高质量模型的参考实现。
一个在分布式系统中运行机器学习模型的框架,提供高性能和容错性,同时仍然是可扩展的。