开源的开发工具,

  开源的开发工具,

  谷歌已经推出了一个开源的机器学习框架High Heels,微软也发布了一个类似的项目,名为DMLT(分布式机器学习工具包)。它通过允许模型在多个节点(学习机的核心组件)上一次训练,简化了分布式系统中机器学习的工作。

  “更大的模型往往在各种应用中产生更好的准确性,”微软在框架的介绍中写道。“然而,学习大车仍然是机器学习研究者和实践者面临的共同挑战。”

  【也在InfoWorld:如何学习机器吃微软学习如何处理InfoWorld的开发者和职业程序员面临的实际问题。紧跟节目与InfoWorld的应用开发交流中的热点话题。]

  DMLT的核心是C SDK的客户-服务器架构。“一些服务器实例运行在多台机器上,负责维护全局模型参数,”微软在其文档中说。在训练程序中,访问并更新调用底层通信设备的客户端API的一些参数

  我希望微软DMLT将使它更容易成为一名数据科学家,而不用担心基本的事实管理线程或跨多个机器节点的工作负载培训。它简化了进程间的通信,并且作为两个不同的库(MPI和ZMQ)也可用于此,并且可以互换使用。

  DMLT有两种算法模型训练。LDA大概会是最常用的大数据模型的快速训练。微软声称,它已经能够仅在八节点系统LightLDA中训练模型“万亿个参数”。此外,还包括分布式单词嵌入和分布式多传感器单词嵌入,确定单词与其算法的关系。

  DMLT从微软得到了一个非常低调的版本。DMLT网站上唯一的宣传似乎是一篇博客文章,宣布源代码已于11月9日公开发布。也就是说,微软声称这只是其向DMLT提供其他算法计划的开始。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: