Scala 机器学习库

自然语言处理

ScalaNLP—机器学习和数值计算库的套装


Breeze —Scala用的数值处理库


Chalk—自然语言处理库。




FACTORIE—可部署的概率建模工具包。用Scala实现的软件库。

为用户提供简洁的语言来创建关系因素图。评估參数并进行判断。


数据分析/数据可视化

MLlib in Apache Spark—Spark下的分布式机器学习库


Scalding —CAscading的Scala接口


Summing Bird—用Scalding 和 Storm进行Streaming MapReduce


Algebird —Scala的抽象代数工具


xerial —Scala的数据管理工具


simmer —化简你的数据,进行代数聚合的unix过滤器


PredictionIO —供软件开发人员和数据project师用的机器学习server。


BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库。


通用机器学习

Conjecture—Scalding下可扩展的机器学习框架


brushfire—scalding下的决策树工具。


ganitha —基于scalding的机器学习程序库


adam—使用Apache Avro, Apache Spark 和 Parquet的基因组处理引擎,有专用的文件格式,Apache 2软件许可。


bioscala —Scala语言可用的生物信息学程序库


BIDMach—机器学习CPU和GPU加速库。


Figaro - 一个构造概率性模型的Scala库


       英文原文链接:Scala机器学习

原文地址:https://www.cnblogs.com/yutingliuyl/p/6755063.html