上一篇:日志 下一篇:消息传递

机器学习

提供具体统计算法的工具。其算法可从数据中学习。

  • Apache Flink:快速、可靠的大规模数据处理引擎。
  • Apache Hadoop:在商用硬件集群上用来进行大规模数据存储的开源软件框架。
  • Apache Mahout:专注协同过滤、聚类和分类的可扩展算法。
  • Apache Spark:开源数据分析集群计算框架。
  • DeepDive:从非结构化数据建立结构化信息并集成到已有数据库的工具。
  • Deeplearning4j:分布式多线程深度学习开发库。
  • H2O:用作大数据统计的分析引擎。
  • Weka:用作数据挖掘的算法集合,包括从预处理到可视化的各个层次。
上一篇:日志 下一篇:消息传递