机器学习
提供具体统计算法的工具。其算法可从数据中学习。
- Apache Flink:快速、可靠的大规模数据处理引擎。
- Apache Hadoop:在商用硬件集群上用来进行大规模数据存储的开源软件框架。
- Apache Mahout:专注协同过滤、聚类和分类的可扩展算法。
- Apache Spark:开源数据分析集群计算框架。
- DeepDive:从非结构化数据建立结构化信息并集成到已有数据库的工具。
- Deeplearning4j:分布式多线程深度学习开发库。
- H2O:用作大数据统计的分析引擎。
- Weka:用作数据挖掘的算法集合,包括从预处理到可视化的各个层次。