1.3.2 数据挖掘开发工具
本小节主要介绍数据挖掘开发工具,包括MLS、Python、Spark MLlib、Rapid Miner、IBM SPSS Modeler、Oracle Data Mining等工具,以及介绍了数据挖掘认证课程的学习路径。
数据挖掘开发工具:
◯ MLS
◯ Python
◯ Spark MLlib
◯ Rapid Miner
◯ IBM SPSS Modeler
◯ Oracle Data Mining
MLS:
机器学习服务MLS:
◯ 易用:通过可视化的拖拽式服务,实现数据建模、分析、预测、可视化。
◯ 开放:交互式Notebook,支持多种开源建模语言(Python)
◯ 丰富:预置丰富的机器学习算法,满足从数据导入和处理,到模型训练和评估、导出,覆盖预测分析端到端业务。
◯ 一站式:提供特征工程、机器学习算法、建模、预测、模型全生命周期管理的机器学习一站式机器学习应用。
Python:
◯ Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。
◯ Python由Guido van Rossum于1989年底发明,第一个公开发行版于1991年。
Spark MLlib:
◯ 便于使用:可用于Java,Scala,Python和R。
◯ 性能:高质量算法,比MapReduce快100倍。
◯ 到处运行:Spark运行在Hadoop,Apache Mesos,Kubernetes,独立或云端,针对不同的数据源。
Rapid Miner:
◯ 可以轻松地为预测建模准备数据。
◯ 交互式地探索数据以评估其健康,完整性和质量。
◯ 快速修复缺失值和异常值等常见问题。
◯ 将多个数据集混合在一起,并使用简单的表示式编辑器创建新列。
IBM SPSS Modeler:
◯ 加快数据研究员执行操作任务的速度,从而帮企业加速实现价值并获得预期的成果。
◯ 依靠IBM的产品和服务进行数据准备和发现、预测分析、模型管理和部署以及机器学习。
Oracle Data Mining:
◯ 提供了强大的数据挖掘算法,使数据分析人员能够进行预测并利用其Oracle数据进行投资。
◯ 在Oracle数据库中构建和应用预测模型,以帮助您预测客户行为,定位最佳客户,开发客户档案,识别交叉销售机会并检测异常和潜在欺诈。
数据挖掘学习路径:



