数据挖掘软件(普通人学python有意义吗)
数据挖掘是一个提取隐藏在大量不完整、有噪声、模糊和随机数据中的潜在有用信息和知识的过程,而人们事先并不知道这些信息和知识。数据挖掘的任务是从数据集中发现模式。可以找到的模式有很多,根据功能可以分为两类:预测模式和描述模式。
数据挖掘软件
奥林奇
Orange是一个基于组件的软件套件,用于数据挖掘和机器学习。它的功能是友好、强大、快速、多功能的可视化编程前端,用于浏览数据分析和可视化,Python绑定脚本开发。它包含一系列完整的数据预处理组件,并提供数据核算、转换、建模、模式评估和探索功能。采用C++和Python开发,其图形库采用跨平台Qt框架开发。
RapidMiner
RapidMiner,以前称为Yale(又一个学习环境),是机器学习和数据挖掘与分析的实验环境,也用于研究现实世界的数据挖掘。它提供的实验由大量的操作符组成,这些操作符由详细的XML文件记录,并由RapidMiner的图形用户界面显示。RapidMiner为主机器学习过程提供了500多个操作符,将学习方案与Weka学习环境的属性赋值器相结合。它是数据分析的独立工具,也是集成到您的产品中的数据挖掘引擎。
新西兰秧鸡
由Java开发的WEKA(Waikato Environment for Knowledge Analysis)是一款知名的机器软件,支持数据预处理、聚类、分类、回归、虚拟化、函数选择等几个经典的数据挖掘任务。它的技术是基于数据是单个文件或关联的假设,其中每个数据点由许多属性标记。Weka可以利用Java的数据库链接能力访问SQL数据库,可以处理一个数据库的查询结果。它的主要用户界面是Explorer,也支持相同功能的命令行或者一个基于组件的知识流界面。
JHepWork
jHepWork是为科学家、工程师和学生设计的免费开源数据分析框架,主要利用开源库创建数据分析环境,并提供丰富的用户界面与那些收费的软件竞争。它主要用于科学计算的二维和三维绘图,包括用Java实现的数学科学库、随机数等数据挖掘算法。JHepWork基于一种高级编程语言Jython。当然,Java代码也可以用来调用jHepWork的数学和图形库。
数据挖掘平台
KNIME (Konstanz Information Miner)是一个用户友好、智能、开源的数据集成、数据处理、数据分析和数据探索平台。它使用户能够以可视化的方式创建数据流或数据通道,并可以选择性地运行部分或全部分析步骤,以及使用以下研究结果、模型和交互式视图。KNIME是用Java写的,基于Eclipse,通过插件提供更多功能。通过插件文件,用户可以为文件、图片和时间序列添加处理模块,并将其集成到其他各种开源项目中,如R语言、Weka、化学开发工具包和LibSVM。