数据挖掘工具收集?

Simba_Ji 2010-10-13 12:18:45
如题!
...全文
564 18 打赏 收藏 转发到动态 举报
写回复
用AI写文章
18 条回复
切换为时间正序
请发表友善的回复…
发表回复
tsingleung 2011-02-23
  • 打赏
  • 举报
回复
希望以下資料對閣下有幫助

对于本次选择的六类产品,除CA的BI产品外,其他五类都是在BI业界非常出名的公司的产品,从互联网上各类搜索引擎的搜索结果既可以看出。
其中:
 MSTR:全称MicroStrategy为正在开发的电信经营分析系统,以下简称MSTR。评估数据来源于开发的经验和同系统支撑商的交流;
 BO:为交流演示后,重点关注的产品,在中国有很好的市场。评估数据来源于同系统提供商的交流和互联网;
 Cognos:应用于本人实施过的电信经营分析系统,评估数据来源于本人系统研发、实施经验;
 Brio:应用于某电信经营分析系统,评估来源于本人对相关实施系统(电信领域)的调研、同维护人员的交流以及互联网;
 SAS:属于在统计分析、数据挖掘方面全球一流的SAS公司的产品。评估数据来源于互联网;
 CA:应用于某电信经营分析系统。评估数据来源于对系统的调研和互联网。


--小F-- 2010-11-02
  • 打赏
  • 举报
回复
都是钱钱..
王向飞 2010-10-24
  • 打赏
  • 举报
回复
感觉大部分都是收费还是很贵的,先用微软试用版吧。
whb147 2010-10-24
  • 打赏
  • 举报
回复
目前还是在学2005
qushengyun 2010-10-24
  • 打赏
  • 举报
回复
我同意。
dawugui 2010-10-24
  • 打赏
  • 举报
回复
本坛有个专门的版里面有相关内容,自己找找.
yanqlv 2010-10-24
  • 打赏
  • 举报
回复
学习的话,我用过一个weka的软件,java写的,带所有源代码,还有本新西兰人写的一本书专门讲解,涵盖了数据挖掘领域大部分算法,很好的!
zhuxinpai 2010-10-22
  • 打赏
  • 举报
回复
顶。。。。。。。。。
zhaojianmi1 2010-10-13
  • 打赏
  • 举报
回复
sqlserver 2008
sas
...
ws_hgo 2010-10-13
  • 打赏
  • 举报
回复
[code=Assembly]DMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集。

R

R (http://www.r-project.org) 是用于统计分析和图形化的计算机语言及分析工具,为了保证性能,其核心计算模块是用C、C++和Fortran编写的。同时为了便于使用,它提供了一种脚本语言,即R语言。R语言和贝尔实验室开发的S语言类似。R支持一系列分析技术,包括统计检验、预测建模、数据可视化等等。在CRAN(http://cran.r-project.org) 上可以找到众多开源的扩展包。
R软件的首选界面是命令行界面,通过编写脚本来调用分析功能。如果缺乏编程技能,也可使用图形界面,比如使用R Commander(http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/)或Rattle(http://rattle.togaware.com)。

Tanagra

Tanagra (http://eric.univ-lyon2.fr/wricco/tanagra/) 是使用图形界面的数据挖掘软件,采用了类似Windows资源管理器中的树状结构来组织分析组件。Tanagra缺乏高级的可视化能力,但它的强项是统计分析,提供了众多的有参和无参检验方法。同时它的特征选取方法也很多。

Weka

Weka (Waikato Environment for Knowledge Analysis, http://www.cs.waikato.ac.nz/ml/weka/) 可能是名气最大的开源机器学习和数据挖掘软件。高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面,称为Weka KnowledgeFlow Environment和Weka Explorer。和R相比,Weka在统计分析方面较弱,但在机器学习方面要强得多。在Weka论坛 (http://weka.sourceforge.net/wiki/index.php/Related_Projects) 可以找到很多扩展包,比如文本挖掘、可视化、网格计算等等。很多其它开源数据挖掘软件也支持调用Weka的分析功能。



YALE (IDMer:现在已经更名为RapidMiner)

YALE (Yet Another Learning Environment, http://rapid-i.com) 提供了图形化界面,采用了类似Windows资源管理器中的树状结构来组织分析组件,树上每个节点表示不同的运算符(operator)。YALE中提供了大量的运算符,包括数据处理、变换、探索、建模、评估等各个环节。YALE是用Java开发的,基于Weka来构建,也就是说它可以调用Weka中的各种分析组件。

KNIME

KNIME (Konstanz InformationMiner, http://www.knime.org)是基于Eclipse开发环境来精心开发的数据挖掘工具。无需安装,方便使用(IDMer:呵呵,大家喜欢的绿色版)。和YALE一样,KNIME也是用Java开发的,可以扩展使用Weka中的挖掘算法。和YALE不同点的是,KNIME采用的是类似数据流(data flow)的方式来建立分析挖掘流程(IDMer:这个我喜欢,和SAS EM或SPSS Clementine等商用数据挖掘软件的操作方式类似)。挖掘流程由一系列功能节点(node)组成,每个节点有输入/输出端口(port),用于接收数据或模型、导出结果。(IDMer:感觉KNIME比Weka的KnowledgeFlow更好用,连接节点时很方便,直接用鼠标拖拽连接端口即可。而Weka中则需要在节点上按鼠标右键,再选择后续节点,比较麻烦,刚开始使用时找了半天才知道怎么连)
KNIME中每个节点都带有交通信号灯,用于指示该节点的状态(未连接、未配置、缺乏输入数据时为红灯;准备执行为黄灯;执行完毕后为绿灯)。在KNIME中有个特色功能——HiLite,允许用户在节点结果中标记感兴趣的记录,并进一步展开后续探索。

Orange

Orange (http://www.ailab.si/orange)是类似KNIME和Weka KnowledgeFlow的数据挖掘工具,它的图形环境称为Orange画布(OrangeCanvas),用户可以在画布上放置分析控件(widget),然后把控件连接起来即可组成挖掘流程。这里的控件和KNIME中的节点是类似的概念。每个控件执行特定的功能,但与KNIME中的节点不同,KNIME节点的输入输出分为两种类型(模型和数据),而Orange的控件间可以传递多种不同的信号,比如learners, classifiers, evaluation results, distance matrices, dendrograms等等。Orange的控件不象KNIME的节点分得那么细,也就是说要完成同样的分析挖掘任务,在Orange里使用的控件数量可以比KNIME中的节点数少一些。Orange的好处是使用更简单一些,但缺点是控制能力要比KNIME弱。
除了界面友好易于使用的优点,Orange的强项在于提供了大量可视化方法,可以对数据和模型进行多种图形化展示,并能智能搜索合适的可视化形式,支持对数据的交互式探索。
Orange的弱项在于传统统计分析能力不强,不支持统计检验,报表能力也有限。Orange的底层核心也是采用C++编写,同时允许用户使用Python脚本语言来进行扩展开发(参见http://www.scipy.org)。




GGobi
数据可视化是数据挖掘的重要组成部分, GGobi (http://www.ggobi.org)就是用于交互式可视化的开源软件,它使用brushing的方法。GGobi可以用作R软件的插件,或者通过Perl、Python等脚本语言来调用。
[/code]
ws_hgo 2010-10-13
  • 打赏
  • 举报
回复
。。。。。。。。。。
fcpslove 2010-10-13
  • 打赏
  • 举报
回复
11111111111111111111111
BIConsulting 2010-10-13
  • 打赏
  • 举报
回复
关键是大数据量时表现如何啊。
HolyPlace 2010-10-13
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 ws_hgo 的回复:]
SQL code
[code=Assembly]DMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集。

R

R (http://www.r-projec……
[/Quote]
+1
billpu 2010-10-13
  • 打赏
  • 举报
回复
我觉得能掌握某一种主流的就很不错了 就从sql server开始吧
fpzgm 2010-10-13
  • 打赏
  • 举报
回复
使用工具的前提是应该了解数据挖掘的几种常用算法,然后找一个简单的工具先练习使用,接下来才会是比较各种工具。
fpzgm 2010-10-13
  • 打赏
  • 举报
回复
先从sql server2008自带的开始。。。

594

社区成员

发帖
与我相关
我的任务
社区描述
提出问题
其他 技术论坛(原bbs)
社区管理员
  • community_281
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧