本站首页    管理页面    写新日志    退出

公告

宿命宽恕轮回修仙


我的分类(专题)

日志更新

最新评论

留言板

链接

-----------数据挖掘-----------

Data Mining Community's Top Resource(KDnuggets)
Information Management(DMReview)
STATISTICA Software(StatSoft)
IIR USA(CRM Community)
Editor's Picks(CustomerThink)
Data Mining Group
ACM SIGKDD(DM顶级国际会议)
SourceForge.NET(Open Source Software)

SAS
SPSS
KXEN
WEKA
AlphaMiner
RapidMiner

中国万维网联盟(W3CHINA)
中国统计网
数据库专委会
数据挖掘研究院(China Data Mining Research)
LAMDA机器学习与数据挖掘研究组
北京大学计算语言学研究所
北京大学Dlib组
哈工大信息检索研究室论坛
神威学术资源中心

CRMSKY
数据挖掘学习交流论坛
计算机科学论坛
数据分析论坛
Weka中文站
R语言中文论坛
SAS中文论坛

ECT 584

-----------同行博客-----------

数据挖掘者(IDMer)
数据挖掘青年(DMman)
数据挖掘斗士(DMFighter)
神威异度空间
一维空间
不准阁
不断学习
欧燊怡
Datamining&BI
王义
Koala++

-----------学者信息-----------

Jiawei Han(韩家炜)
张鹏
曾元顯
吴俊杰

-----------回忆过去-----------

www.5im.cn
www.ustbhrm.com
www.finance3399.cn
www.xueyuanlu.cn
www.ccesr.com
econometrics.buaa.edu.cn

 


Blog信息
blog名称:宿命宽恕轮回修仙
日志总数:18
评论数量:3
留言数量:0
访问次数:114699
建立时间:2009年3月18日

«September 2025»
123456
78910111213
14151617181920
21222324252627
282930




[WEKA](转)利用WEKA编写数据挖掘算法
文章收藏,  软件技术

宿命宽恕轮回修仙 发表于 2009/6/5 19:22:21

  WEKA是由新西兰怀卡托大学开发的开源项目。WEKA是由JAVA编写的,并且限制在GNU通用公众证书的条件下发布,可以运行在所有的操作系统中。WEKA工作平台包含能处理所有标准数据挖掘问题的方法:回归、分类、聚类、关联规则挖掘以及属性选择。作为数据挖掘爱好者自然要对WEKA的源代码进行分析并以及改进,努力写出自己的数据挖掘算法。下面着重介绍一下如何利用WEKA编写新的数据挖掘算法:       注意:WEKA的版本有两个版本:稳定版(STABLE)和开发版(DEVELOP),不同WEKA版本与不同JDK的版本匹配,稳定版WEKA3-4的与JDK1.4.2匹配,而开发版WEKA3-5与JDK1.5匹配,WEKA3-5新加入了对数据库的数据连接。稳定版直接下载weka-src.jar文件就行了,而开发版需使用CVS连接到sourceForge下载,:pserver:cvs_anon@cvs.scms.waikato.ac.nz:/usr/local/global-cvs/ml_cvs。本文以稳定版为例。 一、首先从WEKA官方网站(http://www.cs.waikato.ac.nz/ml/weka)下载WEKA程序包。将程序包解压获得weka-src.jar源文件,再将源代码解压缩导入某个JAVA开发工具中(图1),如:JBuilder,Eclipse,Netbeans等。我现在以Netbeans为例。 500)this.width=500'>             图1 : weka导入Netbeans 二、为了不与WEKA中已包含的算法相冲突,最好自己建立一个JAVA包,将自己编写的挖掘算法存放在该包内(图2)。我以建立hzm包为例: 500)this.width=500'>                           图2 : 建立新weka包   三、在新的包hzm内建立新的java类,然后双击编写数据挖掘算法程序代码,本人以实现ID3算法为例讲解具体操作过程。 500)this.width=500'> 再将weka.classifiers.trees下的id3算法复制到新建的ID3类中(这只是演示,当然最好还是自己写新的挖掘算法),修改一下类中提示的错误,保存就行了。 四、编写好新的挖掘算法并不能马上在weka中exlorer模式中看到,还要修改weka.gui包中的GenericObjectEditor.props文件。如:我刚才建立的ID3类在weka.classifiers.hzm包中,就要在GenericObjectEditor.props中的# Lists the Classifiers I want to choose from段后添加weka.classifiers.hzm.ID3,\ 500)this.width=500'> 五、就可以编译整个weka项目,在选择主类时选择weka.gui.GUIChooser这个类,就可以运行和调试你编写好的算法了,祝大家都能写出优秀的挖掘算法!       注意:稳定版3-4修改GenericObjectEditor.props文件即可,但开发版3-5还要多修改同目录下的GenericProertiesCreator.props文件。


阅读全文(7845) | 回复(0) | 编辑 | 精华
 



发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.020 second(s), page refreshed 144765706 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号