本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1545784
建立时间:2007年4月9日




留言板(签写留言)

谢谢

DM(游客)发表留言于2008-6-23 9:39:20

您好!

我现在有个关联规则的新算法,要实验验证其高效性,请问我要用什么来编程实现:weka? matlab? 直接用C++编程? 亦或是3者结合? 哪种方法最简单易学呢?能简要说说3者吗? 非常感谢!

我的邮箱是:panyiting5@126.com. 期待您的回复

以下为blog主人的回复:

 您可以再网上搜搜介绍关联规则算法的经典论文,看看人家是怎么实验的。咱要验证效率,就要和人家使用相同的平台,相同的实验数据


| 编辑 | 主人回复 | 删除
 


命令行

充感(游客)发表留言于2008-5-27 10:52:03

您好!老师,我这些已经看过了,那只大略介绍了一些,我还是不太了解,java weka.classifiers.trees.J48 -t a.arff -T b.arff,参数是怎么传递的,传到了什么地方,J48的main()只有一个参数,而这个是两个,再打扰了,谢谢!

| 编辑 | 主人回复 | 删除
 


命令行

chonggan(游客)发表留言于2008-5-27 0:20:47

谢谢!我要运行这样一个命令,java weka.classifiers.trees.J48 -t a.arff -T b.arff 具体调用那几个函数,实现原理?谢谢!我对weka还不太了解。 我的QQ:442815849

以下为blog主人的回复:

 命令行实际上和explorer的功能是对应的。请先查看:



| 编辑 | 主人回复 | 删除
 


命令行执行

充感(游客)发表留言于2008-5-25 23:25:39

老师,您好,很荣幸查资料查到这里,我刚接触weka,请问怎么在cmd中我只是把weka-3-5和JDK6安装上,请问还需要其他设置吗?谢谢!在线等待!

以下为blog主人的回复:

 weka的安装目录下有weka.jar,我们可以在命令行进入该目录下,通过java -jar weka.jar运行jar文件。

解压weka.jar后,即为class文件,也可以用java命令运行指定的界面或算法。

首先要确定java安装正确。


| 编辑 | 主人回复 | 删除
 


诚心求教

随梦而飞(游客)发表留言于2008-5-23 14:28:40

   DMman你好!我是一名研二的学生,很开心在查资料的时候找到了这个地方,发现很多都跟weka有关,可是这个东西我都没有用过。我的论文选题是跟点击流数据有关的,是要在数据仓库的基础上进行数据挖掘,可是一直苦于没能有测试数据,同时也以此为借口没好好做研究,现在有点焦急了。看了你的BLOG,觉得你是一位非常热心的人,不知能否给点建议?谢谢!还有能否告知你的邮箱之类的,谢谢了!我的邮箱是zoulixin@hqu.edu.cn

以下为blog主人的回复:

 您好!我的邮箱就在左边;流数据的处理weka不一定有合适的算法;找数据集可以使用google,用英文搜索 ** dataset


| 编辑 | 主人回复 | 删除
 


能从算法的角度解释一下,为什么利用weka做EM聚类结果中的

veraxxrr(游客)发表留言于2008-5-19 15:06:12

打扰了,能从算法的角度解释一下,为什么利用weka做EM聚类结果中的对于离散属性,Discrete Estimator. Counts会有小数吗(如下例),看了很多论文,但是都没有结果,非常感谢!!!                         

                              (F)   (T)

Attribute: /students/
Discrete Estimator. Counts = 83.51 2.49 (Total = 86)

以下为blog主人的回复:

 衡量分布的时候,连续属性使用均值和方差,离散属性采用概率,如a、b、c、d出现次数分别是0|1、2、3,则b为1/6,a为0/6,这个0在算法中是需要处理的,一般方法是在所有的分子上都加上一个数,如1.我觉得EM中的counts就是这个(1+1)/6。


| 编辑 | 主人回复 | 删除
 


留言数:74  « 1 2 3 4 5 6 7 8 9 10 »
给DMman签写留言:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写留言内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.031 second(s), page refreshed 143894538 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号