本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

51La
链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1759876
建立时间:2007年4月9日




   

[数据挖掘]Matlab的数据挖掘工具箱spider 
网上资源,  心得体会

数据挖掘青年 发表于 2007/8/19 16:17:35

  一 spider主页http://www.kyb.mpg.de/bs/people/spider/ (也可以在google上搜索spider matlab得到),关于它的介绍可以参考网址资料 二 使用时为matlab+spider+Weka;因为spider中的一些算法引用了Weka,比如j48 安装注意: 1 matlab7(R14)   6.5版本对java的支持不够,还没有开发javaclasspath等函数 ??? Undefined function or variable 'javaclasspath'.??? Undefined function or variable 'javaaddclasspath'. 2 jre1.4.2  matlab7自带的是1.4.2;matlab6自带的是1.3.可以在D:\MATLAB7\sys\java\jre\win32下看到。如果装了matlab7,使用它自带的1.4.2就可以了,尤其不要使用1.6,因为1.6太新了,matlab还不支持。可以在Matlab下使用 version -java查看JVM版本。  如果你想使用1.5的话,C:\Program Files\Java\jre1.5.0_10;把jre1.5.0_10这个文件夹拷贝到D:\MATLAB7\sys\java\jre\win32下,然后增加环境变量MATLAB_JAVA:D:\MATLAB7\sys\java\jre\win32\jre1.5.0_10。这一步如果有问题的话,重启Matlab会给出错误提示。找不到什么什么文件... 3 Weka3.4.10   使用weka版本低一些即可,高的不行,因为高版本的weka可能是用高版本的jvm支持的。 我使用的组合是 matlab7(R14)+jre1.4.2(matlab7自带的,不需要任何设置)+Weka3.4.10 weka 下载:http://www.cs.waikato.ac.nz/ml/weka/ 三 使用方法 1 下载spider,有core和extra两个压缩包,把他们解压到同一个文件夹spider下面,然后放到$matlabroot\toolbox下面 2下载weka3.4.10,找到weka.jar放到$matlabroot\java\jar下面 3 启动Matlab打开$matlabroot\toolbox\spider\use_spider.m运行 提示spider的一些信息和 WEKA support enabled!表示成功了。 然后可以使用 help spider命令查看信息,他的功能列出如附录,然后就可以训练了。 四 一个简单的例子 X=rand(50)-0.5; Y=sign(sum(X,2));dtrain=data(X,Y);%生成训练集,也可以使用load()从文件读取 model=train(svm,dtrain));%使用函数train()训练模型 rtest=test(dtest,model);%使用训练好的模型对验证集dtest测试,返回测试结果 五 附录spider信息 最新spider Version 1.71 (24/7/2006)  Basic library objects.     data         - Storing input data and output results     data_global  - Implementation of data object that limits memory overhead    algorithm    - Generic algorithm object    group        - Groups sets of objects together (algorithms or data)     loss         - Evaluates loss functions    get_mean     - Takes mean loss over groups of algs    chain        - Builds chains of objects: output of one to input of another    param        - To train and test different hyperparameters of an object    cv           - Cross validation using objects given data    kernel       - Evaluates and caches kernel functions    distance     - Evaluates and caches distance functions   Statistical Tests objects.    wilcoxon     - Wilcoxon test of statistical significance of results    corrt_test   - Corrected resampled t-test - for dependent trials   Dataset objects.    spiral       - Spiral dataset generator.    toy          - Generator of dataset with only a few relevant features    toy2d        - Simple 2d Gaussian problem generator    toyreg       - Linear Regression with o outputs and n inputs    Pre-Processing objects    normalize    - Simple normalization of data    map          - General user specified mapping function of data   Density Estimation objects.    parzen       - Parzen's windows kernel density estimator    indep        - Density estimator which assumes feature independence    bayes        - Classifer based on density estimation for each class    gauss        - Normal distribution density estimator                       Pattern Recognition objects.    svm          - Support Vector Machine (svm)    c45          - C4.5 for binary or multi-class     knn          - k-nearest neighbours    platt        - Conditional Probability estimation for margin classifiers    mksvm        - Multi-Kernel LP-SVM    anorm        - Minimize the a-norm in alpha space using kernels    lgcz         - Local and Global Consistent Learner     bagging      - Bagging Classifier    adaboost     - ADABoost method    hmm          - Hidden Markov Model     loom         - Leave One Out Machine     l1           - Minimize l1 norm of w for a linear separator     kde          - Kernel Dependency Estimation: general input/output machine    dualperceptron       - Kernel Perceptron    ord_reg_perceptron   - Ordinal Regression Perceptron (Shen et al.)    splitting_perceptron - Splitting Perceptron (Shen et al.)    budget_perceptron    - Sparse, online Pereceptron (Crammer et al.)    randomforest - Random Forest Decision Trees         WEKA-Required    j48          - J48 Decision Trees for binary        WEKA-Required   Multi-Class and Multi-label objects.     one_vs_rest  - Voting method of one against the rest (also for multi-label)    one_vs_one   - Voting method of one against one    mc_svm       - Multi-class Support Vector Machine by J.Weston    c45          - C4.5 for binary or multi-class     knn          - k-nearest neighbours                  Feature Selection objects.    feat_sel     - Generic object for feature selection + classifier    r2w2_sel     - SVM Bound-based feature selection    rfe          - Recursive Feature Elimination (also for the non-linear case)    l0           - Dual zero-norm minimization (Weston, Elisseeff)    fsv          - Primal zero-norm based feature selection (Mangasarian)    fisher       - Fisher criterion feature selection    mars         - selection algorithm of Friedman (greedy selection)    clustub      - Multi-class feature selection using spectral clustering    mutinf       - Mutual Information for feature selection.         Regression objects.    svr          - Support Vector Regression    gproc        - Gaussian Process Regression     relvm_r      - Relevance vector machine     multi_rr     - (possibly multi-dimensional) ridge regression       mrs          - Multivariate Regression via Stiefel Constraints          knn          - k-nearest neighbours    multi_reg    - meta method for independent multiple output regression    kmp          - kernel matching pursuit    kpls         - kernel partial least squares    lms          - least mean squared regression [now obselete due to multi_rr]    rbfnet       - Radial Basis Function Network (with moving centers)    reptree      - Reduced Error Pruning Tree       WEKA-Required   Model Selection objects.    gridsel      - select parameters from a grid of values     r2w2_sel     - Selecting SVM parameters by generalization bound    bayessel     - Bayessian parameter selection    Unsupervised objects.    one_class_svm - One class SVM    kmeans       - K means clustering    kvq          - Kernel Vector Quantization    kpca         - Kernel Principal Components Analysis    ppca         - Probabilistic Principal Component Analysis    nmf          - Non-negative Matrix factorization    spectral     - Spectral clustering    mrank        - Manifold ranking    ppca         - Probabilistic PCA   Reduced Set and Pre-Image objects.    pmg_mds      - Calculate Pre-Images based on multi-dimensional scaling    pmg_rr       - Calculate Pre-Images based on learning and ridge regression    rsc_burges   - Bottom Up Reduced Set; calculates reduced set based on gradient descent    rsc_fp       - Bottom Up Reduced Set; calculates reduced set for rbf with fixed-point iteration schemes    rsc_mds      - Top Down Reduced Set; calculates reduced set with multi-dimensional scaling    rsc_learn    - Top Down Reduced Set; calculates reduced set with ridge regression    rss_l1       - Reduced Set Selection via L1 penalization    rss_l0       - Reduced Set Selection via L0 penalization    rss_mp       - Reduced Set Selection via matching pursuit


阅读全文(35642) | 回复(15) | 编辑 | 精华
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

DMstranger(游客)发表评论于2009/3/4 20:55:50

弱弱的问下前辈,问什么不只用matlab或者只用weka呀?还有,前辈的MSN一直的不在线啊... 以下为blog主人的回复: 实现spider和weka的互补,他们提供了不同的函数。而且不同的人喜欢不同的语言吧。


个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

Peter(游客)发表评论于2008/2/22 14:19:08

以下引用Peter(游客)在2008-2-22 11:50:04的评论: 介绍的太粗浅了,应该举一个好点的例子 我想问一下博主,用Spider怎么做CV10? 俺的组合是Matlab7+JVM1.5+Weka3.5.6Solved,thx host for sharing these:-) 以下为blog主人的回复:

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

Peter(游客)发表评论于2008/2/22 11:50:04

介绍的太粗浅了,应该举一个好点的例子 我想问一下博主,用Spider怎么做CV10? 俺的组合是Matlab7+JVM1.5+Weka3.5.6

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

hawkmu(游客)发表评论于2007/12/29 4:28:12

换用matlab7.0 后只有一个警告了。Warning: Function C:\Program Files\MATLAB\R2006a\toolbox\spider\functions\norm.m has the same name as a MATLAB builtin 以下为blog主人的回复:  warning应该没问题

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

hawkmu(游客)发表评论于2007/12/29 4:21:03

 启动以后提示下Warning: Function C:\MATLAB6p5\toolbox\spider\functions\norm.m has the same name as a MATLAB builtin. We suggest you rename the function to avoid a potential name conflict.> In path at 113  In addpath at 100  In use_spider at 62Warning: Function C:\MATLAB6p5\toolbox\spider\functions\norm.m has the same name as a MATLAB builtin. We suggest you rename the function to avoid a potential name conflict.> In path at 113  In addpath at 100  In use_spider at 63Warning: Function C:\MATLAB6p5\toolbox\spider\functions\norm.m has the same name as a MATLAB builtin. We suggest you rename the function to avoid a potential name conflict.> In path at 113  In spider_path at 12  In use_spider at 65不知这个是否有影响,先楼主请教

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

旖罗发表评论于2007/10/28 18:30:19

谢谢你,不过还有些地方不明白,想向你请教。能加我QQ吗?376679218。谢谢!! 以下为blog主人的回复:  已经不大用qq了,我的msn:qingqiangli@hotmail.com matlab+spider我也只用了一次 后来没再用过。您的问题如果涉及比较高级的matlab使用,我也了解不多~

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

旖罗(游客)发表评论于2007/10/27 19:45:03

我装成功了,但怎么运行help spide提示找不到spider.m文件啊? 以下为blog主人的回复:  matlab的问题。默认的他只能找到他安装目录下的work文件夹下面的东西。您先别help;直接用matlab的打开菜单打开spider运行,就知道怎么做了

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

旖罗(游客)发表评论于2007/10/25 10:40:27

哪里能下weka3.4.10啊 以下为blog主人的回复:   http://www.cs.waikato.ac.nz/ml/weka/

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

y(游客)发表评论于2007/10/5 15:31:54

根据这篇文章,我安装成功了:)多谢! 不过我还不很会用matlab,有一个问题想请教您。先不想用他的test和train,而只是想生成三个高斯分布的数据,分别标成不同颜色,再用到自己将的算法中,应该用哪个命令呢。我看toy2d目录下有一个图片是红蓝两色数据,不知如何生成。 以下为blog主人的回复:  您的问题应该是matlab的使用。对于matlab,小弟也是个新手,不好意思~~

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Matlab的数据挖掘工具箱spider
网上资源,  心得体会

jessie(游客)发表评论于2007/9/14 18:29:30

我现在用spider做一些东西,可是我发现spider中存在不少的问题,希望能和你多多交流,能留下你的联系方式吗?谢谢:-) 我的e-mail:xill05@lzu.cn

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


» 1 2 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.078 second(s), page refreshed 144765275 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号