本站首页    管理页面    写新日志    退出



公告


 求真务实打基础,
 宁缺毋滥读好书。

数据挖掘青年(DMman)


我的分类(专题)

日志更新
问君能有几多愁,恰似一群太监上青楼
我和僵尸有个约会:灵异世界或真实存在?
赤壁(下)观后小感:雷人
英科学家:酒精和烟草的危害大于大麻和摇头
只有社会主义才能拯救世界(由金融危机引发
求职心得(非名牌院校 硕士 计算机)
省外就业协议录入
数据挖掘方面的资源、期刊、会议的网址集合
面试心得(摘)
为学
EI收录中国期刊-核心(2008-5)
混沌理论:随机世界的建模
分子计算机已经问世,纳米计算机指日可待?
绝对好用免费的网络电话
NLP:基于机器学习的人类思想及行为建模
Weka中用于组合多个模型的的装袋、提升
数据挖掘在企业中应用的四种途径
(转)几点做人做事的建议
大学计算机软件专业生应该学什么(转)
一个程序员对学弟学妹建议(转)

最新评论

留言板

链接

Blog信息
blog名称:DMman(数据挖掘青年)
日志总数:102
评论数量:564
留言数量:57
访问次数:1543209
建立时间:2007年4月9日




[数据挖掘]Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

数据挖掘青年 发表于 2007-8-18 18:42:41

以下为Xiaojin Zhu在ICML2007上的陈述内容梗概,更多内容可以在他的主页上得到。懒得整理成中文了,而且很多术语虽然理解了意思,但还不知道确切的中文描述...现在才深刻体会到,要想学习前沿的知识,只有通过互联网,平常看书只是看些稳定成型的老知识。。。 半监督学习已经兴起七八年了吧,但在中国还是刚刚起步罢。 一、Introduction to semi-supervised learning    What is semi-supervised learning and transductive learning?  Why can we ever learn a classifier from unlabeled data?  Does unlabeled data always help?  Which semi-supervised learning methods are out there?  Which one should I use?  Answers to these questions set the stage for a detailed look at individual algorithms. 二、Semi-supervised learning algorithms    In fact we will focus on classification algorithms that uses both labeled and unlabeled data.  Several families of algorithms will be discussed, which uses different model assumptions: 1、Self-training   Probably the earliest semi-supervised learning method.  Still extensively used in the natural language processing community. 2、Generative models    Mixture of Gaussian or multinomial distributions, Hidden Markov Models, and pretty much any generative model can do semi-supervised learning.  We will also look into the EM algorithm, which is often used for training generative models when there is unlabeled data. 3、S3VMs   Originally called Transductive SVMs, they are now called Semi-Supervised SVMs to emphasize the fact that they are capable of induction too, not just transduction.  The idea is simple and elegant, to find a decision boundary in 'low density' regions.  However, the optimization problem behind it is difficult, and so we will discuss the various optimization techniques for S3VM, including the one used in SVM-light, Convex-Concave Procedure (CCCP), Branch-and-Bound, continuation method, etc. 4、Graph-based methods    Here one constructs a graph over the labeled and unlabeled examples, and assumes that two strongly-connected examples tend to have the same label.  The graph Laplacian matrix is a central quantity.  We will discuss representative algorithms, including manifold regularization. 5、Multiview learning    Exemplified by the Co-Training algorithm, these methods employ multiple 'views' of the same problem, and require that different views produce similar classifications. 6、Other approaches    Metric based model selection, tree-based learning, information-based method, etc. 7、Related problems    Regression with unlabeled data, clustering with side information, classification with positive and unlabeled data; dimensionality reduction with side information, inferring label missing mechanism, etc. 三、Semi-supervised learning in nature     Long before computers come around and machine learning becomes a discipline, learning has occurred in nature.  Is semi-supervised learning part of it?  The research in this area has just begun.  We will look at a few case studies, ranging from infant word learning, human visual system, and human categorization behavior. 四、Challenges for the future     There are many open questions.  What new algorithms / assumptions can we make?  How to efficiently perform semi-supervised learning for very large problems?  What special methods are needed for structured output domains?  Can we find a way to guarantee that unlabeled data would not decrease performance?  What can we borrow from natural learning?  We suggest these as a few potential research directions.   研究半监督的人,主页上有更多更详细的介绍: http://pages.cs.wisc.edu/~jerryzhu/ http://www.kyb.tuebingen.mpg.de/~chapelle


阅读全文(45740) | 回复(13) | 编辑 | 精华
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

大浪滔天(游客)发表评论于2012-4-29 11:29:27

高手啊,现在在做毕设,想要一份 co-training算法的源码,能给我发一份不?谢啦!邮箱:dltt1991@163.com


个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

ying(游客)发表评论于2012-2-1 15:18:45

太好了,终于遇见高手了,想要一份self-training 和 co-training等半监督算法,可否发给我一份,敬候佳音email:lyaihua1995@163.com

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

huangtx(游客)发表评论于2011-12-3 9:26:07

TSVM或者S3vm代码(matlab) 也发我一份chinanxiam@163.com 谢谢

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

jps2825(游客)发表评论于2011-4-26 22:27:04

大家都留了,很不好意思啊,我也想要关于半监督的一些源码,有的话麻烦给传一份,不胜感激。jpg-kiss@163.com

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

dddangdang(游客)发表评论于2011-4-16 19:28:32

能不能给我一份半监督学习的源码,在先生的主页上没有找到啊= =! ndzj981479673@126.com

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

yy(游客)发表评论于2011-3-2 17:26:26

lz不知道有没有这方面的代码,如果有的话,希望能够给我一份,最近导师叫编这方面代码,但是网上找不到都,邮箱nicknina2006@163.com,谢谢了

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

尕心疼(游客)发表评论于2010-11-11 22:11:08

您好,我最近一直在关注朱晓进教授的论文,但是我在他们主页上一直没有找到想要的代码,有的也只有一部分,能否将基于图的半监督分类的算法发给我一些,谢谢您了,我的邮箱是gaxinteng2010@163.com

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

急冲冲(游客)发表评论于2010-7-1 11:10:04

可以把tsvm、generate model等算法的程序发我一份么?我的邮箱是usforce@163.com,刚刚开始学习,希望能得到你的指导,谢谢啦~~

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

随机(游客)发表评论于2010-6-23 15:25:43

能发个源代码吗?hit_tlg@126.com谢谢了!

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


回复:Semi-Supervised Learning(半监督学习)
网上资源,  心得体会

fafa(游客)发表评论于2010-6-3 14:15:22

能给我发个TSVM的源码吗?不甚感激~ 我的邮箱是xgqu@163.com

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
 


» 1 2 3 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.063 second(s), page refreshed 143877254 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号