新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 中文XML论坛 - 专业的XML技术讨论区W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → [求助]难以理解的WordNet 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 33591 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [求助]难以理解的WordNet 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客楼主
    发贴心情 [求助]难以理解的WordNet

    WordNet大名鼎鼎,诸位想必都不陌生。我刚刚接触这种特殊的词典,发现原来它竟然有多种文件格式供选用,这一点着实让我高兴了一把。在读了《Thinking XML: 查询 XML 格式的 WordNet》http://bbs.w3china.org/dispbbs.asp?boardID=25&ID=15011之后,问题也随之而来,那就是从实际使用的角度(或者说进行语义推理的角度)考虑,哪种文件格式的Wordnet更适合、效率更高呢?请诸位前辈多多指教,谢谢!

       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/7 17:08:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客2
    发贴心情 
    和文件格式无关,wordnet是作为词库存在,和输入输出的文件格式有什么关系?文件格式和性能是无关的,当数据比较大的时候,主要的计算的任务肯定不是文件的输入输出,这一点完全可以忽略。你手里有什么格式就用什么格式好了。

    打个比方,一篇文章是txt格式,另外一篇是doc格式,还有一个pdf格式,都只有同样内容的文本,所以你喜欢看哪个都完全随你。

    p.s. wordnet可不是什么特殊的词典

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/9 15:00:00
     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客3
    发贴心情 
    原来是这样!感谢王大哥的热心解答。我原以为这种文件格式较多的工具在使用时会受到文件描述方式的制约呢!既然如此,我也就放心了。
    我之所以说它特殊,是因为它的编撰方式和普通词典不同,是按同义词集编排而非字母表顺序,呵呵!

    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/9 15:34:00
     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客4
    发贴心情 
    我对比了能查到的所有WordNet的RDF版本,果然有不少。包括WordNet工作组的《WordNet2.0 in RDF/OWL》;史帝夫•瑞德(Steve Reed)基于WordNet2.1转换的Texai;由谢尔盖•梅尔尼克(Sergey Melnik)和斯蒂芬•德克尔 ( Stefan Decker)开发了WordNet的RDF表示和本体定义术语版;普林斯顿大学也在WordNet工作组的版本基础上提出了自己的WordNet RDF。
    可是谢尔盖•梅尔尼克(Sergey Melnik)和斯蒂芬•德克尔 ( Stefan Decker)没有找到下载链接;除此之外,其他版本结构大相径庭,WordNet工作组版只有3个文件,但是最大的有90M!普林斯顿大学版都是些细小的文件,最大不过二十几兆;Texai也有多个文件。
    我越来越闹不清它们对WordNet的拆分原则是什么,用于推理(比如采用Jena作为推理机)哪个更适合?(或者说更常用?)各位先行者对诸多WordNet的RDF版本有何看法,欢迎莅临指导,小可不胜感激。

    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/10 17:17:00
     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客5
    发贴心情 
    WordNet的各种RDF版本中,有的分的文件很多,每个都很小。或许这样的文件布局方式能够加速推理吧。如果使用较大的RDF文件时采用什么样的推理方法更好呢?难道需要自行拆分之后再使用吗?大家有什么好方法或建议呢,小可洗耳恭听。

    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/14 10:23:00
     
     loveunk 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:16
      积分:155
      门派:W3CHINA.ORG
      注册:2008/3/26

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给loveunk发送一个短消息 把loveunk加入好友 查看loveunk的个人资料 搜索loveunk在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看loveunk的博客6
    发贴心情 
    同关注,我也是需要wordnet和jena一起使用

    以下是引用Humphrey在2008-11-10 17:17:00的发言:
    我对比了能查到的所有WordNet的RDF版本,果然有不少。包括WordNet工作组的《WordNet2.0 in RDF/OWL》;史帝夫•瑞德(Steve Reed)基于WordNet2.1转换的Texai;由谢尔盖•梅尔尼克(Sergey Melnik)和斯蒂芬•德克尔 ( Stefan Decker)开发了WordNet的RDF表示和本体定义术语版;普林斯顿大学也在WordNet工作组的版本基础上提出了自己的WordNet RDF。
    可是谢尔盖•梅尔尼克(Sergey Melnik)和斯蒂芬•德克尔 ( Stefan Decker)没有找到下载链接;除此之外,其他版本结构大相径庭,WordNet工作组版只有3个文件,但是最大的有90M!普林斯顿大学版都是些细小的文件,最大不过二十几兆;Texai也有多个文件。
    我越来越闹不清它们对WordNet的拆分原则是什么,用于推理(比如采用Jena作为推理机)哪个更适合?(或者说更常用?)各位先行者对诸多WordNet的RDF版本有何看法,欢迎莅临指导,小可不胜感激。

    ----------------------------------------------
    hs1107033#gmail.com http://www.iamqiwen.cn/

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/14 20:13:00
     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客7
    发贴心情 
    似乎现在用WordNet作知识库的同志很少,也有可能真的随便选一个用就行。总之到目前为止,这个问题还是没有人理会。
    不过我始终这么想:既然不同的机构将WordNet拆分成不同的形式肯定有其用意,否则直接用就是了。一定是针对了某种问题或对某种情况有利,但是现在我仍然无法确定。相关内容过多(还有找不到的),逐个看下来时间不允许啊!

    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/16 16:05:00
     
     beyondlei 帅哥哟,离线,有人找我吗?天秤座1982-9-24
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:69
      积分:644
      门派:XML.ORG.CN
      注册:2007/8/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给beyondlei发送一个短消息 把beyondlei加入好友 查看beyondlei的个人资料 搜索beyondlei在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看beyondlei的博客8
    发贴心情 
    以下是引用iamwym在2008-11-9 15:00:00的发言:
    和文件格式无关,wordnet是作为词库存在,和输入输出的文件格式有什么关系?文件格式和性能是无关的,当数据比较大的时候,主要的计算的任务肯定不是文件的输入输出,这一点完全可以忽略。你手里有什么格式就用什么格式好了。

    打个比方,一篇文章是txt格式,另外一篇是doc格式,还有一个pdf格式,都只有同样内容的文本,所以你喜欢看哪个都完全随你。

    p.s. wordnet可不是什么特殊的词典


    同意版主的说法, 文件格式和性能应该是无关的,用哪种格式完全是个人选择,当然可能和你使用的编程接口也有一定的关系,以前我用过lucene index形式的wordnet,这样可以直接通过lucene API访问,网上有个把一般格式的wordnet转换成lucene index小程序,网址忘了,好像wordnet网站上有链接。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/17 3:02:00
     
     Humphrey 帅哥哟,离线,有人找我吗?狮子座1981-7-23
      
      
      威望:1
      等级:研二(搞定了DL,再搞定F-Logic!)
      文章:937
      积分:5743
      门派:W3CHINA.ORG
      注册:2008/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Humphrey发送一个短消息 把Humphrey加入好友 查看Humphrey的个人资料 搜索Humphrey在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Humphrey的博客9
    发贴心情 
    原来是这样,就是说如果想先用Jena进行推理就选择一个RDF格式的WordNet就行了?
    我头一次接触这些工具,所以提出的问题似乎傻了一些。之所以有此问是因为我想把推理机对WordNet的推理结果用于组织其它材料,例如文本或索引一类的东西。
    另:如楼上所言,在Lucene中直接调用WordNet是实现一定的智能检索功能吗?如果确实如此,是否可以把推理机省略而直接用Lucene实现了呢?

    ----------------------------------------------
    鸿丰

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/17 9:29:00
     
     beyondlei 帅哥哟,离线,有人找我吗?天秤座1982-9-24
      
      
      威望:1
      等级:大三(研究MFC有点眉目了!)
      文章:69
      积分:644
      门派:XML.ORG.CN
      注册:2007/8/9

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给beyondlei发送一个短消息 把beyondlei加入好友 查看beyondlei的个人资料 搜索beyondlei在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看beyondlei的博客10
    发贴心情 
    我用的时候主要就是用它找近义词,比如 person 可以找到 individual, someone, somebody, mortal, soul。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008/11/17 15:53:00
     
     GoogleAdSense天秤座1982-9-24
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/9 22:43:13

    本主题贴数33,分页: [1] [2] [3] [4]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    2,218.750ms