本站首页    管理页面    写新日志    退出


«December 2025»
123456
78910111213
14151617181920
21222324252627
28293031


公告
暂无公告...

我的分类(专题)

日志更新

最新评论

留言板

链接


Blog信息
blog名称:
日志总数:3
评论数量:9
留言数量:0
访问次数:29212
建立时间:2005年7月2日




[我的收藏][收藏]关于[B]语义标注[/B]的一些个人思考,欢迎大家讨论 -- 作者:npubird
文章收藏

pglin 发表于 2005/7/2 16:49:50

本文转载自W3CHINA.ORG讨论区(BBS.W3CHINA.ORG)   原文链接作者:npubird以下为原文:关于[B]语义标注[/B]的一些个人思考,欢迎大家讨论最近,由于写东西的需要,需要对语义标注做一些考虑,因此,便有如下初稿中的一点想法,望各位同学各抒己见,发表自己对语义标注的看法。 在本体的建模阶段,大部分的建模工作都集中在领域知识的抽象表示上,即发现领域内的概念、概念的继承层次、潜在的关系和公理等。对于领域中的实例,在建模时一般不需要考虑它们,除非建模时就能确定该本体所涉及的所有实例。实际上,通常的本体都具有一定的通用性,表示特定领域内的知识,但由于领域内可能的实例数目无穷无尽且动态变化,因此,只有本体和一个具体的应用结合时考虑实例才有意义。将现实应用中涉及的实例和抽象的本体概念相联系,这正是语义标注(Semantic Annotation)所要做的工作。和数据库类比,语义标注就如同为建立好的数据库表添加具体的纪录。从语义Web的角度来看,在传统Web上添加语义信息,将Web的状态从机器可读提高到机器可理解,这是整个语义Web实现的基础。通常,这种语义信息的添加是基于本体进行的,称之为语义标注。语义标注将推动语义Web走向实际应用,智能Agent能够根据Web上的语义信息实现智能推理任务,并能提高信息检索的精确性。如果将本体看作简化了的知识库,那么从本体的角度来看,添加实例,即进行语义标注,可视为丰富本体的过程。如果站在语义Web的角度来看,语义标注便是语义信息的发布过程:用户依据一定的本体,为页面添加语义信息。然而,语义Web中的标注问题由于受到多方面因素的影响,变得很复杂。一部分人希望语义Web上的语义信息能像页面本身的创建一样,由用户来完成,因为任何机构都不可能完成如此庞大的语义标注任务。这样一来,任何用户都能够选择或创建自己喜好的本体,并利用它们来标注页面。这些本体的规模通常是小型的。目前的很多研究者都支持这种观点,它们认为语义Web将建立在无数的小本体之上,正如Rousset在ISWC2004大会上的特邀演讲中所说的:“Small can be beautiful in the Semantic Web”[Rou04]。但这种观点的缺点也很明显:大量的小本体往往是异构的,这将造成在使用语义信息的过程中需要频繁执行处理本体异构的操作,给应用系统带来沉重的负担。为了克服第一种观点的缺陷,一部分人希望某些大型的机构能提供一些权威而通用的大本体,让用户在标注的过程中使用。但这样做也同样会导致很多问题:首先,本体的提供者如果被少数机构垄断,那将大大限制了用户表达自己思想的自由,Web从此失去了它与生俱来的自由本质;其次,目前的研究已经表明,创建涵盖人类多个方面知识的大规模本体极其困难,而又要让这样的本体得到Web用户的公认,这个目标更难以达到;最后,也是最重要的问题是:什么机构或组织能提供这样的本体呢?W3C还是ISO?Google还是Yahoo?美国国家标准局还是中国国家标准局?这种本体的标准之争必然会涉及到不同国度、历史背景和文化,很难有一个最终的结果。在我们看来,上述两种观点都过于极端,切实可行的标注方案应该是二者的折中,既要保证标注的本体具有一定的通用性,又要保证它能满足用户的要求。涉及专业领域的本体可由领域中的权威机构统一制定,如医学中的UMLS本体,而涉及文化冲突的本体制定时可以考虑多个版本。因此,对语义Web来说,语义标注不仅仅是一种技术,更是一种文化。语义标注技术也碰到了经典的“鸡与蛋”的问题:一方面通常的网页创建者很不愿意为创作的网页内容提供语义标注,除非他亲自感受到那样做所带来的巨大好处;另一方面只有大规模的语义标注数据存在,并在Web上实现优于现有技术或现有技术不能解决的应用,才可能有更多人或团体愿意提供语义标注。最后,在语义标注过程中通常既要保证个人的观点,又要比较权威的专家的意见,而且还需要大量本体来满足不同用户的需求;某些用户仅希望通过标注来更快地找到标注对象所对应的网站,而那些本身知道链接的高层用户还要求进一步获得关于标注对象的更精确的描述。作为语义Web的基础,很多研究机构都对其进行了深入的研究,但并没有取得根本性的进展。至今,语义标注仍然是语义Web实现的瓶颈问题。 [此贴子已经被作者于2005-6-15 10:11:42编辑过]<完>参与讨论本主题


阅读全文(4755) | 回复(0) | 编辑 | 精华
 



发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.438 second(s), page refreshed 144824195 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号