以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  (第1期@Semantic Web专题讨论) 究竟什么是Semantic Web,它有什么标志特征?它能给我们带来什么?[已结束,附黄智生老师的专家点评]  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=69324)


--  作者:admin
--  发布时间:11/10/2008 1:24:00 PM

--  (第1期@Semantic Web专题讨论) 究竟什么是Semantic Web,它有什么标志特征?它能给我们带来什么?[已结束,附黄智生老师的专家点评]

-------------------------

本期讨论已结束,感谢大家参与。

点击这里查看黄智生老师的专家点评

-------------------------

栏目说明:今年是Semantic Web构想诞生十周年。1998年,Tim Berners-Lee首次非正式提出(http://www.w3.org/DesignIssues/Semantic.html)Semantic Web的概念;2000年,Tim首次在正式场合(XML2000大会)上向大家介绍了Semantic Web的概念;接着,2001年,Tim首次正式写文章讲述了Semantic Web,也就是大家所熟知的发表于《科学美国人》上的文章。

从2003年W3China论坛成立至今,在Semantic Web版 发过言 的用户,已经超过4000名(发广告、垃圾贴的不算),Semantic Web版的主题数有5700多。经过这么多年的讨论,相信大家对于Semantic Web都形成了自己的理解和看法,因此我们不妨把一些重要的、受关注的问题拿出来进行专题讨论。

每期专题讨论设置一个话题。专题讨论结束后,我们将对大家的看法与观点进行收集整理,然后邀请有关专家进行点评和总结。

希望大家踊跃发言。即便说错什么,稍后会有专家为你指出,大家不要错过这么好的学习机会。

-------------------------------------------------------------------------------

* * *  第1期@Semantic Web专题讨论 * * *
本期论题:究竟什么是Semantic Web,它有什么标志特征?它能给我们带来什么?
(同时征集下一期论题题目)

-------------------------------------------------------------------------------


[此贴子已经被作者于2010-8-8 21:26:37编辑过]

--  作者:雪褥织影
--  发布时间:11/10/2008 6:22:00 PM

--  
抛砖引玉一下吧
*仅代表个人观点,与实验室观点无关

语义Web包罗万象,但个人认为最实用的仍是RDF模型,这个东东用于数据集成确实很方便。先抛开查询效率不谈,对于N个数据集的数据,只要一个triple store就可以搞定,很舒服。当然,集成中面临的其它问题仍然有待解决,比如co-reference,不过单单这种三元组的数据组织形式还是非常promising。如果我向别人介绍SW,大概就两点:URI+三元组


--  作者:lanting1018
--  发布时间:11/10/2008 7:34:00 PM

--  
我理解的Semantic Web就是为了使web更加“人性化”而对其加入“知识”的“学习”能力。
   问一个比较弱的问题:提到Semantic Web就会提到本体,而现在所提到的本体都是针对的某一领域而言的本体,或者说叫领域本体。那作为一个能够替代甚至超越现在的传统WEB的Semantic Web到底要描述多少领域本体才能满足我们的需要。只有得到足够的“知识”支撑semantic Web才能满足人们的需要,而“足够的知识”则需要足够多的对“领域”的本体描述。不知道我理解的又没问题。希望各位朋友专家指正。
--  作者:雪褥织影
--  发布时间:11/10/2008 8:19:00 PM

--  
以下是引用lanting1018在2008-11-10 19:34:00的发言:
我理解的Semantic Web就是为了使web更加“人性化”而对其加入“知识”的“学习”能力。
    问一个比较弱的问题:提到Semantic Web就会提到本体,而现在所提到的本体都是针对的某一领域而言的本体,或者说叫领域本体。那作为一个能够替代甚至超越现在的传统WEB的Semantic Web到底要描述多少领域本体才能满足我们的需要。只有得到足够的“知识”支撑semantic Web才能满足人们的需要,而“足够的知识”则需要足够多的对“领域”的本体描述。不知道我理解的又没问题。希望各位朋友专家指正。

我觉得是这样:一般来说确实是一个领域一个本体(当然也有一些上层本体比如SUMO,或者一些庞大的多领域本体比如OpenCyc)。但对于一个特定的应用来说,比如一个具体的website或者application,一般一个本体就够了,因为往往只是针对一个领域。牵扯到两者数据交换的时候,也总共两个本体就够了。最难的就是search engine,可能需要知道所有的本体

其实,语义网上的本体已经多到超乎人的想象了,至少是几k级别的,对于大部分应用已经可以找到现成的本体了,或者基于现有本体简单扩展就可以了,因此本体的数量应该不是问题。而且,一旦语义网的价值得到工业界的承认,我想高质量的本体一定会喷涌而出


--  作者:admin
--  发布时间:11/10/2008 8:43:00 PM

--  

第一个问题:究竟什么是Semantic Web,它有什么标志特征?

严格地讲,Semantic Web这个词的本义指的是下一代World Wide Web。但平常我们说Semantic Web,很多时候指的是Semantic Web技术或采用Semantic Web技术的应用。

所以下面我准备分别来谈。

什么是Semantic Web?按照W3C的最初定义,Semantic Web是当前Web的扩展,信息被给予良好定义的含义,从而人与计算机可以更好的协作;2006年3月后,W3C将Semantic Web定义为web of data。

什么是Semantic Web应用?我觉得,并不是说你用RDF或OWL了,就算SW应用了。评判一个应用是否算SW应用,应该看它是否采纳了SW的思想。那么SW的思想是什么呢?我觉得SW的核心思想可以分为两个方面:一个是semantics,一个是web。语义(semantics)指的是提供能被计算机“理解”的数据。这里“理解”打了引号,意思是说,计算机并不是真的理解,而是较没有语义而言,“理解”能力提高一个层次。网(web)指的是那些语义数据不是孤立存在的,而是彼此互连,形成一个网状结构,这样可以扩大计算机的“理解”范围。

现在我们来看在万维网(WWW)环境下,“语义”和“网”分别对应哪些技术元素。

(1)语义(semantics)方面:

首先得有一个语义表达模型。它可以简单,也可以复杂,只要能达到“让计算机的‘理解’能力提高一个层次”就算达标了。因此,最简单的、语义极弱的tag,以及RDF都可以作为语义表达模型,只不过它们各自提升计算机‘理解’能力的程度不同罢了。

有了语义表达模型,相当于规定好了表达语义的语法。然而,即便有共同的语法,如果大家采用的词汇五花八门,计算机的理解能力就仅能限于分辨语法成分(比如,在采用RDF模型的应用里,计算机只能分辨谁是subject、谁是property、谁是object)因此,为进一步提升计算机的“理解”能力,我们可以增加一个本体层,来定义概念及概念之间的关系。同样地,本体可以简单,也可以复杂,只要是定义了概念和/或概念之间的关系就算达标了。因此,最简单的、仅有概念定义的词汇表、仅包含上下位关系定义的分类树、以及描述能力齐全的OWL都可以作为本体来用。

(2)网(web)方面:本质上是用URI来唯一标识资源的。

综上所述,我认为Semantic Web应用的标志特征为:符合以上(1)(2)的应用。

第二个问题:Semantic Web能给我们带来什么?

条条大路通罗马,你不采用Semantic Web技术照样能实现丰富多彩的应用,只是有时可能会辛苦一点。Semantic Web技术将为我们提供的是一种“语义计算”基础设施,有了这个语义计算基础设施,你就可以专注于业务功能的实现,而把“语义互操作”的任务(比方说,最简单的,解决同义词或近义词的问题)交给这个基础设施完成。这样一来,把语义层面从业务逻辑中脱离出来,从而令你的应用具有更好的可扩展性、灵活性及松耦合性。

[此贴子已经被作者于2008-11-10 21:53:40编辑过]

--  作者:wzf63
--  发布时间:11/10/2008 10:10:00 PM

--  
对语义web存在一点疑问。个人觉得语义网现在最大的作用是让计算机能够“理解”网页内容的真实含义(就所谓的语义吧),因为人类是可以完全理解的。这里“理解”也只是一种形象的说法了,因为计算机不像人一样能够思考,所有的内容都是靠人输入的。将现在的web变成语义web是一个正确的思路,但其效果是否如现在所讨论的那样好,就不得而知了。目前人类自身语言交流就存在障碍,我想计算机之间实现语义交流应该更难吧?但并不是说一定不能实现,只是说现在大家都在讨论这个热门的东西的时候,似乎偏离了其大的方向,更多的只是考虑技术细节,而忽视了原则性问题。目前的情形是,大家都在建本体和语义网,结果是建了多个相同领域本体(重复劳动)却无法共享(既然都不能共享还怎么交流)、建了语义网计算机之间还是不理解(因为各用各的本体),那么我们创建他们做什么呢?研究10年了,不知道大家有没有看到一点点实际的效果。
--  作者:admin
--  发布时间:11/10/2008 11:21:00 PM

--  
以下是引用wzf63在2008-11-10 22:10:00的发言:
对语义web存在一点疑问。个人觉得语义网现在最大的作用是让计算机能够“理解”网页内容的真实含义(就所谓的语义吧),因为人类是可以完全理解的。这里“理解”也只是一种形象的说法了,因为计算机不像人一样能够思考,所有的内容都是靠人输入的。将现在的web变成语义web是一个正确的思路,但其效果是否如现在所讨论的那样好,就不得而知了。目前人类自身语言交流就存在障碍,我想计算机之间实现语义交流应该更难吧?但并不是说一定不能实现,只是说现在大家都在讨论这个热门的东西的时候,似乎偏离了其大的方向,更多的只是考虑技术细节,而忽视了原则性问题。目前的情形是,大家都在建本体和语义网,结果是建了多个相同领域本体(重复劳动)却无法共享(既然都不能共享还怎么交流)、建了语义网计算机之间还是不理解(因为各用各的本体),那么我们创建他们做什么呢?研究10年了,不知道大家有没有看到一点点实际的效果。

如前所述,计算机的理解能力实际上并非真正意义上的“理解”。举个例子:
A是B的一种;我想购买一个B;现在C商店里有A卖;
如果把以上信息交给计算机,那么它能得出:请去C商店买A。这里的ABC是可以自己往里代的。可见,计算机并非真正理解。

至于你说的第二个问题,目前的确存在着很多的本体,他们质量良莠不齐,而且很多是重复劳动。我觉得出现这种现象,有这几个原因:
1)目前SW应用还处于起步阶段,大家都还在摸索着如何建本体,所以就出现了这么多本体。但随着时间的发展,最终会有高质量的本体脱颖而出、得到大家认可、并广为使用的。这需要一个过程。就如同Wiki第一次出现在网上的时候,大家都很好奇,不知道怎么用,于是出现了很多垃圾内容,但随着大家逐渐熟悉掌握了这个新事物,渐渐地大家就懂得按规则使用它了。
2)实现SW需要慢慢来,一开始就放到Internet规模上去实现,是不太现实的。目前很多机构都在内部尝试实现SW,等他们逐渐积累起经验之后,在Internet规模上实现SW便有了可供参考的经验。



--  作者:Humphrey
--  发布时间:11/11/2008 10:58:00 AM

--  
语义网就是代入可供计算机处理的语义信息的万维网。
目前的语义网的标志性特征是“有意义且计算机可处理的标识(语义标注)”和/或“计算机的理解力(知识库+推理引擎)”。
语义网带给人们的不会是一种翻天覆地的变化,至少在可以预见的十几年或几十年中语义网不会太多地影响万维网的生存状态。语义网技术通过模拟人的思维方式来获得机器的“理解力”,而事实上计算机却仍然无法理解人类的语言,仅仅通过人为制定的规则,固定的知识库进行完全程式化的推理。(当然,现在有计算机自主学习的研究,不过暂时也未能带来实质性变化。)用现行技术实现语义网的人们只能更多地寄希望与将人类语言向机器可读模式进行转化(增加语义标注)和尽可能使用/制作适合本领域的知识库以适应推理引擎工具。
我们的语义网实质是万维网到智能互联网的过渡阶段,也是初级阶段,而且这一阶段将持续较长的时间。在我们目前的计算机硬件架构之下,我们能做的仍然相当有限(超级计算机除外)。或许只有在类神经结构的新体系计算机(或者说生物计算机,不知道这样说是否合适)问世之前,我们只能选择“提取——模拟——应用”这样一条道路,尽量增加计算机对网络信息的操作能力,努力改善用户体验。而研究未来语义技术的先锋们遭遇的最大问题不是技术的优越性,而是远水不解近渴。
(以上内容,均属个人观点;如有雷同,不胜荣幸。)


[此贴子已经被作者于2008-11-12 9:45:34编辑过]

--  作者:leopard
--  发布时间:11/11/2008 11:42:00 AM

--  
semantic web,原先是希望semantic on top of (old) web,这也就是早期的一种观点,a little semantics goes a long way。而现在,随着semantic web的发展,可能需要改变一下观点,变成(new) web on top of semantic,也就是利用semantics的技术,重新构建web的基本体系结构(主要体现在URI和带语义标签的hyperlink),建立一个全新的web。

目前的实际应用,我个人觉得,至少在数据库方向,还是更看重semantic,希望通过建立表达能力更强的本体,为数据集成和管理提供一个新的解决方法。具体的应用主要表现在global view、data warehouse、OLAP等等方面,由于数据库领域特有的封闭精神,基本上不关心URI的问题,因为原本他们就不想把数据公开给其他人看和使用。而对于semantic的理解,最核心的就是DLP。DLP是介于OWL Lite和DL之间的一个表达能力,由于和Datalog、logic programming、Horn子句、rule等具有(至少是syntatic)兼容性,所以被广泛的采用和研究。


--  作者:daximen
--  发布时间:11/11/2008 2:27:00 PM

--  
我的理解就是一个 better web.
举个实际生活的例子,冬天到了,我打算去京东商城(360buy.com)买个暖手器,结果搜到了收线器,驱蚊器。。。本来以为这个购物网站在北京地区还算不错呢,结果使用的体验很一般。如果可以采用一些语义web的技术,希望它能帮助我减少人工检索的工作量,我的要求似乎不算高吧:)概念炒得那么热,技术搞得特新只能让人疲于应付,恰到好处的应用才能直抵人心,印象深刻。
Mark Weiser 说过的两句话很中肯:The most profound technologies are those
that disappear. They weave themselves into the fabric of everyday life until they
are indistinguishable from it.


--  作者:雪褥织影
--  发布时间:11/11/2008 4:46:00 PM

--  
其实,虽然extension of the current Web这一说法被换成了Web of data,然而现在看起来工业界对于Web of data的接受程度是很低的,更多的认识仍停留在extension of the current Web。所以RDFa能够迅速得到工业界的认同并开始被使用,当然这也与它相对而言在部署上的简洁性有关。Semantic Web想做的事情太多了,这也一定程度上阻碍了它自身的推广,也许Semantic Web这个大的目标(可能谁也说不全这个大目标究竟是什么)终究难以实现,最终沉淀下来的无非是一些技术元素的广为使用,譬如RDF(a)等等
--  作者:yezhunan3h
--  发布时间:11/11/2008 5:47:00 PM

--  
但是RDF只实现了数据表述的准确性(于是方便了推理),但是我认为像Powerset那种NLP的设计也是属于SW的,哲学一点讲,NLP代表经验主义(统计嘛),OWL代表唯理主义(推理嘛),最终认识世界还是要把两者结合起来的,于是现在有人研究ontology learning(其实早就有,但是用在text retrival上),把这个思想加在semantic learning on web.
--  作者:baojie
--  发布时间:11/13/2008 11:12:00 AM

--  
我的看法比较极端。我觉得RDF和OWL在很大程度上,阻碍而不是促进了语义网的实现。语义网的核心精神,在我看无非是web数据的结构化和一定形式的推理。在当前的技术条件下,我觉得 tagging + 分类树 + 弱关系表(如RSS之类)是最可能大规模实现的。

我还觉得有必要把领域本体的研究,e-science的研究等等和语义网区别开来。这些方面的工作更接近于以往的知识库方面的工作,工作重心,方法,目的,都是和语义网有重大区别。OWL 2的失败(大胆的预言一下),就在于其设计是面向领域本体开发而不是真正的语义网应用。

我认为面向终端用户的小型工具,比如联系人,比如email tagging,比如任务管理,比如书签管理,比如手机号码管理,是语义网最好的切入点之一。我反对任何需要用户有RDF或SPARQL知识的工具。

我个人是semantic wiki的狂热支持者。我觉得基于semantic wiki做semantic intranet要比semantic web靠谱得多。

也许十年之后semantic web能成功吧(标志就是有一个主营semantic web的公司进NASDAQ)--希望我是太保守。


--  作者:yezhunan3h
--  发布时间:11/13/2008 1:02:00 PM

--  
补充之前的
现在很多人把RDF这种对资源的准确化表述模型等价为对信息搜索时的准确化是错误的,RDF的准确只是为了逻辑推理,所以掩着RDF这条路走下去的目标是能过推理出新的内容,但是也在KB之内,这样就等于对RDF对资源进行第一层定位之后第二层还是传统的IR,而且这样后反而使第一层成为了速度上的瓶颈,所以把RDF这条路用于SW上就根本不能做成理想化的SW.

PS:昨天乱想,能否这样进行逻辑消解:逻辑->自动机->群(作群计算)->自动机->逻辑..


--  作者:loveunk
--  发布时间:11/13/2008 3:05:00 PM

--  
本人初学,按我的理解

语义网应该是和现在的html等标记的数据格式不同的,可以很好的被解析并且被机器理解的网络数据存储格式。


--  作者:雪褥织影
--  发布时间:11/14/2008 12:19:00 PM

--  
以下是引用baojie在2008-11-13 11:12:00的发言:我反对任何需要用户有RDF或SPARQL知识的工具。

即便底层是RDF+SPARQL,用户未必需要知道这些
好比现在大家在论坛上发帖子,或者写blog,底层是HTML+SQL,但是我们并没有直接编辑HTML页面,更没有直接写SQL语句
现在只是缺乏易用的RDF数据发布方式,设想有朝一日Dreamweaver内置了一些常用的class/property,并且能够允许用户方便地设计RDF(a)的时候,语义网必将迅速普及


--  作者:雪褥织影
--  发布时间:11/14/2008 12:23:00 PM

--  
以下是引用yezhunan3h在2008-11-13 13:02:00的发言:
RDF的准确只是为了逻辑推理

我不认为RDF与推理有关,只是后来的RDFS和OWL让推理成为可能而已
RDF本身主要就是为了方便交换数据,仅此而已,今后的SW apps是否具备推理能力只是一个optional的事情,先通过RDF把数据“连”起来,或者至少具备连起来的可能,可能更加重要


--  作者:baojie
--  发布时间:11/14/2008 2:36:00 PM

--  
[b]以下是引用雪褥织影在2008-11-14 12:19:00的发言:
即便底层是RDF+SPARQL,用户未必需要知道这些
好比现在大家在论坛上发帖子,或者写blog,底层是HTML+SQL,但是我们并没有直接编辑HTML页面,更没有直接写SQL语句
现在只是缺乏易用的RDF数据发布方式,设想有朝一日Dreamweaver内置了一些常用的class/property,并且能够允许用户方便地设计RDF(a)的时候,语义网必将迅速普及

semantic wiki就是这样的一种工具. Dreamweaver如果能支持RDF(a),当然是最好不过了. 不过它为什么要支持呢? 如何说服这些厂家来支持呢?

说个最简单的例子, gmail的label不支持分类树, 尽管非常多的用户呼吁这种功能. Google这么做,相比不是没有想到, 也想必不是没有技术条件. 它为什么不做呢? Google不是傻瓜, 这里面一定是有原因的.


--  作者:iamwym
--  发布时间:11/15/2008 8:26:00 PM

--  
以下是引用雪褥织影在2008-11-14 12:19:00的发言:
[quote]以下是引用baojie在2008-11-13 11:12:00的发言:我反对任何需要用户有RDF或SPARQL知识的工具。[/quote]

即便底层是RDF+SPARQL,用户未必需要知道这些
好比现在大家在论坛上发帖子,或者写blog,底层是HTML+SQL,但是我们并没有直接编辑HTML页面,更没有直接写SQL语句
现在只是缺乏易用的RDF数据发布方式,设想有朝一日Dreamweaver内置了一些常用的class/property,并且能够允许用户方便地设计RDF(a)的时候,语义网必将迅速普及


基本不同意,设置这些东西不是dreamwaver的事情


--  作者:iamwym
--  发布时间:11/15/2008 8:30:00 PM

--  
以下是引用baojie在2008-11-14 14:36:00的发言:
[quote][b]以下是引用雪褥织影在2008-11-14 12:19:00的发言:
  即便底层是RDF+SPARQL,用户未必需要知道这些
  好比现在大家在论坛上发帖子,或者写blog,底层是HTML+SQL,但是我们并没有直接编辑HTML页面,更没有直接写SQL语句
  现在只是缺乏易用的RDF数据发布方式,设想有朝一日Dreamweaver内置了一些常用的class/property,并且能够允许用户方便地设计RDF(a)的时候,语义网必将迅速普及
[/quote]

semantic wiki就是这样的一种工具. Dreamweaver如果能支持RDF(a),当然是最好不过了. 不过它为什么要支持呢? 如何说服这些厂家来支持呢?

说个最简单的例子, gmail的label不支持分类树, 尽管非常多的用户呼吁这种功能. Google这么做,相比不是没有想到, 也想必不是没有技术条件. 它为什么不做呢? Google不是傻瓜, 这里面一定是有原因的.


我现在知道为什么了,普通用户非常讨厌的就是树形结构,请注意是普通用户而不是具有计算机知识的用户。这也是为什么windows不把默认的文件夹结构列为树形的原因。windows explorer边缘化就是一个例子。树形结构非常片面不直观,HCI非常忌讳这点。

所以基本上ontology不可能是普通用户能够直接交互的对象。


--  作者:iamwym
--  发布时间:11/15/2008 8:39:00 PM

--  
我从两个角度说说我的看法。

首先是表面一点的:
sw最大的好处在我看来是信息集成,对于开发者来说,应该是一个福音,特别是数据管理方面的开发。设想一下,所有的数据都有semantic metadata,这样子查询和管理,扩展,都要比现在的关系数据模型要容易上不少,特别在实际应用当中,往往一个企业有来自于不同地方的数据,有五花八门的格式,如果都转换了放在数据库里,好几年可能用不到可是也不能删除,成本很高,用ontology注释一下,按需转换调用,可以降低不少成本。

另外,基本同意baojie的看法,owl极大制约sw的发展,数理逻辑为主表达力的研究方向完全是个joke,除了对学术界有意义对工业界看不出任何好处。而semantic wiki是个不错的方向,个人觉得对于小企业来说简直是个节约钱的大福音,内部信息系统和项目管理基本上直接用wiki就行了,如果有公司运作了好一点,SAP基本就不要打500人以下企业的念头了。


--  作者:iamwym
--  发布时间:11/15/2008 8:48:00 PM

--  
第二个角度,就是本质上看sw:

基本上来说,计算机在世界上的应用,三点:save time, save money, have fun,对于个人用户,电脑有趣好玩增加生活乐趣是主要的,节约时间和金钱是附加的好处。而对企业来说,时间和金钱就是至关重要的,所以才有了microsoft, sap等等办公自动化软件企业。SW也不例外,业界为什么开始逐渐考虑使用这个技术,或者概念,就是为了节约成本,增加效率,就如我楼上一帖所说,我作为一个开发人员,了解感受到了对于我们开发人员的便利,于是,企业开始实施了。

至于其他方面,semantic search,ontology expressivity,ontology annotation,等等华丽的技术和nb的论文,在其证明它能够切实地为企业提高效率节约成本之前,我看企业是不会对其感兴趣的。而学界烧钱也不在乎其研究方向和发paper的动力,研究sw到现在,我觉得就已经够本了。



--  作者:iamwym
--  发布时间:11/15/2008 8:51:00 PM

--  
以下是引用wzf63在2008-11-10 22:10:00的发言:
对语义web存在一点疑问。个人觉得语义网现在最大的作用是让计算机能够“理解”网页内容的真实含义(就所谓的语义吧),因为人类是可以完全理解的。这里“理解”也只是一种形象的说法了,因为计算机不像人一样能够思考,所有的内容都是靠人输入的。将现在的web变成语义web是一个正确的思路,但其效果是否如现在所讨论的那样好,就不得而知了。目前人类自身语言交流就存在障碍,我想计算机之间实现语义交流应该更难吧?但并不是说一定不能实现,只是说现在大家都在讨论这个热门的东西的时候,似乎偏离了其大的方向,更多的只是考虑技术细节,而忽视了原则性问题。目前的情形是,大家都在建本体和语义网,结果是建了多个相同领域本体(重复劳动)却无法共享(既然都不能共享还怎么交流)、建了语义网计算机之间还是不理解(因为各用各的本体),那么我们创建他们做什么呢?研究10年了,不知道大家有没有看到一点点实际的效果。

非常同意semantics under the web这个观点


--  作者:redchar
--  发布时间:11/15/2008 10:41:00 PM

--  
以下是引用iamwym在2008-11-15 20:39:00的发言:
我从两个角度说说我的看法。

首先是表面一点的:
sw最大的好处在我看来是信息集成,对于开发者来说,应该是一个福音,特别是数据管理方面的开发。设想一下,所有的数据都有semantic metadata,这样子查询和管理,扩展,都要比现在的关系数据模型要容易上不少,特别在实际应用当中,往往一个企业有来自于不同地方的数据,有五花八门的格式,如果都转换了放在数据库里,好几年可能用不到可是也不能删除,成本很高,用ontology注释一下,按需转换调用,可以降低不少成本。

另外,基本同意baojie的看法,owl极大制约sw的发展,数理逻辑为主表达力的研究方向完全是个joke,除了对学术界有意义对工业界看不出任何好处。而semantic wiki是个不错的方向,个人觉得对于小企业来说简直是个节约钱的大福音,内部信息系统和项目管理基本上直接用wiki就行了,如果有公司运作了好一点,SAP基本就不要打500人以下企业的念头了。


确实,以数理逻辑、推理为基础的技术现在要应用于工业界看起来非常之困难。经常看到在一个973课题组里,做工程的人一遇到做理论,做逻辑的就非常头大。这也是整个以数理逻辑为基础的形式化方法的一个弊端,就是很难实用,形式化规约、验证等技术还只是在硬件方面取得了小范围的成功,对于软件验证,现在还能做的还非常有限。对于基于逻辑的知识表示的方法到底能走多远,目前还是看不太清。。。或许轻量级的形式化是个比较好的折中策略。。。


--  作者:ideal0
--  发布时间:11/18/2008 8:53:00 PM

--  
说三点自己的理解。
1、SW不一定要做出什么一个可以实际应用的东西,就好比XML,当初很多人说这个可以替代HTML,但是现在呢?XML很好的和HTML融合在一起,XML更好的应用在一些软件和网站的配置上面。XML是否和人们的初衷一样呢?
2、OWL只是一个格式,比RDF丰富,但是OWL却限制了SW的研究,数理逻辑为主表达力的研究方向是个很头疼的问题,一阶逻辑和二阶逻辑不是一到二那么简单。要想改变,除非冯·诺伊曼体系做出重大修改。
3、semantic wiki是个很好的方向,目前很热门,web变成语义web,效果会怎么样?白马、王子、唐僧,计算机是理解不了的。我觉得还是建立丰富的本体,足够丰富,足够规范,这样才能起到效果。所以我觉得语义标注是目前的一个实用且明智的方向。

我的研究比较浅显,向大家学习,也希望大家指正。


--  作者:baojie
--  发布时间:11/25/2008 3:30:00 PM

--  
http://smw.referata.com/wiki/Minutes_for_November_22_2008_SMW_Users_Meeting_at_Monitor_Group#RPI_talks

最近semantic wiki开了个研讨会,大家可以看看一些slides


--  作者:wanggou
--  发布时间:12/9/2008 2:23:00 PM

--  
我怎么觉得上面这些讨论都很浮
说的问题又大又空
我也谈点看法
1. 数理逻辑是个很好的工具,并不是像上面的这些讨论者坚持的观点,只是它相对门槛高一些,不适合普通用户。这也是语义Web研究的一个重点,就是要化难为易,降低门槛。试想当年关系数据库刚提出的时候,关系演算那套理论也不是容易掌握的,即便到现在,懂得关系演算的人也并不多,但因为发明了SQL,因此关系数据库的使用走进了千家万户。
2. 语义Web的研究是分层递进的,基本是沿着Tim所指定的路线图在前进,我的认识是,目前的研究基本上已经推进到了Logic层,还是蛮快的。大家可以把重点放在这一层了。
--  作者:liuytliuyt
--  发布时间:12/9/2008 7:24:00 PM

--  
我认为在描述逻辑的基础上的ontology,是对客观世界的意义的一次逼近描述,但它并不能表达自然语言中的信息,当然我认为只有真正研究能够最大程度表达自然语言的逻辑才是我们的最终研究目标,现在世界上面对计算机中最难最重要的人工智能问题没有多大进展,因此,研究者大都想绕开这个问题,就研究一些其他的问题,看看国内的计算机期刊,好像对这个问题基本不感兴趣,国际上要好一些。我认为语义网的描述逻辑就是我们最终实现人工智能中的重要要分支之一,自然语言理解的一个好的思路,但现在的描述逻辑显然不能解决这个问题。假如仅仅为了使计算机稍微聪明了一点的话(本体也就是是如此而已),它的意义实在微不足道。我认为人类必将最终掌握极为高级的人工智能,使计算机在智能上高度接近人类,而要想实现真正的自然语言理解,现在的主流统计方法肯定不管用,只有对基于语义的描述逻辑进行扩展,才能解决自然语言理解的问题。我们假如一味的追求使得网络上的信息具有一定语义的实现技术,那么我们注定就是一个工匠,而不可能成为大师,要成为大师,我们就要敢于挑战现有描述逻辑的缺陷,提出新的理论,这才是实现语义的真正精髓。至于那些希望软件开发中使用语义网技术立即产生经济效益的人,一句话,鼠目寸光。就像当年研究相对论,爱因斯坦会想到基于相对论的轻核聚变可能解决人类的生存问题。我认为,以后实现人类技术革命的关键技术就是人工智能,凡是研究计算机不盯准这个技术的,到现在基本上都是工匠级别,不会产生真正的大师。而语义网再向前一部可能就是能产生大师的技术了。我们不要迷信权威,更不要迷信美国人,欧洲人,要敢于提出自己的理论。
--  作者:liuytliuyt
--  发布时间:12/9/2008 7:39:00 PM

--  
难道现在我们的研究就真的只能在 THE DESCRIPTION LOGIC HANDBOOK这本书的理论框架下吗?假如我们思想的高度不能超越这本书,我们不是注定要落后吗,再说既不能真正描述客观世界,又不是相对论,连相对论还有人质疑呢,更何况这个理论。网友们觉得我太狂妄,但我始终认为,我们的研究思想绝不能画地为牢,就被死死的限定在这个理论框架下,心甘情愿的永远做一个最终被社会遗忘的工匠。
--  作者:baojie
--  发布时间:12/10/2008 3:29:00 AM

--  
27, 28, 29楼的观点要放到现实中来考验。 如果做做一个具体的本体应用,相信会明白语义网的瓶颈不在逻辑表达力过低。

有一点应该明确,语义网研究主要是一种工程实践,讲究的是既有技术和市场的紧密结合,而不是人工智能的一个分支。有人工智能固然好,没有人工智能语义网一样能活得好得很。


--  作者:liuytliuyt
--  发布时间:12/10/2008 2:11:00 PM

--  
30楼的不要觉得别人都没有做过应用,我最近刚花3个月写了一个较为复杂的本体项目,逻辑完整,涉及本体的很多方面。现在研究本体的最怕别人批评自己的技术没有用,我觉得这是嫉疾讳医,一触即跳。这样狭隘的心态怎能成就真正的学问。
--  作者:liuytliuyt
--  发布时间:12/10/2008 2:19:00 PM

--  
语义网真正吸引人的其实就是语义两个字,但这个语义无论现在的研究者怎么不愿意承认现实他也是个事实,不能实现对自然语言(当然主要是文字材料)的自动分析,就注定最多只能流行一阵而最后必将被抛弃到历史的垃圾坑。计算机技术的发展史中这样的技术还少吗?
--  作者:baojie
--  发布时间:12/10/2008 3:43:00 PM

--  
“实现对自然语言(当然主要是文字材料)的自动分析”,就目前的技术实力,离大规模商用,还远着呢。语义网技术,怎么可能建立在这样摸不着边的基础上呢?当然,以后,以后或许能成,也许技术的发展会远远超过我们的想象。不过那也就不是我们今天所讲的语义网了。

我们今天这个历史阶段,现有技术手段可以达到的的语义网,核心问题应该是网页数据的结构化,可以查询化。这个数据的结构性,可能是经过自然语言理解(如twine做的那样),但我觉得其大多数,还是应该通过数据本身的结构性(比如通过表格产生的数据)来自动,大规模的产生。Blog, Calender, Social Network, Email, Photo, Music, Video 这些日常应用数据的tagging,分类,是语义网成功的基础。

语义网在我看,不必拘泥于一种技术。如果基于关系数据库可以做,甚好;如果基于XML可以做,也好;基于wiki来实现,更好。谁说一定要是OWL?只要是能大规模工业化应用,就是成功的路线。在我看,只要Youtube和Gmail推出了tag关系,并允许对此查询,语义网就算是成功了。哪怕这个实现是基于索引表的,没有任何RDF支持,我也会支持这是一个语义网应用。先有若干互不相连的语义网网站,如果商业成功,过上年把自然会有动力将其互联(如Youtube和Gmail共享tagging系统),假以时日,这种层出不穷的复杂应用自然会冒出来。Web产生的当年,哪里能料到今天这千奇百怪的各种应用?语义网自然也是一样的,先有若干简单但是商业成功的应用(即使不是RDF的),然后循序渐进,演化出种种匪夷所思的新鲜玩意儿来。

进不进历史的垃圾坑,要看能不能服务这个社会。语义网是一种技术,是一种工业,和造发动机,造飞机一样,讲究得是将一种简单的基本原理,用现在人类可以得到的手段,克服种种工程困难,来得到有用,可用,耐用的产品。饭要一口一口地吃,路要一步一步地走,冒进不得。


--  作者:liuytliuyt
--  发布时间:12/10/2008 4:30:00 PM

--  
网友baojie对语义网的研究现状同我的理解一样,但我只是有感而发,我只是对计算机科研领域不敢面对计算机领域最重要问题进行挑战的一种哀叹,看看软件学报,计算机科学国内所谓最权威的期刊发表的文章基本上很少谈智能,天天留恋与信息安全(我教过3年),吧cpu的由奔腾一代提高到奔腾4代对计算机科学的发展促进作用究竟有多大?,计算机科研始终不敢面对最有意义、最有挑战、最难实现的人工智能,这不过就是害怕失败、害怕在现在急功近利的科研体系下自己数年的心血付之东流,不被人承认,可悲吧。人类的科学研究应当主要是向未知领域发起挑战,技术研究是主要看如何应用(这是语义网的现状),我只是感慨为什么人人都只是想当一名工匠而不是想成为一名大师呢?我的恐怕也只是能成为一名工匠。但我有梦想,希望人类(最好是中国人)有人能成为大师。我始终认为,假设以后人类能够解决语言理解的问题,可能已经把语义网中的基于描述逻辑的本体等技术抛弃,但新的技术也必须吸收其思想。所以,我认为也许语义网再向前一步也许就是自然语言的逻辑分析模型了。
我一直在想一个问题,什么技术能够让计算机理解并回答下面的问题:
树上有四只鸟,开枪打死一只,还有几只?
桌子有四个角,砍掉一个角,还有几个角?
水缸里有四条鱼,死了一条,还有几条?
有两群羊,赶到一起,有几群羊?
像这样的问题不正是我们人类科技文明主要是计算机技术进步的所最重要的问题吗?要回答这样的问题,靠现在的所谓的统计方法来研究分析自然语言根本不可能成功,而成功的希望就目前为止,我觉得只有语义网中的描述逻辑加以改造才可能解决,这就是我为什么由上面的几段发言的道理。
我正是认识到语义网发展的可能蕴含着极大的潜力才对语义网感兴趣的,假如语义网仅仅满足于现状,仅仅是Frank van Harmelen所说的:语义网不是人工智能,人工智能也不是语义网;人工智能是一个领域,而语义网是一个项目,我觉得他就不会引起我的多大兴趣了,因为着更大程度上就沦为技术研究了,因为理论基础现在已经基本完备。就像20世纪初1900年,物理学家开尔说得“科学大厦已经基本建成,后辈物理学家只要做一些零碎的修补工作就行了。”但同时也有所担忧:在物理学晴朗天空的远处,还有两朵小小的令人不安的乌云。”,我们现在大多数人还是满足于对基于描述逻辑的语义网的大厦的修补吗?为什么我们不能考虑这个大厦的地基能不能在开拓一点呢?

--  作者:baojie
--  发布时间:12/10/2008 4:51:00 PM

--  
to  liuytliuyt

最近一期IEEE Intelligent System正好是讲中国的人工智能进展的,整整一期都是,相信看了以后会改变你的一些看法。

你可能对语义网和描述逻辑的理解和其本意有些不同。整个Web到目前为止,都不幸的沦为技术研究,和造原子弹,造氢弹一样,主要是技术,不是什么基础理论的研究。


--  作者:liuytliuyt
--  发布时间:12/10/2008 4:53:00 PM

--  
为什么我说描述逻辑中的本体等技术可能解决语言理解呢?因为只有把自然语言中的词汇分门别类,构成一种结构,存储到知识库中,在分析语言时才不会无的放矢(统计学方法就是靠猜),而语义技术是靠知识库,但描述逻辑及本体根本就不是为了描述自然语言,描述逻辑所追求的逻辑上的严谨性、自恰性,而语言理解中充满了歧义,冲突,故此现在看起来两者相差甚远,但他们的根是一致的,都是知识要合理组织。

--  作者:admin
--  发布时间:12/11/2008 1:28:00 AM

--  
我的看法跟baojie在33楼的回复完全一致。

目前语义网的研究可以分为两种类型:
1。纯学术类。他们研究的是“伟大的语义网”
2。工程类。他们研究的是“现实的语义网”

虽然1的工作暂时看不见功效,但没准以后会有。不过2的工作在目前看来是最靠谱的。所以也是我比较关注的。

相当同意baojie关于“只要Youtube和Gmail推出了tag关系,并允许对此查询,语义网就算是成功了”的论断。在此重提一下我在5楼所说:

语义可以简单,也可以复杂,只要能达到“让计算机的‘理解’能力提高一个层次”就算达标了。


--  作者:admin
--  发布时间:12/11/2008 1:32:00 AM

--  
以下是引用liuytliuyt在2008-12-10 16:53:00的发言:
为什么我说描述逻辑中的本体等技术可能解决语言理解呢?因为只有把自然语言中的词汇分门别类,构成一种结构,存储到知识库中,在分析语言时才不会无的放矢(统计学方法就是靠猜),而语义技术是靠知识库,但描述逻辑及本体根本就不是为了描述自然语言,描述逻辑所追求的逻辑上的严谨性、自恰性,而语言理解中充满了歧义,冲突,故此现在看起来两者相差甚远,但他们的根是一致的,都是知识要合理组织。

NLP是个好东西。NLP跟SW是相互影响与促进的关系。但他们是两样不同的东西。我觉得可能你误解了语义网里“语义“的真实含义。


--  作者:admin
--  发布时间:12/11/2008 1:41:00 AM

--  
理解你的担忧。不过我觉得事物(包括技术、理论在内)的发展是分阶段的。就好比实现共产主义还要分初级阶段和高级阶段。

“挑战最难“是不错,人是应该有这样的精神。但并不是人人都适合干最难的工作,而且人类社会里也并不是只需要最难的工作。这要具体讲起来,就扯远了。。。

以下是引用liuytliuyt在2008-12-10 16:30:00的发言:
网友baojie对语义网的研究现状同我的理解一样,但我只是有感而发,我只是对计算机科研领域不敢面对计算机领域最重要问题进行挑战的一种哀叹,看看软件学报,计算机科学国内所谓最权威的期刊发表的文章基本上很少谈智能,天天留恋与信息安全(我教过3年),吧cpu的由奔腾一代提高到奔腾4代对计算机科学的发展促进作用究竟有多大?,计算机科研始终不敢面对最有意义、最有挑战、最难实现的人工智能,这不过就是害怕失败、害怕在现在急功近利的科研体系下自己数年的心血付之东流,不被人承认,可悲吧。人类的科学研究应当主要是向未知领域发起挑战,技术研究是主要看如何应用(这是语义网的现状),我只是感慨为什么人人都只是想当一名工匠而不是想成为一名大师呢?我的恐怕也只是能成为一名工匠。但我有梦想,希望人类(最好是中国人)有人能成为大师。我始终认为,假设以后人类能够解决语言理解的问题,可能已经把语义网中的基于描述逻辑的本体等技术抛弃,但新的技术也必须吸收其思想。所以,我认为也许语义网再向前一步也许就是自然语言的逻辑分析模型了。
我一直在想一个问题,什么技术能够让计算机理解并回答下面的问题:
树上有四只鸟,开枪打死一只,还有几只?
桌子有四个角,砍掉一个角,还有几个角?
水缸里有四条鱼,死了一条,还有几条?
有两群羊,赶到一起,有几群羊?
像这样的问题不正是我们人类科技文明主要是计算机技术进步的所最重要的问题吗?要回答这样的问题,靠现在的所谓的统计方法来研究分析自然语言根本不可能成功,而成功的希望就目前为止,我觉得只有语义网中的描述逻辑加以改造才可能解决,这就是我为什么由上面的几段发言的道理。
我正是认识到语义网发展的可能蕴含着极大的潜力才对语义网感兴趣的,假如语义网仅仅满足于现状,仅仅是Frank van Harmelen所说的:语义网不是人工智能,人工智能也不是语义网;人工智能是一个领域,而语义网是一个项目,我觉得他就不会引起我的多大兴趣了,因为着更大程度上就沦为技术研究了,因为理论基础现在已经基本完备。就像20世纪初1900年,物理学家开尔说得“科学大厦已经基本建成,后辈物理学家只要做一些零碎的修补工作就行了。”但同时也有所担忧:在物理学晴朗天空的远处,还有两朵小小的令人不安的乌云。”,我们现在大多数人还是满足于对基于描述逻辑的语义网的大厦的修补吗?为什么我们不能考虑这个大厦的地基能不能在开拓一点呢?



--  作者:liuytliuyt
--  发布时间:12/11/2008 9:07:00 AM

--  
“只要Youtube和Gmail推出了tag关系,并允许对此查询,语义网就算是成功了”
确实是这样,得到大网站的使用,证明了这个技术是有用的,充分体现了商业力量的强大,这恐怕也是美国强大的根本原因吧,最新的技术首先需要市场,商业应用,从而获得经费,得到经费支持的研究就有了更加持续深入的动力,而远离市场的研究最终在商业研究发展需求的推动下也能取得较好的进展。中国正是这种力量的缺乏,使得研究要么脱离实践,要么纯粹理论。从而没有很强的发展动力而导致落后。
--  作者:wanggou
--  发布时间:12/18/2008 7:41:00 PM

--  
不要总是提那么大,那么空的人工智能
人工智能!=人的智能
它只是一种人造的有我们所谓“智能”的软件或者其它实体。
把人工智能简单的和人脑的智能划等号是不明智也不合理的。
语义Web很明显是人工智能的一个分支,是人工智能的又一次实践活动,这一点不论怎样的判断标准都是没法抹煞的。
--  作者:应用探索
--  发布时间:12/27/2008 10:30:00 AM

--  
看了5楼的解释,本体研究似乎陷入一种两难的境地:

从计算机科学的角度,本体追求的是“语义计算”基础设施,使得应用具有更好的可扩展性、灵活性及松耦合性,其背后往往是基于逻辑的推理。而实际情况或许“只是定义了概念和/或概念之间的关系就算达标了”。这两者之间如何衔接?一定能够衔接上吗?有没有人在这个方面有经验。

我从企业应用的角度定义了一个“本体/语义网”模式,听听计算机专家意见:
1。企业的知识要存得住。“知识”的涵义要比“数据”广。简单的说,“知识”还要包括设计数据库的逻辑模型。
2。储存的知识-数据要能够用的上,当然要比传统的“数据库”更有用。

有了这两条,企业就愿意投资了。做得到吗?


[此贴子已经被作者于2008-12-27 11:01:31编辑过]

--  作者:应用探索
--  发布时间:12/27/2008 2:53:00 PM

--  
如果要从理论上分析,本体研究或许需要回答什么是"概念"以及“知识”的问题。

wanggon在<知识和推理的理解[讨论]>中说的意思大致是“知识对我们来说,就是一些命题,也就是一些有真价值的句子”。仔细分析,这两者之间的差异还是很大的。句子,我们通常理解为用自然语言,或许还要加上一些专业术语等,表述的。而“命题”往往定义在某一个“理论空间”。这个有关“知识”的陈述可能是本体研究的关键所在:本体研究是在一个“理论空间”表述该理论能够表述的“知识本体”呢?还是研究如何表述“知识”的本体知识?

或许有人可以证明这两者最终是一致的?


--  作者:应用探索
--  发布时间:12/28/2008 10:48:00 AM

--  
我想请教5楼的两个问题:

你在解释语义(semantics)时说:
首先得有一个语义表达模型。它可以简单,也可以复杂,只要能达到“让计算机的‘理解’能力提高一个层次”就算达标了。因此,最简单的、语义极弱的tag,以及RDF都可以作为语义表达模型,只不过它们各自提升计算机‘理解’能力的程度不同罢了。

第一个问题是提高一个层次以什么为基础?

第二个问题是按这个解释,数据库表也应该是一种semantics,数据只要放在数据库表就有意义了?


--  作者:admin
--  发布时间:12/28/2008 8:00:00 PM

--  
以下是引用应用探索在2008-12-28 10:48:00的发言:
我想请教5楼的两个问题:

你在解释语义(semantics)时说:
首先得有一个语义表达模型。它可以简单,也可以复杂,只要能达到“让计算机的‘理解’能力提高一个层次”就算达标了。因此,最简单的、语义极弱的tag,以及RDF都可以作为语义表达模型,只不过它们各自提升计算机‘理解’能力的程度不同罢了。

第一个问题是提高一个层次以什么为基础?
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~“提高一个层次”指的是,相对于过去的技术手段,计算机对Web上的资源的理解能力有所提高。

第二个问题是按这个解释,数据库表也应该是一种semantics,数据只要放在数据库表就有意义了?
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~数据库表属于“过去的技术手段”,并没有迈出上述“提高理解层次”的一步。




--  作者:应用探索
--  发布时间:12/29/2008 11:22:00 AM

--  
讨论本主题:究竟什么是Semantic Web,它有什么标志特征?它能给我们带来什么? 或许需要按照37楼的观点将语义网的研究可以分为纯学术类和工程类讨论。虽然这两者是互相影响的,但是在现实世界中却充满了茅盾。

我认为纯学术类的语义网是从若干可以操作的“技术”为依据,并试图将这些技术拓展的所有的领域。如果是将这些技术渗透到各个领域,也许比较容易成功。但是,如果要将这些技术解决“本体”问题,我理解就是所有问题的本质问题,可能会有极大的障碍。我将这类东西看作是“本体”。

工程类的语义网是从应用为出发点的。它大概有个目标,然后要实现的是如何使计算机表示达到目标所需要的知识,最后是如何应使这些知识转变为“智能”。工程类语义网,我称它为“本体知识”,的关键是要让计算机“表示”的知识能够被客户,或者说是领域专家接受,应为他们才是知识的主体。

还有一个问题,作为一个目标明确的工程类的语义网应用系统,它的知识不应该仅仅局限在“语义网”中,系统本身也会包含其它的知识。我们的经验表明,这或许也是工程类的语义网与纯学术类的语义网的重要区别之一。

如果把问题“是什么”想明白了。应用和实现应该不是问题。


--  作者:应用探索
--  发布时间:12/30/2008 10:15:00 AM

--  
我想改变一下讨论问题的视角,我们或许应该从更深一层去看待语义和本体问题,即语义,本体本质上不应该是一个技术问题,而是一个认知问题。

从这个角度看那些SW新技术,譬如语义极弱的tag, triple,仅仅意味着计算机技术意识到需要采用一些更基本的结构才能够表示更大范围,更本质的知识体。但是,它们并没有表明知识体本身的特征。我们在<tag></tag>里放上“概念/术语”或者“字母”,它们的表达能力和表达的内容是绝对不一样的。相反,我们如果能够在一个现成的数据库系统中,存放、操作能够达到目的的知识-数据,何尝不是一件好事呢?

前面的讨论中已有提到分类树的概念,确切一点说应该是层次结构。或许它才是本体、语义模型(我们认识世界)的基本特征和核心内容。围绕以层次结构为核心的知识体/本体,可以有很多的讨论,譬如,什么是“概念”,什么是“DL的概念”等。有了这层内容,也许我们可以讨论baojie在13楼提出的“RDF和OWL在很大程度上,阻碍而不是促进了语义网的实现”这样的问题。


--  作者:yayatu
--  发布时间:12/31/2008 12:45:00 AM

--  
以下是引用iamwym在2008-11-15 20:30:00的发言:
[quote]以下是引用baojie在2008-11-14 14:36:00的发言:
[quote][b]以下是引用雪褥织影在2008-11-14 12:19:00的发言:
   即便底层是RDF+SPARQL,用户未必需要知道这些
   好比现在大家在论坛上发帖子,或者写blog,底层是HTML+SQL,但是我们并没有直接编辑HTML页面,更没有直接写SQL语句
   现在只是缺乏易用的RDF数据发布方式,设想有朝一日Dreamweaver内置了一些常用的class/property,并且能够允许用户方便地设计RDF(a)的时候,语义网必将迅速普及
  [/quote]

  semantic wiki就是这样的一种工具. Dreamweaver如果能支持RDF(a),当然是最好不过了. 不过它为什么要支持呢? 如何说服这些厂家来支持呢?

  说个最简单的例子, gmail的label不支持分类树, 尽管非常多的用户呼吁这种功能. Google这么做,相比不是没有想到, 也想必不是没有技术条件. 它为什么不做呢? Google不是傻瓜, 这里面一定是有原因的.
[/quote]

我现在知道为什么了,普通用户非常讨厌的就是树形结构,请注意是普通用户而不是具有计算机知识的用户。这也是为什么windows不把默认的文件夹结构列为树形的原因。windows explorer边缘化就是一个例子。树形结构非常片面不直观,HCI非常忌讳这点。

所以基本上ontology不可能是普通用户能够直接交互的对象。


Peter Mika早把兴趣投向了Folksonomies,其user-generated的特点更受欢迎。自由tagging,自由添加term。yahoo 旗下的delicious等众多applications都支持Folksonomies。但是我个人并不排斥ontology和Folsonomies并存。从某种意义上来说,ontology可以为Folksonomies中的term提供解释。有人试图将两者统一在一个模型下,静观最近进展。


--  作者:应用探索
--  发布时间:12/31/2008 11:01:00 AM

--  
是啊,这个世界是多姿多彩。我们可以从许多侧面观测我们的现实世界和操作计算机世界。

我在这里讨论的出发点是“本体”,“语义网”(其涵义是“语义数据不是孤立存在的,而是彼此互连,形成一个网状结构”。是否可以用“语义模型”表示,以区别采用“本体”技术,“语义模型”技术,或者其它什么技术实施的因特网)这类计算机知识表示的“终极问题”可能具有一些什么特点。

我同意计算机的理解能力实际上并非真正意义上的“理解”。计算机实际上只是知道知识的结构,或者是组织知识规则。因此,本体/语义模型的研究开发者需要明白什么样的知识结构,或者组织知识的规则具有普世意义或者局限性,以及它们的适用性。


我们的经验表明,层次结构的知识体在现实世界中具有普世意义;逻辑推理规则,描述性的概念定义则有比较大的局限性。

常识还表明,很通用的东西,或者完全采用语义很弱的构件,往往解决不了,或者解决不好现实世界中的具体问题。

讨论这些问题的目的是希望建立一个比较好的知识体,能够用来解决企业,或者行业的问题。譬如,企业,行业知识的管理,应用和演化问题。

我们已经看到了计算机操作的知识体能够给企业、社会带来许许多多的利益,实现也就是眼前的事。

希望明年这个时候论坛上有好消息。


--  作者:应用探索
--  发布时间:1/6/2009 4:37:00 PM

--  
我想从应用的角度提一个语义网的论题,不知是否能够引起讨论:

语义网会终结阿里巴巴那样的网站吗?

语义网是一种“智能”网。这种“智能”是相对用户的水平而言的。语义网可以让客户不仅知其然,还可以知其所以然。这样就可以给用户带来更多的价值。语义网的这种特点决定了语义网一定是比较专业的,所以,不可能服务于“所有的”中小企业。由此,本人认为,那种一网打尽的网站,一定会给比较专业,能够给用户提供更多价值的语义网站所替代。


--  作者:cathen0023
--  发布时间:1/31/2009 8:47:00 PM

--  
讨论好热烈啊
偶最近刚刚接触语义网,以后一定要经常来和大家交流一下啊
多多向各位学习!!
--  作者:iamwym
--  发布时间:2/25/2009 4:50:00 PM

--  
以下是引用kenneygg在2009-1-13 20:38:00的发言:
从头看到现在,这个话题还是引起了不少的争论啊。我也谈谈愚见。
语义网,说了那么多,做了那么多。
我们首先问一下,为什么叫做语义网呢,语义网是对谁说的呢?
互联网的发展到现在可以说是一直在发展,可以看出,语义网的提出的对象是对于机器而言,因为现在的信息爆炸太厉害了,我们在找寻“有用”信息和信息的跨平台发布与集成的时候存在很大困难,所以希望建立某种框架,内容创作遵循这个框架,软件开发也由着这个框架来开发,那么信息的有效利用就会更加完美(耗费时间少,内容进准)。如果有这样一个框架,只需要做少量环境设定,机器会自动完成信息的搜集,发布。
至于里面的web,也不是简单的WWW,而是基于Internet的所有互联网硬件、软件的结合,个人觉得可以理解成整个网络生态系统。
还有,最重要的就是人了。
在说点题外话:
为什么商业会炒作SOA,web2.0,SaaS,云计算,而没有来炒作语义网?
这是一个很值得深思的问题。
个人认为,语义网的发展不能是以革掉现行互联网存在模式为铺路石的,相反,应该对现有网络不断的提出改进模式逐步过渡到语义网上面去,但是很可惜,标榜着语义网的相关方案很少。但是纵览SOA,web2.0, SaaS到云计算的概念提出到发展,都看到了现有互联网自身的不断改进和提高。




语义网不被炒作的原因其实也蛮简单的。SOA和云计算之类的概念是业界提出的,所以一般比较容易热,主要因为有业界大佬支持,来钱快,小企业和开发者自然趋之若鹜。

学界提出的东西,一般要进入业界,除非是马上能看到效益的(这类很少),否则一般都是些有政府背景或者财大气粗的企业在做。这些企业一般不会太计较研发成本,采用广撒网,尝试新技术,如果一旦有突破他们肯定能从中获益巨大,如果不成功,转向其他技术,对他们来说也是小菜一碟。


--  作者:tanabata
--  发布时间:2/26/2009 4:11:00 PM

--  
大家好,我是刚刚接触语义网,想把语义网做为自己研究方向的小小菜鸟,以后多关注论坛,希望大家多多指教。
我做过几个网站,就我个人理解,语义网要想真的推广开来,现有的网站建立模式可能需要改进,网站都需要建立成本体的模式吧,否则基本的搜索都无法完成。
--  作者:happychensi
--  发布时间:2/26/2009 7:41:00 PM

--  
初学,还请各位多指教!
--  作者:Huang
--  发布时间:3/11/2009 9:22:00 PM

--  
应Admin的邀请, 让我为Semantic Web的第一个专题讨论“究竟什么是Semantic Web,它有什么标志特征?它能给我们带来什么?”作点评。这四个月以来, 大家在这个中国语义网论坛上对语义网的最基本问题展开热烈的讨论。到目前为止,共发帖55份,总点击数逼近8千。这对于一个纯学术的帖子来说,实属不易。我看到的是,大家在这个专题讨论中都能本着学术探讨的精神,畅所欲言,其乐融融,展现出良好的学术风气。

值得说明的是,我的下面的点评,不管是支持你的观点的还是反对你的观点的,都不是对大家的看法的一个结论性的判断。我希望以一个讨论参与者的身份平等地与大家进行讨论。首先我要感谢所有讨论的参与者,你们的所有看法或观点都是值得鼓励的,所以都是有价值的。

究竟什么是Semantic Web,它有什么标志特征?这是所有语义网研究者必然要思考的核心问题。
正如Admin所指出的那样, SW的核心思想可以分为两个方面:一个是semantics,一个是web。语义(semantics)指的是提供能被计算机“理解”的数据, 即它的逻辑分析与语义表示的维度。网(web)指的是那些语义数据不是孤立存在的,而是彼此互连,形成一个网状结构,即它的数据连接的维度。

所以,对于何为语义网,存在着下面四种不同的理解:

(1) semantic + web: 即语义网应是在现有的网络数据上加一点语义分析的内容,或者是在现有的语义数据上加一些网络描述的能力。在这方面, Leopard提得很好, 即“利用semantics的技术,重新构建web的基本体系结构(主要体现在URI和带语义标签的hyperlink),建立一个全新的web......至少在数据库方向,还是更看重semantic,希望通过建立表达能力更强的本体,为数据集成和管理提供一个新的解决方法"。

(2) semantic + Web: 这里的Web的第一个字母是大写的,即语义网应是更多的网络成分,相对少的语义表示和处理的部分。在这方面,baojie提得好,“语义网的核心精神,在我看无非是web数据的结构化和一定形式的推理。在当前的技术条件下,我觉得 tagging + 分类树 + 弱关系表(如RSS之类)是最可能大规模实现的”。

(3) Semantic + web: 即语义网应是更多的语义处理成分,相对少的网络处理部分。
(好像在这次讨论里,还没有人持这个观点?)

(4) Semantic + Web: 即语义网应是很多的语义处理成分,再加上很多的网络处理部分。
值得注意的是:很多的语义处理成分,包括推理技术,并不意味着要实现像人一样的高度智能化的系统。所以说, “语义网技术通过模拟人的思维方式来获得机器的理解力”的说法是一种对语义网的误解。实际上, 语义网的推理只是要获得间接数据(如从我在VU工作而且VU在阿姆斯特丹,就能推出我在阿姆斯特丹工作,再从阿姆斯特丹是荷兰的一个城市,就能推出我在荷兰工作等)。这里的智能化程度实际上是不高的,但又是非常需要的。从知识表示和推理技术上看,就是这样的推理要求也是有较高技术含量的。(想想看这里很可能涉及到非单调推理问题)。 ”Semantic Web想做的事情太多了,这也一定程度上阻碍了它自身的推广,也许Semantic Web这个大的目标终究难以实现“的说法也是对语义网本身的误解。

正是由于存在着这四种不同的理解,使得对语义网的看法众说纷纭,每个人都可以立足于自己的理解去批评别人的不同理解。当然,在这里,我觉得没有必要来规定哪种理解才是唯一正确的,或者是正统的。

推动语义网发展的最有说服力的,就是看它究竟能给人类社会带来什么。“实践是检验真理的唯一标准”。同样,“市场是检验技术的唯一标准”。这也许是以后语义网讨论专题中要关注的。

iamwym说得好, 他指出了sw的最大的好处之一在于信息集成,“对于开发者来说,应该是一个福音,特别是数据管理方面的开发。设想一下,所有的数据都有 semantic metadata,这样子查询和管理,扩展,都要比现在的关系数据模型要容易上不少,特别在实际应用当中,往往一个企业有来自于不同地方的数据,有五花八门的格式,如果都转换了放在数据库里,好几年可能用不到可是也不能删除,成本很高,用ontology注释一下,按需转换调用,可以降低不少成本”。这就是语义数据共享的好处。

"应用探索“提得好,“我同意计算机的理解能力实际上并非真正意义上的‘理解’。计算机实际上只是知道知识的结构,或者是组织知识规则。因此,本体/语义模型的研究开发者需要明白什么样的知识结构,或者组织知识的规则具有普世意义或者局限性,以及它们的适用性。”

[此贴子已经被作者于2009-3-19 0:58:08编辑过]

--  作者:springbird
--  发布时间:3/17/2009 11:01:00 AM

--  
学习了
--  作者:Humphrey
--  发布时间:3/30/2009 9:10:00 PM

--  
只在此山中,云深不知处。
--  作者:zhxiaomiao
--  发布时间:5/18/2009 4:06:00 PM

--  
非常不错 一口气看完

--  作者:lgpxzyb
--  发布时间:9/21/2009 11:19:00 AM

--  
以下是引用应用探索在2008-12-27 10:30:00的发言:
看了5楼的解释,本体研究似乎陷入一种两难的境地:

从计算机科学的角度,本体追求的是“语义计算”基础设施,使得应用具有更好的可扩展性、灵活性及松耦合性,其背后往往是基于逻辑的推理。而实际情况或许“只是定义了概念和/或概念之间的关系就算达标了”。这两者之间如何衔接?一定能够衔接上吗?有没有人在这个方面有经验。

我从企业应用的角度定义了一个“本体/语义网”模式,听听计算机专家意见:
1。企业的知识要存得住。“知识”的涵义要比“数据”广。简单的说,“知识”还要包括设计数据库的逻辑模型。
2。储存的知识-数据要能够用的上,当然要比传统的“数据库”更有用。

有了这两条,企业就愿意投资了。做得到吗?


[此贴子已经被作者于2008-12-27 11:01:31编辑过]



我觉得学术上应该研究一下语义计算的基础设施。根基不牢,在应用上会走好多弯路。
--  作者:lanbinger2001
--  发布时间:9/22/2009 10:22:00 PM

--  
不管SEMANTIC WEB到底能不能够实现,至少我们都在为她而努力!
--  作者:service365
--  发布时间:5/7/2010 1:10:00 AM

--  
黄大侠还是狠能扯得,呵呵
--  作者:quhuifang6722
--  发布时间:5/7/2010 4:09:00 PM

--  
说的太精彩了,佩服!但要真的提出自己独到的见解,实属不易呀!
--  作者:quhuifang6722
--  发布时间:5/7/2010 4:14:00 PM

--  
我看过陈小平译的《语义网基础教程》,对入门者来说是本不错的书,建议大家看参考一下。
--  作者:commit
--  发布时间:5/24/2010 3:26:00 PM

--  
以下是引用admin在2008-12-11 1:28:00的发言:
我的看法跟baojie在33楼的回复完全一致。

目前语义网的研究可以分为两种类型:
1。纯学术类。他们研究的是“伟大的语义网”
2。工程类。他们研究的是“现实的语义网”

虽然1的工作暂时看不见功效,但没准以后会有。不过2的工作在目前看来是最靠谱的。所以也是我比较关注的。

相当同意baojie关于“只要Youtube和Gmail推出了tag关系,并允许对此查询,语义网就算是成功了”的论断。在此重提一下我在5楼所说:

语义可以简单,也可以复杂,只要能达到“让计算机的‘理解’能力提高一个层次”就算达标了。


2007年的一个中国专利已经涵盖了这个内容。


--  作者:yindongbo
--  发布时间:5/23/2011 2:53:00 PM

--  
学习了
--  作者:lvym001
--  发布时间:2/22/2012 2:57:00 PM

--  
上大学时接触到语义网,目前认识还比较浅,读了这个贴子,学习了很多,我认为语义网为大家描述的前景是非常让人振奋的,但要想替代掉现有的WEB实现革命性变革还存在很多的困难,但话又说回来了,退回20年又有谁会想到能出现现在的WEB以及建立在WEB上的各种各样的应用呢。SW思想很好,我更倾向于利用语义网的思想和现有技术与具体现实问题相结合,在某一领域基至是某一项目解决一些问题。我还是做个工匠吧,那些大而空的理论研究让大师们去做吧。
--  作者:baojie
--  发布时间:2/22/2012 3:02:00 PM

--  
这个认识过程是很多人都走过的,赞一个。语义网的工程方法,各大公司都在低调地做。至于出来以后人会不会说“这不是语义网”,有什么关系?

以下是引用lvym001在2012-2-22 14:57:00的发言:
上大学时接触到语义网,目前认识还比较浅,读了这个贴子,学习了很多,我认为语义网为大家描述的前景是非常让人振奋的,但要想替代掉现有的WEB实现革命性变革还存在很多的困难,但话又说回来了,退回20年又有谁会想到能出现现在的WEB以及建立在WEB上的各种各样的应用呢。SW思想很好,我更倾向于利用语义网的思想和现有技术与具体现实问题相结合,在某一领域基至是某一项目解决一些问题。我还是做个工匠吧,那些大而空的理论研究让大师们去做吧。


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
308.594ms