W3CHINA Blog首页    管理页面    写新日志    退出           Stand on the shoulders of giants


[语义网格]语义网格case study(中)
whale 发表于 2005/1/12 17:53:17

myGrid项目 myGrid是一个可扩展的开放式的数据和工具协作平台。它是应用网格,Web服务,语义网等技术构建的一个高层应用中间件。Mygrid 的主要目标是开发一个高层次基于服务的中间件来支持计算机环境下的生物试验. 计算机环境下的试验是一个基于信息库和和计算分析的假设验证过程或者是一个论证已知实事的过程. 其重点放在数据密集型的计算上. 它结合了数据库和应用. 用户可以创建和发现其他的工作流并与之交互.不应把它当作数据网格和计算网格而是应该把它看作在计算机环境下的基本服务例程. myGrid希望不仅能为生物信息学家提供一个可灵活的配置的中间件, 同时这些生物学家反过来能为其他生物学家实现终端应用. myGrid的另一个目标是提高知识库的共享质量和它的使用方式。从科学家的角度,myGrid是一个提供一些生物信息学服务的平台,例如现在已经开发的服务: 模拟有机体基因表达分析服务和对坟墓病的遗传研究的服务. 从开发者的角度, 它是一个开发者的应用工具集:提供服务描述及发现,服务建模型,服务APIs 和消息工具等功能,并已经实现了对已有的经过整合的生命科学平台的连接。 myGrid试图在分布式环境下为生物科学家建立一个个人协同问题解决环境,便于他们进行长时间的试验,寻找其他的生物研究合作伙伴,在共享的知识库发布自己的意见和观点,并能够及时获取最新的领域相关的数据和工具的信息。 它的任务焦点在于进行数据密集型基因函数分析。 myGrid 致力于通过科学家推理探索来构建一个发现试验环境.这包括了科学家的思想,设计和试验原型. 中间版本和数据被保存下来,注释和思想被保持并且部分的试验和其他相关试验被保存在一起形成作为论证网络,如同我们在试验室手册上看到的那样. 我们的目标是收集,共享和重用: 1.       试验时间组件 工作流描述,查询描述,经过注释对象,相关论文,相关重要工作的页面连接等. 2.       记录试验的实例 数据结果;被工作流引擎创建的历史服;创建的服务实例;应用的参数设置;结果注释;等等. 3.       联系小组,设计和实例组件的试验关联 查询和结果;工作流和输出;工作流的以前版本的子版本; 一组这样的到文档连接,这个文档讨论了生物学家的结论;等等. 3.语义网格的研究内容 语义网格的研究重点是用语义和知识工程的方法来解决目前网格平台建设和应用中存在的各种问题.其研究内容可以概括为以下几个方面. 1.       智能实验室(Smart Laboratories) 智能化的实验室是e-Science成功不可豁缺的,同时配置智能实验室可以充分挖掘Grid的能力. 2.       面向服务的结构(Service-Oriented Architectures) 研究语义网格设施的预备和实现,研究基于语义的服务描述语言. 3.       基于代理的方法(Agent Based Approaches) 研究Agent Based架构使用,研究交互语言以便开发\制定\维护e-Science marketplaces 4.       信任和证实(Trust and Provenance) 研究网格系统中计算信任建立的过程\方法\技术,决定内容种源和品质,这些涉及到数字权管理问题. 5.       元数据和注释(Metadata and Annotation) 元数据设施已经以RDF的形式存在,进一步工作研究支持ontology设计和运用的方法和工具,研究Annotation工具和方法. 6.       知识工具(Knowledge Technologies) 知识捕获工具和方法\动态内容连接(dynamic content linking)\基于注解搜索(annotation based search)\annotated reuse repositories\自然语言处理方法(natural language processing methods )(for content tagging, mark-up, generation and summarisation)\数据挖掘(data mining)\机器学习(machine learning) \Internet 推理服务( internet reasoning services). 7.       集成媒体(Integrated Media) 把一系列的媒体合成到e-science基础设施中,包括视频\音频\各种图像方法\;研究 metadata和annotation同这些多样媒体格式的关联 8.       内容表达(Content Presentation) 研究内容的可视化技术和方法 9.       电子科研工作流和协作(e-Science Workflow and Collaboration) 理解现在和未来e-Science合作的工作流,拥护应该能够形成,维护和解散基于一定成员限制规则和操作规则的合作环境。 10.     普适电子科研(Pervasive e-Science) 不仅关注计算能力,更包括所有对所有资源的访问 4.面向语义的网格应用      面向语义的网格承诺带来语义可互操作性,智能自动化,行动指南以及灵活重用的优势,它日益被认为是网格计算演变中的一个重要阶段。 我们将语义网格广泛的应用场景概括为以下几个方面的网格应用。   服务发现.      英国e-Science的领头项目myGrid寻求提供开放源代码的高层网格中间件, 用于形式化表达,管理以及共享生物信息实验中的密集数据. MyGrid所用资源是开放网格体系结构的服务,这些服务能够静态或动态的与上下文结合.这里的上下文包括用户信息,执行代码,执行速度,可靠性和对用户有用的适当的认证机制.能否找到正确的服务依赖于服务的知识.服务的语义描述对服务的自动发现,查找,选择,精确匹配,组合,交互操作,调用以及执行的监控都是必要的.在开放网格体系结构中, 服务规范提供了描述接口的语法, 但服务除了按照一定的参数和返回值要求执行操作,还应该按照一定的用户需求来响应. 生物信息学家常常掌握着一些特殊的数据,他们需要找到服务来操作这些数据以便产生期望的结果,或者他们希望在这些数据之上应用一些任务. 他们必须表达他们的需求,以便同可用的服务来匹配, 并考虑服务的功能,接收和产生的数据以及用于完成其目标的资源, 从而匹配用户的需求. 而且, 他们必须从能够完成任务的后选者中选出在请求约束下获取结果情况最佳的一个. 这种选择依赖于功能,代价,服务质量,地理位置和发布者相关的元数据. 基于提供的功能进行的这种服务分类正在被不同的组织采用,作为一种有效的查找.索引合适服务的方法.不同组织目前在服务注册的分类模式上是一致的. 比如生物信息学应用和仓库EMBOSS套件对本身所包含工具有一个粗略的分类,并且被当前众多的生物信息学集成平台使用. MyGrid的一个假设是:第三方服务注册为可用的生物信息服务编目分类.服务描述的附加(个性化的)元数据使用RDF陈述来进行声明. 服务提供者发布他们的服务,服务使用者通过多种机制,如名字,词语,特征,类型或本题描述来查找,匹配服务.myGrid生物信息服务本体基于DAML-S服务模型.服务描述分为两类:服务种类设计的领域名, 可调用服务实例的操作元数据(如数据质量,服务质量和代价等). DAML+OIL提供了服务描述的词汇。匹配首先对域进行匹配,然后是操作的属性。 副本服务(生物学里大量存在)之间有着同样的描述,但操作意义上的服务配置不同。在执行工作流之前,对服务类和他们的实例进行发现,匹配和选择。在执行期间,实例也可以动态的选择。   知识注释,通知和指南 Geodise试图用网格技术,设计优化技术,知识管理技术,Web服务和本体技术来构建一个具有目前最高水平的知识密集性设计工具,该工具要与OGSA基础设施保持一致。Geodise正使用知识工程方法学来对设计知识进行建模,封装,以便航空引擎不见等新设计能够一更低的成本更快的开发出来。 Geodise首次使用的知识模式之一就是通过注释使工程设计流具有丰富的语义。Geodise希望能够回答的一个关键问题是:以前的实际开发出什么以及怎么重用它们。一个典型的工程设计通常包括问题定义信息(几何方面);工具用于划分网格或者将集合设计拆分成能够进行分析的单元;然后,将优化方法产生的一组行为应用上去,以不同的参数进行实验,并得一组可能的设计方案。所有这些信息——如何四用软件包的每一步活动——都记录在日志中。为了最有效的重用日志文件中包含的知识,Geodise项目中通过使用域本体术语从语义上丰富这些日志文件。经过语义扩充的结果日志形成一个知识库,该知识库可以被查询,索引和重用。这样一个知识库使的我们能够基于以前的经验,为当前的设计问题找到合适的解决办法。

阅读全文(2944) | 回复(0) | 编辑 | 精华

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)

 
«November 2025»
1
2345678
9101112131415
16171819202122
23242526272829
30

  公告
暂无公告...

  我的分类(专题)
  最近日志

  最新评论

  留言板

  链接

  

 W3C
 CGCL
 W3China
 Google
 Feirenren
 

  Blog信息
blog名称:
日志总数:13
评论数量:32
留言数量:0
访问次数:100370
建立时间:2004年11月10日



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 1.094 second(s), page refreshed 144799171 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号