[原创作品]2008年10月《分布式数据挖掘:应付分布式海量数据的现代方法》

人们面临的挑战不再是收集信息,而是挖掘数据以回答特定研究问题。Benjamin Lieberman在最近的一篇developerWorks系列文章里向大家介绍了用分布式数据挖掘来处理这些分布式海量数据的技术。Benjamin Lieberman认为拥有分布式数据的组织面临着如何发现、访问和有效地使用分布式海量数据的挑战,而这可以用分布式数据挖掘技术来解决: 发现信息:包括静态发现和动态发现。静态发现是手动确定数据源系统,并预先把处理系统配置好,以便其在处理过程中使用发现的源,此方法最常见但最不灵活。动态发现是UDDI及OGSI(Open Grid Service Infrastructure)背后的基本思想,数据源将其功能和内容在中央注册中心进行注册,以便你可以在运行时查询中央注册中心以寻找符合处理需要的数据源。 安全地访问信息:获得访问权限需要对用户进行身份验证。对于分布式数据库,每个源可能使用的是不同的安全机制,这是分布式处理模型里的一个主要难题。 有效地传输与使用数据:数据源的庞大使得通过远程连接获取数据变得不切实际。你有两种选择:批量获取数据,然后在本地处理(如SETI@HOME项目);或者在远程平台上执行处理。 [略]

“网格计算已出现一段时间了,并正开始被看作是大规模计算的未来趋势。管理大型分布式数据集的能力是网格工作的关键问题,”Benjamin Lieberman总结道。随着世界上最大网格(大型强子对撞机计算网格)的投入使用,这篇关于分布式数据挖掘的文章也许可以给我们带来了不少启发。感兴趣的朋友请进一步阅读全文。

全文请看InfoQ中文站:http://www.infoq.com/cn/news/2008/10/distributed-data-mining



阅读全文(6868) | 回复(0) | 编辑 | 精华 | 删除


[原创作品]2008年9月《Web IDL:W3C DOM规范语言绑定有了新名称》

全文于2008年9月7日发布于InfoQ中文站上:http://www.infoq.com/cn/news/2008/09/WebIDL 摘要 <以下略>
W3C Web应用工作组(Web Applications Working Group)最近发布了Web IDL工作草案,即过去的DOM规范语言绑定(Language Bindings for DOM Specifications)。该工作草案定义了一个OMG IDL 3.0版的语法子集,供那些定义接口的规范使用。InfoQ采访了该规范的编辑,以进一步了解该规范、以及该规范对Web开发社区的影响。由该工作草案定义的接口定义语言叫作Web IDL,它可被用来描述要在Web浏览器里实现接口。Web IDL是一种IDL的变体,它具有很多特性,使之可以更加容易地对Web平台里的公共脚本对象的行为进行规定。为了支持过去只能以文字描述的公共功能,该IDL在很多方面得到了扩展。另外,它还为ECMAScript第3版和Java给出了精确的语言绑定。该规范文档的介绍部分解释了为什么要有这个规范: 过去,W3C技术术报告都是用对象管理组织(OMG)的接口定义语言(IDL)[OMGIDL]来描述编程语言接口的。利用该IDL,可以独立于语言的方式来描述这些接口。通常,这些文档还要另外提供一个语言绑定的附录,以详细描述用IDL描述的接口如何与给定语言的构造成分相对应。然而,这些规范为ECMAScript(Web上最常用的语言)给出绑定时,描述的精确度很低,因而造成互操作性问题。另外,各个规范必须描述同样的基本信息,比如:用IDL描述的DO



阅读全文(9635) | 回复(1) | 编辑 | 精华 | 删除


[原创作品]2008年8月《SOAP协议栈是令人尴尬的失败?》

本文于2008年8月12日发布于InfoQ中文站上:http://www.infoq.com/cn/news/2008/08/rest-vs-soap-stack 摘要 关于REST vs. SOAP的争论已不是什么新鲜事了。然而,现就职于Sun公司的XML权威Tim Bray近期的一番话再次引发了这一争论。在OSCON上接受采访时,Tim Bray说:
目前,SOAP协议栈通常被认为是一个令人尴尬的失败……SOAP协议栈能做的,REST也能做,而且在可行性、优美性、代价和经济上更优于前者,只是我们尚缺乏相关工具。
跟以往的情况一样,双方的支持者们纷纷出动并发言支持自己所钟爱的风格。他们在Service-Oriented-Architecture Yahoo!讨论组上的辩论已经形成了一个有超过150条回复的主题。争论中,Nick Gall给出了一个已抛弃SOAP技术的大公司的案例: 好几年前,沃尔玛将其供应链的VAN EDI基础设施替换成为EDIINT AS2,并一直愉快地沿用至今。AS2本质上属于普通老式XML(Plain Old XML,POX),它用自己的方法实现了可靠消息传递的幂等性。
Mark Baker补充道: 我一直都说SOAP不会在防火墙以外获得广泛使用的。
在谈到什么样的例子才能被算作一个使用SOAP的成功案例时,Nick Gall


« 1

日历 | CALENDAR

«November 2018»
123
45678910
11121314151617
18192021222324
252627282930
blog名称:World Wide Web Watch
日志总数:193
评论数量:663
留言数量:75
访问次数:5555821
建立时间:2004年10月30日
站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.047 second(s), page refreshed 144159966 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号