以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  关于spider的链接分析  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=39169)


--  作者:panye123
--  发布时间:10/21/2006 5:40:00 PM

--  关于spider的链接分析
最近需要写一个蜘蛛程序,但看了一段时间后发现,网上的很多网页的链接存在相对url或者是javascript生成的链接,请问像下面的相对url如何处理
   
   比如 http:///www.ieee.org.cn/info/Searchmore.asp?id=1(只是比方)的网页中有相对地址     /cs/a.html和Searchmore.asp?id=2 其相应的绝对url分别为 http:///www.ieee.org.cn/cs/a.htmlhttp:///www.ieee.org.cn/info/Searchmore.asp?id=2请问这样的情况怎么分析?
   还有就是javascript生成的联接。请高手指明一下思路。谢谢

--  作者:mzq_bim
--  发布时间:12/1/2006 2:04:00 PM

--  
做出来了吗?正在关注同一个问题
--  作者:soufz
--  发布时间:12/27/2006 4:42:00 PM

--  
我们已经都实现了。
看看:http://www.soufz.com
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
185.547ms