以文本方式查看主题 - 中文XML论坛 - 专业的XML技术讨论区 (http://bbs.xml.org.cn/index.asp) -- 『 Web挖掘技术 』 (http://bbs.xml.org.cn/list.asp?boardid=69) ---- 关于spider的链接分析 (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=39169) |
-- 作者:panye123 -- 发布时间:10/21/2006 5:40:00 PM -- 关于spider的链接分析 最近需要写一个蜘蛛程序,但看了一段时间后发现,网上的很多网页的链接存在相对url或者是javascript生成的链接,请问像下面的相对url如何处理 比如 http:///www.ieee.org.cn/info/Searchmore.asp?id=1(只是比方)的网页中有相对地址 /cs/a.html和Searchmore.asp?id=2 其相应的绝对url分别为 http:///www.ieee.org.cn/cs/a.html和http:///www.ieee.org.cn/info/Searchmore.asp?id=2请问这样的情况怎么分析? 还有就是javascript生成的联接。请高手指明一下思路。谢谢 |
-- 作者:mzq_bim -- 发布时间:12/1/2006 2:04:00 PM -- 做出来了吗?正在关注同一个问题 |
-- 作者:soufz -- 发布时间:12/27/2006 4:42:00 PM -- 我们已经都实现了。 看看:http://www.soufz.com |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
185.547ms |