欢迎来到Doc100.Net免费学习资源知识分享平台!
您的位置:首页 > 程序异常 >

用开源爬虫arale 实现具有登陆页面的抓取,该怎么解决

更新时间: 2014-01-05 01:59:07 责任编辑: Author_N1

 

用开源爬虫arale 实现具有登陆页面的抓取
首先请教一下用过开源工具arale的高手,我想修改它的源代码,实现能对具有登陆页
面的网页进行抓取,改怎么改,请给出思路!如果有其它办法,也可以给我具体思路,包括
使用其它的爬虫

--参考方法--
如果该网站验证信息放在COOKIE里,你可以在http中加入cookie内容,这样就能获取需要验证的数据
如果是通过session,先向验证页面提交用户名和密码,再去抓出其它数据
上一篇:上一篇
下一篇:下一篇

 

随机推荐程序问答结果

 

 

如对文章有任何疑问请提交到问题反馈,或者您对内容不满意,请您反馈给我们DOC100.NET论坛发贴求解。
DOC100.NET资源网,机器学习分类整理更新日期::2014-01-05 01:59:07
如需转载,请注明文章出处和来源网址:http://www.doc100.net/bugs/t/4113/
本文WWW.DOC100.NET DOC100.NET版权所有。