欢迎来到Doc100.Net免费学习资源知识分享平台!
您的位置:首页 > 程序异常 >

再次获取网页数据!

更新时间: 2014-01-05 02:27:18 责任编辑: Author_N1

 

再次求助获取网页数据!!!!!!!!!!!!!!!!
这次主任下达了死命令,一定要收集到这些数据,我可不想一条条复制啊!!!!! 关键是直接访问单个具体药品 有验证码 烦死啦,各位大侠帮帮忙吧,哎……我一个学医的天天搞这玩意 容易吗

http://www.mims.com/China/Browse/Alphabet/A?cat=drug
用户名:592854173@qq.com
密码:changhai123
文字和图片都需要 如果该条药品有“详细信息”就取详细信息内容,否则再取简明信息



--参考方法--
1. 调用 Wininet.dll 通过 InternetGetCookieEx 方法获取 Cookies

2. SetRequestHeader("Referer","来路的绝对地址")

3. =poWinHttp.Send()  && 提交表单获取页面

这样就可以绕开验证码,也 94 防盗链

最后的结果是这样的


--参考方法--
我估算一下

A-Z = 26页
每页约 15子页
每子页约 15条目
每个条目最多的有10,000字符,就算 5000字符
总共有: 26x15x15x5000=29,250,000
约 3,000万的文字


上一篇:上一篇
下一篇:下一篇

 

随机推荐程序问答结果

 

 

如对文章有任何疑问请提交到问题反馈,或者您对内容不满意,请您反馈给我们DOC100.NET论坛发贴求解。
DOC100.NET资源网,机器学习分类整理更新日期::2014-01-05 02:27:18
如需转载,请注明文章出处和来源网址:http://www.doc100.net/bugs/t/9985/
本文WWW.DOC100.NET DOC100.NET版权所有。