欢迎来到Doc100.Net免费学习资源知识分享平台!
您的位置:首页 > 程序异常 >

抓取url跟网页内容

更新时间: 2014-01-05 00:55:44 责任编辑: Author_N1

 

抓取url和网页内容
由于技术不够,整天在逛论坛。看到许多关于抓取网页内容(file_get_contents)和抓取url(这个不知道用什么)对这个听感兴趣。望大神指点下这是怎么回事?最好能帮我整个源码嘎嘎。叫我参考下。
--参考方法--
$url='http://www.iheima.com/';
$con=file_get_contents($url);
if ($con){

preg_match_all('/<h5><a href="(.+)".*>(.+)<\/a>.*<p class="clearb bac">(.+)<\/p>/isU', $con, $temp,PREG_SET_ORDER);
foreach ($temp as $key=> $v){
$title=$v[2];
$v_url=$v[1];
$des=$v[3];
$con_url=file_get_contents($v_url);
if ($con_url){
$tags='';
preg_match('/keywords" content="(.+)"/isU', $con_url,$tags);
$tags=trim($tags[1],',');

preg_match('/class="txs_Content".*>(.+)<\/div>/isU', $con_url,$txt);
$txt=$txt[1];
}

}
} 够清楚了吧
上一篇:上一篇
下一篇:下一篇

 

随机推荐程序问答结果

 

 

如对文章有任何疑问请提交到问题反馈,或者您对内容不满意,请您反馈给我们DOC100.NET论坛发贴求解。
DOC100.NET资源网,机器学习分类整理更新日期::2014-01-05 00:55:44
如需转载,请注明文章出处和来源网址:http://www.doc100.net/bugs/t/1496/
本文WWW.DOC100.NET DOC100.NET版权所有。