百度搜索优化 父子元素 Android开发 inheritance mobile hive hyperlink get Component 查看kafka消费情况 java微服务架构 python实例 python字典get python写脚本 python安装环境变量 python中集合 javamysql java终止线程 java语言是什么 java日期格式化 pr黑场过渡 dota改键工具 电脑密码查看器 dnf男柔道加点 win10有几个版本 maya2016教程 js日期格式化 wegame更新失败 挑战程序设计竞赛 正当防卫4存档 img写盘工具 操作系统安装 摇骰子表情包 系统激活 python字符串 sprutcam python进程池 文件解密软件 goldwave消除人声 武林外传戟神加点
当前位置: 首页 > 学习教程  > 编程学习

php 抓取网页数据

2021/1/9 1:58:33 文章标签: php抓取网页内容

php 抓取网页数据 header("Content-type: text/html; charsetutf-8"); //$url "https://www.cnblogs.com/chenliyang/p/6554647.html"; //$html file_get_contents($url); 如果出现中文乱码使用下面代码 $getcontent iconv("gb2312", "u…

php 抓取网页数据
header("Content-type: text/html; charset=utf-8");
//$url = "https://www.cnblogs.com/chenliyang/p/6554647.html";
//$html = file_get_contents($url);
如果出现中文乱码使用下面代码
$getcontent = iconv("gb2312", "utf-8",$html);
//echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>"; //获取整个内容

第一种 file_get_contents 抓取$url = 'http://www.baidu.com'; //这儿填页面地址
$info=file_get_contents($url);
//preg_match('|<title>(.*?)<\/title>|i',$info,$m);
$m1=preg_match('|<title>(.*?)<\/title>|',$info,$m);
//var_dump($m1);
 echo $m[1]; //获取标题
 echo '<br/>';

 第二种 curl抓取,$url = "http://www.baidu.com";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);

$m1=preg_match('|<title>(.*?)<\/title>|',$html,$ms);
//echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";  //获取整个内容
//curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
echo $ms[1]; //获取标题
echo '<br/>';

本文链接: http://www.dtmao.cc/news_show_1100160.shtml

附件下载

相关教程

    暂无相关的数据...

共有条评论 网友评论

验证码: 看不清楚?