多数大学生出来选择的工作和专业无关
首页 > 专业知识

PHP抓取网页内容的技巧分享

时间:2017-11-04 13:52:42 [来源]:郑州PHP培训学校

   PHP抓取网页内容的技巧分享

  PHP抓取网页内容的实现还是比较简单的。希望大家可以通过本文介绍的方法技巧,彻底掌握这一方法,提高自己的实际编码能力。
  如何才能正确的实现PHP抓取网页内容呢?这个问题对于接触PHP语言不久的朋友来说有些难办。我们今天就为大家介绍了具体的解决办法。
  首先,在C\windows里的php.ini中我打开了extension=php_curl.dll的功能,然后也重启了apapche,以下是我写的PHP抓取网页内容之抓取百度中PHP的信息:
  < ?php
  //初始化curl
  $ch = curl_init() or die (curl_error());
  echo "测试一下";
  //设置URL参数
  curl_setopt($ch,CURLOPT_URL,"http:
  //www.baidu.com/s?wd=php");
  //要求CURL返回数据
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  //执行请求
  $result = curl_exec($ch) or die (curl_error());
  //取得返回的结果,并显示
  echo $result;
  echo curl_error($ch);
  //关闭CURL
  curl_close($ch);
  ?>
  如何正确使用PHP DOM-XML创建XML文件
  PHP接口类interface的正确使用方法
  深入解读PHP抽象类abstract的应用
  探讨PHP simplexml详细使用方法
  如何实现PHP抓取天气预报的功能
  可为什么PHP抓取网页内容后没反应呢?连测试的文字都没有,要是我把echo "测试一下";放到第一行就可以输出,我估计是curl_init()函数还没有运行!
  你看看PHP的phpinfo()中有没有CURL扩展支持!
  把php_curl.dll拷到c:\windows\和c:\windows\system32里面 重启apache之后再试试看
  不是php_curl.dll这个文件,是把php目录中的libeay32.dll,ssleay32.dll拷到c:\windows\system32里面 重启apache
  为了服务器安全着想,所以把allow_url_fopen关掉了。
  当服务器allow_url_fopen = Off 时,就不能用file_get_contents,只有设置ON时可以用。
  < ?php /*
  $getstr=file_get_contents("http://www.
  163.com/weatherxml/54511.xml");
  $qx=explode("\"",strstr($getstr,"qx="));
  $wd=explode("\"",strstr($getstr,"wd="));
  $qximg=explode("\"",strstr($getstr,"qximg="));
  $qximg_=explode(",",$qximg[1]);
  echo "北京&nbsp;".$qx[1]."";
  echo $wd[1];*/
  //echo "< img src='http://news.
  163.com/img/logo/".$qximg_[0]."'>
  < img src='http://news.163.com
  /img/logo/".$qximg_[1]."'>";
  ?>
  以下PHP抓取网页内容的范例是通curl_init函数来获取163天气预报
  把php.ini里( ;extension=php_curl.dll ) 前面的(;)去掉保存
  把php_curl.dll,libeay32.dll,ssleay32.dll拷到c:\windows\system32里,重启IIS即可,没有装apache
  < ?php
  //初始化curl
  $ch = curl_init() or die (curl_error());
  //设置URL参数
  curl_setopt($ch,CURLOPT_URL,"http:
  //www.163.com/weatherxml/54511.xml");
  //要求CURL返回数据
  curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
  //执行请求
  $result = curl_exec($ch) or die (curl_error());
  //取得返回的结果,并显示
  //echo $result;
  // echo curl_error($ch);
  $qx=explode("\"",strstr($result,"qx="));
  $wd=explode("\"",strstr($result,"wd="));
  $qximg=explode("\"",strstr($result,"qximg="));
  $qximg_=explode(",",$qximg[1]);
  echo "北京&nbsp;".$qx[1]."< br />";
  echo $wd[1];
  //关闭CURL
  curl_close($ch);
  ?>
  通过以上对PHP抓取网页内容的学习,大家可以自行实际操作一遍,加深对它的理解。

上一篇:PHP随机数生成与使用解析

下一篇:详解PHP页面跳转函数的具体含义