gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区

站長(zhǎng)資訊網(wǎng)
最全最豐富的資訊網(wǎng)站

掌握PHP 爬取網(wǎng)頁(yè)的主要方法

掌握PHP 爬取網(wǎng)頁(yè)的主要方法

主要流程就是獲取整個(gè)網(wǎng)頁(yè),然后正則匹配(關(guān)鍵的)。

PHP抓取頁(yè)面的主要方法,有幾種方法是網(wǎng)上前輩的經(jīng)驗(yàn),現(xiàn)在還沒(méi)有用到的,先存下來(lái)以后試試。

1.file()函數(shù)

2.file_get_contents()函數(shù)

3.fopen()->fread()->fclose()模式

4.curl方式 (本人主要用這個(gè))

5.fsockopen()函數(shù) socket模式

6.插件(如:http://sourceforge.net/projects/snoopy/)

7.file()函數(shù)

<?php //定義url $url='[http://t.qq.com](http://t.qq.com/)';//fiel函數(shù)讀取內(nèi)容數(shù)組 $lines_array=file($url);//拆分?jǐn)?shù)組為字符串 $lines_string=implode('',$lines_array);//輸出內(nèi)容 echo $lines_string; 

2.使用file_get_contents方法實(shí)現(xiàn),比較簡(jiǎn)單。

使用file_get_contents和fopen必須空間開(kāi)啟allow_url_fopen。方法:編輯php.ini,設(shè)置 allow_url_fopen = On,allow_url_fopen關(guān)閉時(shí)fopen和file_get_contents都不能打開(kāi)遠(yuǎn)程文件。

$url="[http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml](http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml)"; $html=file_get_contents($url); //如果出現(xiàn)中文亂碼使用下面代碼` //$getcontent = iconv("gb2312", "utf-8",$html); echo"<textarea style='width:800px;height:600px;'>".$html."</textarea>";

3.fopen()->fread()->fclose()模式 ,目前還沒(méi)用過(guò),看到了就先記下了

<?php //定義url $url='[http://t.qq.com](http://t.qq.com/)';//fopen以二進(jìn)制方式打開(kāi)  $handle=fopen($url,"rb");//變量初始化 $lines_string="";//循環(huán)讀取數(shù)據(jù) do{ $data=fread($handle,1024);   if(strlen($data)==0) {` break;  }  $lines_string.=$data; }while(true);//關(guān)閉fopen句柄,釋放資源 fclose($handle);//輸出內(nèi)容 echo $lines_string;

4.使用curl實(shí)現(xiàn)(本人一般使用這個(gè))。

使用curl必須空間開(kāi)啟curl。方法:windows下修改php.ini,將extension=php_curl.dll前面的分號(hào)去掉,而且需 要拷貝ssleay32.dll和libeay32.dll到C:WINDOWSsystem32下;Linux下要安裝curl擴(kuò)展。

<?php header("Content-Type: text/html;charset=utf-8"); date_default_timezone_set('PRC'); $url = "https://***********ycare";//要爬取的網(wǎng)址 $res = curl_get_contents($url);//curl封裝方法 preg_match_all('/<script>(.*?)</script>/',$res,$arr_all);//這個(gè)網(wǎng)頁(yè)中數(shù)據(jù)通過(guò)js包過(guò)來(lái),所以直接抓js就可以 preg_match_all('/"id":"(.*?)",/',$arr_all[1][1],$arr1);//從js塊中匹配要的數(shù)據(jù) $list = array_unique($arr1[1]);//(可省)保證不重復(fù) //以下則是同理,循環(huán)則可 for($i=0;$i<=6;$i=$i+2){   $detail_url = 'ht*****em/'.$list[$i];   $detail_res = curl_get_contents($detail_url);   preg_match_all('/<script>(.*?)</script>/',$detail_res,$arr_detail);   preg_match('/"desc":"(.*?)",/',$arr_detail[1][1],$arr_content);   ***     ***     ***   $ret=curl_post('http://**********cms.php',$result);//此腳本未放在服務(wù)器上,原因大家懂就好哈。 } function curl_get_contents($url,$cookie='',$referer='',$timeout=300,$ishead=0) {   $curl = curl_init();   curl_setopt($curl, CURLOPT_RETURNTRANSFER,1);   curl_setopt($curl, CURLOPT_FOLLOWLOCATION,1);   curl_setopt($curl, CURLOPT_URL,$url);   curl_setopt($curl, CURLOPT_TIMEOUT,$timeout);   curl_setopt($curl, CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36');   if($cookie)   {     curl_setopt( $curl, CURLOPT_COOKIE,$cookie);   }   if($referer)   {     curl_setopt ($curl,CURLOPT_REFERER,$referer);   }   $ssl = substr($url, 0, 8) == "https://" ? TRUE : FALSE;   if ($ssl)   {     curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);     curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);   }   $res = curl_exec($curl);   return $res;   curl_close($curl); } //curl post數(shù)據(jù)到服務(wù)器 function curl_post($url,$data){   $ch = curl_init();   curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);   //curl_setopt($ch,CURLOPT_FOLLOWLOCATION, 1);   curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);   curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36');   curl_setopt($ch,CURLOPT_URL,$url);   curl_setopt($ch,CURLOPT_POST,true);   curl_setopt($ch,CURLOPT_POSTFIELDS,$data);   $output = curl_exec($ch);   curl_close($ch);   return $output;  } ?>

5.fsockopen()函數(shù) socket模式(沒(méi)用過(guò),以后可以試試)

socket模式能否正確執(zhí)行,也跟服務(wù)器的設(shè)置有關(guān)系,具體可以通過(guò)phpinfo查看服務(wù)器開(kāi)啟了哪些通信協(xié)議

<?php $fp = fsockopen("t.qq.com", 80, $errno, $errstr, 30); if (!$fp) {   echo "$errstr ($errno)<br />n"; } else {   $out = "GET / HTTP/1.1rn";   $out .= "Host: t.qq.comrn";   $out .= "Connection: Closernrn";   fwrite($fp, $out);   while (!feof($fp)) {     echo fgets($fp, 128);   }   fclose($fp); }

6.snoopy插件,最新版本是Snoopy-1.2.4.zip Last Update: 2013-05-30,推薦大家使用

使用網(wǎng)上非常流行的snoopy來(lái)進(jìn)行采集,這是一個(gè)非常強(qiáng)大的采集插件,并且它的使用非常方便,你也可以在里面設(shè)置agent來(lái)模擬瀏覽器信息。

說(shuō)明:設(shè)置agent是在 Snoopy.class.php 文件的第45行,請(qǐng)?jiān)谠撐募兴阉?“var 公式輸入有誤_SERVER['HTTP_USER_AGENT']; 可以得到瀏覽器信息,將echo出來(lái)的內(nèi)容復(fù)制到agent里面就可以了。

<?php //引入snoopy的類文件 require('Snoopy.class.php'); //初始化snoopy類 $snoopy=new Snoopy; $url="[http://t.qq.com](http://t.qq.com/)"; //開(kāi)始采集內(nèi)容` $snoopy->fetch($url); //保存采集內(nèi)容到$lines_string $lines_string=$snoopy->results; //輸出內(nèi)容,嘿嘿,大家也可以保存在自己的服務(wù)器上 echo $lines_string;

推薦相關(guān)學(xué)習(xí):php圖文教程

贊(0)
分享到: 更多 (0)
?
網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)
gmnon.cn-疯狂蹂躏欧美一区二区精品,欧美精品久久久久a,高清在线视频日韩欧美,日韩免费av一区二区
三级黄色片免费看| 男人天堂999| 日日碰狠狠躁久久躁婷婷| 日本黄大片一区二区三区| 亚洲人成无码网站久久99热国产| 五月激情婷婷在线| 国产日韩一区二区在线观看| 97碰在线视频| 日韩精品福利片午夜免费观看| 久久精品影视大全| 男人天堂成人在线| 免费日韩中文字幕| 熟女性饥渴一区二区三区| 国产资源在线免费观看| 一二三级黄色片| 欧美一级免费在线| 五月天综合婷婷| 国产在线视频三区| 黄色网zhan| 妺妺窝人体色www看人体| 亚洲欧美一区二区三区不卡| 红桃视频 国产| 亚洲精品国产一区二区三区| 亚洲福利精品视频| 男女男精品视频站| 久热精品在线观看视频| 国产福利精品一区二区三区| 亚洲精品性视频| 6080国产精品| 男人j进女人j| 无罩大乳的熟妇正在播放| 五十路熟女丰满大屁股| 日本三级免费观看| 艹b视频在线观看| 青青草原网站在线观看| 精品人妻人人做人人爽| 久久亚洲中文字幕无码| 日本xxxxxxx免费视频| 久久综合伊人77777麻豆最新章节| xxxx一级片| 亚洲国产一二三精品无码 | 亚洲天堂第一区| 国产精品久久久久久久久电影网| 精品丰满人妻无套内射| 国产成人无码av在线播放dvd| 免费涩涩18网站入口| 欧洲金发美女大战黑人| 亚洲色成人一区二区三区小说| 中文字幕第80页| 成人国产一区二区三区| www.超碰com| 2022中文字幕| 一级特黄性色生活片| 五月天在线免费视频| 国产男女在线观看| 偷拍盗摄高潮叫床对白清晰| 成人av一级片| 国产高清免费在线| 热久久精品国产| www.国产在线视频| 亚洲精品手机在线观看| 欧美不卡在线播放| 裸体裸乳免费看| 天天爱天天操天天干| 免费人成自慰网站| 亚洲天堂伊人网| 久久9精品区-无套内射无码| 自拍偷拍视频在线| 在线观看亚洲色图| 精品久久一二三| 国产黄色激情视频| 免费黄频在线观看| 手机看片福利日韩| av网站在线观看不卡| 国产a级黄色大片| 亚洲第一色av| www.天天射.com| a√天堂在线观看| 久久国产精品视频在线观看| 久久精品久久99| 日本免费色视频| 免费看黄色一级大片| 欧美牲交a欧美牲交aⅴ免费真| 日韩欧美视频免费在线观看| 在线观看av免费观看| 中文字幕第38页| 怡红院亚洲色图| 伊人网在线综合| 色免费在线视频| 国产3p在线播放| 女人高潮一级片| 午夜激情视频网| 美国av在线播放| 8x8ⅹ国产精品一区二区二区| 超碰中文字幕在线观看| 亚洲怡红院在线| 999这里有精品| 日本xxx免费| 国产亚洲黄色片| 欧美色图另类小说| 狠狠操精品视频| 亚洲娇小娇小娇小| 男同互操gay射视频在线看| 四虎精品欧美一区二区免费| 欧美a级黄色大片| aa视频在线播放| 精品99在线视频| 九九热免费精品视频| 黄色手机在线视频| 日韩国产精品毛片| 青青草精品视频在线| 国产美女无遮挡网站| 熟妇人妻无乱码中文字幕真矢织江 | 国产又粗又猛大又黄又爽| 熟妇熟女乱妇乱女网站| 真实国产乱子伦对白视频| 日韩av新片网| 中文字幕 91| www.国产在线视频| www亚洲成人| 老司机激情视频| 污污视频网站免费观看| 日韩a一级欧美一级| 青青在线视频免费观看| 欧美极品欧美精品欧美图片| 做a视频在线观看| 男人天堂a在线| 亚洲美女性囗交| 日韩黄色短视频| 超碰超碰在线观看| 国产曰肥老太婆无遮挡| 日本熟妇人妻中出| 看全色黄大色大片| www.日日操| 国产情侣第一页| 国产高清视频网站| 国产免费黄色av| 黄色三级中文字幕| 久久精品一卡二卡| 可以免费在线看黄的网站| 麻豆视频传媒入口| 国产欧美精品一二三| 国产又黄又猛视频| 日韩伦理在线免费观看| 三级网在线观看| 成人亚洲精品777777大片| 免费看又黄又无码的网站| 亚洲高潮无码久久| 久久久精品视频国产| 无码内射中文字幕岛国片| 僵尸世界大战2 在线播放| 中文字幕亚洲影院| 亚洲综合婷婷久久| 在线观看的毛片| 日韩一级片播放| 欧美激情国产精品日韩| 久久久久99精品成人片| 日本中文字幕一级片| 少妇高潮流白浆| 污视频在线观看免费网站| 久热精品在线观看视频| 精品免费国产一区二区| 欧美 激情 在线| 国产精品第12页| 那种视频在线观看| 国产91美女视频| 色综合av综合无码综合网站| av黄色在线网站| 日韩免费一级视频| 日韩毛片在线免费看| 又色又爽又高潮免费视频国产| 欧美在线观看成人| 国产裸体免费无遮挡| 亚洲视频在线a| 欧美日韩在线免费播放| 成人亚洲视频在线观看| 自拍偷拍一区二区三区四区| 国产美女18xxxx免费视频| 中文字幕一区二区在线观看视频| 日韩成人精品视频在线观看| 色姑娘综合天天| 大荫蒂性生交片| a级黄色一级片| 国产精品69页| 三区视频在线观看| 97久久国产亚洲精品超碰热| 久草视频国产在线| 国产一线二线三线在线观看| 97超碰人人看| 亚洲熟妇无码一区二区三区| 波多野结衣天堂| 无码毛片aaa在线| 无码人妻丰满熟妇区五十路百度| 欧美女同在线观看| 日本一本中文字幕| 黄大色黄女片18第一次| 国产日本在线播放| 中文字幕一区二区三区四| 国产人妻777人伦精品hd| 午夜在线观看av|