黄色一级二级三级_99精品视频在线免费观看_一本大道久久a久久综合婷婷 _久久精品国产99国产精品澳门_精品久久久久久综合日本_外国成人在线视频_久久婷婷综合激情_亚洲精品久久区二区三区蜜桃臀 _国产精品最新在线观看_手机福利在线_在线欧美不卡_亚洲夜晚福利在线观看

python使用動態ip抓取網頁

當我們從網站抓取一條信息時,如果我們經常訪問它,它可能會被被訪問的網站檢測到并被阻止。解決這個問題的方法之一是使用代理ip。當我們上網時,我們的電腦會被分配一個IP讓我們嘗試。當我們頻繁訪問一個網站時,網站會被阻止,因為我們發現同一個IP地址被訪問了很多次。此時,更改IP地址是最好的解決方案。此時如果我們使用多個不同的頭,此時會出現多個ip+主機的組合,訪問時被發現的概率會進一步降低。
 
 
關于代碼中ip代理的使用,介紹如下:
 
步驟:
 
1.urllib2庫中的ProxyHandler類,通過它可以使用ip代理來訪問網頁。
 
proxy _ support = urllib 2 . proxy handler({ }),其中參數是字典{'type':' proxy ip:端口號' }。
 
2、定制和創建一個開瓶器。
 
open er = urllib 2 . build _ open er(proxy _ support)
 
3.(1)安裝開啟器。
 
urlib2.install_opener(opener)
 
(2)調用默認的開瓶器。
 
open . open(URL)
 
對于沒有反爬蟲機制的網站,我們只需要直接引入如上的ProxyHandler類進行處理,以訪問csdn主頁為例:
 
導入urllib
 
url="http://www.csdn.net/"
 
對于范圍內的I(0,10000):
 
html=urllib.urlopen(url)
 
打印html.info()
 
使用上述代碼時,當循環到20時,將出現以下錯誤。
 
追溯(最近一次通話持續時間):
文件“C:/Users/Lenovo/pycharmports/untitle 1/jt2/_ _ init _ _。py”,第19行,中
html=urllib.urlopen(url)
文件“C:Python27liburllib.py”,第87行,在urlopen中
返回開啟器. open(url)
文件“C:python 27 LiberLib . py”,第213行,處于打開狀態
返回getattr(自我,姓名)(url)
open_http中第350行的文件“C:Python27liburllib.py”
h.endheaders(數據)
文件“C:Python27libhttplib.py”,第997行,在endheaders中
自我。_發送輸出(消息正文)
文件“C:Python27libhttplib.py”,第850行,in _send_output
self.send(消息)
文件“C:Python27libhttplib.py”,第812行,發送中
self.connect()
文件“C:Python27libhttplib.py”,第793行,在connect中
self.timeout,self.source_address)
create_connection中的文件“C:Python27libsocket.py”,第571行
引發錯誤
IOError: [Errno套接字錯誤] [Errno 10060]
 
這是因為我們使用計算機的單個ip進行頻繁訪問并被檢測到。
 
以下是使用ip代理的代碼:
 
導入urllib2
 
隨機導入
 
def getHtml(url,代理):
 
random_proxy = random.choice(代理)
 
proxy_support = urllib2。proxy handler({“http”:random _ proxy })
 
open er = urllib 2 . build _ open er(proxy _ support)
 
urllib2.install_opener(opener)
 
html=urllib2.urlopen(url)
 
返回html
 
url="http://www.csdn.net/"
 
代理=["101.53.101.172:9999 "、" 171.117.93.229:8118 "、" 119.251.60.37:21387 "、" 58.246.194.70:8080 "
 
"115.173.218.224:9797","110.77.0.70:80"]
 
對于范圍內的I(0,10000):
 
嘗試:
 
html=getHtml(url,代理)
 
打印。info () #打印網頁的標題信息只是為了顯示您已經訪問過該網頁,并且可以將其修改為您想要顯示的內容。
 
打印I
 
除了:
 
打印“已失敗”
 
在1096次測試中檢測到此代碼。我們應該知道我的列表中只有6個IP。如果我們增加IPs的數量,被發現的概率會不會再次降低?至于上例中的ip代理,可能過了一段時間就不用了,需要在網上搜索最新的ip代理進行更換。此外,程序中的異常處理是為了使程序能夠處理訪問ip代碼時出現的問題,因為一些ip代理在訪問時會失敗,這可以使程序更加健壯。
 
對于具有反爬蟲機制的網頁,以下是訪問csdn中博客的示例:
 
#編碼:utf-8
 
導入urllib2
 
隨機導入
 
def get_html(url、標頭、代理):
 
random_userAget = random.choice(標頭)
 
random_proxy = random.choice(代理)
 
#以下是模擬的瀏覽器訪問。
 
req = urllib2。請求(網址)
 
req.add_header(“用戶代理”,random_userAget)
 
req.add_header("GET ",url)
 
req.add_header("Host "," blog.csdn.net ")
 
req.add_header("Referer "," http://blog.csdn.net/?&page=6”)
 
#以下是使用ip代理的訪問。
 
proxy_support = urllib2。proxy handler({“http”:random _ proxy })
 
open er = urllib 2 . build _ open er(proxy _ support)
 
urllib2.install_opener(opener)
 
html = urllib2.urlopen(req)
 
返回html
 
url = "http://blog.csdn.net/?&page=3 "
 
使用來自多個主機的user_agent信息形成一個列表。當然,這個列表中所有的user _ agents都是不完整的,使用的時候可以自己去找。
 
用戶代理= [
 
“Mozilla/5.0(Windows NT 6.3;蘋果我們.。。hrome/45 . 0 . 2454 . 101 Safari/537.36 ",
 
“Mozilla/5.0(Windows NT 6.1)apple WebKit/537。。。。。likeGecko)Chrome/45 . 0 . 2454 . 101 safari/537.36”,
 
" Mozilla/5.0(Windows NT 10.0;蘋果網絡工具包.。。。。gecko)Chrome/50 . 0 . 2661 . 102 Safari/537.36”,
 
" Mozilla/5.0(Windows NT 6.1;蘋果網絡工具包/537.3 .。。。ML,像Gecko)Chrome/49 . 0 . 2623 . 112 Safari/537.36”,
 
"用戶代理:Mozilla/5.0(Windows NT 10.0;Win64x64 ).。。WebKit/537.36 (KHTML,像Gecko)Chrome/46 . 0 . 2486 . 0 Safari/537.36 Edge/13.10586”,
 
"用戶代理:Mozilla/5.0(Windows NT 10.0)applebwebki .。。。。36 (KHTML,喜歡Gecko)Chrome/46 . 0 . 2486 . 0 Safari/537.36 Edge/13 . 10586”,
 
" Mozilla/5.0(Windows NT 10.0;蘋果公司.。。。。KHTML,像Gecko)Chrome/50 . 0 . 2661 . 94 Safari/537.36 "

#互聯網上的ip可能不可用,所以您需要嘗試更多。
 
my proxy =[" 220 . 189 . 249 . 80:80 "、" 124.248.32.43:80"]
 
html = get_html(url、用戶代理、我的代理)
 
打印html.read()
 
欧美成人资源| 一区二区三区四区在线看| 成人久久久精品乱码一区二区三区 | 免费在线看黄色片| 九色成人国产蝌蚪91| 亚洲男人第一网站| 日韩a在线观看| 成人美女在线视频| 青青草成人激情在线| 综合国产视频| www.亚洲天堂| aaa大片在线观看| 亚洲成人av福利| 无码精品a∨在线观看中文| 日韩天天综合| 7777精品视频| 久青青在线观看视频国产| 福利影院在线看| 清纯唯美亚洲经典中文字幕| 日本一区二区三区在线观看| 国产亚洲精品久久久久久777| 亚洲黄色a v| 日本成人中文| 国产婷婷一区二区| 国产区视频在线观看| 亚洲欧美日韩在线观看a三区 | 97影院理论午夜| 伊人久久大香线蕉精品组织观看| 日韩女优视频免费观看| 久久久精品有限公司| 欧美2区3区4区| 欧美系列一区| 在线视频超级| 色综合天天综合狠狠| 欧美亚洲另类色图| 亚洲三级视频| 久久夜色精品国产欧美乱| 四虎精品一区二区永久在线观看| 国产精品白丝jk黑袜喷水| 久久亚洲一区二区三区四区五区高| 日本18视频网站| 午夜一级久久| 69视频在线免费观看| 少妇精品久久久一区二区三区| 91电影在线观看| 亚洲不卡中文字幕无码| 亚洲一区二区三区视频| 日本在线精品| 成人爽a毛片免费啪啪红桃视频| 亚洲欧美日韩一区二区三区在线观看 | 亚洲已满18点击进入在线看片| 欧美乱大交做爰xxxⅹ性3| 欧美日韩精品久久| 婷婷六月天在线| 蜜乳av综合| 日韩欧美中文第一页| 国产一二三区av| 不卡视频一二三四| 无限国产资源| 国内精品视频一区二区三区八戒| 精品一区二区三区免费毛片| 亚洲九九精品| 久久久久久久激情| 成人丝袜高跟foot| 99视频在线免费播放| 亚洲已满18点击进入久久| 国产精彩免费视频| 欧美日韩人人澡狠狠躁视频| 亚洲国产精选| 久久一区二区三区欧美亚洲| 亚洲婷婷国产精品电影人久久| 亚洲图片88| 97久久天天综合色天天综合色hd| 91精品综合| 麻豆福利视频| 亚洲一级免费视频| 精品二区视频| 男人天堂成人网| 亚洲欧洲免费视频| 一区二区国产精品| 免费看国产一级片| 在线看日韩av| 成人同人动漫免费观看 | 欧美大胆性生话| 国产精品二区在线| 欧美三区在线观看| 美女尤物久久精品| 国产精品.xx视频.xxtv| 丰满人妻一区二区三区53号| 99re热视频这里只精品| ww久久综合久中文字幕| 一本色道久久99精品综合| 婷婷一区二区三区| 成人国产一区二区三区精品麻豆| 亚洲一一在线| 欧美人与性动xxxx| 国产 日韩 欧美 综合 一区| 国内av免费| 91国偷自产一区二区三区的观看方式| 91影院在线免费观看| 欧美wwwww| 中文字幕人成乱码在线观看| 国产欧美日韩精品在线观看| 亚洲午夜在线视频| 九九久久婷婷| 国产激情在线视频| 91蜜桃网站免费观看| 日韩电影中文字幕在线观看| 不卡一卡二卡三乱码免费网站| 日韩大尺度黄色| 伊人久久大香线蕉午夜av| 日韩三级成人av网| 亚洲午夜免费福利视频| 香蕉视频成人在线观看| 久久电影tv| 欧美3p视频在线观看| 日韩jizzz| 精品伦理精品一区| 成a人片国产精品| 色综合色综合| 日韩精品一页| 免费av在线网址| 激情视频综合网| 日韩欧美成人免费视频| 国产欧美日韩精品一区二区免费| 精品亚洲成a人片在线观看| 热99在线视频| 日韩国产激情在线| 欧美在线制服丝袜| 国产成人av电影免费在线观看| 国产精品毛片无码| 2020国产在线| www免费网站在线观看| 日本中文字幕在线视频观看| 日韩在线视频免费观看高清中文| 亚洲成人一区在线| 国产精品伦理一区二区| 国产精品久久久久蜜臀 | 国产欧美精品一区aⅴ影院| 美腿丝袜亚洲色图| 国内精品久久久久久99蜜桃| xxxxx.日韩| 精品麻豆剧传媒av国产九九九| 美女露胸视频在线观看| 欧美777四色影视在线| 国产wwww| 色诱视频在线观看| 国产精品12345| 三级a在线观看| 丰满少妇被猛烈进入高清播放| 99久久99久久| 久久久久久久久国产精品| 亚洲精品永久免费| 亚洲精品一区二区三区四区高清| 一本色道综合亚洲| 大伊人狠狠躁夜夜躁av一区| 亚洲国产精品久久不卡毛片 | 可播放的18gay1069| 国产 福利 在线| 69日本xxxxxxxxx49| 黄色影视在线观看| 国产精品拍拍拍| 春暖花开成人亚洲区| av基地在线| 乱馆动漫1~6集在线观看| av综合网址| 成人在线视频免费看| 涩涩涩在线视频| 天堂中文а√在线| 成人在线免费电影网站| 欧洲杯什么时候开赛| 欧美一区网站| 精彩视频一区二区三区| 蜜桃精品视频在线观看| 亚洲日本护士毛茸茸| 亚洲欧洲av色图| 欧美一区二区网站| 日本久久亚洲电影| 午夜欧美精品| 精品国产乱码久久久久久果冻传媒| 日本a级不卡| 欧州一区二区| 久久久九九九九| 欧美性三三影院| 九九热精品视频| 亚洲一区二区在线看| 黄色软件在线| 华人av在线| 国内成人自拍| 国产宾馆实践打屁股91| 精品视频在线看| 97精品在线视频| 中文网丁香综合网| 国产在线三区| 免费电影日韩网站| 欧美午夜电影在线观看| 亚洲成人资源在线| xvideos亚洲人网站| 日韩精品一区在线视频| 你懂得在线网址|