亚洲伊人成综合网2222,人人草人人澡,亚洲人成网线在线播

當(dāng)前位置：首頁(yè) > 范文|應(yīng)用文 > IT技術(shù)專欄 > 腳本欄目

python中使用urllib2偽造HTTP報(bào)頭的2個(gè)方法

來(lái)源：易賢網(wǎng) 閱讀：1909 次日期：2014-07-08 19:10:53

溫馨提示：易賢網(wǎng)小編為您整理了“python中使用urllib2偽造HTTP報(bào)頭的2個(gè)方法”,方便廣大網(wǎng)友查閱！

這篇文章主要介紹了python中使用urllib2偽造HTTP報(bào)頭的2個(gè)方法,即偽造http頭信息,需要的朋友可以參考下

在采集網(wǎng)頁(yè)信息的時(shí)候，經(jīng)常需要偽造報(bào)頭來(lái)實(shí)現(xiàn)采集腳本的有效執(zhí)行

下面，我們將使用urllib2的header部分偽造報(bào)頭來(lái)實(shí)現(xiàn)采集信息

方法1、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#Filename:urllib2-header.py

import urllib2

import sys

#抓取網(wǎng)頁(yè)內(nèi)容-發(fā)送報(bào)頭-1

url= "http://www.xxx.net"

send_headers = {

'Host':'www.xxx.net',

'User-Agent':'Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0',

'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',

'Connection':'keep-alive'

}

req = urllib2.Request(url,headers=send_headers)

r = urllib2.urlopen(req)

html = r.read() #返回網(wǎng)頁(yè)內(nèi)容

receive_header = r.info() #返回的報(bào)頭信息

# sys.getfilesystemencoding()

html = html.decode('utf-8','replace').encode(sys.getfilesystemencoding()) #轉(zhuǎn)碼:避免輸出出現(xiàn)亂碼

print receive_header

# print '####################################'

print html

方法2、

#!/usr/bin/python

# -*- coding: utf-8 -*-

#encoding=utf-8

#Filename:urllib2-header.py

import urllib2

import sys

url = 'http://www.xxx.net'

req = urllib2.Request(url)

req.add_header('Referer','http://www.xxx.net/')

req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0')

r = urllib2.urlopen(req)

html = r.read()

receive_header = r.info()

html = html.decode('utf-8').encode(sys.getfilesystemencoding())

print receive_header

print '#####################################'

print html

更多信息請(qǐng)查看IT技術(shù)專欄

更多信息請(qǐng)查看腳本欄目

上一篇：python實(shí)現(xiàn)多線程采集的2個(gè)代碼例子

下一篇：Python中使用urllib2防止302跳轉(zhuǎn)的代碼例子

易賢網(wǎng)手機(jī)網(wǎng)站地址：python中使用urllib2偽造HTTP報(bào)頭的2個(gè)方法

由于各方面情況的不斷調(diào)整與變化，易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考，敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)！

相關(guān)閱讀腳本欄目

Bottle框架中的裝飾器類和描述符應(yīng)用詳解10月30日

Python探索之SocketServer詳解10月30日

Python探索之實(shí)現(xiàn)一個(gè)簡(jiǎn)單的HTTP服務(wù)器10月30日

python探索之BaseHTTPServer-實(shí)現(xiàn)Web服務(wù)器介紹10月30日

13個(gè)最常用的Python深度學(xué)習(xí)庫(kù)介紹10月30日

深入理解Python中的*重復(fù)運(yùn)算符10月30日

python logging日志模塊詳解10月30日

System表空間不足的報(bào)警問(wèn)題淺析10月22日

Android開(kāi)發(fā)自定義TextView省略號(hào)樣式的方法10月22日

MySQL 清除表空間碎片的實(shí)例詳解10月22日

Ubuntu下MySQL安裝及配置遠(yuǎn)程登錄教程10月22日

Python 2.x如何設(shè)置命令執(zhí)行的超時(shí)時(shí)間實(shí)例10月22日

windows 64位下redis安裝教程10月22日

Android 自定義 HorizontalScrollView 打造多圖片OOM 的橫向滑動(dòng)效果10月22日

淺談Node Inspector 代理實(shí)現(xiàn)10月22日

java web開(kāi)發(fā)之購(gòu)物車功能實(shí)現(xiàn)示例代碼10月22日

Android開(kāi)發(fā)中GridView用法示例10月22日

Django ORM框架的定時(shí)任務(wù)如何使用詳解10月22日

SpringMail使用過(guò)程中的報(bào)錯(cuò)解決辦法10月22日

Android 使用自定義RecyclerView控件實(shí)現(xiàn)Gallery效果10月22日