爬蟲Python ~ HTTP協議與Requests庫之間的關係

編程語言 Python 網絡爬蟲 技術 奔跑的小賣鋪 奔跑的小賣鋪 2017-09-17

要想知道HTTP與Requests庫之間的關係,需要先了解什麼是HTTP協議

HTTP協議,即超文本傳輸協議(Hypertext transfer protocol)。是一種詳細規定了瀏覽器和萬維網(WWW = World Wide Web)服務器之間互相通信的規則,通過因特網傳送萬維網文檔的數據傳送協議

HTTP的格式

http://host[:port][path]

host: 合法的Internet主機域名或IP地址

port: 端口號,缺省端口為80

path: 請求資源的路徑

HTTP URL實例

http://www.bit.edu.cn

http://220.181.111.188/duty

HTTP URL的理解:URL是通過HTTP協議存取資源的Internet路徑,一個URL對應一個數據資源

HTTP協議對資源的操作

爬蟲Python ~ HTTP協議與Requests庫之間的關係

HTTP協議對於服務器資源的操作方法

HTTP協議對雲端資源的操作都是基於URL來進行操作的

通過GET、HEAD方法來獲取資源,GET方法獲取全部資源,HEAD方法獲取資源頭部信息。

如果想把自己的資源放在服務器上,可以使用POST、PATCH、PUT方法,如果像刪除資源,使用DELETE方法

每次對資源的操作都是獨立無狀態的,也就是說這次的操作跟下一次的操作沒有任何關係

PATCH和PUT的區別

假設URL位置中有一組數據UserInfo,包含UserID、UserName等20個字段 需求:用戶修改了UserName,其他不變 *採用PATCH,僅向URL提交UserName的局部更新請求 *採用PUT,必須將所有20個字段一併提交到UTL,未提交字段被刪除

HTTP協議與Requests庫方法對比

爬蟲Python ~ HTTP協議與Requests庫之間的關係

相關推薦

推薦中...