嗨!一隻小蜘蛛
網絡爬蟲是什麼?
又被稱為網頁蜘蛛,網絡機器人
在FOAF社區中間,更經常的稱為網頁追逐者
是一種按照一定的規則
自動地抓取萬維網信息的程序或者腳本
另外一些不常使用的名字還有:
螞蟻、自動索引、模擬程序或者蠕蟲
利用爬蟲技術能做到哪些很酷很有趣很有用的事情?
比如這些:
批量下載:
自動爬取文章小說,生成pdf
爬取互聯網內容生成網站文章(有人做
淘寶客
)批量下載圖片
批量下載視頻
網絡上某某寫的批量下載妹子圖
知乎妹子頭像
淘寶MM
煎蛋網
當然技術是用來解決生活 | 學習 |工作 問題的
高德API+Python解決租房問題
總結一下租房難的癥結:
沒錢。
小中介發佈的價位一般都是假的,會浪費你很多時間。
對交通路線不熟悉以致於選擇面窄。
如果是多人,得同時考慮多人的通勤時間。
利用爬蟲可以將
合適價格
在公司附近(通勤路線好)
房子照片
房東信息
批量獲取後,顯示在網頁上,高效解決租房問題
更多應用
詳情請查閱
知乎
自己寫的一個簡單小蜘蛛–武漢義工
[活動通知助手]
功能:
自動
獲取活動更新
通過
微信
(或者郵件)就及時通知我立即
一鍵群發
給指定微信好友在
微信群
內@所有人,即使通知
背景
武漢在線義工聯盟 http://www.whyigong.com
是一個論壇
無論是
新人培訓
通知,還是活動徵集
都需要通過訪問網站來獲取信息
對於移動互聯網時代
[爬蟲腳本] 自動抓取活動通知
寫入本地文檔
彙總一覽
自動微信通知
自動發送到微信群
#### 時間關係,未完待續
### 如何學習爬蟲-[思維導圖]
一起來爬啊,蜘蛛俠!
你還可以閱讀精彩文章
把你的微信變成超級營銷機器人
相關推薦
'python爬蟲模擬微博登錄'
"微博模擬登錄這是本次爬取的網址:https://weibo.com/一、請求分析找到登錄的位置,填寫用戶名密碼進行登錄操作看看這次請求響應的數據是什麼這是響應得到的數據,保存下來exectime: 8nonce: "HW9VSX"pcid: "gz-4ede4c6269a...
'寫python爬蟲,不會正則怎麼行呢?另贈學習資料'
"導讀:正則在各語言中的使用是有差異的,本文以 Python 3 為基礎。本文主要講述的是正則的語法,對於 re 模塊不做過多描述,只會對一些特殊地方做提示。很多人覺得正則很難,在我看來,這些人一定是沒有用心。其實正則很簡單,根據二八原則,我們只需要懂 20% 的內容就可以...
'python小課堂19 - 面向對象篇(二)'
"前言哈嘍呀Everybody,又到了更新干貨的時間了,繼續python小課堂的迴歸之路,面向對象篇的第二章,面向對象的涉及的東西實在是太多了,所以打算拆開三次寫吧,後面還有一次面向對象篇,但是打算寫完這篇之後用面向對象的設計思想來一波實戰篇教學,依然是和安全相關的,敬請期...
'VS Code 寫 Python 的一點小技巧'
"本文基於 VS Code 1.36.1為什麼要用 VS Code?用 PyCharm 不好嗎?VS Code 是開源免費的,PyCharm 是收費的。VS Code 除了 Python,還可以寫其他語言,PyCharm 不行。VS Code 啟動速度比 PyCharm 快...
推薦中...