33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

Python 網絡爬蟲 筆記本電腦 CSDN程序人生 2019-06-07
33 關 Python 遊戲,測試你的爬蟲能力到底及格不?33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

作者 | 蘇克1900

責編 | 胡巍巍

本文經授權轉載自高級農民工

最近在網上看到一個非常有意思的 Python 遊戲通關網站,一共有 33 關,每一關都需要利用 Python 知識解題找到答案,然後進入下一關。

很考驗對 Python 的綜合掌握能力,比如有的闖關需要用到正則表達式,有的要用到爬蟲。

我們平常學 Python 都是按章節順序、包或者模塊來學,容易前學後忘。正好可以拿這個網站來綜合測試一下對 Python 的掌握情況,以便查缺補漏。

來說說這個網站怎麼玩。

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

這是網站主頁面,很有歷史感對吧,誕生了已有十幾年了。但千萬不要因為看著像老古董而小瞧它。

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

我們來玩玩看,點擊「get challenged」開始挑戰。

第 0 關是 Warming up 熱身環節:

這一關要求是修改 URL 鏈接,給的提示是電腦上的數學表達式:2 的 38 次方,所以大概就是需要計算出數值,然後修改url 進入下一關。

所以這關就是考 Python 的基本數值運算,你知道怎麼算麼?

打開 Python 自帶終端,一行代碼就能計算出結果:

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

把原鏈接中的 0替換為274877906944回車就會進入下一關:

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

遊戲這就正式開始了。圖片中的筆記本給了三組字母,很容易發現規律:前面的字母往後移動兩位就是後面的字母。

那麼需要做的就是根據這個規律把下面的提示字符串,做位移解密得到真正的句子含義:

這道題考察字符串編碼和 for 循環相關知識,代碼實現如下:

1text = '''g fmnc wms bgblr rpylqjyrc gr zw fylb. rfyrq ufyr amknsrcpq

2 ypc dmp. bmgle gr gl zw fylb gq glcddgagclr ylb rfyr'q

3 ufw rfgq rcvr gq qm jmle. sqgle qrpgle.kyicrpylq

4 gq pcamkkclbcb. lmu ynnjw ml rfc spj.'''

5

6text_translate = ''

7for i in text:

8 if str.isalpha(i):

9 n = ord(i)

10 if i >= 'y':

11 n = ord(i) + 2 - 26

12 else:

13 n = ord(i) + 2

14 text_translate += chr(n)

15 else:

16 text_translate += i

17print(text_translate)

得到結果:

1i hope you didnt translate it by hand.

2thats what computers are for.

3doing it in by hand is inefficient and that's why this text is so long.

4using string.maketransis recommended. now apply on the url.

作者很風趣,當然不能手動去一個推算了,推薦用 string.maketrans 這個方法解決,我們上面採取的是比較直接的方法,官方給出了更為精簡的方法:

1import string

2l = string.lowercase

3t = string.maketrans(l, l[2:] + l[:2])

4print (text.translate(t))

然後把 url 中的 map 改為ocr回車就來到了第 2 關:

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

作者接著說過關的提示可能在書裡(當然不可能了)也可能在網頁源代碼裡。那就右鍵查看源代碼往下拉看到綠色區域,果然找到了問題:

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

意思就是:要在下面這一大串字符裡找到出現次數最少的幾個字符

考察了這麼幾個知識點:

  • 正則表達式提取字符串

  • list 計數

  • 條件語句

如果是你,你會怎麼做?

來看下,十行代碼快速實現:

1import requests

2url = 'http://www.pythonchallenge.com/pc/def/ocr.html'

3res = requests.get(url).text

4text = re.findall('.*?<!--.*-->.*<!--(.*)-->',res,re.S)

5# list轉為str便於遍歷字符

6str = ''.join(text)

7

8lst =

9key=

10#遍歷字符

11for i in str:

12 #將字符存到list中

13 lst.append(i)

14 #如果字符是唯一的,則添加進key

15 if i not in key:

16 key.append(i)

17# 將list列表中的字符出現字數統計出來

18for items in key:

19 print(items,lst.count(items))

首先,用 Requests 請求網頁然後用正則提取出字符串,接著 for 循環計算每個字符出現的次數。

1% 6104

2$ 6046

3@ 6157

4_ 6112

5^ 6030

6# 6115

7) 6186

8& 6043

9! 6079

10+ 6066

11] 6152

12* 6034

13} 6105

14[ 6108

15( 6154

16{ 6046

17

18e 1

19q 1

20u 1

21a 1

22l 1

23i 1

24t 1

25y 1

可以看到出現次數最少的就是最後幾個字符,合起來是「equality」,替換 url 字符就闖過過了第 2 關進入下一關繼續挑戰。是不是有點意思?

後面每一關都需要用到相關的 Python 技巧解決,比如第 4 關:

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

mark

這一關作者弄了個小惡作劇,需要手動輸入數值到 url 中然後回車,你以為這樣就完了麼?並沒有它有會不斷重複彈出新的數值讓你輸入,貌似無窮盡。

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

所以,這一關肯定不能採取手動輸入的方法闖關,自然要用到 Python 了。要實現自動填充修改 url 回車跳轉到新 url,循環直到網頁再也無法跳轉為止這一功能。

如果是你,你會怎麼做?

其實,一段簡單的爬蟲加正則就能搞定。思路很簡單,把每次網頁中的數值提取出來替換成新的 url 再請求網頁,循環下去,代碼實現如下:

1import requests

2import re

3import os

4

5# 首頁url

6resp = requests.get(

7 'http://www.pythonchallenge.com/pc/def/linkedlist.php?nothing=12345').text

8url = 'http://www.pythonchallenge.com/pc/def/linkedlist.php?nothing='

9# 計數器

10count = 0

11while True:

12 try:

13 # 提取下一頁動態數值

14 nextid = re.search('\d+', resp).group

15 count = count + 1

16 nextid = int(nextid)

17 except:

18 print('最後一個url為:%s' % nexturl)

19 break

20

21 # 獲取下一頁url

22 nexturl = url + str(nextid)

23 print('url %s:%s' % (count, nexturl))

24 # 重複請求

25 resp = requests.get(nexturl).text

輸出結果如下:

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

可以看到,最終循環了 85 次找到了最後一個數字16044,輸入到 url 中就闖關成功。

33 關既有趣又能鍛鍊使用 Python 解決問題的技巧,感興趣的話去玩玩看。

網址:http://www.pythonchallenge.com/

如果遇到不會做的題,可以在這裡找到參考答案:

中參考文教程:

https://www.cnblogs.com/jimnox/archive/2009/12/08/tips-to-python-challenge.html

官方參考教程:

http://garethrees.org/2007/05/07/python-challenge/

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

作為碼一代,想教碼二代卻無從下手:

聽說少兒編程很火,可它有哪些好處呢?

孩子多大開始學習比較好呢?又該如何學習呢?

最新的編程教育政策又有哪些呢?

下面給大家介紹CSDN新成員:極客寶寶(ID:geek_baby)

戳他了解更多↓↓↓

熱 文推 薦

☞“年薪百萬程序員遭親媽拍賣”剛剛刷爆朋友圈!網友:是我本人!

☞ 真壕!騰訊員工平均月薪 7 萬!

☞ 高級!程序員用遞歸來撩妹?!| 程序員有話說

☞厲害!女學生偷師男子學校,變身區塊鏈開發工程師

☞這家公司的 IoT ,你可千萬別低估!

☞深扒! 幣安被盜的7074.18枚比特幣去哪了?

☞如何使用「番茄法」高效的寫算法題?

☞面對互聯網一線大廠,這些技術你需要了解!

☞刺激!華為程序員年薪200萬 ?真相讓人心酸!

33 關 Python 遊戲,測試你的爬蟲能力到底及格不?

你點的每個“在看”,我都認真當成了喜歡

相關推薦

推薦中...