'Python中的正則表達式'

Python 編程python新視野 2019-08-29

什麼是正則表達式

世界上分為兩種人，一種是懂正則表達式的，一種是不懂正則表達式的

按照一定的規則，從某個字符串中匹配出想要的數據，這個規則就是正則表達式

正則表達式常用的匹配規則

匹配某個字符串

text = 'hello'ret = re.match('he', text)print(ret.group())# >> he

Python資源共享群：626017123

點(.) 匹配任意的字符串

text = 'ab'ret = re.match('.', text)print(ret.group())# >> a

\\d 匹配任意的數字

text = '123'ret = re.match('\\d', text)print(ret.group())# >> 1

\\D 匹配任意的非數字

text = "a"ret = re.match('\\D',text)print(ret.group())# >> a

如果text為一個數字，那麼就匹配不成功了

text = "1"ret = re.match('\\D',text)print(ret.group())# >> AttributeError: 'NoneType' object has no attribute 'group'

\\s 匹配的是空白字符串(包括：\\n，\\t，\\r，空格)

text = "\\t"ret = re.match('\\s',text)print(ret.group())# >> 此處是一個空白

\\w 匹配的是 a-z 和 A-Z 以及數字和下劃線

text = "_"ret = re.match('\\w',text)print(ret.group())# >> _

如果要匹配一個其他的字符，那麼就匹配不到

text = "+"ret = re.match('\\w',text)print(ret.group())# >> AttributeError: 'NoneType' object has no attribute

\\W 匹配的是和 \\w 相反的

text = "+"ret = re.match('\\W',text)print(ret.group())# >> +

如果你的text是一個下劃線或者英文字符，那麼就匹配不到了

text = "_"ret = re.match('\\W',text)print(ret.group())# >> AttributeError: 'NoneType' object has no attribute

[] 組合的方式，只要滿足中括號中的某一項都算匹配成功

text = "027-88888888"ret = re.match('[\\d\\-]+',text)print(ret.group())# >> 027-88888888

其實可以使用中括號代替幾種默認的匹配規則

\\d ：[0-9]
\\D ：0-9
\\w ：[0-9a-zA-Z_]
\\W ：[^0-9a-zA-Z_]

匹配多個字符

*：可以匹配0或者任意多個字符

text = '8888'ret = re.match('\\d*',text)print(ret.group())# >> 8888

以上因為匹配的要求是 \\d ，那麼就要求是數字，後面跟了一個星號，就可以匹配到8888這四個字符

+：可以匹配1個或者多個字符，最少一個

text = "abc"ret = re.match('\\w+',text)print(ret.group())# >> abc

因為匹配的是\\w ，那麼就要求是英文字符，後面跟了一個加號，意味著最少要有一個滿足 \\w 的字符才能夠匹配到。如果text是一個空白字符或者是一個不滿足\\w的字符，就會報錯

text = ""ret = re.match('\\w+',text)print(ret.group())# >> AttributeError: 'NoneType' object has no attribute

?：匹配的字符可以出現一次或者不出現(0或者1)

text = "123"ret = re.match('\\d?',text)print(ret.group())# >> 1

{m}：匹配m個字符

text = "123"ret = re.match('\\d{2}',text)print(ret.group())# >> 12

{m,n}：匹配 m-n 個字符，在這中間的字符都可以匹配到

text = "123"ret = re.match('\\d{1,2}',text)prit(ret.group())# >> 12

如果text只有一個字符，也可以匹配出來

text = "1"ret = re.match('\\d{1,2}',text)prit(ret.group())# >> 1

幾個實際的案例(以給出的文本為例)

驗證手機號碼：手機號碼的規則是以1開頭，第二位可以是34587，後面那9位就可以隨意了

text = "18570631587"ret = re.match('1[34587]\\d{9}',text)print(ret.group())# >> 18570631587

如果是個不滿足條件的手機號碼。那麼就匹配不到了

text = "1857063158"ret = re.match('1[34587]\\d{9}',text)print(ret.group())# >> AttributeError: 'NoneType' object has no attribute

驗證郵箱：郵箱的規則是郵箱名稱是用數字、數字、下劃線組成的，然後是@符號，後面就是域名了

text = "[email protected]"ret = re.match('\\w+@\\w+\\.[a-zA-Z\\.]+',text)print(ret.group())

驗證URL：URL的規則是前面是http或者https或者是ftp然後再加上一個冒號，再加上一個斜槓，再後面就是可以出現任意非空白字符了

text = "http://www.baidu.com/"ret = re.match('(http|https|ftp)://[^\\s]+',text)print(ret.group())

驗證身份證：身份證的規則是，總共有18位，前面17位都是數字，後面一位可以是數字，也可以是小寫的x，也可以是大寫的X

text = "3113111890812323X"ret = re.match('\\d{17}[\\dxX]',text)print(ret.group())

^：表示以…開始

text = "hello"ret = re.match('^h',text)print(ret.group())

如果是在中括號中，代表的是取反操作

$：表示以…結束

# 匹配163.com的郵箱text = "[email protected]"ret = re.search('\\w+@163\\.com$',text)print(ret.group())# >> [email protected]

|：匹配多個表達式或者字符串

text = "hello|world"ret = re.search('hello',text)print(ret.group())# >> hello

貪婪模式和非貪婪模式

貪婪模式：正則表達式會匹配儘量多的字符，默認是貪婪模式。
非貪婪模式：正則表達式會盡量少的匹配字符。

text = "0123456"ret = re.match('\\d+',text)print(ret.group())# 因為默認採用貪婪模式，所以會輸出0123456

可以改成非貪婪模式，就只會匹配到0

text = "0123456"ret = re.match('\\d+?',text)print(ret.group())

匹配0-100之間的數字

text = '99'ret = re.match('[1-9]?\\d$|100$',text)print(ret.group())

如果text=101，就會拋出一個異常

text = '101'ret = re.match('[1-9]?\\d$|100$',text)print(ret.group())# >> AttributeError: 'NoneType' object has no attribute 'group'

轉義字符和原生字符

在正則表達式中，有些字符是有特殊意義的字符，在 Python 中 \\ 也是用來轉義的，因此如果想要在普通的字符串中匹配 \\ ，那麼就要給出四個 \\

text = "apple \\c"ret = re.search('\\\\\\\\c',text)print(ret.group())

所以要使用原生字符就可以解決這個問題

text = "apple \\c"ret = re.search(r'\\\\c',text)print(ret.group())

相關推薦

'Python網絡數據採集入門教程'

"在這篇文章中，我們將介紹Python提供的幾乎所有的網絡數據採集工具，你可以將本文看作是我們的《終極網絡數據採集指南》的系列文章。我們將從最基本的工具到最先進的工具進行介紹，並將涵蓋每一個的利弊。當然，我們並不能涵蓋我們討論的每個工具的所有方面，但是這篇文章應該足以讓你瞭...

Python 瀏覽器 Chrome HTML 文章 JavaScript JSON CSS Apache Nginx 操作系統 Reddit OS X 2019-09-19

'Python什麼情況下會生成 pyc文件？通過pyc文件瞭解Python運行原理'

"由於最近一位同學在做分佈式計算時，部分模塊只把 pyc文件拷貝部署至遠程計算節點，導致主節點程序更新後，計算節點拋出了錯誤異常，於是有了這篇文章...示例如下，有兩個py模塊，testops.py 與 testops_imported.py模塊。我們先來看 testops...

Python 分佈式計算 2019-09-18

'用Python實現進制轉換，這一篇教程就夠了！這也太完美了'

"前言Python 實現進制轉換一、導言導語：在計算機進行數據交換時，常常會有一個進制轉換的過程，我們知道計算機只認0 和 1.在內存系統中，基本基於二進制進行運算的，但是有時候數據過於龐大，為了方便存儲管理，計算機會使用十六進制存儲數據，但是怎麼實現數據轉換呢？我們人類由...

Python 電腦 C語言腳本語言工程師迪吉多 2019-09-18

'用 Python 寫一個安卓 APP'

"作者：youerning來源：http://youerning.blog.51cto.com/10513771/1733534前言用 Python 寫安卓 APP 肯定不是最好的選擇，目前用Java和 kotlin 寫的居多，但是肯定也是一個很偷懶的選擇，而且實在不想學習...

Python Android Java Linux Windows 虛擬機 Google Apache VirtualBox iOS Kotlin GitHub 設計 VMware 電腦 2019-09-18

'Python的概念化知識、優化技巧和常見算法性能優化（高級下篇）'

"6、字典實現原理CPython中使用偽隨機探測的散列表作為字典底層數據結構。只有可哈希對象才能作為字典的鍵。如果一個對象有一個在整個生命週期都不變的散列值，而且這個值可以與其他對象進行比較，那麼這個對象就是可哈希Python中所有不可變的內置類型都是可哈希的。可變（列表，...

Python 算法數據結構 XML 編譯器 2019-09-17

'Python中的Lambda，Map和Filter'

"今天的部分介紹了在Python中使用lambda，map和filter函數。我們將介紹每個的基本語法，並通過一些示例來熟悉使用它們。讓我們開始吧！*** Lambda***lambda運算符或lambda函數用於在Python中創建小型的、一次性的匿名函數對象基本語法la...

Python Java 2019-09-17

'中秋佳節：沒編程合集大團圓！318本編出電子書籍➕視頻資料項目'

"中秋節佳節，小夥伴們都放假開心的回家團圓去了吧？這不、小編給你們帶來了更開心的事情、那就是給你們準備好了編程合集大團圓！全網最全編程語言視頻教程（從零基礎到大牛哦！）包含java、python、web、大數據、人工智能、等視頻教程+項目+源碼，現在免費分享給各位！[領取方...

Java 人工智能 Linux 技術腳本語言大數據 Node.js UNIX 程序設計設計 Python 數據庫移動互聯網 HTML HTML5 編程語言操作系統最圓不過中秋月網頁設計 CSS 程序員 JavaScript JSP 自然語言處理 GNU ASP IBM Velocity 讀書中央處理器硬件英語 PHP 文章 2019-09-17

'8個用於業餘項目的優秀Python庫'

"這些庫可以使你更容易構架個人項目。在Python/Django的世界裡有這樣一個諺語：為語言而來，為社區而留。對絕大多數人來說的確是這樣的，但是，還有一件事情使得我們一直停留在Python的世界裡，不願離開，那就是我們可以很容易地利用一頓午餐或晚上幾個小時的時間，把一個想...

Python Django 數據庫 HTML XML 腳本語言 Java 機器學習搜索引擎編程語言 2019-09-16

'《What the f*ck Python!》那難以理解和反人類直覺的例子及原理'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!前言最近，發現了一個在GitHub關於Python的一個非常有趣的項目。這個項目叫《What t...

Python Calvin Klein JavaScript Stack Overflow 機器學習腳本語言 2019-09-16

'Python Requests作者另一神作，Records通用而優雅的數據庫訪問庫'

"我們在開發過程中經常涉及與數據庫進行交互，比如MySQL、Oracle、PostgreSQL、Sqlite，一般，我們使用其對應的Python 第三方模塊，實現相關數據庫操作，如下MySQL數據庫：mysql-connector，pymysql PostgreSQL數據庫...

數據庫 Python SQL MySQL HTML YAML PostgreSQL Excel 2019-09-16

'阿里在職架構師推出了的一份Python學習清單，這一定是你最需要的'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL 數據庫 Linux 程序員讀書 Django 面向對象程序編程 CSS HTML JavaScript MongoDB jQuery 人工智能編程語言算法硬件物聯網路由器操作系統 2019-09-16

'python爬蟲模擬微博登錄'

"微博模擬登錄這是本次爬取的網址：https://weibo.com/一、請求分析找到登錄的位置，填寫用戶名密碼進行登錄操作看看這次請求響應的數據是什麼這是響應得到的數據，保存下來exectime: 8nonce: "HW9VSX"pcid: "gz-4ede4c6269a...

Python 微博網絡爬蟲百度 2019-09-16

'PyPy是Python解釋器的替代品，某些 Python 程序來說會快很多倍'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!前言Python因其強大、靈活且易於使用等特性，而贏得了聲譽。這些優點使其在各種各樣的應用程序、...

Python 技術彙編語言機器學習讀書 2019-09-16

'VBA 會被 Python 代替嗎？'

"VBA和Python都可以處理Excel，VBA和Python各有什麼優勢?有傳言說，微軟會使用Python來替代VBA處理Excel，真的會替代麼？在知乎上看到這篇文章，我覺得分析得挺對的，特轉載一下，內容有所刪減。來源：https://zhuanlan.zhihu.c...

Python Excel 電腦微軟 Word 跳槽那些事兒設計軟件技術 PowerShell 人生第一份工作歷史程序設計數據結構財會人工智能金融 2019-09-16

'Python中的Requests模塊，星號和括號'

"requests模塊官方地址：https://github.com/psf/requests官方文檔：https://2.python-requests.org/en/master/用於http請求的模塊，用於網頁數據抓取七個主要方法Python資源共享群：62601...

Python JSON 2019-09-16

'為什麼有人說 Python 的多線程是雞肋？不是真正意義上的多線程？'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!問題：1、Python 多線程為什麼耗時更長？2、為什麼在 Python 裡面推薦使用多進程而不...

Python 機器學習中央處理器腳本語言網絡爬蟲 2019-09-15

'Python學習乾貨史上最全的 Python 爬蟲工具列表大全'

"這個列表包含與網頁抓取和數據處理的Python庫。網絡通用urllib -網絡庫(stdlib)。requests -網絡庫。grab – 網絡庫（基於pycurl）。pycurl – 網絡庫（綁定libcurl）。urllib3 – Python HTTP庫，安全連接池...

Python 網絡爬蟲 HTML Scrapy XML 瀏覽器 CSS XHTML jQuery C語言 JSON Excel 可視化技術 2019-09-15

'Python基礎學習教程系列講解——try_except異常處理機制'

"在Python編程中不可避免的會出現錯誤，在調試階段出現語法之類的錯誤時，Pycharm會在Debug窗口提示錯誤，但是程序在運行時由於內部隱含的問題而引起錯誤，會導致程序終止執行。比如以下例程中，使用urllib庫打開URL時由於網絡問題而發生了錯誤：import ur...

Python PyCharm 2019-09-15

'用Python控制Excel實現自動化辦公！附全套學習教程'

"1.安裝2.操作一個簡單的Excel文檔操作註釋及代碼：操作完成後，數據存儲結果如下：3. 操作簡單Excel文檔並添加數據格式操作代碼如下：附帶數據格式的定義操作效果如圖所示：4.Excel中添加不同類型的數據操作代碼如下：將不同的數據按照指定的格式添加到文件中代碼執行...

Excel Python 2019-09-15

'入門Python，總遇到這樣那樣的安裝問題，手把手教會你'

"轉發本文並私信我"python"，即可獲得Python資料以及更多系列文章(持續更新的)最近有挺多小夥伴問我要入門 Python 的資料，還有小夥伴完全沒有入門 Python 就直接購買了我的 pandas 專欄。因此我決定寫幾篇 Python 數據處理分析必備的入門知識...

Python 腳本語言 Windows 電腦操作系統文章 2019-09-15

推薦中...