亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python中正則表達式的巧妙使用一文包你必掌握正則

系統 1537 0

前言

正則表達式就是從字符串中發現規律,并通過“抽象”的符號表達出來。打個比方,對于2,5,10,17,26,37這樣的數字序列,如何計算第7個值,肯定要先找該序列的規律,然后用n2+1這個表達式來描述其規律,進而得到第7個值為50。對于需要匹配的字符串來說,同樣把發現規律作為第一步,本文主要使用正則表達式完成字符串的查詢匹配、替換匹配和分割匹配。

Python中正則表達式的巧妙使用一文包你必掌握正則_第1張圖片

常用的正則符號

在進入字符串的匹配之前,先來了解一下都有哪些常用的正則符號,見下表所示:

Python中正則表達式的巧妙使用一文包你必掌握正則_第2張圖片

如果讀者能夠比較熟練地掌握上表中的內容,相信在字符串處理過程中將會游刃有余。如前文所說,本節將基于正則表達式完成字符串的查詢、替換和分割操作,這些操作都需要導入re模塊,并使用如下介紹的幾個函數。

字符串的匹配查詢

re模塊中的findall函數可以對指定的字符串進行遍歷匹配,獲取字符串中所有匹配的子串,并返回一個列表結果。該函數的參數含義如下:

findall(pattern, string, flags=0)

pattern:指定需要匹配的正則表達式。

string:指定待處理的字符串。

flags:指定匹配模式,常用的值可以是re.I、re.M、re.S和re.X。re.I的模式是讓正則表達式對大小寫不敏感;re.M的模式是讓正則表達式可以多行匹配;re.S的模式指明正則符號.可以匹配任意字符,包括換行符 ;re.X模式允許正則表達式可以寫得更加詳細,如多行表示、忽略空白字符、加入注釋等。

字符串的匹配替換

re模塊中的sub函數的功能是替換,類似于字符串的replace方法,該函數根據正則表達式把滿足匹配的內容替換為repl。該函數的參數含義如下:

sub(pattern, repl, string, count=0, flags=0)

pattern:同findall函數中的pattern。

repl:指定替換成的新值。

string:同findall函數中的string。

count:用于指定最多替換的次數,默認為全部替換。

flags:同findall函數中的flags。

字符串的匹配分割

re模塊中的split函數是將字符串按照指定的正則表達式分隔開,類似于字符串的split方法。該函數的具體參數含義如下:

split(pattern, string, maxsplit=0, flags=0)

pattern:同findall函數中的pattern。

maxsplit:用于指定最大分割次數,默認為全部分割。

string:同findall函數中的string。

flags:同findall函數中的flags。

實戰案例

如果上面的函數和參數含義都已經掌握了,還需要進一步通過案例加強理解,接下來舉例說明上面的三個函數:

            
# 導入用于正則表達式的re模塊 
import re 
# 取出字符串string8中所有的天氣狀態 
string8 = "{ymd:'2018-01-01',tianqi:'晴',aqiInfo:'輕度污染'},{ymd:'2018-01-02',tianqi:'陰~小雨',aqiInfo:'優'},{ymd:'2018-01-03',tianqi:'小雨~中雨',aqiInfo:'優'},{ymd:'2018-01-04',tianqi:'中雨~小雨',aqiInfo:'優'}" 
# 基于正則表達式使用findall函數 
print(re.findall("tianqi:'(.*?)'", string8)) 
# 取出string9中所有含O字母的單詞 
string9 = 'Together, we discovered that a free market only thrives when there are rules to ensure competition and fair play, Our celebration of initiative and enterprise' 
# 基于正則表達式使用findall函數 
print(re.findall('w*ow*',string9, flags = re.I)) 
# 將string10中的標點符號、數字和字母刪除 
string10 = '據悉,這次發運的4臺蒸汽冷凝罐屬于國際熱核聚變實驗堆(ITER)項目的核二級壓力設備,先后完成了壓力試驗、真空試驗、氦氣檢漏試驗、千斤頂試驗、吊耳載荷試驗、疊裝試驗等驗收試驗。' 
# 基于正則表達式使用sub函數 
print(re.sub('[,。、a-zA-Z0-9()]','',string10)) 
# 將string11中的每個子部分內容分割開 
string11 = '2室2廳 | 101.62平 | 低區/7層 | 朝南 
 上海未來 - 浦東 - 金楊 - 2005年建' 
# 基于正則表達式使用split函數 
split = re.split('[-| 
]', string11) 
print(split) 
# 分割結果的清洗 
split_strip = [i.strip() for i in split] 
print(split_strip) 
out: 
['晴', '陰~小雨', '小雨~中雨', '中雨~小雨'] 
['Together', 'discovered', 'only', 'to', 'competition', 'Our', 'celebration', 'of'] 
據悉這次發運的臺蒸汽冷凝罐屬于國際熱核聚變實驗堆項目的核二級壓力設備先后完成了壓力試驗真空試驗氦氣檢漏試驗千斤頂試驗吊耳載荷試驗疊裝試驗等驗收試驗 
['2室2廳 ', ' 101.62平 ', ' 低區/7層 ', ' 朝南 ', ' 上海未來 ', ' 浦東 ', ' 金楊 ', ' 2005年建'] 
['2室2廳', '101.62平', '低區/7層', '朝南', '上海未來', '浦東', '金楊', '2005年建']
          

如上結果所示,在第一個例子中通過正則表達式"tianqi:'(.*?)'"實現目標數據的獲取,如果不使用括號的話,就會產生類似"tianqi:'晴'", "tianqi:'陰~小雨'"這樣的值,所以,加上括號就是為了分組,且僅返回組中的內容;

第二個例子并沒有將正則表達式寫入圓括號,如果寫上圓括號也是返回一樣的結果,所以findall就是用來返回滿足匹配條件的列表值,如果有括號,就僅返回括號內的匹配值;

第三個例子使用替換的方法,將所有的標點符號換為空字符,進而實現刪除的效果;

第四個例子是對字符串的分割,如果直接按照正則 '[,。、a-zA-Z0-9()]' 分割的話,返回的結果中包含空字符,如 '2室2廳' 后面就有一個空字符。為了刪除列表中每個元素的首尾空字符,使用了列表表達式,并且結合字符串的strip方法完成空字符的壓縮。

總結

以上所述是小編給大家介紹的Python中正則表達式的巧妙使用一文包你必掌握正則,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復大家的!


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 四虎永久在线精品免费影视 | 欧美性狂猛bbbbbbxxxx | 四虎精品成人免费视频 | 情欲综合网| 中文字幕伊人久久网 | 亚洲好色网 | 成人小视频在线播放 | 成人9久久国产精品品 | 在线综合 亚洲 欧美中文字幕 | 人人揉揉香蕉大免费不卡 | 国产福利专区精品视频 | 精品综合在线 | 四虎网址换成什么了2021 | 狠狠色狠狠色综合 | 欧美污视频网站 | 国产高清免费 | 国产一区二区三区在线影院 | 久久伊人久久亚洲综合 | 四虎永久视频 | 成人性毛片 | 久久88香港三级台湾三级中文 | 99热久久久久久久免费观看 | 国产精品99久久久久久www | 天天射天天干天天 | 国产成人精品视频播放 | 欧美成人亚洲国产精品 | 精品久久久久久久一区二区伦理 | 色综合激情网 | 天天爱添天天爱添天天爱添 | 亚洲国产精品一区二区久久 | avtom影院入口四虎 | 成人一级毛片 | 在线麻豆| 国产在线一区二区 | 精品在线视频观看 | 欧美色婷婷 | 久久一本热 | 伊人久久综在合线亚洲91 | 国产产一区二区三区久久毛片国语 | 亚洲国产日韩欧美 | 男人午夜影院 |