介紹Python常見(jiàn)的字符串處理方式
字符串截取
>>>s = 'hello' >>>s[0:3] 'he' >>>s[:] #截取全部字符 'hello'
消除空格及特殊符號(hào)????
s.strip() #消除字符串s左右兩邊的空白字符(包括'\t','\n','\r','') s.strip('0') #消除字符串s左右兩邊的特殊字符(如'0'),字符串中間的'0'不會(huì)刪除
例如:
>>>s = '000hello00world000' >>>s.strip('0') 'hello00world' s.strip('12')等價(jià)于s.strip('21')
例如:
>>>s = '12hello21' >>>s.strip('12') 'hello'
lstrip,rstrip 用法與strip類似,分別用于消除左、右的字符
字符串復(fù)制
s1 = 'hello' s2 = s1 # s2 = 'hello'
若指定長(zhǎng)度
s1 = 'hello' s2 = s1[0:2] #s2 = 'he'
字符串連接
s1 = 'hello' s2 = 'world' s3 = s1 + s2 #s3 = 'helloworld'
或者
import operator s3 = operator.concat(s1,s2) #concat為字符串拼接函數(shù)
字符串比較
(1)利用operator模塊方法比較(python3.X取消了cmd函數(shù))
包含的方法有:
- lt(a, b) ―――― 小于
- le(a, b) ―――― 小于等于
- eq(a, b) ―――― 等于
- ne(a, b) ―――― 不等于
- ge(a, b) ―――― 大于等于
- gt(a, b) ―――― 大于
例子:
>>>import operator >>>operator.eq('abc','edf') #根據(jù)ASCII碼比較 Flase >>>operator.gt('abc','ab') True
(2)關(guān)系運(yùn)算符比較(>,<,>=,<=,==,!=)
>>>s1 = 'abc' >>>s2 = 'ab' >>>s1 > s2 True >>>s1 == s2 False
求字符串長(zhǎng)度
>>>s1 = 'hello' >>>len(s1) 5
求字符串中最大字符,最小字符
>>>s1 = 'hello' >>>max(s1) #求字符串s1中最大字符 'o' >>>min(s1) #求字符串s2中最小字符 'e'
字符串大小寫轉(zhuǎn)換
主要有如下方法:
- upper ―――― 轉(zhuǎn)換為大寫
- lower ―――― 轉(zhuǎn)換為小寫
- title ―――― 轉(zhuǎn)換為標(biāo)題(每個(gè)單詞首字母大寫)
- capitalize ―――― 首字母大寫
- swapcase ―――― 大寫變小寫,小寫變大寫
例子:
>>>s1 = 'hello' >>>s2 = 'WORLD' >>>s3 = 'hello world' >>>s1.upper() 'HELLO' >>>s2.lower() 'world' >>>s3.title() 'Hello World' >>>s3.capitalize() 'Hello world' >>>s3.title().swapcase() 'hELLO wORLD'
字符串翻轉(zhuǎn)
>>>s1 = 'hello' >>>s1[::-1] 'olleh'
字符串分割
split方法,根據(jù)參數(shù)進(jìn)行分割,返回一個(gè)列表
例子:
>>>s1 = 'hello,world' >>>s1.split(',') ['hello','world']
字符串序列連接
join方法:
語(yǔ)法為str.join(seq) #seq為元素序列
例子:
>>>l = ['hello','world'] >>>str = '-' >>>str.join(l) 'hello-world'
字符串內(nèi)查找
find方法:
檢測(cè)字符串內(nèi)是否包含子串str
語(yǔ)法為:
str.find(str[,start,end]) #str為要查找的字符串;strat為查找起始位置,默認(rèn)為0;end為查找終止位置,默認(rèn)為字符串長(zhǎng)度。若找到返回起始位置索引,否則返回-1
例子:
>>>s1 = 'today is a fine day' >>>s1.find('is') 6 >>>s1.find('is',3) 6 >>>s1.find('is',7,10) -1
字符串內(nèi)替換
replace方法:
把字符串中的舊串替換成新串
語(yǔ)法為:
str.replace(old,new[,max]) #old為舊串,new為新串,max可選,為替換次數(shù)
例子:
>>>s1 = 'today is a find day' >>>s1.replace('find','rainy') 'today is a rainy day'
判斷字符串組成
主要有如下方法:
- isdigit ―――― 檢測(cè)字符串時(shí)候只由數(shù)字組成
- isalnum ―――― 檢測(cè)字符串是否只由數(shù)字和字母組成
- isalpha ―――― 檢測(cè)字符串是否只由字母組成
- islower ―――― 檢測(cè)字符串是否只含有小寫字母
- isupper ―――― 檢測(cè)字符串是否只含有大寫字母
- isspace ―――― 檢測(cè)字符串是否只含有空格
- istitle ―――― 檢測(cè)字符串是否是標(biāo)題(每個(gè)單詞首字母大寫)
例子:
>>>s1 = 'hello' >>>s1.islower() True >>>s1.isdigit() False
字符串轉(zhuǎn)數(shù)組
a = 'My name is Jason' #使用split(str="", num=string.count(str)) 方法根據(jù)不同的分割符轉(zhuǎn),也可指定分割次數(shù),可使用 ' '.join方法轉(zhuǎn)回 >>> 'My name is Jason'.split(' ') ['My', 'name', 'is', 'Jason'] >>> ' '.join(['My', 'name', 'is', 'Jason']) 'My name is Jason'
字符串首尾匹配
>>> 'cat.jpg'.startswith('cat') True >>> 'cat.jpg'.startswith('cat',0,3) True >>> 'cat.jpg'.endswith('.jpg') True >>> 'cat.jpg'.endswith('.jpg',-4) True
字符串空格處理
>>> s = ' Hello World ' >>> s.strip() 'Hello World' >>> s.lstrip() 'Hello World ' >>> s.rstrip() ' Hello World' #擴(kuò)展 >>> 'www.example.com'.lstrip('www.') 'example.com' >>> 'www.example.com'.lstrip('cmowz.') 'example.com'
字符串格式化、數(shù)字及大小寫判斷、長(zhǎng)度補(bǔ)全
#字符串的格式化 >>> '{name},{sex},{age}'.format(age=15,sex='male',name='小安') '小安,male,15' >>> '{1},{0},{2}'.format('15','小安','male') '小安,15,male' >>> '{},{},{}'.format('小安', '15','male') '小安,15,male' #如果字符串中的所有字符都是數(shù)字,并且至少有一個(gè)字符,則返回真,否則返回假 >>> '123'.isdigit() True >>> '123一二三'.isdigit() False #isnumeric 是所有字符都是數(shù)字字符返回真 >>> '123一二三'.isnumeric() True #字符串是否大小寫判斷 >>> 'abc'.islower() True >>> 'Abc'.islower() False >>> 'ABC'.isupper() True #首字母大寫 >>> "they're bill's friends from the UK".title() "They'Re Bill'S Friends From The Uk" #正則處理方式 >>> import re >>> def titlecase(s): ... return re.sub(r"[A-Za-z]+('[A-Za-z]+)?", ... lambda mo: mo.group(0)[0].upper() + ... mo.group(0)[1:].lower(), ... s) ... >>> titlecase("they're bill's friends.") "They're Bill's Friends." #返回指定長(zhǎng)度字符串,前面補(bǔ)0,一般存csv文件中含00開(kāi)頭的字符0會(huì)被抹掉 >>> code = '1' >>> code.zfill(6) '000001' #字符串長(zhǎng)度及遍歷 >>> s = '混蛋哥' >>> len(s) 3 >>> for i in s: print(i) 混 蛋 哥 >>>
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
