maketrans和translate函數(shù)是進行字符串字符編碼的常用方法。本文著重點在于演示其基本用法和在不同版本下操作的差異。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。
??? 2.X版本把字符串基本分為兩種:unicode字符串和8位字符串str,后者包含字節(jié)數(shù)據(jù)和我們常見的ASCII碼數(shù)據(jù);而3.X版本則重新對字符串進行了劃分,分為了字節(jié)字符串bytes和文本字符串str,兩者都是不可變的,所以添加了一個可變的字節(jié)字符串類型bytearray。
???? 2.X版本中string類型和str、unicode類型大量方法是重復的,所以3.X版本不提倡使用string模塊中與str重復的方法。string模塊中還有很多有用的常量和方法,比如string.digits,可以在字符串編碼中方便地使用。
???? 2.X中maketrans和translate函數(shù)的簽名:
string.maketrans(from, to) string.translate(s, table[, deletechars]) str.translate(table[, deletechars]) unicode.translate(table)
??? 3.X中maketrans和translate函數(shù)的簽名:
static str.maketrans(x[, y[, z]]) static bytes.maketrans(from, to) static bytearray.maketrans(from, to) str.translate(map) bytes.translate(table[, delete]) bytearray.translate(table[, delete])
??? 從中可以看出,相對于2.X的string模塊的maketrans方法,3.X中分別提供了三個靜態(tài)方法用于創(chuàng)建映射表。
?? 下面讓我們看一個簡單的例子來說明字符串轉(zhuǎn)換的過程:
??? 2.X下的演示過程:
>>> import string #導入string模塊 >>> map = string.maketrans('123', 'abc') #建立映射表,將字符串中含有的'1','2','3'替換為'a','b','c' >>> s = '54321123789' #轉(zhuǎn)換前的字符串 >>> s.translate(map) #用創(chuàng)建的映射表map轉(zhuǎn)換字符串 '54cbaabc789' #轉(zhuǎn)換后的字符串
??? 3.X下的演示過程:
>>> map = str.maketrans('123','abc') >>> s = '54321123789' >>> s.translate(map) '54cbaabc789'
??? 2.X使用了string的maketrans函數(shù),而3.X使用了str的maketrans函數(shù),除了這一點,使用方法是基本相同的。若指定字符串中要刪除的字符時,使用就會略有不同,如下:
??? 2.X下的演示過程:
>>> import string >>> map = string.maketrans('123', 'abc') >>> s = '54321123789' >>> s.translate(map, '78') #除了轉(zhuǎn)換,還要刪除字符串中的字符'7','8' '54cbaabc9' #轉(zhuǎn)換后的字符串沒有字符'7','8'
??? 3.X下的演示過程:
>>> map = str.maketrans('123','abc', '78')#要刪除的字符需要在這指定 >>> s = '54321123789' >>> s.translate(map) '54cbaabc9'
??? 我在讀《Python Cookbook》遇到了一個基于2.X版本的例子,如下
import string def translator(frm='', to='', delete='', keep=None): if len(to) == 1: to = to * len(frm) trans = string.maketrans(frm, to) if keep is not None: allchars = string.maketrans('', '') delete = allchars.translate(allchars, keep.translate(allchars,delete)) def translate(s): return s.translate(trans, delete) return translate
??? allchars應(yīng)該是一個返回的映射表,為什么還可以調(diào)用translate方法,所以它應(yīng)該是一個str類型,測試如下:
>>> import string >>> map = string.maketrans('123', 'abc') >>> type(map)
??? 在3.X版本中這個方法不能正常通過運行,那么錯在什么地方呢,我們看看映射表是什么類型:
>>> map = str.maketrans('123','abc') >>> type(map)
??? 知道了映射表的類型了,我們就可以對其進行“后期加工”,像上面《Python Cookbook》中的例子一樣,來滿足我們的編碼要求。
?? 上面討論的例子用的字符串是ASCII字符組成的,如果是字節(jié)類型,2.X版本中操作是一樣的,3.X中調(diào)用bytes或bytearray的函數(shù);若是unicode類型的,2.X需要用unicode的translate方法,注意下面的代碼
?
>>> print u"hallo".translate({97:u'e'}) hello >>> print u"hallo".translate({'a':u'e'}) hallo >>> print u"hallo".translate({u'a':u'e'}) hallo
??? 結(jié)果之所以不一樣,查閱手冊可知unicode的translate方法的映射表也就是字典的鍵必須是unicode的位序數(shù),值可以是unicode的位序數(shù)、unicode字符串或這None。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
