什么是轉(zhuǎn)義字符
在 HTML 中 <、>、& 等字符有特殊含義(<,> 用于標簽中,& 用于轉(zhuǎn)義),他們不能在 HTML 代碼中直接使用,如果要在網(wǎng)頁中顯示這些符號,就需要使用 HTML 的轉(zhuǎn)義字符串(Escape Sequence),例如 < 的轉(zhuǎn)義字符是 <,瀏覽器渲染 HTML 頁面時,會自動把轉(zhuǎn)移字符串換成真實字符。
轉(zhuǎn)義字符(Escape Sequence)由三部分組成:第一部分是一個 & 符號,第二部分是實體(Entity)名字,第三部分是一個分號。 比如,要顯示小于號(<),就可以寫< 。
Python 轉(zhuǎn)義字符串反轉(zhuǎn)義
用 Python 來處理轉(zhuǎn)義字符串有多種方式,而且 py2 和 py3 中處理方式不一樣,在 python2 中,反轉(zhuǎn)義的模塊是 HTMLParser。
# Python2 import HTMLParser >>> HTMLParser().unescape('param=p1¶m=p2') 'param=p1¶m=p2'
Python3 HTMLParser 模塊遷移到了 html.parser
# Python3 >>> from html.parser import HTMLParser >>> HTMLParser().unescape('param=p1¶m=p2') 'param=p1¶m=p2'
到 python3.4 以后的版本,在 html 模塊新增了 unescape 方法。
# Python3.4 >>> import html >>> html.unescape('param=p1¶m=p2') 'param=p1¶m=p2'
推薦最后一種寫法,因為 HTMLParser.unescape 方法在 Python3.4 就已經(jīng)被廢棄掉不推薦使用了,意味著之后的版本會被徹底移除。
另外,xml的sax模塊也有支持反轉(zhuǎn)義的函數(shù)
>>> from xml.sax.saxutils import unescape >>> unescape('param=p1¶m=p2') 'param=p1¶m=p2'
當然,你完全可以實現(xiàn)自己的反轉(zhuǎn)義功能,不復雜,當然,我們崇尚不重復造輪子。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
更多文章、技術交流、商務合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
