在爬網(wǎng)易云評論的時候發(fā)現(xiàn)評論里有很多人發(fā)表情,然而python爬取表情后發(fā)現(xiàn)無法把表情寫入文件里。從而導(dǎo)致異常。后來找到了兩種方法判斷。
第一種:通過re.sub()刪除評論里無法識別的字符串,re.sub有個弊端就是只有第一個表情圖片錯誤的時候能處理,第二個就無法處理了
def character(a):
dk = open(r'.\評論.txt', 'w')
try: # 如果報錯,則獲取報錯的字符串信息
dk.write(a)
dk.close()
except Exception as error:
# 處理字符串,獲取報錯的內(nèi)容
u = str(error).split(" '")
u_error = str(u[1]).split("' ")
b = re.sub(u_error[0], '', a) # 刪除字符串a(chǎn)里所有的報錯字符串
dk.write(b)
dk.close()
第二種:使用try...except...的方式處理字符串中每個字符,刪除無法識別的表情字符。
def character(a):
dk = open(r'.\評論.txt', 'a+')
for i in a:
try:
dk.write(i)
except:
pass
dk.close()
?
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
