在python的Beautiful Soup 4 擴展庫的使用過程中出現了
TypeError: list indices must be integers or slices, not str
這個錯誤,這里就分析一下為什么會報錯以及如何解決。
這個錯誤的意思是'類型錯誤:list的索引必須是'integers'或者'slices'不能是'str'
我出現錯誤的代碼:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標簽 img_tag = div.select("img") #獲取標簽屬性(這里報錯) src = img_tag['src'] #輸出 print(src)
經過檢查對比后我發現錯誤原因
就是獲取標簽時獲取的是list數據而不是tag
主要原因如下:
主要就是獲取的內容和自己認為的有偏差。
也就是find()和find_all(),select()和select_one()的區別。
當使用
find() select_one()
時,獲得的是一個標簽
類型為
所以可以使用tag['class']取值
當使用
find_all() select()
時,獲得的是組標簽(就算只有一個標簽也是一組)
類型為
#find_all()的返回值類型#select()的返回值類型
這時,我們要取值就需要先定位是list(ResultSet)中的那個標簽在取值
例如tag[0]['class']
解決方法
方法一:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標簽 img_tag = div.select("img") #獲取標簽屬性(這里有改動) src = img_tag[0]['src'] #輸出 print(src)
因為我知道頁面中的結構可以確保獲得的第一個bag為我需要的標簽。
所以使用src = img_tag[0]['src']來獲取屬性信息。
方法二:
#引入庫 from bs4 import BeautifulSoup #讀取頁面 soup = BeautifulSoup(open('index.html')) #獲取標簽 img_tag = div.select_one("img") #獲取標簽屬性(這里有改動) src = img_tag['src'] #輸出 print(src)
同上理,這樣修改也是可以成功的。
出現這種問題還是因為自己不用心,還是要時刻提醒自己。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
