亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup

系統(tǒng) 1699 0

一、Beautiful Soup簡介

網(wǎng)絡(luò)數(shù)據(jù)挖掘指的是從網(wǎng)站中獲取數(shù)據(jù)的過程,數(shù)據(jù)挖掘技術(shù)可以讓我們從網(wǎng)站世界中收集大量有價(jià)值的數(shù)據(jù)。

Beautiful Soup是一個(gè)Python庫,可以從HTML或XML文件中獲取數(shù)據(jù),利用它你可以做很多事情,比如你可以持續(xù)解析某個(gè)商品的最新價(jià)格,以便跟蹤價(jià)格的波動(dòng)情況。

二、Beautiful Soup安裝

安裝Beautiful Soup

pip3 install beautifulsoup4

檢驗(yàn)是否安裝成功

from bs4 import BeautifulSoup

三、創(chuàng)建一個(gè)Beautiful Soup對(duì)象

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第1張圖片

四、查找內(nèi)容

find()方法

在find()方法中傳入節(jié)點(diǎn)名,例如ul,這樣就可以獲取第一個(gè)匹配的ul節(jié)點(diǎn)的內(nèi)容,例如:

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第2張圖片

找到ul節(jié)點(diǎn)后,通過觀察html可以得知,ul下有2個(gè)li,每個(gè)li下有2個(gè)div,則通過student_entries.li可以獲取第一個(gè)li節(jié)點(diǎn)的數(shù)據(jù),繼續(xù)通過student_entries.li.div可以獲取第一個(gè)li下第一個(gè)div的數(shù)據(jù),例如:

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第3張圖片

繼續(xù)通過div.string可以獲取div的內(nèi)容:

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第4張圖片

使用正則表達(dá)式查找:

find()方法支持根據(jù)正則表達(dá)式查找內(nèi)容,例如:

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第5張圖片

find_all()方法

find()方法返回第一個(gè)匹配的內(nèi)容,find_all()方法會(huì)返回所有匹配的內(nèi)容列表,例如上面的根據(jù)正則表達(dá)式查找郵箱地址,將find()方法換成find_all()方法,則會(huì)返回所有匹配成功的內(nèi)容:

find_parent()方法

find_parent()方法往上查找內(nèi)容,例如,從第一個(gè)li節(jié)點(diǎn)上使用find_parent()方法,可以獲取父節(jié)點(diǎn)的內(nèi)容:

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第6張圖片

find_next_sibling()方法

sibling是兄弟姐妹的意思,find_next_sibling()方法獲取下一個(gè)同級(jí)別的兄弟節(jié)點(diǎn),例如:

Python網(wǎng)絡(luò)爬蟲:基礎(chǔ)知識(shí)Beautiful Soup_第7張圖片

其它方法還有很多,例如:

find_next()方法

find_all_next()方法

find_previous_sibling()方法

find_all_previous()方法


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 天天操 夜夜操 | 亚洲精品一区二区深夜福利 | 大色佬视频在线观看 | 91最新视频在线观看 | 亚洲区一二三四区2021 | 亚洲视频免 | 日韩高清在线日韩大片观看网址 | 精品国产欧美一区二区最新 | 久久久久夜夜夜精品国产 | 免费久久久久 | 日日骑夜夜骑 | 精品国产乱码久久久久久浪潮 | 波多野结衣亚洲一区二区三区 | 国产福利在线观看永久视频 | 99视频精品全部在线播放 | 国产成人免费a在线视频色戒 | 亚洲免费久久 | 日韩爱爱小视频 | 日本国产亚洲 | 国产香蕉国产精品偷在线观看 | 四虎影视网址 | 99人中文字幕亚洲区 | 精品一区二区三区的国产在线观看 | 毛片一级视频 | 欧美一区二区三区播放 | 久草视频在线免费看 | 九九黄色网 | 日本不卡中文字幕一区二区 | 99国内精品久久久久久久 | 天天爱天天色天天干 | 亚洲精品视频一区二区 | 亚洲欧美色综合自拍 | 日本aaaa级毛片在线看 | 久久国产加勒比精品无码 | 精品一区二区乱码久久乱码 | 老湿机永久体验 | 一区二区日韩欧美 | 亚洲精品国产福利片 | 福利久久 | 亚洲美女亚洲精品久久久久 | 日韩视频大全 |