亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python爬取快手視頻--json數據分析

系統 2190 0

打開快手主頁,進行頁面分析

對于快手這種平臺,分析完頁面代碼之后,無任何想要的信息,所以,只能進行json數據的抓取,這些視頻都是通過json語句傳給前段,然后進行循環生成,所以,我們來看抓的json包
python爬取快手視頻--json數據分析_第1張圖片
然后進行詳情頁鏈接分析
python爬取快手視頻--json數據分析_第2張圖片
接下來看json數據
python爬取快手視頻--json數據分析_第3張圖片
補充一下,這里由于頁面刷新了,所以看到的兩個鏈接不一樣,方法就是這樣的
然后拼接出來二級路徑,進行訪問詳情頁
python爬取快手視頻--json數據分析_第4張圖片
最后在詳情頁按照常規方法進行分析頁面爬取數據就行了
分享一下代碼

            
              import requests
from bs4 import BeautifulSoup
import json
import time

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
}

def first_get_request(first_request):
    first_data = json.loads(first_request.text)
    print(first_data)
    #進入第二層
    first_two_data = first_data['data']['videoFeeds']['list']
    for num in first_two_data:
        two_url = 'https://live.kuaishou.com/u/' + num['user']['id'] + '/' + num['photoId']
        # print(two_url)
        two_get_request(two_url)


def two_get_request(two_url):
    two_data = requests.get(url=two_url,headers=headers,verify=False)
    soup = BeautifulSoup(two_data.text,'lxml')
    #頭像
    name_photo = soup.select('.profile-user img')[0]['src']
    #名字
    name = soup.select('.video-card-footer-user-name')[0].text
    #點贊量
    number = soup.select('.profile-user-count-info > .watching-count')[0].text
    #點心量
    num = soup.select('.profile-user-count-info > .like-count')[0].text
    #內容
    text = soup.select('.profile-user > .profile-user-desc > span')[0].text
    item = {
        '頭像':name_photo,
        '名字':name,
        '內容':text,
        '點贊量':number,
        '點心量':num
    }
    with open('爬取的信息.txt','a',encoding='utf8') as f:
        f.write(str(item) + '\n')

   time.sleep(3)

def main():
    first_url = 'https://live.kuaishou.com/graphql'
    formdata = {
        "operationName": "videoFeedsQuery", "variables": {"count": 50, "pcursor": "50"},
        "query": "fragment VideoMainInfo on VideoFeed {\n  photoId\n  caption\n  thumbnailUrl\n  poster\n  viewCount\n  likeCount\n  commentCount\n  timestamp\n  workType\n  type\n  useVideoPlayer\n  imgUrls\n  imgSizes\n  magicFace\n  musicName\n  location\n  liked\n  onlyFollowerCanComment\n  width\n  height\n  expTag\n  __typename\n}\n\nquery videoFeedsQuery($pcursor: String, $count: Int) {\n  videoFeeds(pcursor: $pcursor, count: $count) {\n    list {\n      user {\n        id\n        eid\n        profile\n        name\n        __typename\n      }\n      ...VideoMainInfo\n      __typename\n    }\n    pcursor\n    __typename\n  }\n}\n"
    }
    #訪問快手界面
    first_request = requests.post(url=first_url,headers=headers,data=formdata,verify=False)
    #分析首頁鏈接
    first_get_request(first_request)

if __name__ == '__main__':
    main()

            
          

最后就找到了我們想要的東西,


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产精品国产三级国产专区5o | 伊人成年综合网 | 女人一级一级毛片 | 亚洲在线视频一区 | 久热精品免费 | 亚洲综合视频在线 | 五月婷婷视频在线 | 久久久久国产精品免费网站 | 久久精品色 | 天天天天天天干 | 亚洲综合色在线 | 奇米影视888狠狠狠777九色 | 四虎成人精品在永久免费 | 久久草在线视频 | 日韩伦理视频 | 国产一级毛片外aaaa | 一级特级aaa毛片 | 激情五月社区 | 天天操天天干天天爽 | 亚洲一区二区成人 | 亚洲成在人线免费视频 | 亚洲国产精品网站久久 | 久久香蕉国产线看观看式 | 最新国产精品好看的国产精品 | 国产精品爱久久久久久久9999 | 久久国产精品视频 | 大学生一级黄色片 | 日本成本人在线观看免费视频 | 日本精品一区 | 国产小视频在线观看免费 | 久久久久在线 | 日韩在线观看一区二区三区 | 国产欧美日韩图片一区二区 | www.欧美xxx| 久久精品中文字幕极品 | 色天使久久综合网天天 | 久久一区二区三区免费播放 | 成人精品久久 | 全部在线播放免费毛片 | 亚洲小视频 | 美女精品|