亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python爬取快手視頻--json數據分析

系統 2190 0

打開快手主頁,進行頁面分析

對于快手這種平臺,分析完頁面代碼之后,無任何想要的信息,所以,只能進行json數據的抓取,這些視頻都是通過json語句傳給前段,然后進行循環生成,所以,我們來看抓的json包
python爬取快手視頻--json數據分析_第1張圖片
然后進行詳情頁鏈接分析
python爬取快手視頻--json數據分析_第2張圖片
接下來看json數據
python爬取快手視頻--json數據分析_第3張圖片
補充一下,這里由于頁面刷新了,所以看到的兩個鏈接不一樣,方法就是這樣的
然后拼接出來二級路徑,進行訪問詳情頁
python爬取快手視頻--json數據分析_第4張圖片
最后在詳情頁按照常規方法進行分析頁面爬取數據就行了
分享一下代碼

            
              import requests
from bs4 import BeautifulSoup
import json
import time

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
}

def first_get_request(first_request):
    first_data = json.loads(first_request.text)
    print(first_data)
    #進入第二層
    first_two_data = first_data['data']['videoFeeds']['list']
    for num in first_two_data:
        two_url = 'https://live.kuaishou.com/u/' + num['user']['id'] + '/' + num['photoId']
        # print(two_url)
        two_get_request(two_url)


def two_get_request(two_url):
    two_data = requests.get(url=two_url,headers=headers,verify=False)
    soup = BeautifulSoup(two_data.text,'lxml')
    #頭像
    name_photo = soup.select('.profile-user img')[0]['src']
    #名字
    name = soup.select('.video-card-footer-user-name')[0].text
    #點贊量
    number = soup.select('.profile-user-count-info > .watching-count')[0].text
    #點心量
    num = soup.select('.profile-user-count-info > .like-count')[0].text
    #內容
    text = soup.select('.profile-user > .profile-user-desc > span')[0].text
    item = {
        '頭像':name_photo,
        '名字':name,
        '內容':text,
        '點贊量':number,
        '點心量':num
    }
    with open('爬取的信息.txt','a',encoding='utf8') as f:
        f.write(str(item) + '\n')

   time.sleep(3)

def main():
    first_url = 'https://live.kuaishou.com/graphql'
    formdata = {
        "operationName": "videoFeedsQuery", "variables": {"count": 50, "pcursor": "50"},
        "query": "fragment VideoMainInfo on VideoFeed {\n  photoId\n  caption\n  thumbnailUrl\n  poster\n  viewCount\n  likeCount\n  commentCount\n  timestamp\n  workType\n  type\n  useVideoPlayer\n  imgUrls\n  imgSizes\n  magicFace\n  musicName\n  location\n  liked\n  onlyFollowerCanComment\n  width\n  height\n  expTag\n  __typename\n}\n\nquery videoFeedsQuery($pcursor: String, $count: Int) {\n  videoFeeds(pcursor: $pcursor, count: $count) {\n    list {\n      user {\n        id\n        eid\n        profile\n        name\n        __typename\n      }\n      ...VideoMainInfo\n      __typename\n    }\n    pcursor\n    __typename\n  }\n}\n"
    }
    #訪問快手界面
    first_request = requests.post(url=first_url,headers=headers,data=formdata,verify=False)
    #分析首頁鏈接
    first_get_request(first_request)

if __name__ == '__main__':
    main()

            
          

最后就找到了我們想要的東西,


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 精品四虎免费观看国产高清午夜 | 九九热视频精品在线观看 | 九九精品视频在线播放8 | 日日视频 | 国产午夜亚洲精品久久www | 99精品亚洲| 久久人人爽人人爽人人片av不 | 欧美日韩国产最新一区二区 | 色网在线免费观看 | 亚洲精品综合一二三区在线 | 麻豆国产精品视频 | 五月天色婷婷在线 | 国产成人综合网亚洲欧美在线 | 中文伊人 | 中文一级片 | 中国性xxxxx极品奶水 | 欧美做爰xxxⅹ在线视频hd | 亚洲国产成人在线观看 | 日韩一区二区三区精品 | 四虎影视永久地址www成人污 | 久久综合狠狠综合久久 | 国产成人香蕉在线视频fuz | 精品在线小视频 | 午夜香蕉成视频人网站高清版 | 欧美亚洲国产日韩一区二区三区 | 国产麻豆视频在线看网站 | 亚洲乱码一区二区三区国产精品 | 天天摸天天操天天干 | 奇米一区 | 欧美久久精品一级c片片 | xxxx免费国产在线视频 | 一级欧美日韩 | 日韩毛片高清免费 | 五月天色区 | 免费一级欧美片在线观看 | 久久国产精品一国产精品金尊 | 国产综合区 | 欧美精品午夜毛片免费看 | 97在线视频免费 | 日韩香蕉视频 | 污影院 |