亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python爬取快手視頻--json數據分析

系統 2190 0

打開快手主頁,進行頁面分析

對于快手這種平臺,分析完頁面代碼之后,無任何想要的信息,所以,只能進行json數據的抓取,這些視頻都是通過json語句傳給前段,然后進行循環生成,所以,我們來看抓的json包
python爬取快手視頻--json數據分析_第1張圖片
然后進行詳情頁鏈接分析
python爬取快手視頻--json數據分析_第2張圖片
接下來看json數據
python爬取快手視頻--json數據分析_第3張圖片
補充一下,這里由于頁面刷新了,所以看到的兩個鏈接不一樣,方法就是這樣的
然后拼接出來二級路徑,進行訪問詳情頁
python爬取快手視頻--json數據分析_第4張圖片
最后在詳情頁按照常規方法進行分析頁面爬取數據就行了
分享一下代碼

            
              import requests
from bs4 import BeautifulSoup
import json
import time

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
}

def first_get_request(first_request):
    first_data = json.loads(first_request.text)
    print(first_data)
    #進入第二層
    first_two_data = first_data['data']['videoFeeds']['list']
    for num in first_two_data:
        two_url = 'https://live.kuaishou.com/u/' + num['user']['id'] + '/' + num['photoId']
        # print(two_url)
        two_get_request(two_url)


def two_get_request(two_url):
    two_data = requests.get(url=two_url,headers=headers,verify=False)
    soup = BeautifulSoup(two_data.text,'lxml')
    #頭像
    name_photo = soup.select('.profile-user img')[0]['src']
    #名字
    name = soup.select('.video-card-footer-user-name')[0].text
    #點贊量
    number = soup.select('.profile-user-count-info > .watching-count')[0].text
    #點心量
    num = soup.select('.profile-user-count-info > .like-count')[0].text
    #內容
    text = soup.select('.profile-user > .profile-user-desc > span')[0].text
    item = {
        '頭像':name_photo,
        '名字':name,
        '內容':text,
        '點贊量':number,
        '點心量':num
    }
    with open('爬取的信息.txt','a',encoding='utf8') as f:
        f.write(str(item) + '\n')

   time.sleep(3)

def main():
    first_url = 'https://live.kuaishou.com/graphql'
    formdata = {
        "operationName": "videoFeedsQuery", "variables": {"count": 50, "pcursor": "50"},
        "query": "fragment VideoMainInfo on VideoFeed {\n  photoId\n  caption\n  thumbnailUrl\n  poster\n  viewCount\n  likeCount\n  commentCount\n  timestamp\n  workType\n  type\n  useVideoPlayer\n  imgUrls\n  imgSizes\n  magicFace\n  musicName\n  location\n  liked\n  onlyFollowerCanComment\n  width\n  height\n  expTag\n  __typename\n}\n\nquery videoFeedsQuery($pcursor: String, $count: Int) {\n  videoFeeds(pcursor: $pcursor, count: $count) {\n    list {\n      user {\n        id\n        eid\n        profile\n        name\n        __typename\n      }\n      ...VideoMainInfo\n      __typename\n    }\n    pcursor\n    __typename\n  }\n}\n"
    }
    #訪問快手界面
    first_request = requests.post(url=first_url,headers=headers,data=formdata,verify=False)
    #分析首頁鏈接
    first_get_request(first_request)

if __name__ == '__main__':
    main()

            
          

最后就找到了我們想要的東西,


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 插插射射 | 特黄特黄一级高清免费大片 | 久草热视频在线 | 国产青草视频免费观看97 | 国产精品久久久久影院 | 毛片线看免费观看 | 亚洲精品天堂自在久久77 | 亚洲综合色播 | 99热最新网址获取 | 思99热精品久久只有精品 | 色吧在线视频 | 免费不卡 | 香蕉在线视频网站 | 黄页在线免费观看 | 欧美亚洲图片 | 亚洲精品午夜级久久久久 | 亚洲久本草在线中文字幕 | 波多野结衣 一区二区 | 天天操天天干天天拍 | 91精品国产91热久久p | 免费看国产片 | 日本一级在线播放线观看视频 | 中国一级毛片在线观看 | a一级毛片免费高清在线 | 四虎国产永久在线精品免费观看 | 日本一二三区视频 | 国产福利午夜波多野结衣 | 亚洲视频久久 | 中文字幕在线观看一区二区三区 | 久久精品国产亚洲aa | 中国妞xxxx | 色爱两性网 | 在线观看视频一区二区 | 中文乱码字幕午夜无线观看 | 亚洲天堂爱爱 | 午夜影院欧美 | 日韩欧美二区 | 亚洲视频在线网站 | 欧美中文字幕一区 | 丁香午夜婷婷 | 91亚洲国产系列精品第56页 |