當(dāng)年學(xué)爬蟲(chóng)的第一個(gè)想法就是想把雙色球的數(shù)據(jù)爬下來(lái),然后看能不能用什么牛叉的算法,或者數(shù)據(jù)分析把后面的雙色球概率算出來(lái);
知道現(xiàn)在才抽空寫(xiě)了這幾行代碼爬取了雙色球的數(shù)據(jù),我也真是夠懶的;
也算是閑來(lái)無(wú)事,練手的爬蟲(chóng)吧;
好了,多余的就不說(shuō)了,直接上代碼吧,代碼注釋已經(jīng)很清楚了;
import sys
import requests
from lxml import etree
def get_url(url): #請(qǐng)求url的方法,返回html
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36',
}
response = requests.get(url,headers=headers) #獲取請(qǐng)求的返回?cái)?shù)據(jù)
response.encoding = 'utf-8' #定義編碼,不然中文輸出會(huì)亂碼;
if response.status_code == 200: #如果請(qǐng)求成功,則返回;
return response.text
return None
for q in range(1,125): #for循環(huán),一共124頁(yè);
url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list_%s.html' % (q) #定義請(qǐng)求的鏈接
html = get_url(url) #請(qǐng)求url獲取返回代碼
xpath_html = etree.HTML(html) #xpath初始化html代碼
dates = xpath_html.xpath('//table[@class="wqhgt"]//tr//td[1]//text()') #獲取開(kāi)獎(jiǎng)日期
result = xpath_html.xpath('//table[@class="wqhgt"]//tr//em//text()') #獲取上色球號(hào)
issues = xpath_html.xpath('//table[@class="wqhgt"]//tr//td[2]//text()') #獲取期號(hào)
# print(result) #輸出所有雙色球的列
# print(len(result)//7) #輸出有幾組雙色球
# print(dates)
# print(issues)
sta = 0
end = 7
for n in range(len(result)//7): #雙色球7個(gè)號(hào)一組,
print("開(kāi)獎(jiǎng)日期:" + str(dates[n]) + " --- " + "期號(hào):" + str(issues[n]) + " --- " + str(result[sta:end]))
sta = sta + 7
end = end + 7
python版本用的3.7,開(kāi)發(fā)工具用的pycharm;
爬取的結(jié)果可以根據(jù)自己需求進(jìn)行調(diào)整,后面怎么用這些數(shù)據(jù)就不說(shuō)了哈;具體根據(jù)自己需求進(jìn)行分析吧;
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
