前言
首先聲明,本工具僅僅為學(xué)習(xí)之用,不涉及版權(quán)問題,因?yàn)榘俣纫魳防锩娴母枨旧硎强梢韵螺d的,而且現(xiàn)在百度也提供了”百度音樂播放器”,可以通過這個(gè)工具進(jìn)行批量下載。
我當(dāng)時(shí)做這個(gè)工具的時(shí)候,百度還沒有提供”百度音樂播放器”,而我又想批量下載,所以做了這樣的一個(gè)下載工具。當(dāng)然,主要還是為了學(xué)習(xí)。
工具 采用Python2.7.3+PyQt開發(fā)。
功能:
1.集中展示百度新歌榜或熱歌榜可下載的歌單。
2.支持單個(gè)、多個(gè)歌曲的下載。
3.可復(fù)制歌單中所有的鏈接內(nèi)容,方便在迅雷等下載工具中創(chuàng)建下載組。
缺陷:
目前采用單線程,效率不高,UI界面容易假死。
本工具運(yùn)行流程:
1.模擬用戶登錄百度。
2.若登錄成功,采集并解析頁面內(nèi)容,加載歌單列表。
3.用戶點(diǎn)擊下載按鈕或者批量下載按鈕后,下載歌曲。
使用方法:
1.在配置文件setting.py的最后,配置可登錄百度的賬號(hào)和密碼,及百度熱歌榜或新歌榜的URL.
username = "your baidu acount" #配置你的百度賬號(hào) password = "your baidu password" #配置你的百度密碼 musiclistUrl = "http://music.baidu.com/top/dayhot" # http://music.baidu.com/top/new
2.直接運(yùn)行mainWindow.py文件即可,如果網(wǎng)速不給力的話可能要等上3、4分鐘。
運(yùn)行后如圖:
用到的知識(shí):
1.首先用到了PyQt的GUI編程,窗體布局及QTableWidget、QProgressBar、QPushButton等控件及控件的重寫
2.用到了網(wǎng)絡(luò)編程的部分內(nèi)容,利用urllib,urllib2,cookielib請(qǐng)求網(wǎng)頁,模擬登錄百度。
3.利用HTMLParser解析網(wǎng)頁內(nèi)容,匹配網(wǎng)頁元素。
4.利用codecs進(jìn)行文件的讀寫。
遇到的問題:
1.編碼問題,由于在創(chuàng)建文件時(shí)將文件編碼設(shè)置為UTF-8,當(dāng)需要向文件寫入的內(nèi)容為中文等非ASCII碼內(nèi)容時(shí),總是提示編碼問題。其實(shí),百度音樂的網(wǎng)頁全部為UTF-8格式,因此從網(wǎng)頁中獲取的內(nèi)容也是UTF-8格式,但是,要講內(nèi)容寫入U(xiǎn)TF-8的文本中,必須將網(wǎng)頁內(nèi)容進(jìn)行decode(“utf8”)解碼為unicode格式,才能正常寫入。
檢測(cè)內(nèi)容編碼,可以用chardet模塊的chardet.detect(“內(nèi)容”)的方法。
另外,HTMLParser解析網(wǎng)頁內(nèi)容過程中,有的下載頁面會(huì)出現(xiàn)問題,根據(jù)提示信息發(fā)現(xiàn)還是編碼問題,將feed()方法中的內(nèi)容參數(shù)進(jìn)行decode(“utf8”)后,結(jié)果正常。
decode將內(nèi)容根據(jù)參數(shù)內(nèi)容解碼為unicode類型,具體要根據(jù)所采集的頁面的編碼。
github下載地址:點(diǎn)這里
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
