前言
有些人看到這個問題覺得不是問題,是嘛,不就是df.col[]函數(shù)嘛,其實忽略了一個重點,那就是我們要省去把csv文件全部讀取這個過程,因為如果在面臨億萬級別的大規(guī)模數(shù)據(jù),得到的結(jié)果就是boom,boom,boom。
我們要使用一下現(xiàn)成的函數(shù)里面的參數(shù)nrows,和skiprows,一個代表你要讀幾行,一個代表你從哪開始讀,這就可以了,比如從第3行讀取4個
示例代碼
import pandas as pd df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]}) df.to_csv('test.csv') dt = pd.read_csv('test.csv',skiprows=5,nrows=3) print(dt) out: 4 5 66 0 5 6 77 1 6 7 88 2 7 8 99 3 8 9 10
就可以了,不過這個列頭不知道是怎么回事,順便如果想根據(jù)列值找index,可以參考下面的
然后
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50]) print(df) a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist() print(a) df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]}, index=[10,20,30,40,50]) print(df) a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist() print(a)
問題得到了解決
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
