亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

Python,Pandas中刪除的方法（2）, 有示例代碼

系統(tǒng) 2019-09-27 17:49:32 1890 0

pandas主要有三個用來刪除的函數(shù)，.drop()、.drop_duplicates()、.dropna()。總結如下
.drop()刪除行、列
.drop_duplicates()刪除重復數(shù)據(jù)
.dropna()刪除空值（所在行、列）
為避免篇幅太長，將其分為兩部分，不想看參數(shù)介紹的可以直接看實例。
本篇介紹.drop_duplicates(), df.dropna


          
            drop_duplicates()的用法
          
          
            df.drop_duplicates() 則通常用于數(shù)據(jù)去重，即剔除數(shù)據(jù)集中的重復值。官方解釋很詳細，下面做一些解讀。
            

             官方解釋：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html#pandas.DataFrame.drop_duplicates
          
                      
              DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
Return DataFrame with duplicate rows removed, optionally only considering certain columns.
#返回一個去除了重復行的df，也可以選擇刪除重復列

Parameters:	
subset : column label or sequence of labels, optional
subset：可以選擇列標簽或者標簽順序
Only consider certain columns for identifying duplicates, by default use all of the columns
#只刪除某些指定列含有重復值的情況，默認情況下使用所有列

keep : {‘first’, ‘last’, False}, default ‘first’（默認'first'）
first : Drop duplicates except for the first occurrence.
#刪除除第一次出現(xiàn)外的重復項。
last : Drop duplicates except for the last occurrence.
#刪除重復項(最后一次發(fā)生的除外)。
False : Drop all duplicates.
#刪除所有的重復項（一個也不留）
inplace : boolean, default False
Whether to drop duplicates in place or to return a copy
#確定是否在原數(shù)據(jù)上進行修改

            
          
          
            
              下面時代碼實例
            
          
                      
              dic = {'A': [1, 2, 1, 1], 'B': [2, 5, 2, 4], 
       'C': [3, 5, 3, 10], 'D': [4, 9, 4, 5]}
df = pd.DataFrame(dic, index=['one', 'two', 'three', 'four'])
print(df)
       A  B   C  D
one    1  2   3  4
two    2  5   5  9
three  1  2   3  4
four   1  4  10  5


#默認刪除所有每一列都相同的重復行（保留第一行）
df.drop_duplicates()
#刪除指定列重復的某些行(保留第一行)
df.drop_duplicates(subset='A')
#刪除所有每一列都相同的重復行（保留最后一行）
df.drop_duplicates(keep='last')
#刪除所有重復行（一個不留）
df.drop_duplicates(keep=False)
#以上步驟均不再原數(shù)據(jù)上更改
print(df)
#inplace=True時，直接在原數(shù)據(jù)上更改
df.drop_duplicates(inplace=True)
print(df)


            
          
          
            dropna()的用法
          
          
            df.dropna 用于刪除缺少值，即數(shù)據(jù)集中空缺的數(shù)據(jù)列或行。官方給的解釋很詳細，不做贅述，翻譯一下即可。
            

             官方解釋：https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.dropna.html#pandas.DataFrame.dropna
          
                      
              DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.
去除缺失值
  
  Parameters:	
axis : {0 or ‘index’, 1 or ‘columns’}, default 0（默認0）
Determine if rows or columns which contain missing values are removed.
#確定刪除缺失值所在行還是列
0, or ‘index’ : Drop rows which contain missing values.
#0或者'index'，刪除缺失值所在行
1, or ‘columns’ : Drop columns which contain missing value.
#1或者'columns'，刪除缺失值所在列
    
how : {‘a(chǎn)ny’, ‘a(chǎn)ll’}, default ‘a(chǎn)ny’(默認'any'
Determine if row or column is removed from DataFrame, when we have at least one NA or all NA.
#當行或列至少有一個缺失值，是否將其刪除
‘a(chǎn)ny’ : If any NA values are present, drop that row or column.
#存在任何缺失值，就將該行或列刪除
‘a(chǎn)ll’ : If all values are NA, drop that row or column.
#只有當該行或列所有值都為缺失值，才刪除該行或列

thresh : int, optional
Require that many non-NA values.
#只保留至少有規(guī)定的（thresh的值）非na值的行。

subset : array-like, optional
Labels along other axis to consider, e.g. if you are dropping rows these would be a list of columns to include.
#沿著其他軸的標記要考慮，例如如果要刪除行，則這些列將包含要包含的列。
inplace : bool, default False
If True, do operation inplace and return None.
如果為True，則直接在原數(shù)據(jù)改動

            
          
          
            
              下面是代碼實例
            
          
                      
              
df = pd.DataFrame({'name': ['Alfred', 'Batman', 'Catwoman', np.nan],
                  'toy': [np.nan, 'Batmobile', 'Bullwhip', np.nan],
                  'born': [pd.NaT, pd.Timestamp('1940-06-25'), pd.NaT, np.nan]})

print(df)

#默認刪除所有有缺失值的行
df.dropna()
#刪除所有含有缺失值的列
df.dropna(axis=1)
df.dropna(axis='columns')
#只刪除所有都為缺失值的行
df.dropna(how='all')
#只刪除指定列中含有缺失值的行
df.dropna(subset=['name', 'toy'])
#以上操作均不改動原數(shù)據(jù)，inplace=True直接在原數(shù)據(jù)改動
print(df)
df.dropna(inplace=True)


 
 	
	
	
	
	
			
	
		
			
				
					更多文章、技術交流、商務合作、聯(lián)系博主
					
						微信掃碼或搜索：z360901061
					
					
						
					
					
						微信掃一掃加我為好友
						
							QQ號聯(lián)系：  360901061
						
					
				
			
		
	
	
		
			
				
					您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。
					
						【本文對您有幫助就好】元
					
					
						
					
					
						
							 2元
						
						
							 5元
						
						
							 10元
						
						
							 20元
						
						
							 自定義





	
	您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧，站長會非常 感謝您的哦！！！
	
		
		 
		
	
 


	 python腳本-lpushkey Python web框架：flask路由系統(tǒng) 




	
		
					
		發(fā)表我的評論
		
	
	
		
			
			
			
				
				
				表情
			
		
	


	
		最新評論 總共0條評論


		
		


	
		
			站內(nèi)搜索
		
		
			
					
						 
						
					
				
		
	
	
	
	
	
		
			加入交流
		
		
			1. 手機QQ掃左側二維碼2. 搜Q群：542395358 3. 點擊
				
			1. 手機QQ掃左側二維碼2. 搜Q群：922215567 3. 點擊
				
			1.手機微信掃左側二維碼
				2. 微信中搜索：上海加盾信息科技有限公司
			1.手機微信掃左側二維碼
				2. 微信搜索小程序：張軍博客
				
			1.手機微信掃左側二維碼
				2. 微信搜索小程序：上海加盾信息科技有限公司
			關注企業(yè)釘釘
				
			關注企業(yè)微信
				
			微信掃一掃添加張軍網(wǎng)站微信群
				
			微信掃一掃加我為好友
				
		
	
	
		
			猜你喜歡
		
		
			  
				 RedisUtil工具類 在Redis中數(shù)據(jù)都是以key-value的形式存儲的，key規(guī)定只能是string類型的，所以我們 
			
  
				 緩存技術相關 redis-server.exe 服務器啟動命令
redis-cli.exe 命令行客戶端
re 
			
  
				 定義一個時間類 Time，它能表示 24 小時制的時、分、秒，具體要求如下 (20 分) 定義一個時間類 Time，它能表示 24 小時制的時、分、秒，具體要求如下：
(1) 
			
  
				 java正則表達式 過濾特殊字符的正則表達式 java正則表達式 過濾特殊字符的正則表達式 
			
  
				 安裝DB2 安裝DB2 
			
  
				 Linux擴容分區(qū) Linux擴容分區(qū) 
			
  
				 輸出相關路徑 輸出相關路徑 
			
  
				 輸出當前目錄下所有文件名到指定文件中 輸出當前目錄下所有文件名到指定文件中 
			
  
				 刪除命令參數(shù)說明 刪除命令參數(shù)說明 
			
  
				 刪除前3天、前30天、前7天的文件 刪除前3天、前30天、前7天的文件 
			
  
				 多線程工作處理 多線程工作處理、多線程工作處理簡單實現(xiàn)類、多線程工作處理接口 
			
  
				 壓縮jsp,html中的代碼，去掉所有空白符、換行符 壓縮jsp,html中的代碼，去掉所有空白符、換行符 
			
  
				 壓縮、解壓縮工具類 壓縮、解壓縮工具類 
			
  
				 二維碼工具類 二維碼工具類、支付二維碼 
			
  
				 緩存工具類 緩存名創(chuàng)建后即使移除緩存，也不會重新創(chuàng)建 緩存工具類 緩存名創(chuàng)建后即使移除緩存，也不會重新創(chuàng)建 
			
  
				 json工具類 json工具類 
			
  
				 常量資源文件工具類 常量資源文件工具類 
			
  
				 資源文件工具類 資源文件工具類 
			
  
				 處理查詢結果后分頁排序類 處理查詢結果后分頁排序類 
			
  
				 html解析工具類、html表格解析解析工具類 html解析工具類、爬蟲、html表格解析解析工具類、webClient工廠 
			
		
	
	
		
			標簽云
		
		
			金融業(yè)務 (4)教育資料 (10)Java (901)C++ (86)C# (215)Python (9022)Oracle (911)SqlServer (681)MySql (600)DB2 (33)PostgreSql (23)Tomcat (825)Weblogic (12)Windows (214)Linux (647)VMware (32)Ubuntu (194)ASP.NET (198)Android (681)IOS (75)Hive (45)Hadoop (50)Hbase (9)Spark (4)redis (78)PHP (145)Jquery (174)Javascript (168)NoSQL (6)CSS (127)資料下載 (25)交易系統(tǒng) (9)java工具類 (32)其它 (7)秕處理 (4)		
	
	
	
		
			友情鏈接
申請友鏈
		
		
			上海加盾信息科技有限公司
股票002162悅心健康資金分析
張軍博客
張軍博客-網(wǎng)址導航
張軍java工具類
iBAAO壹寶頭條
快手號出售
全球日報
張軍博客-SpringBoot入門
		
	
	
		
			demo案例
申請友鏈
		
		
			XXX環(huán)保設備有限公司
			市突發(fā)預警平臺實時監(jiān)控
		
	
	
		
			51鏈網(wǎng)站
		
		
			51鏈首頁
			51鏈注冊頁
			廣告出售頁
			友鏈出租頁
			軟文出售頁
			友鏈交換頁