亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python數據歸一化及三種方法詳解

系統 2219 0

數據標準化(歸一化)處理是數據挖掘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數據分析的結果,為了消除指標之間的量綱影響,需要進行數據標準化處理,以解決數據指標之間的可比性。原始數據經過數據標準化處理后,各指標處于同一數量級,適合進行綜合對比評價。以下是三種常用的歸一化方法:

min-max標準化(Min-Max Normalization)

也稱為離差標準化,是對原始數據的線性變換,使結果值映射到[0 , 1]之間。轉換函數如下:?

?

其中max為樣本數據的最大值,min為樣本數據的最小值。這種方法有個缺陷就是當有新數據加入時,可能導致max和min的變化,需要重新定義。

min-max標準化python代碼如下:

            
import numpy as np
 
arr = np.asarray([0, 10, 50, 80, 100])
for x in arr:
  x = float(x - np.min(arr))/(np.max(arr)- np.min(arr))
  print x
 
# output
# 0.0
# 0.1
# 0.5
# 0.8
# 1.0
          

使用這種方法的目的包括:

1、對于方差非常小的屬性可以增強其穩定性;

2、維持稀疏矩陣中為0的條目。

下面將數據縮至0-1之間,采用MinMaxScaler函數

            
from sklearn import preprocessing  
 
import numpy as np 
 
X = np.array([[ 1., -1., 2.], 
 
       [ 2., 0., 0.], 
 
       [ 0., 1., -1.]]) 
 
min_max_scaler = preprocessing.MinMaxScaler() 
 
X_minMax = min_max_scaler.fit_transform(X)
          

最后輸出:

array([[ 0.5 , 0. , 1. ],
????????? [ 1. , 0.5 , 0.33333333],?
????????? [ 0. , 1. , 0. ]])

測試用例:

注意:這些變換都是對列進行處理。

當然,在構造類對象的時候也可以直接指定最大最小值的范圍:feature_range=(min, max),此時應用的公式變為:

            
X_std=(X-X.min(axis=0))/(X.max(axis=0)-X.min(axis=0)) 
X_minmax=X_std/(X.max(axis=0)-X.min(axis=0))+X.min(axis=0))
          

Z-score標準化方法

也稱為均值歸一化(mean normaliztion), 給予原始數據的均值(mean)和標準差(standard deviation)進行數據的標準化。經過處理的數據符合標準正態分布,即均值為0,標準差為1。轉化函數為:?

?

其中? μ μ?為所有樣本數據的均值, σ σ為所有樣本數據的標準差。

            
import numpy as np
 
arr = np.asarray([0, 10, 50, 80, 100])
for x in arr:
  x = float(x - arr.mean())/arr.std()
  print x
 
# output
# -1.24101045599
# -0.982466610991
# 0.0517087689995
# 0.827340303992
# 1.34442799399
          

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!??!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产精品久久久久久久久久影院 | 国产第113页 | 亚洲热久久 | 中文字幕一二三区 | 日韩欧一级毛片在线播无遮挡 | 亚洲a成人7777777久久 | a国产精品| 久久中文字幕视频 | 日本高清一道本 | 经典日韩 | 91视频精品 | 亚洲精品123区 | 久久精品这里 | 亚洲另类在线视频 | 欧美va亚洲va在线观看蝴蝶网 | 国产精品区一区二区免费 | 四虎海外影院 | 色94色欧美一区 | 精品亚洲视频在线 | 亚洲人精品 | 亚洲国产一区二区三区最新 | 国内精品久久久久香蕉 | 国产91九色在线播放 | 日本成人不卡视频 | 亚洲国产高清一区二区三区 | 精品精品国产自在香蕉网 | 亚洲最大免费视频网 | 免费看国产一级特黄aa大片 | 欧美日韩高清观看一区二区 | 大片国产片日本观看免费视频 | 99综合在线 | 2021福利视频| 精品国产影院 | 综合网久久 | 国内精品久久久久久久久久影视 | 99视频在线看观免费 | 欧美成人视 | 成人aaaa | 久久综合久色欧美婷婷 | 日韩久久影院 | 秘密影院久久综合亚洲综合 |