看黄a大片免费,亚洲综合无码一区二区三区 ,日本黄大片在线观看视频

數據標準化（歸一化）處理是數據挖掘的一項基礎工作，不同評價指標往往具有不同的量綱和量綱單位，這樣的情況會影響到數據分析的結果，為了消除指標之間的量綱影響，需要進行數據標準化處理，以解決數據指標之間的可比性。原始數據經過數據標準化處理后，各指標處于同一數量級，適合進行綜合對比評價。以下是三種常用的歸一化方法：

min-max標準化（Min-Max Normalization）

也稱為離差標準化，是對原始數據的線性變換，使結果值映射到[0 , 1]之間。轉換函數如下：?

其中max為樣本數據的最大值，min為樣本數據的最小值。這種方法有個缺陷就是當有新數據加入時，可能導致max和min的變化，需要重新定義。

min-max標準化python代碼如下：

            
import numpy as np
 
arr = np.asarray([0, 10, 50, 80, 100])
for x in arr:
  x = float(x - np.min(arr))/(np.max(arr)- np.min(arr))
  print x
 
# output
# 0.0
# 0.1
# 0.5
# 0.8
# 1.0

使用這種方法的目的包括：

1、對于方差非常小的屬性可以增強其穩定性；

2、維持稀疏矩陣中為0的條目。

下面將數據縮至0-1之間，采用MinMaxScaler函數

            
from sklearn import preprocessing  
 
import numpy as np 
 
X = np.array([[ 1., -1., 2.], 
 
       [ 2., 0., 0.], 
 
       [ 0., 1., -1.]]) 
 
min_max_scaler = preprocessing.MinMaxScaler() 
 
X_minMax = min_max_scaler.fit_transform(X)

最后輸出：

array([[ 0.5 , 0. , 1. ],
????????? [ 1. , 0.5 , 0.33333333],?
????????? [ 0. , 1. , 0. ]])

測試用例：

注意：這些變換都是對列進行處理。

當然，在構造類對象的時候也可以直接指定最大最小值的范圍：feature_range=(min, max)，此時應用的公式變為：

            
X_std=(X-X.min(axis=0))/(X.max(axis=0)-X.min(axis=0)) 
X_minmax=X_std/(X.max(axis=0)-X.min(axis=0))+X.min(axis=0))

Z-score標準化方法

也稱為均值歸一化(mean normaliztion)，給予原始數據的均值（mean）和標準差（standard deviation）進行數據的標準化。經過處理的數據符合標準正態分布，即均值為0，標準差為1。轉化函數為：?

其中? μ μ?為所有樣本數據的均值， σ σ為所有樣本數據的標準差。

            
import numpy as np
 
arr = np.asarray([0, 10, 50, 80, 100])
for x in arr:
  x = float(x - arr.mean())/arr.std()
  print x
 
# output
# -1.24101045599
# -0.982466610991
# 0.0517087689995
# 0.827340303992
# 1.34442799399

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

python數據歸一化及三種方法詳解