亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

用python對訓練集和測試集進行特征規范化處理

系統 2000 0

個人理解這里的規范化處理指對提取后的特征集進行處理,不是對原始的數據信號進行處理,包括 歸一化 標準化。

規范化的原因: 不同特征具有不同量級時會導致:a.數量級的差異將導致量級較大的特征占據主導地位;b.數量級的差異將導致迭代收斂速度減慢;c.依賴于樣本距離的算法對于數據的數量級非常敏感。

歸一化: X_{norm}=\frac{X-X_{min}}{X_{max}-X_{min}} ,也就是原數據減去該特征列最小值,再除以該特征列的極差,將屬性縮放到[0,1]之間。

標準化: X_{norm}=\frac{X-\mu }{\sqrt{\sigma ^{2}}} ,也就是原數據減去該特征列的均值,再除以該特征列的標準差。

注意:

1.所謂規范化是對特征列的規范化,不是對樣本的特征向量規范化(如將一個人身高、年齡、體重等屬性規范化沒有意義);

2.應將訓練集和測試集分開后再規范化處理,測試集使用的是訓練集保留下的參數(歸一化的max、min,標準化的mean、std),也就是訓練集規范化時使用自己的最大值最小值、均值方差,測試集規范化計算時仍使用訓練集的最大值最小值、均值方差。

【例】

訓練集兩個樣本,含三個特征, x_{train}=\begin{bmatrix} 1 &2 &3 \\ 2&3 &4 \end{bmatrix} ,測試集也是兩個樣本,三個特征, x_{test}=\begin{bmatrix} 1 &1 &1 \\ 2&2 &2 \end{bmatrix}

歸一化: 由訓練集得到參數 min=(1,2,3),max=(2,3,4),則

?訓練集第一維特征的第一個數據1的計算為 x=\frac{1-1}{2-1}=0 ,測試集第二維特征的第一個數據1的計算為 x=\frac{1-2}{3-2}=-1 .

標準化: 由訓練集得到參數 mean=(3/2, 5/2, 7/2), std=(1/2, 1/2, 1/2),則

訓練集第一維特征的第一個數據1的計算為 x=\frac{1-3/2}{1/2}=-1 ,測試集第二維特征的第一個數據1的計算為 x=\frac{1-5/2}{1/2}=-3 .

?

python實現:

可由 sklearn.preprocessing.MinMaxScaler 和 sklearn.preprocessing.StandardScaler 實現,訓練集使用函數 fit_transform(),測試集使用函數?transform()。示例如下:

            
              import numpy as np
from sklearn.preprocessing import MinMaxScaler   #歸一化:最值
from sklearn.preprocessing import StandardScaler #標準化:均值方差

#訓練集,兩行三列,兩個樣本、三個特征
x_train = np.array([[1.0,2.0,3.0],
                   [2.0,3.0,4.0]])

#測試集,兩行三列,兩個樣本、三個特征
x_test = np.array([[1.0,1.0,1.0],
                   [2.0,2.0,2.0]])

# 特征縮放:歸一化
mms = MinMaxScaler()
x_train_norm = mms.fit_transform(x_train)
x_test_norm = mms.transform(x_test)
print('\n歸一化:\n')
print('x_train_norm:\n',x_train_norm)
print('\nx_test_norm:\n',x_test_norm, "\n")

# 特征縮放:標準化
stdsc = StandardScaler()
x_train_std = stdsc.fit_transform(x_train)
x_test_std = stdsc.transform(x_test)
print('\n標準化:\n')
print('x_train_std:\n',x_train_std)
print('x_test_std:\n',x_test_std)
            
          

運行結果:

? ? ? ? ? ? ? ? ?? 用python對訓練集和測試集進行特征規范化處理_第1張圖片

參考

1.https://blog.csdn.net/zwqjoy/article/details/81182102

2.https://www.cnblogs.com/dearL/p/9532288.html

3.https://blog.csdn.net/anecdotegyb/article/details/74857055

4.https://www.cnblogs.com/dan-baishucaizi/p/9107858.html


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 久久久久久免费视频 | 99re这里只有热视频 | 中文字幕在线观看一区二区三区 | 国产精品久久久久久久久免费hd | 久久狠狠第一麻豆婷婷天天 | 一本色道久久88加勒比—综合 | 精品免费久久 | 九九爱这里只有精品 | 一极毛片 | 国产精品永久免费视频 | 久久福利青草精品免费 | 久热中文字幕在线精品首页 | 亚洲精品国产啊女成拍色拍 | 不卡在线播放 | 91亚洲精品福利在线播放 | 91嫩草国产线免费观看 | 婷婷sese| 国产精品第| 欧美日韩在线免费观看 | 免费一级黄色片 | 在线观看日韩一区 | 九九精品在线 | 成人区在线观看免费视频 | 日韩 欧美 国产 亚洲 中文 | 日韩一区二区三区视频在线观看 | 一级免费a| 精品久久久久久中文字幕网 | 久久99精品久久久久久国产人妖 | 黄色片网站在线免费观看 | 国产成a人亚洲精v品久久网 | 成年女人a毛片免费视频 | h片免费网站 | 国产亚洲综合精品一区二区三区 | 韩国一级特黄毛片大 | 97在线播放视频 | 国产在线99| 日本欧美一区二区三区乱码 | 久久尹人香蕉国产免费天天 | 国产成人不卡亚洲精品91 | 亚洲精品中文字幕区 | 国产激情久久久久久影院 |