数据特征处理
在机器学习的算法训练中,有很多数据的特征值不止一个,特征值中有些属性的数字过大,从而对计算结果的影响太大,但是实际情况是每个属性都同等重要,这时候就要处理这种不同取值范围的特征值,通常采用数值归一化,将取值范围处理为0-1或者其他范围之间。
1.数据归一化:
sklearn归一化API
from sklearn
.preprocessing
import MinMaxScaler
举例:
mm
=MinMaxScaler
(feature_range
=(0,1))
data
=mm
.fit_transform
([[90,20,4,10],[40,24,3,20],[70,30,5,30]])
print(data
)
结果:
sklearn标准化API(正态分布)
举例
st
=StandardScaler
()
data
=st
.fit_transform
([[1,-1,3],[2,4,2],[4,6,-1]])
print(data
)
结果
转载请注明原文地址:https://tech.qufami.com/read-19808.html