数据预处理及训练结果评估 2018-10-09 机器学习 机器学习初步 数据预处理及训练结果评估 归一化(标准化) 1234#库名from sklearn import preprocessing#使用方法X_scaled = preprocessing.scale(X) K折验证 12345from sklearn.model_selection import train_test_splitX, y = np.arange(10).reshape((5, 2)), range(5)X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.125, random_state=0) # 8折验证 准确率、召回率等 123456789101112131415161718192021from sklearn.metrics import precision_scoreprint(precision_score(y_test,y_predict,average='micro'))#其中,average可选(常用):'''宏平均(Macro-averaging),是先对每一个类统计指标值,然后在对所有类求算术平均值。微平均(Micro-averaging),是对数据集中的每一个实例不分类别进行统计建立全局混淆矩阵,然后计算相应指标。'micro': 计算准确率 'macro': 计算每个标签的准确率 'weighted': 根据每个标签出现的数量按权重计算其准确率'binary': * 计算二分类的准确率(预测为1的准确率) * 在召回率中,则计算预测为1的占总数的百分比''' 召回率 123from sklearn.metrics import recall_score recall_score(y_true, y_pred, average='micro') # average和上一个类似 f1-score 12f1score(y_true, y_pred, average='micro') # average和上一个类似 准确率(sklearn训练) 1print(clf.score(x_train, y_train)) PCA降维 1234567891011import sklearn.decomposition.pca as PCA#PCA降维mypca=PCA.PCA(n_components=2)x_test_de=mypca.fit_transform(x_test)'''其中explained_variance_:方差值explained_variance_ratio_:方差占比singular_values_:分解得到的奇异值(不是奇异向量)inverse_transform(X):按降维操作逆向升维''' 本文作者:HACHp1 本文链接: https://hachp1.github.io/posts/机器学习/20181009-metrics.html 版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 3.0 CN 许可协议。非商业转载请注明作者及出处。商业转载请联系作者本人。 上一篇 树相关-从决策树到kaggle大杀器 下一篇 2018省赛AWD web writeup