怎样提升机器学习:特征工程的奇淫巧技

1500阅读 0评论2016-10-20 jiangwen127
分类:大数据



目录 []

作者:Jacob Joseph
系列名称:Improving analytics output with feature engineering
Part1:
Part2:
Part3:
Part4:

:本文是我爱机器学习(52ml.net)编者的简单总结,但也加入了自己的理解。

1. 数值变量标准化

2. 离散化

3. 减少分类变量取值范围

4. 非正态分布转正太分布

part-1-figure-1

5. Missing Data

6. 哑变量

7. 交叉特征

8. 降维

9. 直觉和额外的特征

上一篇:中概企业实行雇员期权激励计划
下一篇:为什么在神经网络中要使用交叉熵而不是均方差作为损失函数