Feature,特征选择

机器学习入门,什么是特征和特征选择?
【Feature,特征选择】

Feature,特征选择

什么是特征简单来说,机器学习可以看成一个统计过程,基于大量数据进行统计分析,并作出预测(比如,分类问题属于预测目标的分类,目标识别问题属于预测目标的数量、位置,等等) 。预测,简单来说,可以是认为预测各种因素、因子与结果的相关性(概率) 。这些因素、因子,称为特征(feature),也叫变量(variable)——自变量(independent variable)/ 输入变量(input variable)/ 控制变量(control variable) 。
这一大堆名词说的都是一个东西 。什么是特征选择特征选择,就是从特征中选出那些有助于做出预测的特征(没选中的特征不一定是无关特征,可能和预测结果有相关性,只不过比较弱,为了简化模型所以不选) 。具体来说,一个是手工选择,一个是通过机器学习的技术自动选择 。手工选择主要取决于领域知识和经验 。自动选择的方法多种多样,不拘一格 。
比如Ridge回归就可以用来做特征选择。Ridge回归,你可以把它看成加上一个正则化因子α的逻辑回归 。反过来说,逻辑回归可以看成α=0的Ridge回归 。随着α的增大,会依据相关性由低到高依次移除特征,直到所有特征都被移除 。迭代尝试不同数量级的α的值,可以自动选择特征 。(图片来源:towardsdatascience.com)上图是一个Ridge回归的例子 。
机器学习中,特征提取和特征选择有什么区别?
Feature,特征选择

回答分2部分,第一部分为特征提取和特征选择的区别,第二部分为sklearn相应的模块及中英文文档 。1. 特征提取和特征选择区别:特征提取(Feature Extraction):特征选择(Feature Selection):两者对比图:2. sklearn中相关a. 数据预处理: sklearn.preprocessingb. 特征提取: sklearn.feature_extractionc. 降维: sklearn.decompositiond. 特征选择: sklearn.feature_selection详情请查看官方文档或中文文档:如果对你有帮助,请点赞支持 。

    推荐阅读