如何用几行代码做特征选择 - 代码天地

如何用几行代码做特征选择

企业开发 2018-06-07 09:37:14 阅读次数: 2

from sklearn.feature_selection import RFE
from sklearn.linear_model import LinearRegression
#Load boston housing dataset as an example
X = np.array(train1[feature_use].fillna(-1))[1:train1.size,:]
Y = np.array(train1['target'])[1:train1.size]
#print(X)
#print(Y)
names = feature_use
#use linear regression as the model
lr = LinearRegression()
#rank all features, i.e continue the elimination until the last one
rfe = RFE(lr, n_features_to_select=1)
rfe.fit(X,Y)
print("Features sorted by their score:")
#print(sorted(zip(map(lambda x: round(x, 4), rf.feature_importances_), names),             reverse=True))

sortedlist = sorted(zip(map(lambda x: round(x, 4), rfe.ranking_), names),
             reverse=True)
print(sortedlist)

feature_use = []
for index in sortedlist[len(sortedlist)-70 : ]:
    if index[0]>0:
        feature_use.append(index[1])
print(feature_use)

上面的X为数据集的特征集合 Y为标签集合
在sortlist里对特征的重要性进行了排序

最近做机器学习的一点感悟是，特征的影响远比模型参数来的大，特征是现实世界在算法中的倒影。
在特征工程中要对业务有非常深的理解，强调返璞归真，删除无效特征，减少引起干扰的特征。
加特征的过程需要一个一个来，还要多思考这些特征之间的关系，是否是强烈线性相关的。

猜你喜欢

转载自blog.51cto.com/yixianwei/2125816

如何用几行代码做特征选择

机器学习中如何用F-score进行特征选择（附Matlab代码）

如何用Python做自动化特征工程

干货！如何用.map() .filter() 和.reduce()给代码做“减法”

特征选择（含代码）

如何用eclipse做拼图

如何用 Markdown 做幻灯？

如何用vue做网站？--

小白学习Java前期重点四：如何用嵌套循环做选择性排序？

如何做特征工程？

python简单的病毒编程代码,如何用python做恶搞病毒

如何进行特征选择？

如何进行特征选择

特征选择(2):mRMR特征选择算法(matlab代码实现)

如何用Jmeter做压力测试-session

如何用C++做游戏(1)

如何用C++做游戏(3)

如何用C++做游戏(2)

如何用Python做中文分词？

如何用Python做情感分析？

如何用java做分页查询页面

如何用js做简单的轮播图

如何用甘特图做项目进度计划

如何用redis做实时订阅推送

如何用js做关灯游戏

如何用scratch做按键得分

如何用Linux系统做日常办公？

如何用js做轮播图

如何用Github钩子做自动部署

如何用XGBoost做时间序列预测？

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)