数据分析-记录 - 代码天地

数据分析-记录

其他 2020-02-14 21:48:46 阅读次数: 0

1、特征重要性提取：
对于xgb,lgb等模型，都会有model.feature_importance_方法，对特征的影响程度展示。

2、函数参数(*arg,**kwargs)
*args 用来将参数打包成tuple给函数体调用
**kwargs 打包关键字参数成dict给函数体调用
例子：
在这里插入图片描述
3、删除多余变量的方法
通过删除一整行index实现：

data = {
    "a":[1,2,3],
    "b":[4,5,6],
    "c":[7,8,9]   
}
df = pd.DataFrame(data,columns=['a','b','c'],index=['x','y','z'])
print(df)
df.drop(df[df['b']==5].index)

在这里插入图片描述
4、from scipy.special import boxcoxlp
box-cox变换的用处:

通常对于y进行log变换，因为诸如线性模型、SVM等要求target variable是服从正态分布的
线性回归模型满足线性性、独立性、方差齐性以及正态性的同时，又不丢失信息，此种变换称之为Box—Cox变换。

Box-Cox变换的正态变换：
在这里插入图片描述
没有Box-Cox变换的回归：

Box-Cox变换之后的回归：

变换方法：

skewness = skewness[abs(skewness) > 0.75]

from scipy.special import boxcox1p
skewed_features = skewness.index
lam = 0.15
for feat in skewed_features:
    #all_data[feat] += 1
    all_data[feat] = boxcox1p(all_data[feat], lam)

xfxlesson

发布了24 篇原创文章 · 获赞 3 · 访问量 1570

私信关注

猜你喜欢

转载自blog.csdn.net/xfxlesson/article/details/101380826

数据分析-记录

记录数据分析实习的经历。

Spark数据分析-记录关联问题

python 数据分析问题记录

python数据分析打卡记录

动手学数据分析记录

数据仓库与数据分析学习记录

《利用Python进行数据分析》学习记录

利用Python进行数据分析学习记录（一）

数据分析-03数据分析

数据分析

数据分析-python

离线数据分析

日志数据分析

数据分析笔记

什么是数据分析

python数据分析

Excel 数据分析

数据分析思考

数据分析挖掘

ERP数据分析

网站数据分析

YUV数据分析

商业数据分析

【转】数据分析

数据分析遐想

SPSS数据分析

数据分析方法

DD 数据分析

tpot数据分析

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)