数学建模大作业中涉及到的知识点总结

数学建模大作业中涉及到的知识点总结:

(1)写作缘由

在数学模型与优化的大作业中,遇到要对数据集进行统计描述、相关分析、回归分析、特征选择思路、数据预处理,因此就稍微研究了下

(2)统计描述:

① 频率统计
② 中位数
③ 众数
④ 平均数
⑤ 方差
⑥ 标准差
用spss软件,可以很方便快捷,具体的spss可以随意参考一本spss的书籍即可
这里写图片描述

(3)相关分析(点二列相关 )

这里写图片描述

这里写图片描述

(4)回归分析

Logistic回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。

因变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。

回归分析一般有这几个操作:
① 设置筛选条件,刷选数据集 valid
这里写图片描述
这里写图片描述

② 模型拟合度检验
这里写图片描述
这里写图片描述

③ 预测的模型参数
这里写图片描述
④ 预测结果,准确率

这里写图片描述
这里写图片描述

(5)特征选择和数据预处理

特征选择,主要是gzh的想法
特征筛选的思路:
分类变量用1 2 3 4 离散值
对于搜索记录的变量1:用 含敏感词/搜索记录的比 作为值 连续值
对于搜索记录的变量2:用 含敏感类/搜索记录的比 作为值 连续值

注意了:
筛选特征的时候,重复性要考虑、缺失值要考虑

(6)缺失值的填充

这里写图片描述

(7)文档编辑的一些技巧

https://blog.csdn.net/qq_26769591/article/details/80848841

(8)团队合作的一些心得

1.软件解决不了的,就用程序,最厉害的是,能用程序解决的问题都不是问题
2.不会乱 不会重复做功 不会丢失工作
3.经验丰富 总能拿出一种解决方案
4.想做的总是能实现 搜不到的 试着试着就出来了 再难的软件都可以被破解 再难的功能都能被解锁 再难的操作都能被逼近
5.大致方向总是不差 错也只是参数不是思路 不是算法
6.不会停滞 不会闲置 每天都能前进 没思路的时候,基本的数据处理也是相当有意义的
7.同步 思路和进度 已经当前要做的事 和要解决的事 能保持同一水平线

猜你喜欢

转载自blog.csdn.net/qq_26769591/article/details/80840673