2020美赛数学建模 校级培训——Week_1

引言:

博主在今年寒假参加了学校组织的美国大学生数学建模竞赛培训, 在此,用博客来记录这段培训时光。

本篇博客将记录第一轮培训(1.4——1.8 )的相关培训内容:
第一周安排

Day 1: 2020.1.4

一、SPSS软件与统计基础

常见的统计数据工具:SPSS
SPSS

  • 统计中重要操作:

1.描述统计
2.回归
3.分类
4.降维

  • SPSS的基本操作:
  1. SPSS对数据的基本处理
  2. 相关性分析
  3. 普通回归分析
  4. 一般线性模型
  5. 广义线性模型
  6. 聚类分析(无监督学习)
  7. 判别分析(有监督学习)

二、优秀美赛论文学习

Problem:2016MCM_C

2016MCM_C: M奖

Day 2: 2020.1.5

一、2019年数模国赛C题优秀论文讲解(一)

对这篇优秀论文逐页逐页讲解,讲得很详细,
这里就只放一张摘要感受一下:

在这里插入图片描述

Day 3: 2020.1.6

一、第一轮模拟题:2019MCM_C

1. Problem:

2019年MCM问题C:类阿片危机
背景:美国正在经历一场关于使用合成和非合成类阿片治疗和管理疼痛(合法、处方使用)或娱乐目的(非法、非处方使用)的国家危机。像疾病控制中心(CDC)这样的联邦组织正在努力“拯救生命并防止这种流行病对健康的负面影响,如阿片类药物使用障碍、肝炎和艾滋病毒感染,“1强制执行现有法律对联邦调查局(FBI)和美国药品监督管理局(DEA)等都是一项复杂的挑战。
对美国经济的重要部门也有影响。例如,如果阿片类药物危机蔓延到美国人口的各个阶层(包括受过大学教育和拥有高级学位的人群),需要精密劳动技能、高技术组件组装的企业,与客户和客户之间敏感的信任或安全关系可能难以填补这些职位。此外,如果老年人中阿片类药物成瘾的比例增加,医疗保健费用和辅助生活设施人员配置也将受到影响。
缉毒局/国家法医实验室信息系统(NFLIS)作为缉毒局(DEA)转移管制办公室的一部分,发布了一份数据密集型年度报告,内容涉及“联邦、州分析的毒品案件的毒品鉴定结果和相关信息,NFLIS内的数据库包括来自犯罪实验室的数据,这些实验室处理了全国每年约120万个州和地方毒品案件的88%以上。对于这个问题,我们关注位于美国五(5)个州的各个县:俄亥俄州、肯塔基州、西弗吉尼亚州、弗吉尼亚州和田纳西州。在美国,一个县是每个州下一个拥有税务机关的下级政府。
随此问题描述提供了几个数据集供您使用。第一个文件(MCM_NFLIS_Data.xlsx)包含了这五个州的每个县2010-2017年麻醉性镇痛药(合成类阿片)和海洛因的毒品鉴定计数,每个州的犯罪实验室都向DEA报告了这些数据。当执法机构将证据作为刑事调查的一部分提交给犯罪实验室,实验室的法医科学家对证据进行检验时,就会进行毒品鉴定。通常,执法机构在提交这些样本时,会在事件报告中提供位置数据(县)。当证据提交给犯罪实验室而未提供此位置数据时,犯罪实验室使用提交案件的市/县/州调查执法机构的位置。就这个问题而言,您可以假设县位置数据是正确的。
另外七(7)个文件是压缩文件夹,其中包含美国人口普查局的摘录,这些摘录代表了2010-2016年间为这五个州的县收集的一组共同的社会经济因素(ACS-xx-U
5YR-DP02.zip)。(注:2017年没有相同的数据。)
代码表与定义每个变量的每个数据集一起出现。虽然您可以使用其他资源进行研究和背景信息,但所提供的数据集包含您应该用于此问题的唯一数据。
1疾病控制中心网站(https://www.cdc.gov/features/accounting-opiods/index.html),2018年9月4日访问。
第2页共3页 问题:
第一部分。利用所提供的NFLIS数据,建立一个数学模型,描述报告的合成类阿片和海洛因事件(案例)在五个州及其县之间随时间的传播和特点。使用您的模型,确定五个州中每个州可能开始使用特定阿片类药物的任何可能位置。
如果你的团队所确定的模式和特点继续下去,美国政府是否应该有什么特别的担忧?在什么样的药物识别阈值水平上会发生这些情况?你的模型预测它们将在何时何地发生?
第二部分。利用提供的美国人口普查社会经济数据,解决以下问题:
关于阿片类药物的使用如何达到目前的水平,谁在使用/滥用阿片类药物,是什么导致阿片类药物使用和成瘾的增长,以及为什么阿片类药物的使用尽管存在已知的危险,但仍然持续存在,有很多相互矛盾的假设作为解释。使用或使用趋势是否与提供的美国人口普查社会经济数据有关?如果是,请修改第1部分中的模型,以包含此数据集中的任何重要因素。
第三部分。最后,结合第1部分和第2部分的结果,找出应对阿片类药物危机的可能策略。使用您的模型测试此策略的有效性;确定成功(或失败)所依赖的任何重要参数界限。
除了你的主要报告,还包括一份1-2页的备忘录给首席行政官,DEA/NFLIS数据库,总结你在建模过程中发现的任何重要见解或结果。
你的提交应该包括:一页汇总表,一页到两页的备忘录,你的解决方案不超过20页,最多23页,你的摘要和备忘录。注意:参考列表和任何附录不计入23页的限制,应在完成解决方案后出现。

2、题目解读

  • 任务一:判断社会经济学数据与毒品的相关性。

这个任务比较简单,做个PCA和相关性矩阵就好了。

  • 任务二:添加社会经济学数据,改进C.1的模型

必然需要的数据:与人口、经济水平相关的数据 可能需要的数据:自己新构造的指标,指标实在太多了(近600个),必然需要特征融合
(1)把所有的数量指标都考虑进经济学因素,比如计算人均毒品案件数量
(2)把经济学指标添加进回归模型/决策树的自变量
(3)设置回归模型惩罚项,避免过拟合(虽然这点数据很难过拟合,一般都收敛不了,等待打脸)
(4)如果你使用了AutoML,Auto_Keras,EasyDL之类的自动回归机器当我什么也没说,丢进变量训练就是了
(5)注意对比模型效果,理论上应该有巨大提升,如果没有就操作一下

  • 任务三:解释模型

这道题到底要你做什么? 可能改进模型并不是最重要的,而是前面的"computing model to explain"。
你也需要给出你的因素与毒品变化趋势之间的解释,并且应当具体到最重要的几个或十几个变量上。
这样的解释更可能不需要数值上的解释,而是结合经济学模型以及社会因素的解释,
毕竟数值上的解释无异于解决问题,而C题的第二个核心在于“如何给出相应的抑制性政策”。

Day 4: 2020.1.7

第一轮模拟题:2019MCM_C

1、论文模板

因为第一次写美赛论文,完全没有经验,所以第一次基本属于摸瞎,
甚至连摘要页的基本格式都没有搞懂,ε=(´ο`*)))
在这里插入图片描述

2、论文目录

在这里插入图片描述

Day 5: 2020.1.8

第一轮模拟题:2019MCM_C

1、论文修改稿

在这里插入图片描述
在这里插入图片描述

2、论文终稿

2019MCM_C:论文终稿(附件附带下载)

结语

至此,第一周培训结束,我们也顺利完成了第一篇论文, 虽然是第一次写美赛论文很多论文格式,排版,要求都不是很熟悉,但最后好在勉强完成了论文。
相信有过第一次练习后,以后的论文会写得更好!

注:第一轮模拟题的论文会放在附件里,有需要的小伙伴可以下载~
链接:第一轮:2019MCM_C.pdf

发布了13 篇原创文章 · 获赞 29 · 访问量 1995

猜你喜欢

转载自blog.csdn.net/qq_41618424/article/details/104575087