关于模型中变量选择的五个误区, 譬如不显著的变量需要剔除还是保留?

凡是搞计量经济的,都关注这个号了邮箱:[email protected]所有计量经济圈方法论丛的do文件,微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.注:关于变量选择,仍然需要区分变量到底是用来做模型预测的还是做模型估计的,模型预测与模型估计的区别决定了变量选择的标准。误解1:“模型中的变量数量应该减少,直到变量平均事件发生数为10。”不!注:当结果变量是二元的时候
分类: 编程语言 发布时间: 04-07 12:23 阅读次数: 0

美国2002-2019年所有经济学博士学位论文信息, 为中国博士研究生提供前沿方向!

凡是搞计量经济的,都关注这个号了邮箱:[email protected]所有计量经济圈方法论丛的do文件,微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.以下列出了美国和加拿大各大学在2002至2019年总计18年授予博士学位学生的毕业论文。各个大学提供其学校博士学位获得者名单和科目分类。计量经济圈认为这对于中国国内的学生有很大参考价值,对比一下这边的Ph.D的diss
分类: 编程语言 发布时间: 04-07 12:23 阅读次数: 0

Stata波士顿大词典, 随时随地学习动态更新的Stata命令工具(下册)

凡是搞计量经济的,都关注这个号了邮箱:[email protected]所有计量经济圈方法论丛的do文件,微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.Stata的编程语言使用户可以编写命令。就像Stata的官方命令一样,许多用户可以通过StataJournal,SSCArchive或自己的网站等渠道将其命令提供给其他人。Stata的search,netsearch和
分类: 编程语言 发布时间: 04-07 12:23 阅读次数: 0

Stata波士顿大词典, 随时随地学习动态更新的Stata命令工具(上册)

凡是搞计量经济的,都关注这个号了邮箱:[email protected]所有计量经济圈方法论丛的do文件,微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.Stata的编程语言使用户可以编写命令。就像Stata的官方命令一样,许多用户可以通过StataJournal,SSCArchive或自己的网站等渠道将其命令提供给其他人。Stata的search,netsearch和
分类: 编程语言 发布时间: 04-07 12:23 阅读次数: 0

在期数较短的微观面板数据中使用双重差分法(DID)有没有问题呢?

凡是搞计量经济的,都关注这个号了邮箱:[email protected]所有计量经济圈方法论丛的do文件,微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.对在期数较短的微观面板数据中使用双重差分(differenceindifference)的文献做一个清单,而至于在这种情况下使用该方法的严谨性和结果稳健性问题,有待各位学者在留言区评论探讨。后面将围绕该问题在社群开展学
分类: 编程语言 发布时间: 04-07 12:23 阅读次数: 0

没搞明白哪里错了 我的天

int Add (int x,int y){int z=0before z=(x+y)returnz}int main(){ int arr[10]={0} arr[4]; int a=10 int b=20 int sum=Add(a,b) return0;  }
分类: 编程语言 发布时间: 04-07 12:22 阅读次数: 0

【精简教程版】100行代码入手天池CV赛事

本文针对阿里天池《零基础入门CV赛事-街景字符编码识别》,给出了百行代码Baseline,帮助cv学习者更好地结合赛事实践。同时,从赛题数据分析和解题思路分析两方面进行了详细的解读,以便于大家进阶学习。数据及背景https://tianchi.aliyun.com/competition/entrance/531795/information(阿里天池-零基础入门CV赛事)百行BaselineBa
分类: 编程语言 发布时间: 04-07 12:22 阅读次数: 0

深度学习环境配置指南!(Windows、Mac、Ubuntu全讲解)

入门深度学习,很多人经历了从入门到放弃的心酸历程,且千军万马倒在了入门第一道关卡:环境配置问题。俗话说,环境配不对,学习两行泪。如果你正在面临配置环境的痛苦,不管你是Windows用户、Ubuntu用户还是苹果死忠粉,这篇文章都是为你量身定制的。接下来就依次讲下Windows、Mac和Ubuntu的深度学习环境配置问题。一、Windows系统深度学习环境配置系统:Win10  64位操作系统安装组
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

Tensorflow基础入门十大操作总结

TensorFlow 是一个开源的、基于 Python 的机器学习框架,它由 Google 开发,提供了 Python,C/C++、Java、Go、R 等多种编程语言的接口,并在图形分类、音频处理、推荐系统和自然语言处理等场景下有着丰富的应用,是目前最热门的机器学习框架。但不少小伙伴跟我吐苦水说Tensorflow的应用太乱了,感觉学的云里雾里,能不能搞个Tensorflow的教程呀。今天,就和大
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

SVM算法在项目实践中的应用!

支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。正是由于SVM具有很多独特的优势,基于SVM分类器在很多时候都具有较好的拟合作用。本文对SVM算法在行人检测项目实践中的应用进行详细讲解,同时给出调用OpenCV分类器及可视化的代码实
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

鱼佬&阿水竞赛相声:我是如何2小时杀进排名前10%的!

晚上7点,鱼佬一个人来到阿水的家里,在长达2个小时的时间里,两个人开始渐入状态,第一次进行了深入交流……开始各自的比赛刷分经验分享。听说2小时杀进了排名前10%?是兄弟,就讲讲上分经验啊。话不多说,直接看那晚发生了什么 ↓↓↓https://v.qq.com/x/page/j3081l4ll6j.html(特别感谢阿水的整理)本次分享,鱼佬和阿水结合正在进行的科大讯飞AI赛事(数据挖掘,cv,nl
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

不谈技术,聊聊我最近的拖延困惑

「WhaleFace」:当我们选择面对(Face)问题,解决问题便成了可能。明知一堆事却死活不想干,选择拖延,事情却越堆越多,尤其是在毕业季和面临找工作阶段,事情的扎堆让我感觉到压力,但是又找不到突破口。在Datawhale聊了这个话题后,才发现不是我一个人有这个困惑,索性在组织内部成立了「WhaleFace」小组,一起去厘清问题和解决问题,从面对拖延开始。这就是「WhaleFace」第一期的由来
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

一文总结词向量的计算、评估与优化

为了处理语言,需要将文本信息用向量的形式表达。词向量(Word Vector)或称为词嵌入(Word Embedding)就是将词语向量化。常见的生成词向量的神经网络模型有NNLM模型,C&W模型,CBOW模型和Skip-gram模型。本文目录:       1. 词向量计算方法1.1 Word2Vec的计算1.2 Word2Vec中计算方法详解1.3 高频词(the)引起的问题    2
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

NLP入门必知必会(一):Word Vectors

自然语言处理( NLP )是信息时代最重要的技术之一,也是人工智能的重要组成部分。NLP的应用无处不在,因为人们几乎用语言交流一切:网络搜索、广告、电子邮件、客户服务、语言翻译、医疗报告等。近年来,深度学习方法在许多不同的NLP任务中获得了非常高的性能,同时也吸引了越来越多的人加入学习NLP的大潮中。应广大学习者要求,Datawhale正式开启NLP专辑系列,提供NLP入门方向和指引,希望能帮助到
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

机器学习模型评估与超参数调优详解

机器学习分为两类基本问题----回归与分类。在之前的文章中,也介绍了很多基本的机器学习模型。可在Datawhale机器学习专辑中查看。但是,当我们建立好了相关模型以后我们怎么评价我们建立的模型的好坏以及优化我们建立的模型呢?那本次分享的内容就是关于机器学习模型评估与超参数调优的。本次分享的内容包括:用管道简化工作流使用k折交叉验证评估模型性能使用学习和验证曲线调试算法通过网格搜索进行超参数调优比较
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

数据分析之Pandas合并操作总结

pandas 是一个强大的分析结构化数据的工具集,它的使用基础是Numpy(提供高性能的矩阵运算),用于数据挖掘和数据分析,同时也提供数据清洗功能。Pandas做分析数据,可以分为索引、分组、变形及合并四种操作。前边已经介绍过索引操作、分组操作及变形操作,最后对Pandas中的合并操作进行介绍,涉及知识点提纲如下图:     本文目录              1. append与assign  
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

如何优雅地展示机器学习项目!

很多数据科学工作者都存在这样一个痛点,由于没有能点亮网页前端的技能树,导致在项目展示或项目合作时,无法快速开发出这样一套用户界面以供使用。而今天要介绍的Streamlit正是为了应对这一痛点而生的。Streamlit是一个机器学习工程师专用的,专门针对机器学习和数据科学团队的应用开发框架,是目前开发自定义机器学习工具的最快的方法。可以认为它的目标是取代Flask在机器学习项目中的地位,可以帮助机器
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

我的XGBoost学习经历及动手实践

知乎地址:http://www.zhihu.com/people/meng-di-76-92我今天主要介绍机器学习集成学习方法中三巨头之一的XGBoost,这个算法在早些时候机器学习比赛内曾经大放异彩,是非常好用的一个机器学习集成算法。XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在Gradient Boosting框架下实现机器学习算法。XGBoost提供了并行树提升(
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

知识主题间先序关系挖掘

知识主题间先序关系挖掘麻珂欣1,2,魏笔凡1,2,马杰1,2,刘均1,2,黄毅3,胡珉3,冯俊兰31西安交通大学计算机科学与技术学院,陕西西安7100492陕西省天地网技术重点实验室,陕西西安7100493中国移动研究院,北京100032摘要:先序关系指知识主题之间学习的先后依赖关系。已有的先序关系挖掘方法大多是流线型的方式,易导致错误累计,且严重依赖可能导致错误先序关系的超链接。为了解决以上问题
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0

基于数据智能的区域教育大平台建设与应用实践

基于数据智能的区域教育大平台建设与应用实践贺相春,郭绍青西北师范大学教育技术学院,甘肃兰州730070摘要:数据智能引领是新时期区域教育大平台建设与应用的重要方向。从区域教育大平台建设与应用的现状和挑战出发,从理念视角阐述了基于数据智能的区域教育大平台的发展阶段,提出运用迭代思维推进平台建设、坚持3个导向统筹平台建设、聚焦3个重点推动平台建设、创新建设机制助推生态构建等方面的建设思路,从技术视角分
分类: 编程语言 发布时间: 04-07 12:20 阅读次数: 0