XGBoost
XGBoost (eXtreme Gradient Boosting)是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree(梯度提升树)工具包,比常见的工具包快10倍以上。因为在数据科学比赛中,有大量重点内容选手选用它进行数据挖掘比赛,其中包括两个以上kaggle比赛的夺冠方案。在工业界规模方面,xgboost的分布式版本有广泛的可移植性,支持在YARN, MPI, Sungrid Engine等各个平台上面运行,并且保留了单机并行版本的各种优化,使得它可以很好地解决于工业界规模的问题。
安装
考虑到文章太长,看着难受,所以分成各个模块来介绍这个东习
这部分首先是讲好如何安装,先把环境配好了再说其他的吧
方法一:超级简易版
该方法非常简单只需要几步就行:
1.1安装包基地:XGBoost,选择和你的环境相配合的包:
我尽量做到闭环(只看该文档就可以解决基本问题):
通过图片可以看见,我的python是2.7版本(python --version)查看
同时可在系统信息中看见我的电脑是64位的。
因此选择:cp27==python 27 win_amd64=64 位
下载好后,使用:pip install '存放路径'
就可以了:
等待出现如下图像就安装完成了:
方法二:anaconda依赖版
anaconda安装可以参考官方文档,相关操作可以参考:
anaconda安装库相应操作
进入anaconda prompt
后,可以使用:
anaconda search -t conda xgboost
如图所示:
然后,会得到很多可选的库,机器版本是64位的因此推荐使用下面的库:
conda install -c anaconda py-xgboost
接着选择:y
就行了
这种方法,依赖于anaconda,手续比较简单。
检验
安装完成后,都可以使用:
pip show xgboost
来检验是否安装成功。