【python】《Python数据挖掘入门与实践》实验环境搭建

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/lixiaowang_327/article/details/52215175

VMware Workstation + ubuntukylin-14.04.5-enhanced-i386 (32Bit)(64Bit也可以,但虚拟机推荐使用32Bit)

后来我改用win8.1 + Ubuntu Kylin14.04双64位系统了,以下指令亲测可用。

ubuntukylin-14.04.5 本身自带python2 和 python3,在terminal中输入python调用python2.7,输入python3调用python3.4.


可以通过设置将默认的python指向python3.4,(但此处不需要)指令如下:

$ sudo rm /usr/bin/python
$ sudo ln -s /usr/bin/python3.4 /usr/bin/python

此处 不需要将默认的python指向python3.4,但由于《Python数据挖掘入门与实践》一书推荐使用python3.4,后续组件的安装都以python3.4的版本为主.

<1> 安装pip3,指令如下:

$ sudo apt-get install python3-pip

使用指令
$ pip3 freeze
命令验证pip是否能正常运行.

<2> 安装ipython notebook,指令如下:

$ sudo apt-get install ipython3-notebook

此时,ipython3 --version = 1.2.1,后续可能需要做版本更新。安装好IPython notebook后,运行方式如下:

$ ipython3 notebook

IPython notebook关闭方法如下:打开运行实例的终端界面(就是之前用IPython命令创建Notebook实例的界面),按下Ctrl+C键,系统提示shutdown this notebook server (y/[n]) ?, 询问是否关闭笔记本服务器,输入y,敲回车,IPython notebook就会关闭.

<3> 安装NumPy、SciPy、scikit-learn的指令依次如下:

$ sudo pip3 install NumPy
$ sudo apt-get install liblapack-dev
$ sudo apt-get install gfortran
$ sudo pip3 install SciPy
$ sudo pip3 install scikit-learn
其中,
$ sudo apt-get install liblapack-dev
$ sudo apt-get install gfortran
是为了防止安装SciPy时报错.

以上NumPy、SciPy、scikit-learn之间存在版本依赖,目前测试这套指令可以成功配置《Python数据挖掘入门与实践》一书需要的运行环境。

如果需要手动安装python相关的库,以下网址非常重要:

http://www.lfd.uci.edu/~gohlke/pythonlibs/


<4> 以更新ipython notebook为例,从以上网址下载 ipython-5.1.0-py2.py3-none-any.whlnotebook-4.2.2-py2.py3-none-any.whl,默认路径为 Downloads,安装指令如下:

$ cd Downloads
$ sudo pip3 install ipython-5.1.0-py2.py3-none-any.whl
$ sudo pip3 install notebook-4.2.2-py2.py3-none-any.whl


<5> 安装matplotlib相对复杂一些,需要先安装其依赖的包libpng和freetype

参考链接:http://my.oschina.net/u/939893/blog/163921

安装libpng:

$ sudo apt-get install libpng-dev

安装freetype:

$ cd ~/Downloads
$ wget http://download.savannah.gnu.org/releases/freetype/freetype-2.4.10.tar.gz
$ tar zxvf freetype-2.4.10.tar.gz
$ cd freetype-2.4.10
$ ./configure
$ make
$ sudo make install

可以用下面的命令来查找matplotlib和查看其安装状态

$ sudo pip3 search matplotlib

安装matplotlib

$ sudo pip3 install matplotlib

<6>安装PIL和scikit-image

由于存在python2和python3不兼容、版本不兼容问题,目前采用以上方式安装。

PIL

http://packages.ubuntu.com/trusty/amd64/python3-pil/download

下载,选择对应站点,保存文件 python3-pil_2.3.0-1ubuntu3_amd64.deb,或直接使用Ubuntu软件中心打开并安装。(amd64对应64Bit)

scikit-image

sudo easy_install -U scikit-image

<7>安装PyBrain

也是存在版本不兼容问题,用pip3安装后在使用中报错:ImportError: No module named 'structure'

尝试了3中安装方法,最后安装成功了,但不知道是其中哪种方法成功了。

sudo easy_install structure pybrain

sudo apt-get install git
sudo pip3 install git+https://github.com/pybrain/pybrain.git

sudo pip install pybrain

<8>安装nolearn

sudo pip3 install nolearn

其他的python库安装书上的指令安装即可,但可能需要加sudo.

<9>pip3已安装库的检查与更新

pip3 list
#可以看到库的版本号,决定是否需要更新

sudo pip3 install --upgrade scikit-learn
#以scikit-learn为例,更新库的版本

更新之后可能需要到安装路径下,删除原来版本的文件夹,形如:

sudo rm -rf scikit_learn-0.17.1-py3.4.egg-info



猜你喜欢

转载自blog.csdn.net/lixiaowang_327/article/details/52215175