scrapy分布式爬虫之Ubantu下服务器的搭建 - 代码天地

scrapy分布式爬虫之Ubantu下服务器的搭建

编程语言 2019-01-21 09:00:52 阅读次数: 0

1.在windows下安装好分布式爬虫的相关模块，并且成功运行。
2.在Ubuntu上安装scrapy之前，需要先安装以下依赖：
```
sudo apt-get install build-essential python3-dev libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev zlib1g-dev
```
3.在window中打开命令窗口，进入到项目路径（或项目的环境），输入下面的命令，生成一个包含当前项目所有虚拟环境包的文件requirements.txt

pip freeze > requirements.txt

4.在linux中安装rz

sudo apt-get install lrzsz

5.安装virtualenv和virtualenvwrapper，执行下面命令

sudo pip install virtualenv
sudo pip install virtualenvwrapper
sudo pip3 install virtualenv
sudo pip3 install virtualenvwrapper

sudo apt-get install python-virtualenv
sudo easy_install virtualenvwrapper

6.配置虚拟环境

1.创建目录用来存放虚拟环境
mkdir $HOME/.virtualenvs
2.在~/.bashrc中添加行：
export WORKON_HOME=$HOME/.virtualenvs
source /usr/local/bin/virtualenvwrapper.sh
3.运行:
source ~/.bashrc

【扩展】

使用 virtualenvwrapper
虚拟环境相关操作：
lsvirtualenv:                    列出虚拟环境列表(个人喜欢用第二个)
workon+Enter:                        列出虚拟环境列表
mkvirtualenv [虚拟环境名称]:   新建虚拟环境
workon [虚拟环境名称]:              切换虚拟环境
rmvirtualenv [虚拟环境名称]:    删除虚拟环境
deactivate:                                    离开虚拟环境

7.创建虚拟环境

mkvirtualenv -p /user/bin/python3 crawler-env(环境名)

8.安装requirements.txt

pip3 install -r requirements.txt

linux中不需要pywin32，删除后在执行此命令

猜你喜欢

转载自blog.csdn.net/qq_40176258/article/details/86568574

scrapy分布式爬虫之Ubantu下服务器的搭建

在服务器上搭建scrapy分布式爬虫环境的过程

python爬虫之Scrapy分布式

SpringCloud学习笔记023---分布式集群之_Windows下搭建zookeeper服务器

CentOS 7下FastDFS分布式文件服务器搭建实战

阿里云服务器centos7.2下搭建hadoop伪分布式环境

centos7下fastDFS分布式文件服务器的搭建

阿里云服务器centos7.3下搭建hadoop伪分布式环境

FASTDFS分布式文件存储服务器搭建

Gogs分布式服务器的搭建

FastDFS图片服务器搭建-支持分布式

FastDFS分布式图片服务器搭建

爬虫 scrapy 分布式

scrapy 分布式爬虫

Scrapy分布式爬虫

docker下的FastDFS分布式文件服务器

使用scrapy-redis搭建分布式爬虫环境

使用scrapy-redis 搭建分布式爬虫环境

Python:从零搭建Redis-Scrapy分布式爬虫

scrapy分布式爬虫之xpath简介

python之scrapy(五)分布式爬虫

Scrapy框架之基于RedisSpider实现的分布式爬虫

Python 爬虫之 Scrapy 分布式原理以及部署

redis 分布式 1 爬虫scrapy框架之CrawlSpider

分布式远程服务器

分布式服务器缓存

分布式缓存服务器

Scrapy分布式爬虫之ES搜索引擎网站|Scrapy分布式爬虫教程

Python爬虫之Scrapy框架系列（22）——初识分布式爬虫scrapy_redis

docker+fastdfs+springboot一键式搭建分布式文件服务器

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)