第6章 Docker 数据管理

生产环境中使用Docker的过程中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作。

    容器中管理数据主要有两种方式:

            数据卷(Data Volumes):容器内数据直接映射到本地主机环境;

            数据卷容器(Data Volume Containers):使用特定容器维护数据卷。

    本章将首先介绍如何在容器内创建数据卷,并且把本地的目录或文件挂载到容器内的数据卷中。接下来,会介绍如何使用数据卷容器在容器和主机、容器和容器之间共享数据,并实现数据的备份和恢复。

6.1 数据卷

    数据卷是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器,类似于Linux中的mount操作。

    数据卷可以提供很多有用的特性,如下所示:

        数据卷可以在容器之间共享和重用,容器间传递数据将变得高效方便;

        对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作;

        对数据卷的更新不会影响镜像,解耦了应用和数据;

        卷会一直存在,直到没有容器使用,可以安全地卸载它。

1.在容器内创建一个数据卷

在用docker run 命令的时候,使用-v 标记可以在容器内创建一个数据卷。多次重复使用-v 标记可以创建多个数据卷。

    下面使用httpd镜像创建一个web容器,并创建一个数据卷挂载到容器的/opt目录


[root@localhost ~]# docker run -d -P --name web2 -v /opt/app httpd
[root@localhost ~]# docker exec -it 800 /bin/bash
root@800a9f4b25ce:/usr/local/apache2# ls
bin  build  cgi-bin  conf  error  htdocs  icons  include  logs  modules
root@800a9f4b25ce:/usr/local/apache2# pwd
/usr/local/apache2
root@800a9f4b25ce:/usr/local/apache2# cd /
lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
root@800a9f4b25ce:/# cd /opt/

root@800a9f4b25ce:/opt# ls -l
total 0
drwxr-xr-x. 2 root root 6 May  9 00:42 app

2.挂载一个主机目录作为数据卷

      使用-v标记也可以指定挂载一个本地的已有目录到容器中去作为数据卷(推荐方式)。  

[root@localhost webapp]# docker run -d  --name web -v /src/webapp:/opt/webapp httpd

上面的命令加载主机的/src/webapp目录到容器的/opt/webapp目录。

在宿主机的/src/webapp目录下新建aa.txt文件,在容器的/opt/webapp目录下有aa.txt文件

[root@localhost ~]# docker exec -it dee /bin/bash
root@dee981778b36:/usr/local/apache2# cd /opt/webapp/
root@dee981778b36:/opt/webapp# pwd
/opt/webapp
root@dee981778b36:/opt/webapp# ls -l
total 0
-rw-r--r--. 1 root root 0 May  9 00:36 aa.txt
root@dee981778b36:/opt/webapp# 

    这个功能在进行测试的时候十分方便,比如用户可以将一些程序或数据放到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存,在Docker会自动创建。

    Docker 挂载数据卷的默认权限是读写(rw),用户可以通过ro指定为只读:

[root@localhost ~]# docker run -d -P --name web3 -v /src/webapp:/opt/webapp:ro httpd
c6282c676a2ba23647d623a5ba69e9a08b1107989db9482cba10686ebd55cae2
[root@localhost ~]# docker ps -a
CONTAINER ID        IMAGE               COMMAND              CREATED             STATUS              PORTS                   NAMES
c6282c676a2b        httpd               "httpd-foreground"   13 seconds ago      Up 10 seconds       0.0.0.0:32772->80/tcp   web3
800a9f4b25ce        httpd               "httpd-foreground"   21 minutes ago      Up 21 minutes       0.0.0.0:32771->80/tcp   web2
dee981778b36        httpd               "httpd-foreground"   33 minutes ago      Up 33 minutes       80/tcp                  web
[root@localhost ~]# docker exec -it c62 /bin/bash
root@c6282c676a2b:/usr/local/apache2# cd /opt/
root@c6282c676a2b:/opt# cd webapp/
root@c6282c676a2b:/opt/webapp# ls
aa.txt
root@c6282c676a2b:/opt/webapp# touch bb.txt
touch: cannot touch 'bb.txt': Read-only file system
root@c6282c676a2b:/opt/webapp# rm aa.txt
rm: cannot remove 'aa.txt': Read-only file system

不能新建bb.txt文件,和删除aa.txt文件。

3 挂载一个本地主机文件作为数据卷

不推荐此方式

6.2 数据卷容器

如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门用来提供数据卷供其他容器挂载。

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

[root@localhost ~]# docker run -it -v /dbdata --name dbdata ubuntu
root@6fd74a488946:/# 

查看/dbdata目录:

root@6fd74a488946:/# ls
bin  boot  dbdata  dev  etc  home  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
root@6fd74a488946:/# 

然后,可以在其它容器中使用--volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:

[root@localhost ~]# docker run -it --volumes-from dbdata --name db1 ubuntu

[root@localhost ~]# docker run -it --volumes-from dbdata --name db2 ubuntu

此时,容器db1和db2 都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。

例如,在dbdata容器中创建一个test文件,如下所示:

root@6fd74a488946:/# cd dbdata/
root@6fd74a488946:/dbdata# touch test
root@6fd74a488946:/dbdata# ls
test

在db1容器内查看它

root@1ad7222904a0:/# ls
bin  boot  dbdata  dev  etc  home  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
root@1ad7222904a0:/# ls dbdata/
test
root@1ad7222904a0:/# 

可以多次使用--volumes-from参数来从多个容器挂载多个数据。还可以从其他已经挂载了容器的容器来挂载数据卷:

[root@localhost ~]# docker run -d -it --name db3 --volumes-from db1 ubuntu

注意:

使用--volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

    如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显示使用docker rm -v 命令指定同时删除关联的容器。

    使用数据卷容器可以让用户在容器之间自由地升级和移动数据卷。具体的操作将在下一节中讲解。

6.3 利用数据卷容器来迁移数据

        可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。下面介绍这两个操作。

1.备份

    使用下面的命令来备份dbdata数据卷容器内的数据卷。

[root@localhost dbdata]# docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/bakcup.tar /dbdata

这个命令稍微有点复杂,具体分析一下,首先利用ubuntu镜像创建了一个容器worker.使用--volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/bakcup参数一挂载本地的当前目录到worker容器的/backup目录。

worker容器启动后,使用了tar cvf /backup/backup.tar /dbdata 命令来将/dbdata下的内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。

2.恢复

[root@localhost ~]# docker run -v /dbdata --name dbdata2 --volumes-from db1 ubuntu /bin/bash                                 
[root@localhost ~]# docker run --volumes-from dbdata2 -v $(pwd):/backup ubuntu tar xvf /backup/backup.tar
dbdata/
dbdata/db1.txt
[root@localhost ~]# 

6.4 本章小结

    数据是最宝贵的资源。Docker在设计上考虑到了这点。为数据管理提供了充分的操作支持。

    本章介绍了通过数据卷和数据卷容器对容器内数据进行共享、备份和恢复等操作,通过这些操作,通过这些机制,即容器在运行中出现故障,用户也不必担心数据发生丢失,只需要快速地重新创建容器即可。

    在生产环境中,笔者推荐在使用数据卷或数据卷容器之外,定期将主机的本地数据进行备份,或者使用支持容器的存储系统,包括RAID或分布式文件系统如Ceph、GPFS、HDFS等。

猜你喜欢

转载自blog.csdn.net/tjjingpan/article/details/80245744