为啥不建议在Docker中跑MySQL?

容器的定义:容器是为了解决“在切换运行环境时,如何保证软件能够正常运行”这一问题。目前,容器和 Docker 依旧是技术领域最热门的词语,无状态的服务容器化已经是大势所趋,同时也带来了一个热点问题被大家所争论不以:数据库 MySQL 是否需要容器化?

认真分析大家的各种观点,发现赞同者仅仅是从容器优势的角度来阐述 MySQL 需要容器化,几乎没有什么业务场景进行验证自己的观点;反过来再看反对者,他们从性能、数据安全等多个因素进行阐述 MySQL不需要容器化,也举证了一些不适合的业务场景。下面,我们就聊一下 Docker 不适合跑 MySQL 的 N 个原因!

数据安全问题

不要将数据储存在容器中,这也是 Docker 官方容器使用技巧中的一条。容器随时可以停止、或者删除。当容器被rm掉,容器里的数据将会丢失。为了避免数据丢失,用户可以使用数据卷挂载来存储数据。但是容器的 Volumes 设计是围绕 Union FS 镜像层提供持久存储,数据安全缺乏保证。如果容器突然崩溃,数据库未正常关闭,可能会损坏数据。另外,容器里共享数据卷组,对物理机硬件损伤也比较大。

对于容器的持久存储,Volumes 设计确实围绕 Union FS 镜像层提供,并且其数据安全性有一定的限制。这主要是因为容器的设计初衷是为了提供高度的可移植性和快速启动,而不是为了长期存储和数据安全。Union FS 是一种文件系统层叠技术,它允许将多个不同的文件系统(如多个镜像层)以只读方式叠加在一起,看起来像一个单一的文件系统。每个容器实例都包含一个可写的顶层层,用于存储容器运行时产生的文件变化。这种设计使得容器可以在启动时非常快速,并且占用较低的存储空间。

然而,由于容器的存储是基于镜像层的叠加,数据持久性和安全性有一定的局限性。首先,当容器被删除或重新创建时,容器的数据会丢失。其次,由于容器共用主机的内核,存在主机和容器之间的访问权限问题,容器中的数据可能面临未经授权的访问。为了解决容器数据持久化和安全性的问题,可以采取以下措施:

  1. 将重要的数据保存在宿主机上的持久化存储上,而不是容器的 Volumes 中。
  2. 使用外部存储服务,如网络存储或数据库服务,来存储容器的数据。
  3. 通过备份和恢复机制来保护容器数据,例如使用容器编排工具的快照或备份功能。
  4. 限制容器的访问权限,确保只有授权的用户可以访问容器中的数据。
  5. 使用加密技术来保护容器中的敏感数据。

总之,容器的 Volumes 设计确实有一定的局限性,但通过合理的数据存储策略和安全措施,可以弥补这些不足,并确保容器中的数据持久性和安全性。

性能问题

大家都知道,MySQL 属于关系型数据库,对IO要求较高。当一台物理机跑多个时,IO就会累加,导致IO瓶颈,大大降低 MySQL 的读写性能。在一次Docker应用的十大难点专场上,某国有银行的一位架构师也曾提出过:“数据库的性能瓶颈一般出现在IO上面,如果按 Docker 的思路,那么多个docker最终IO请求又会出现在存储上面。现在互联网的数据库多是share nothing的架构,可能这也是不考虑迁移到 Docker 的一个因素吧”。其实也有相对应的一些策略来解决这个问题,比如:

  • 数据库程序与数据分离

如果使用Docker 跑 MySQL,数据库程序与数据需要进行分离,将数据存放到共享存储,程序放到容器里。如果容器有异常或 MySQL 服务异常,自动启动一个全新的容器。另外,建议不要把数据存放到宿主机里,宿主机和容器共享卷组,对宿主机损坏的影响比较大。

  • 跑轻量级或分布式数据库

Docker 里部署轻量级或分布式数据库,Docker 本身就推荐服务挂掉,自动启动新容器,而不是继续重启容器服务。

  • 合理布局应用

对于IO要求比较高的应用或者服务,将数据库部署在物理机或者KVM中比较合适。目前腾讯云的TDSQL和阿里的Oceanbase都是直接部署在物理机器,而非Docker 。在 Docker 中水平伸缩只能用于无状态计算服务,而不是数据库。Docker 快速扩展的一个重要特征就是无状态,具有数据状态的都不适合直接放在 Docker 里面,如果 Docker 中安装数据库,存储服务需要单独提供。

资源隔离方面

资源隔离方面,Docker 确实不如虚拟机KVM,Docker是利用Cgroup实现资源限制的,只能限制资源消耗的最大值,而不能隔绝其他程序占用自己的资源。如果其他应用过渡占用物理机资源,将会影响容器里 MySQL 的读写效率。需要的隔离级别越多,获得的资源开销就越多。相比专用环境而言,容易水平伸缩是Docker的一大优势。然而在 Docker 中水平伸缩只能用于无状态计算服务,数据库并不适用。

虚拟机KVM拓展

虚拟机KVM(Kernel-based Virtual Machine)是一种基于Linux内核的开源虚拟化技术,可以将物理服务器划分为多个独立的虚拟机,并在每个虚拟机中运行不同的操作系统。KVM利用Linux内核的虚拟化功能(KVM模块),将其转化为一个完整的虚拟化基础设施。它提供了一种硬件辅助的虚拟化解决方案,可以在物理服务器上创建和管理虚拟机。KVM利用虚拟化扩展(Intel VT或AMD-V)来实现虚拟机的访问和隔离。KVM虚拟机作为独立的实体运行,每个虚拟机都具有自己的操作系统、应用程序和资源配置。KVM对多种操作系统提供支持,包括Linux、Windows和其他许多主流操作系统。它还可以针对不同的工作负载进行调整,提供高性能和可扩展性。

KVM的优点包括:

  1. 原生虚拟化:KVM利用Linux内核的虚拟化功能,提供原生虚拟化的性能和隔离度。这使得KVM虚拟机可以直接访问硬件资源,得到更高的性能。
  2.  资源隔离:每个KVM虚拟机都是独立的实体,具有自己的操作系统和资源配置。这允许不同的虚拟机之间相互隔离,避免资源共享和干扰。
  3. 安全性:KVM提供了高度的安全性,每个虚拟机都运行在自己的隔离环境中,减少了系统漏洞的风险,并且可以使用安全增强功能,如SELinux和硬件加密。
  4. 灵活性和可扩展性:KVM支持多种操作系统和工作负载,可以针对不同的需求进行调整。它也可以根据需要动态调整虚拟机的资源配置,实现灵活的资源管理和扩展。

总结来说,KVM是一种强大的开源虚拟化技术,它提供了高性能、资源隔离和安全性。它广泛用于云计算和数据中心环境,为运行多个独立虚拟机的需求提供了可靠的解决方案。

难道 MySQL 不能跑在容器里吗?

MySQL 也不是全然不能容器化。

  1. 对数据丢失不敏感的业务(例如用户搜索商品)就可以数据化,利用数据库分片来来增加实例数,从而增加吞吐量。
  2. docker适合跑轻量级或分布式数据库,当docker服务挂掉,会自动启动新容器,而不是继续重启容器服务。
  3. 数据库利用中间件和容器化系统能够自动伸缩、容灾、切换、自带多个节点,也是可以进行容器化的。

典型案例:同程旅游、京东、阿里的数据库容器化都是不错的案例,大家可以自行去查看。

猜你喜欢

转载自blog.csdn.net/qq_28165595/article/details/131625275