配置仓库
1.安装仓库的包
sudo yum install http://www.percona.com/downloads/percona-release/redhat/0.1-4/percona-release-0.1-4.noarch.rpm
如果成功将看下如下信息
[root@node1 ~]# sudo yum install http://www.percona.com/downloads/percona-release/redhat/0.1-4/percona-release-0.1-4.noarch.rpm Loaded plugins: fastestmirror percona-release-0.1-4.noarch.rpm | 6.4 kB 00:00:00 Examining /var/tmp/yum-root-NKCxiN/percona-release-0.1-4.noarch.rpm: percona-release-0.1-4.noarch Marking /var/tmp/yum-root-NKCxiN/percona-release-0.1-4.noarch.rpm to be installed Resolving Dependencies --> Running transaction check ---> Package percona-release.noarch 0:0.1-4 will be installed --> Finished Dependency Resolution Dependencies Resolved ============================================================================================= Package Arch Version Repository Size ============================================================================================= Installing: percona-release noarch 0.1-4 /percona-release-0.1-4.noarch 5.8 k Transaction Summary ============================================================================================= Install 1 Package Total size: 5.8 k Installed size: 5.8 k Is this ok [y/d/N]: y Downloading packages: Running transaction check Running transaction test Transaction test succeeded Running transaction Installing : percona-release-0.1-4.noarch 1/1 Verifying : percona-release-0.1-4.noarch 1/1 Installed: percona-release.noarch 0:0.1-4 Complete!
2.确保 Percona 的包是可用的
sudo yum list | grep percona-toolkit
如果执行成功会看到
percona-toolkit.noarch 2.2.20-1 percona-release-noarch percona-toolkit.x86_64 3.0.9-1.el7 percona-release-x86_64 percona-toolkit-debuginfo.x86_64 3.0.9-1.el7 percona-release-x86_64
3. 安装 Percona Toolkit 工具包
sudo yum install percona-toolkit
出现如下信息表示安装成功
Installed: percona-toolkit.x86_64 0:3.0.9-1.el7 Dependency Installed: perl-Compress-Raw-Bzip2.x86_64 0:2.061-3.el7 perl-Compress-Raw-Zlib.x86_64 1:2.061-4.el7 perl-DBD-MySQL.x86_64 0:4.023-5.el7 perl-DBI.x86_64 0:1.627-4.el7 perl-Data-Dumper.x86_64 0:2.145-3.el7 perl-Digest.noarch 0:1.17-245.el7 perl-Digest-MD5.x86_64 0:2.52-3.el7 perl-IO-Compress.noarch 0:2.061-2.el7 perl-IO-Socket-IP.noarch 0:0.21-4.el7 perl-IO-Socket-SSL.noarch 0:1.94-6.el7 perl-Net-Daemon.noarch 0:0.48-5.el7 perl-Net-LibIDN.x86_64 0:0.12-15.el7 perl-Net-SSLeay.x86_64 0:1.55-6.el7 perl-PlRPC.noarch 0:0.2020-14.el7 Complete!
安装了很多命令
pt-align pt-ioprofile pt-slave-delay
pt-archiver pt-kill pt-slave-find
pt-config-diff pt-mext pt-slave-restart
pt-deadlock-logger pt-mongodb-query-digest pt-stalk
pt-diskstats pt-mongodb-summary pt-summary
pt-duplicate-key-checker pt-mysql-summary pt-table-checksum
pt-fifo-split pt-online-schema-change pt-table-sync
pt-find pt-pmp pt-table-usage
pt-fingerprint pt-query-digest pt-upgrade
pt-fk-error-logger pt-secure-collect pt-variable-advisor
pt-heartbeat pt-show-grants pt-visual-explain
pt-index-usage pt-sift ptx
有的32个命令,可以分为7大类
工具类别
|
工具命令
|
工具作用
|
备注
|
开发类
|
pt-duplicate-key-checker
|
列出并删除重复的索引和外键
|
|
pt-online-schema-change
|
在线修改表结构
|
|
|
pt-query-advisor
|
分析查询语句,并给出建议,有bug
|
已废弃
|
|
pt-show-grants
|
规范化和打印权限
|
|
|
pt-upgrade
|
在多个服务器上执行查询,并比较不同
|
|
|
性能类
|
pt-index-usage
|
分析日志中索引使用情况,并出报告
|
|
pt-pmp
|
为查询结果跟踪,并汇总跟踪结果
|
|
|
pt-visual-explain
|
格式化执行计划
|
|
|
pt-table-usage
|
分析日志中查询并分析表使用情况
|
pt 2.2新增命令
|
|
配置类
|
pt-config-diff
|
比较配置文件和参数
|
|
pt-mysql-summary
|
对mysql配置和status进行汇总
|
|
|
pt-variable-advisor
|
分析参数,并提出建议
|
|
|
监控类
|
pt-deadlock-logger
|
提取和记录mysql死锁信息
|
|
pt-fk-error-logger
|
提取和记录外键信息
|
|
|
pt-mext
|
并行查看status样本信息
|
|
|
pt-query-digest
|
分析查询日志,并产生报告
|
常用命令
|
|
pt-trend
|
按照时间段读取slow日志信息
|
已废弃
|
|
复制类
|
pt-heartbeat
|
监控mysql复制延迟
|
|
pt-slave-delay
|
设定从落后主的时间
|
|
|
pt-slave-find
|
查找和打印所有mysql复制层级关系
|
|
|
pt-slave-restart
|
监控salve错误,并尝试重启salve
|
|
|
pt-table-checksum
|
校验主从复制一致性
|
|
|
pt-table-sync
|
高效同步表数据
|
|
|
系统类
|
pt-diskstats
|
查看系统磁盘状态
|
|
pt-fifo-split
|
模拟切割文件并输出
|
|
|
pt-summary
|
收集和显示系统概况
|
|
|
pt-stalk
|
出现问题时,收集诊断数据
|
|
|
pt-sift
|
浏览由pt-stalk创建的文件
|
pt 2.2新增命令
|
|
pt-ioprofile
|
查询进程IO并打印一个IO活动表
|
pt 2.2新增命令
|
|
实用类
|
pt-archiver
|
将表数据归档到另一个表或文件中
|
|
pt-find
|
查找表并执行命令
|
|
|
pt-kill
|
Kill掉符合条件的sql
|
常用命令
|
|
pt-align
|
对齐其他工具的输出
|
pt 2.2新增命令
|
|
pt-fingerprint
|
将查询转成密文
|
pt 2.2新增命令
|
这次我们主要用这两个命令
pt-table-checksum 和
pt-table-sync
pt-table-checksum 是 Percona-Toolkit 的组件之一,用于检测MySQL主、从库的数据是否一致。其原理是在主库执行基于statement的sql语句来生成主库数据块的checksum,把相同的sql语句传递到从库执行,并在从库上计算相同数据块的checksum,最后,比较主从库上相同数据块的checksum值,由此判断主从数据是否一致。检测过程根据唯一索引将表按row切分为块(chunk),以为单位计算,可以避免锁表。检测时会自动判断复制延迟、 master的负载, 超过阀值后会自动将检测暂停,减小对线上服务的影响。
pt-table-checksum 默认情况下可以应对绝大部分场景,官方说,即使上千个库、上万亿的行,它依然可以很好的工作,这源自于设计很简单,一次检查一个表,不需要太多的内存和多余的操作;必要时,pt-table-checksum 会根据服务器负载动态改变 chunk 大小,减少从库的延迟。
为了减少对数据库的干预,pt-table-checksum还会自动侦测并连接到从库,当然如果失败,可以指定--recursion-method选项来告诉从库在哪里。它的易用性还体现在,复制若有延迟,在从库 checksum 会暂停直到赶上主库的计算时间点(也通过选项--设定一个可容忍的延迟最大值,超过这个值也认为不一致)。
为了保证主数据库服务的安全,该工具实现了许多保护措施:
- 自动设置 innodb_lock_wait_timeout 为1s,避免引起
- 默认当数据库有25个以上的并发查询时,pt-table-checksum会暂停。可以设置 --max-load 选项来设置这个阀值
- 当用 Ctrl+C 停止任务后,工具会正常的完成当前 chunk 检测,下次使用 --resume 选项启动可以恢复继续下一个 chunk
工作过程
1\. 连接到主库:pt工具连接到主库,然后自动发现主库的所有从库。默认采用show full processlist来查找从库,但是这只有在主从实例端口相同的情况下才有效。3\. 查找主库或者从库是否有复制过滤规则:这是为了安全而默认检查的选项。你可以关闭这个检查,但是这可能导致checksum的sql语句要么不会同步到从库,要么到了从库发现从库没有要被checksum的表,这都会导致从库同步卡库。5\. 开始获取表,一个个的计算。6\. 如果是表的第一个chunk,那么chunk-size一般为1000;如果不是表的第一个chunk,那么采用19步中分析出的结果。7\. 检查表结构,进行数据类型转换等,生成checksum的sql语句。8\. 根据表上的索引和数据的分布,选择最合适的split表的方法。9\. 开始checksum表。10\. 默认在chunk一个表之前,先删除上次这个表相关的计算结果。除非–resume。14\. 根据explain的结果,判断chunk的size是否超过了你定义的chunk-size的上限。如果超过了,为了不影响线上性能,这个chunk将被忽略。15\. 把要checksum的行加上for update锁,并计算。17-18\. 把计算结果存储到master_crc master_count列中。19\. 调整下一个chunk的大小。20\. 等待从库追上主库。如果没有延迟备份的从库在运行,最好检查所有的从库,如果发现延迟最大的从库延迟超过max-lag秒,pt工具在这里将暂停。21\. 如果发现主库的max-load超过某个阈值,pt工具在这里将暂停。22\. 继续下一个chunk,直到这个table被chunk完毕。23-24\. 等待从库执行完checksum,便于生成汇总的统计结果。每个表汇总并统计一次。25-26\. 循环每个表,直到结束。
校验结束后,在每个从库上,执行如下的sql语句即可看到是否有主从不一致发生:
select * from percona.checksums where master_cnt <> this_cnt OR master_crc <> this_crc OR ISNULL(master_crc) <> ISNULL(this_crc) \G
检查使用的mysql用户一般是没有 create table 权限的,所以你可能需要先手动创建:
CREATE DATABASE IF NOT EXISTS percona; CREATE TABLE IF NOT EXISTS percona.checksums ( db CHAR(64) NOT NULL, tbl CHAR(64) NOT NULL, chunk INT NOT NULL, chunk_time FLOAT NULL, chunk_index VARCHAR(200) NULL, lower_boundary TEXT NULL, upper_boundary TEXT NULL, this_crc CHAR(40) NOT NULL, this_cnt INT NOT NULL, master_crc CHAR(40) NULL, master_cnt INT NULL, ts TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, PRIMARY KEY (db,tbl,chunk), INDEX ts_db_tbl(ts,db,tbl) ) ENGINE=InnoDB;
具体实验过程: