MySQL中kill僵死进程的脚本

MySQL + PHP的模式在大并发压力下经常会导致MySQL中存在大量僵死进程,导致服务挂死。为了自动干掉这些进程,弄了个脚本,放在服务器后台通过crontab自动执行。发现这样做了以后,的确很好的缓解了这个问题。把这个脚本发出来和大家Share.



根据自己的实际需要,做了一些修改:



SHELL脚本:mysqld_kill_sleep.sh



#!/bin/sh

mysql_pwd=”root的密码"

mysqladmin_exec="/usr/local/bin/mysqladmin"

mysql_exec="/usr/local/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_timeout_log="$mysql_timeout_dir/mysql_timeout.log"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysqladmin_exec -uroot -p"$mysql_pwd" processlist | awk '{ print $12 , $2 ,$4}' | grep -v Time | grep -v '|' | sort -rn > $mysql_timeout_log

awk '{if($1>30 && $3!="root") print "'""$mysql_exec""' -e " "/"" "kill",$2 "/"" " -uroot " "-p""/"""'""$mysql_pwd""'""/"" ";" }' $mysql_timeout_log > $mysql_kill_timeout_sh

echo "check start ...." >> $mysql_kill_timeout_log

echo `date` >> $mysql_kill_timeout_log

cat $mysql_kill_timeout_sh



把这个写到mysqld_kill_sleep.sh。然后chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然后用root账户到cron里面运行即可,时间自己调整。

执行之后显示:







www# ./mysqld_kill_sleep.sh

/usr/local/bin/mysql -e "kill 27549" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27750" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27840" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27867" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27899" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27901" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27758" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27875" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27697" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27888" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27861" -uroot -p"mysql root的密码";



如果确认没有问题了,把最后的cat修改为sh即可。



本人改写了下上面的脚本:



#!/bin/bash

mysql_pwd="密码"

mysql_exec="/usr/local/mysql/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysql_exec -uroot -p$mysql_pwd -e "show processlist" | grep -i "Locked" >> $mysql_kill_timeout_log

chmod 777 $mysql_kill_timeout_log

for line in `$mysql_kill_timeout_log  | awk '{print $1}'`

do

echo "$mysql_exec -uroot -p$mysql_pwd -e /"kill $line/"" >> $mysql_kill_timeout_sh

done

chmod 777 $mysql_kill_timeout_sh

cat $mysql_kill_timeout_sh



============================================================================



很多时候!一不小心就锁表!这里讲解决锁表终极方法!



案例一



mysql>show processlist;



参看sql语句



一般少的话



mysql>kill thread_id;



就可以解决了



kill掉第一个锁表的进程, 依然没有改善. 既然不改善, 咱们就想办法将所有锁表的进程kill掉吧, 简单的脚本如下.



#!/bin/bash

mysql - u root - e " show processlist " | grep - i " Locked " >> locked_log . txt



for line in ` cat locked_log.txt | awk '{print $1 }' `

do

echo " kill $line ; " >> kill_thread_id . sql

done

现在kill_thread_id.sql的内容像这个样子



kill 66402982 ;

kill 66402983 ;

kill 66402986 ;

kill 66402991 ;

.....

好了, 我们在mysql的shell中执行, 就可以把所有锁表的进程杀死了.



mysql > source kill_thread_id . sql



当然了, 也可以一行搞定

for id in `mysqladmin processlist | grep -i locked | awk '{print $1}'`

do

mysqladmin kill ${id}

done



案例二



如果大批量的操作能够通过一系列的select语句产生,那么理论上就能对这些结果批量处理。

但是mysql并没用提供eval这样的对结果集进行分析操作的功能。所以只能现将select结果保存到临时文件中,然后再执行临时文件中的指令。

具体过程如下:

mysql> SELECT concat('KILL ',id,';') FROM information_schema.processlist WHERE user='root';

+------------------------+

| concat('KILL ',id,';')

+------------------------+

| KILL 3101;           

| KILL 2946;           

+------------------------+

2 rows IN SET (0.00 sec)

mysql> SELECT concat('KILL ',id,';') FROM information_schema.processlist WHERE user='root' INTO OUTFILE '/tmp/a.txt';

Query OK, 2 rows affected (0.00 sec)

mysql> source /tmp/a.txt;

Query OK, 0 rows affected (0.00 sec)





案例三



MySQL + PHP的模式在大并发压力下经常会导致MySQL中存在大量僵死进程,导致服务挂死。为了自动干掉这些进程,弄了个脚本,放在服务器后台通过crontab自动执行。发现这样做了以后,的确很好的缓解了这个问题。把这个脚本发出来和大家Share.

根据自己的实际需要,做了一些修改:

SHELL脚本:mysqld_kill_sleep.sh

#!/bin/sh

mysql_pwd="root的密码"

mysqladmin_exec="/usr/local/bin/mysqladmin"

mysql_exec="/usr/local/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_timeout_log="$mysql_timeout_dir/mysql_timeout.log"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysqladmin_exec -uroot -p"$mysql_pwd" processlist | awk '{ print $12 , $2 ,$4}' | grep -v Time | grep -v '|' | sort -rn > $mysql_timeout_log

awk '{if($1>30 && $3!="root") print "'""$mysql_exec""' -e " "\"" "kill",$2 "\"" " -uroot " "-p""\"""'""$mysql_pwd""'""\"" ";" }' $mysql_timeout_log > $mysql_kill_timeout_sh

echo "check start ...." >> $mysql_kill_timeout_log

echo `date` >> $mysql_kill_timeout_log

cat $mysql_kill_timeout_sh

把这个写到mysqld_kill_sleep.sh。然后chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然后用root账户到cron里面运行即可,时间自己调整。

执行之后显示:



www# ./mysqld_kill_sleep.sh

/usr/local/bin/mysql -e "kill 27549" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27750" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27840" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27867" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27899" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27901" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27758" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27875" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27697" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27888" -uroot -p"mysql root的密码";

/usr/local/bin/mysql -e "kill 27861" -uroot -p"mysql root的密码";

如果确认没有问题了,把最后的cat修改为sh即可。



本人改写了下上面的脚本:

#!/bin/bash

mysql_pwd="密码"

mysql_exec="/usr/local/mysql/bin/mysql"

mysql_timeout_dir="/tmp"

mysql_kill_timeout_sh="$mysql_timeout_dir/mysql_kill_timeout.sh"

mysql_kill_timeout_log="$mysql_timeout_dir/mysql_kill_timeout.log"

$mysql_exec -uroot -p$mysql_pwd -e "show processlist" | grep -i "Locked" >> $mysql_kill_timeout_log

chmod 777 $mysql_kill_timeout_log

for line in `$mysql_kill_timeout_log  | awk '{print $1}'`

do

echo "$mysql_exec -uroot -p$mysql_pwd -e \"kill $line\"" >> $mysql_kill_timeout_sh

done

chmod 777 $mysql_kill_timeout_sh

cat $mysql_kill_timeout_sh



是不是很方便呢!

=============================================================



processlist命令的输出结果显示了有哪些线程在运行,可以帮助识别出有问题的查询语句,两种方式使用这个命令。



1. 进入mysql/bin目录下输入mysqladmin processlist;



2. 启动mysql,输入show processlist;



如果有SUPER权限,则可以看到全部的线程,否则,只能看到自己发起的线程(这是指,当前对应的MySQL帐户运行的线程)。



得到数据形式如下(只截取了三条):



mysql> show processlist;



+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------



| Id | User | Host | db | Command | Time| State | Info



+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------



|207|root |192.168.0.20:51718 |mytest | Sleep | 5 | | NULL



|208|root |192.168.0.20:51719 |mytest | Sleep | 5 | | NULL



|220|root |192.168.0.20:51731 |mytest |Query | 84 | Locked |



select bookname,culture,value,type from book where id=001



先简单说一下各列的含义和用途,第一列,id,不用说了吧,一个标识,你要kill一个语句的时候很有用。user列,显示单前用户,如果不是root,这个命令就只显示你权限范围内的sql语句。host列,显示这个语句是从哪个ip的哪个端口上发出的。呵呵,可以用来追踪出问题语句的用户。db列,显示这个进程目前连接的是哪个数据库。command列,显示当前连接的执行的命令,一般就是休眠(sleep),查询(query),连接(connect)。time列,此这个状态持续的时间,单位是秒。state列,显示使用当前连接的sql语句的状态,很重要的列,后续会有所有的状态的描述,请注意,state只是语句执行中的某一个状态,一个sql语句,已查询为例,可能需要经过copying to tmp table,Sorting result,Sending data等状态才可以完成,info列,显示这个sql语句,因为长度有限,所以长的sql语句就显示不全,但是一个判断问题语句的重要依据。



这个命令中最关键的就是state列,mysql列出的状态主要有以下几种:



Checking table

正在检查数据表(这是自动的)。

Closing tables

正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。

Connect Out

复制从服务器正在连接主服务器。

Copying to tmp table on disk

由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。

Creating tmp table

正在创建临时表以存放部分查询结果。

deleting from main table

服务器正在执行多表删除中的第一部分,刚删除第一个表。

deleting from reference tables

服务器正在执行多表删除中的第二部分,正在删除其他表的记录。

Flushing tables

正在执行FLUSH TABLES,等待其他线程关闭数据表。

Killed

发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。MySQL会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。

Locked

被其他查询锁住了。

Sending data

正在处理Select查询的记录,同时正在把结果发送给客户端。

Sorting for group

正在为GROUP BY做排序。

Sorting for order

正在为ORDER BY做排序。

Opening tables

这个过程应该会很快,除非受到其他因素的干扰。例如,在执Alter TABLE或LOCK TABLE语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。

Removing duplicates

正在执行一个Select DISTINCT方式的查询,但是MySQL无法在前一个阶段优化掉那些重复的记录。因此,MySQL需要再次去掉重复的记录,然后再把结果发送给客户端。

Reopen table

获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。

Repair by sorting

修复指令正在排序以创建索引。

Repair with keycache

修复指令正在利用索引缓存一个一个地创建新索引。它会比Repair by sorting慢些。

Searching rows for update

正在讲符合条件的记录找出来以备更新。它必须在Update要修改相关的记录之前就完成了。

Sleeping

正在等待客户端发送新请求.

System lock

正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。

Upgrading lock

Insert DELAYED正在尝试取得一个锁表以插入新记录。

Updating

正在搜索匹配的记录,并且修改它们。

User Lock

正在等待GET_LOCK()。

Waiting for tables

该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:FLUSH TABLES tbl_name, Alter TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。

waiting for handler insert

Insert DELAYED已经处理完了所有待处理的插入操作,正在等待新的请求。

大部分状态对应很快的操作,只要有一个线程保持同一个状态好几秒钟,那么可能是有问题发生了,需要检查一下。

还有其他的状态没在上面中列出来,不过它们大部分只是在查看服务器是否有存在错误是才用得着。



mysql手册里有所有状态的说明,链接如下:http://dev.mysql.com/doc/refman/5.0/en/general-thread-states.html

猜你喜欢

转载自fengbin2005.iteye.com/blog/1701881