老铁们好,这里是java研究所。
今天我们来探讨一下分布式锁的4种实现:
1、通过MySQL实现分布式锁
2、通过redis实现分布式锁
3、通过zookeeper实现分布式锁
4、通过etcd实现分布式锁
1、什么是分布式锁?
如何确保共享资源在同一时刻只能被一个线程访问?
大家可能觉得这个很简单吧,在一个jvm中,通过synchronized或者ReentrantLock是很容易实现的。
确实,单个jvm中确实没有问题。
但是,通常我们的系统会采用集群的方式部署,此时集群中的每个节点都是一个jvm环境,那么通过synchronized或者ReentrantLock是无法解决共享资源访问的问题了。
此时就要用到分布式锁了:分布式锁就是解决分布式环境中共享资源顺序访问的问题,同一时刻,集群中所有节点中,只允许有一个线程可以访问共享资源。
2、分布式锁的功能
分布式锁使用者位于不同的机器中,锁获取成功之后,才可以对共享资源进行操作
同一时刻所有机器中只有一个使用者可以获取到分布式锁
锁具有重入的功能:即一个使用者可以多次获取某个分布式锁
获取锁的过程允许指定超时功能:在指定的时间内尝试获取锁,过了超时时间,若还未获取到锁,则获取失败
防止死锁:如:A机器获取锁之后,在释放锁之前,A机器挂了,导致锁未释放,结果锁一直被A机器占有着,遇到这种情况时,分布式锁要能够自动解决;解决方式:持有锁的时候可以加个持有超时时间,超过了这个时间锁将自动释放,此时其他机器将有机会获取锁
下面我们来看一下分布式锁的4种实现。
3、方式1:数据库的方式
3.1、原理
锁的获取过程
假如:一个集群环境中有n个系统,每个系统中有一个jvm,每个jvm中有m个线程去获取分布式锁,那么同时可能就有n*m个线程去获取分布式锁,此时分布式锁的压力是比较大的,每个jvm中多个线程同时去获取锁其实是没有意义的,可以在每个jvm中先加一把本地的锁,获取分布式锁之前需要先获取jvm本地的锁,本地锁获取成功之后,才可以尝试获取分布式锁,此时n个系统中最多有n个线程尝试获取分布式锁,获取锁的步骤主要2步:
1、先尝试获取jvm本地锁
2、jvm本地锁获取成功之后尝试获取分布式锁
超时时间
获取锁的时候可以传递获取锁最大等待时间,在指定的时间内多次尝试获取锁,获取失败之后,休眠一会,再继续尝试获取,直到时间耗尽。
锁有效期
获取锁的时候需要指定有效期,有效期就是获取锁之后,使用者希望使用多长时间,为什么需要有效期?
如果没有有效期,当使用者获取成功之后,系统突然down机了,那么这个锁就无法释放,其他线程就再也无法获取到这个锁了。
所以需要有有效期,超过了有效期,锁将失效,其他线程将可以尝试获取锁。
锁续命
什么是锁续命?
比如:使用者获取锁的时候,指定有效期是5分钟,但是5分钟之后,使用者事情还未干完,还想继续使用一会,那么可以使用续命功能,延迟锁的有效期。
可以启动一个子线程,自动完成续命的操作,比如:原本有效期是5分钟,当使用4分钟的时候,续命2分钟,那么有效期是7分钟,这个比较简单,大家可以随意发挥。
3.2、准备sql
create table t_lock(
lock_key varchar(32) PRIMARY KEY NOT NULL COMMENT '锁唯一标志',
request_id varchar(64) NOT NULL DEFAULT '' COMMENT '用来标识请求对象的',
lock_count INT NOT NULL DEFAULT 0 COMMENT '当前上锁次数',
timeout BIGINT NOT NULL DEFAULT 0 COMMENT '锁超时时间',
version INT NOT NULL DEFAULT 0 COMMENT '版本号,每次更新+1'
)COMMENT '锁信息表';
注意:表中有个版本号字段,版本号主要用于乐观锁的方式更新数据,确保并发情况下更新数据的正确性。
3.3、锁工具类代码
代码比较简单,大家主要看获取锁的lock方法和释放锁的unlock方法,注释比较详细,大家看看就懂了。
代码中的重点是更新数据的时候,通过比对版本号,采用cas的方式,确保并发情况下更新数据的正确性。
本代码实现了获取锁和释放锁的操作,续命操作未实现,大家可以尝试实现一下。
package lock;
import lombok.Builder;
import lombok.Getter;
import lombok.Setter;
import lombok.extern.slf4j.Slf4j;
import java.sql.*;
import java.util.Map;
import java.util.Objects;
import java.util.UUID;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.locks.ReentrantLock;
@Slf4j
public class DbLockUtil {
//将requestid保存在该变量中
static ThreadLocal<String> requestIdTL = new ThreadLocal<>();
//jvm锁:当多个线程并发获取分布式锁时,需要先获取jvm锁,jvm锁获取成功,则尝试获取分布式锁
static Map<String, ReentrantLock> jvmLockMap = new ConcurrentHashMap<>();
/**
* 获取当前线程requestid
*
* @return
*/
public static String getRequestId() {
String requestId = requestIdTL.get();
if (requestId == null || "".equals(requestId)) {
requestId = UUID.randomUUID().toString();
requestIdTL.set(requestId);
}
log.info("requestId:{}", requestId);
return requestId;
}
/**
* 获取锁
*
* @param lockKey 锁key
* @param lockTimeOut(毫秒) 持有锁的有效时间,防止死锁
* @param getTimeOut(毫秒) 获取锁的超时时间,这个时间内获取不到将重试
* @return
*/
public static boolean lock(String lockKey, long lockTimeOut, int getTimeOut) throws Exception {
log.info("start");
boolean lockResult = false;
/**
* 单个jvm中可能有多个线程并发获取一个锁
* 此时我们只允许一个线程去获取分布式锁
* 所以如果同一个jvm中有多个线程尝试获取分布式锁,需要先获取jvm中的锁
*/
ReentrantLock jvmLock = new ReentrantLock();
ReentrantLock oldJvmLock = jvmLockMap.putIfAbsent(lockKey, jvmLock);
oldJvmLock = oldJvmLock != null ? oldJvmLock : jvmLock;
boolean jvmLockSuccess = oldJvmLock.tryLock(getTimeOut, TimeUnit.MILLISECONDS);
//jvm锁获取失败,则直接失败
if (!jvmLockSuccess) {
return lockResult;
} else {
//jvm锁获取成功,则继续尝试获取分布式锁
try {
String request_id = getRequestId();
long startTime = System.currentTimeMillis();
//循环尝试获取锁
while (true) {
//通过lockKey获取db中的记录
LockModel lockModel = DbLockUtil.get(lockKey);
if (Objects.isNull(lockModel)) {
//记录不存在,则先插入一条
DbLockUtil.insert(LockModel.builder().lock_key(lockKey).request_id("").lock_count(0).timeout(0L).version(0).build());
} else {
//获取请求id,稍后请求id会放入ThreadLocal中
String requestId = lockModel.getRequest_id();
//如果requestId为空字符,表示锁未被占用
if ("".equals(requestId)) {
lockModel.setRequest_id(request_id);
lockModel.setLock_count(1);
lockModel.setTimeout(System.currentTimeMillis() + lockTimeOut);
//并发情况下,采用cas方式更新记录
if (DbLockUtil.update(lockModel) == 1) {
lockResult = true;
break;
}
} else if (request_id.equals(requestId)) {
//如果requestId和表中request_id一样表示锁被当前线程持有者,此时需要加重入锁
lockModel.setTimeout(System.currentTimeMillis() + lockTimeOut);
lockModel.setLock_count(lockModel.getLock_count() + 1);
if (DbLockUtil.update(lockModel) == 1) {
lockResult = true;
break;
}
} else {
//锁不是自己的,并且已经超时了,则重置锁,继续重试
if (lockModel.getTimeout() < System.currentTimeMillis()) {
DbLockUtil.resetLock(lockModel);
} else {
//如果未超时,休眠100毫秒,继续重试
if (startTime + getTimeOut > System.currentTimeMillis()) {
TimeUnit.MILLISECONDS.sleep(100);
} else {
break;
}
}
}
}
}
} finally {
//释放jvm锁,将其从map中异常
jvmLock.unlock();
jvmLockMap.remove(lockKey);
}
}
log.info("end");
return lockResult;
}
/**
* 释放锁
*
* @param lock_key
* @throws Exception
*/
private static void unlock(String lock_key) throws Exception {
//获取当前线程requestId
String requestId = getRequestId();
LockModel lockModel = DbLockUtil.get(lock_key);
//当前线程requestId和库中request_id一致 && lock_count>0,表示可以释放锁
if (Objects.nonNull(lockModel) && requestId.equals(lockModel.getRequest_id()) && lockModel.getLock_count() > 0) {
if (lockModel.getLock_count() == 1) {
//重置锁
resetLock(lockModel);
} else {
lockModel.setLock_count(lockModel.getLock_count() - 1);
DbLockUtil.update(lockModel);
}
}
}
/**
* 重置锁
*
* @param lockModel
* @return
* @throws Exception
*/
private static int resetLock(LockModel lockModel) throws Exception {
lockModel.setRequest_id("");
lockModel.setLock_count(0);
lockModel.setTimeout(0L);
return DbLockUtil.update(lockModel);
}
/**
* 更新lockModel信息,内部采用乐观锁来更新
*
* @param lockModel
* @return
* @throws Exception
*/
private static int update(LockModel lockModel) throws Exception {
return exec(conn -> {
String sql = "UPDATE t_lock SET request_id = ?,lock_count = ?,timeout = ?,version = version + 1 WHERE lock_key = ? AND version = ?";
PreparedStatement ps = conn.prepareStatement(sql);
int colIndex = 1;
ps.setString(colIndex++, lockModel.getRequest_id());
ps.setInt(colIndex++, lockModel.getLock_count());
ps.setLong(colIndex++, lockModel.getTimeout());
ps.setString(colIndex++, lockModel.getLock_key());
ps.setInt(colIndex++, lockModel.getVersion());
return ps.executeUpdate();
});
}
private static LockModel get(String lock_key) throws Exception {
return exec(conn -> {
String sql = "select * from t_lock t WHERE t.lock_key=?";
PreparedStatement ps = conn.prepareStatement(sql);
int colIndex = 1;
ps.setString(colIndex++, lock_key);
ResultSet rs = ps.executeQuery();
if (rs.next()) {
return LockModel.builder().
lock_key(lock_key).
request_id(rs.getString("request_id")).
lock_count(rs.getInt("lock_count")).
timeout(rs.getLong("timeout")).
version(rs.getInt("version")).build();
}
return null;
});
}
private static int insert(LockModel lockModel) throws Exception {
return exec(conn -> {
String sql = "insert into t_lock (lock_key, request_id, lock_count, timeout, version) VALUES (?,?,?,?,?)";
PreparedStatement ps = conn.prepareStatement(sql);
int colIndex = 1;
ps.setString(colIndex++, lockModel.getLock_key());
ps.setString(colIndex++, lockModel.getRequest_id());
ps.setInt(colIndex++, lockModel.getLock_count());
ps.setLong(colIndex++, lockModel.getTimeout());
ps.setInt(colIndex++, lockModel.getVersion());
return ps.executeUpdate();
});
}
private static <T> T exec(SqlExec<T> sqlExec) throws Exception {
Connection conn = getConn();
try {
return sqlExec.exec(conn);
} finally {
closeConn(conn);
}
}
@FunctionalInterface
public interface SqlExec<T> {
T exec(Connection conn) throws Exception;
}
@Getter
@Setter
@Builder
public static class LockModel {
private String lock_key;
private String request_id;
private Integer lock_count;
private Long timeout;
private Integer version;
}
private static final String url = "jdbc:mysql://localhost:3306/dlock?useSSL=false"; //数据库地址
private static final String username = ""; //数据库用户名
private static final String password = ""; //数据库密码
private static final String driver = "com.mysql.jdbc.Driver"; //mysql驱动
/**
* 连接数据库
*
* @return
*/
private static Connection getConn() {
Connection conn = null;
try {
Class.forName(driver); //加载数据库驱动
try {
conn = DriverManager.getConnection(url, username, password); //连接数据库
} catch (SQLException e) {
e.printStackTrace();
}
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
return conn;
}
/**
* 关闭数据库链接
*
* @return
*/
private static void closeConn(Connection conn) {
if (conn != null) {
try {
conn.close(); //关闭数据库链接
} catch (SQLException e) {
e.printStackTrace();
}
}
}
}
4、方式2:redis 的方式
4.1、用到的几个命令
-
setnx
命令格式:SETNX key value;是『SET if Not eXists』(如果不存在,则 SET)的简写,只在键 key 不存在的情况下,将键 key 的值设置为 value 。若键 key 已经存在, 则 SETNX 命令不做任何动作。命令在设置成功时返回 1 ,设置失败时返回 0 。 -
getset
命令格式:GETSET key value,将键 key 的值设为 value ,并返回键 key 在被设置之前的旧的value。返回值:如果键 key 没有旧值, 也即是说, 键 key 在被设置之前并不存在, 那么命令返回 nil 。当键 key 存在但不是字符串类型时,命令返回一个错误。 - expire
命令格式:EXPIRE key seconds,使用:为给定 key 设置生存时间,当 key 过期时(生存时间为 0 ),它会被自动删除。返回值:设置成功返回 1 。当 key 不存在或者不能为 key 设置生存时间时(比如在低于 2.1.3 版本的 Redis 中你尝试更新 key 的生存时间),返回 0 。
- del
命令格式:DEL key [key …],使用:删除给定的一个或多个 key ,不存在的 key 会被忽略。返回值:被删除 key 的数量。
4.2、原理
过程分析,先看图左边过程:
1、A尝试去获取锁lockkey,通过setnx(lockkey,currenttime+timeout)命令,对lockkey进行setnx,将value值设置为当前时间+锁超时时间;
2、如果返回值为1,说明redis服务器中还没有lockkey,也就是没有其他用户拥有这个锁,A就能获取锁成功;
3、在进行相关业务执行之前,先执行expire(lockkey),对lockkey设置有效期,防止死锁;因为如果不设置有效期的话,lockkey将一直存在于redis中,其他用户尝试获取锁时,执行到setnx(lockkey,currenttime+timeout)时,将不能成功获取到该锁;
4、执行相关业务
5、释放锁,A完成相关业务之后,要释放拥有的锁,也就是删除redis中该锁的内容,del(lockkey),接下来的用户才能进行重新设置锁新值
再看右边过程
6、当A通过setnx(lockkey,currenttime+timeout)命令不能成功设置lockkey时,这是不能直接断定获取锁失败;因为我们在设置锁时,设置了锁的超时时间timeout,当当前时间大于redis中存储键值为lockkey的value值时,可以认为上一任的拥有者对锁的使用权已经失效了,A就可以强行拥有该锁;具体判定过程如下;
7、A通过get(lockkey),获取redis中的存储键值为lockkey的value值,即获取锁的相对时间lockvalueA
8、lockvalueA!=null && currenttime>lockvalue,A通过当前的时间与锁设置的时间做比较,如果当前时间已经大于锁设置的时间临界,即可以进一步判断是否可以获取锁,否则说明该锁还在被占用,A就还不能获取该锁,结束,获取锁失败;
9、步骤4返回结果为true后,通过getSet设置新的超时时间,并返回旧值lockvalueB,以作判断,因为在分布式环境,在进入这里时可能另外的进程获取到锁并对值进行了修改,只有旧值与返回的值一致才能说明中间未被其他进程获取到这个锁
10、lockvalueB == null || lockvalueA==lockvalueB,判断:若果lockvalueB为null,说明该锁已经被释放了,此时该进程可以获取锁;旧值与返回的lockvalueB一致说明中间未被其他进程获取该锁,可以获取锁;否则不能获取锁,结束,获取锁失败。
4.3、代码
留给给大家,按照上面的过程实现下。
5、方式3:zookeeper
5.1、原理
zookeeper是什么?是一个开源的中间件,可以做高可用配置中心使用,简单点理解:可以用来保存用户的一些数据。
zookeeper有3个特点比较重要,这2个特点是实现分布式锁的关
键。
第1个特点:节点天然有序
zookeeper中存储数据是树结构,树下面可以创建很多节点,节点中可以存储用户的数据。
在每一个节点下面创建子节点时,只要选择的创建类型是有序类型,那么,此节点将自动在客户端指定的节点名后面添加一个单调递增序号,重点是,并发创建子节点的情况下,也可以确保多个子节点的有序性。
比如并发在/lock/lock1下面创建4个有序子节点,如下:
客户端可以判断创建的节点序号是不是最小的,如果编号是子节点中最小的,则获取锁成功。
第2个特点:临时节点
客户端操作zookeeper,需要和zookeeper之间建立连接,如果客户端请求在zookeeper上创建的节点类型是临时节点,那么当客户端和zookeeper之间连接断开的时候,创建的临时节点自动会被zookeeper删除。
这个可以防止死锁多功能,比如客户端获取锁之后挂了,那么节点会自动被删除,此时锁的其他获取者才有机会获取锁。
第3个特点:监听器
客户端可以对某个节点添加监听器,当节点信息发生变化的时候,zookeeper会通知客户端,比如节点数据被修改、节点被删除等等,都会通知客户端;
这个特性特别牛逼:这个特别爽,后面的节点只需要监听他前面的一个节点,当前面的一个节点被删除时,zookeeper会通知监听者,监听者可以判断自己创建的节点编号是不是最小的,如果是最小的,即获取锁成功,这个是不是比上面数据库和redis的方式好一些,db和redis的方式需要自旋(获取失败了,休眠稍许,继续循环尝试),而zookeeper不需要自旋,锁被释放的时候,zookeeper会通知等待者。
5.2、代码
重点理解原理,代码大家可以在网上找找,比较多,这里就不贴出来了。
6、方式4:etcd
etcd 和 zookeeper功能差不多,也可以作为高可用配置中心,不过etcd基于Go语言实现,也可以用来实现分布式锁,实现原理上和zookeeper差不多,这里就不细说了。
7、总结
本文主要介绍了4种方式实现分布式锁,大家重点要理解每种方式的原理。
db和redis的方式原理差不多,内部在获取失败的情况下,都需要采用自旋的方式重新尝试获取锁,而zookeeper采用监听的方式。
redis和zookeeper这2种方式用的比较多,性能上面redis更好一些,并发量比较大的可以采用redis的方式。
设计中还有一点:获取锁的时候分2步走,先获取jvm中的锁,然后在尝试获取分布式锁。
8、更多面试题
- B站上有哪些值得推荐学习的视频?
- 经典面试题:重写equals方法时,为什么必须重写hashCode方法?
- 经典面试题:HashMap的默认容量为什么是16 ?
- 经典面试题:Arraylist和Linkedlist到底有什么区别???
- 经典面试题:NoClassDefFoundError 和 ClassNotFoundException 有什么区别?
- 经典面试题:Throwable、Exception、Error、RuntimeException到底有什么区别?
- 经典面试题:try、finally中都有return时,代码如何执行????
- 面对亿级数据,MySQL到底行不行,一起来看看!!
- 经典面试题:ThreadLocal连环炮!!
- 经典面试题:强引用、软引用、弱引用、虚引用有什么区别?
- 面试官:线程有几种状态?他们是如何相互转换的?
·END·
扫描二维码 | 关注我们