卧槽，头条4面：这个问题砍了我10万！！！

老铁们好，这里是java研究所。
今天我们来探讨一下分布式锁的4种实现：
1、通过MySQL实现分布式锁
2、通过redis实现分布式锁
3、通过zookeeper实现分布式锁
4、通过etcd实现分布式锁

1、什么是分布式锁？

如何确保共享资源在同一时刻只能被一个线程访问？
大家可能觉得这个很简单吧，在一个jvm中，通过synchronized或者ReentrantLock是很容易实现的。
确实，单个jvm中确实没有问题。
但是，通常我们的系统会采用集群的方式部署，此时集群中的每个节点都是一个jvm环境，那么通过synchronized或者ReentrantLock是无法解决共享资源访问的问题了。
此时就要用到分布式锁了：分布式锁就是解决分布式环境中共享资源顺序访问的问题，同一时刻，集群中所有节点中，只允许有一个线程可以访问共享资源。

2、分布式锁的功能

分布式锁使用者位于不同的机器中，锁获取成功之后，才可以对共享资源进行操作
同一时刻所有机器中只有一个使用者可以获取到分布式锁
锁具有重入的功能：即一个使用者可以多次获取某个分布式锁
获取锁的过程允许指定超时功能：在指定的时间内尝试获取锁，过了超时时间，若还未获取到锁，则获取失败
防止死锁：如：A机器获取锁之后，在释放锁之前，A机器挂了，导致锁未释放，结果锁一直被A机器占有着，遇到这种情况时，分布式锁要能够自动解决；解决方式：持有锁的时候可以加个持有超时时间，超过了这个时间锁将自动释放，此时其他机器将有机会获取锁
下面我们来看一下分布式锁的4种实现。

3、方式1：数据库的方式

3.1、原理

锁的获取过程
假如：一个集群环境中有n个系统，每个系统中有一个jvm，每个jvm中有m个线程去获取分布式锁，那么同时可能就有n*m个线程去获取分布式锁，此时分布式锁的压力是比较大的，每个jvm中多个线程同时去获取锁其实是没有意义的，可以在每个jvm中先加一把本地的锁，获取分布式锁之前需要先获取jvm本地的锁，本地锁获取成功之后，才可以尝试获取分布式锁，此时n个系统中最多有n个线程尝试获取分布式锁，获取锁的步骤主要2步：

1、先尝试获取jvm本地锁
2、jvm本地锁获取成功之后尝试获取分布式锁

超时时间

获取锁的时候可以传递获取锁最大等待时间，在指定的时间内多次尝试获取锁，获取失败之后，休眠一会，再继续尝试获取，直到时间耗尽。

锁有效期

获取锁的时候需要指定有效期，有效期就是获取锁之后，使用者希望使用多长时间，为什么需要有效期？
如果没有有效期，当使用者获取成功之后，系统突然down机了，那么这个锁就无法释放，其他线程就再也无法获取到这个锁了。
所以需要有有效期，超过了有效期，锁将失效，其他线程将可以尝试获取锁。

锁续命

什么是锁续命？
比如：使用者获取锁的时候，指定有效期是5分钟，但是5分钟之后，使用者事情还未干完，还想继续使用一会，那么可以使用续命功能，延迟锁的有效期。
可以启动一个子线程，自动完成续命的操作，比如：原本有效期是5分钟，当使用4分钟的时候，续命2分钟，那么有效期是7分钟，这个比较简单，大家可以随意发挥。

3.2、准备sql

create table t_lock(
  lock_key varchar(32) PRIMARY KEY NOT NULL COMMENT '锁唯一标志',
  request_id varchar(64) NOT NULL DEFAULT '' COMMENT '用来标识请求对象的',
  lock_count INT NOT NULL DEFAULT 0 COMMENT '当前上锁次数',
  timeout BIGINT NOT NULL DEFAULT 0 COMMENT '锁超时时间',
  version INT NOT NULL DEFAULT 0 COMMENT '版本号，每次更新+1'
)COMMENT '锁信息表';

注意：表中有个版本号字段，版本号主要用于乐观锁的方式更新数据，确保并发情况下更新数据的正确性。

3.3、锁工具类代码

代码比较简单，大家主要看获取锁的lock方法和释放锁的unlock方法，注释比较详细，大家看看就懂了。
代码中的重点是更新数据的时候，通过比对版本号，采用cas的方式，确保并发情况下更新数据的正确性。
本代码实现了获取锁和释放锁的操作，续命操作未实现，大家可以尝试实现一下。

package lock;

import lombok.Builder;
import lombok.Getter;
import lombok.Setter;
import lombok.extern.slf4j.Slf4j;

import java.sql.*;
import java.util.Map;
import java.util.Objects;
import java.util.UUID;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.locks.ReentrantLock;

@Slf4j
public class DbLockUtil {

    //将requestid保存在该变量中
    static ThreadLocal<String> requestIdTL = new ThreadLocal<>();
    //jvm锁：当多个线程并发获取分布式锁时，需要先获取jvm锁，jvm锁获取成功，则尝试获取分布式锁
    static Map<String, ReentrantLock> jvmLockMap = new ConcurrentHashMap<>();

    /**
     * 获取当前线程requestid
     *
     * @return
     */
    public static String getRequestId() {
        String requestId = requestIdTL.get();
        if (requestId == null || "".equals(requestId)) {
            requestId = UUID.randomUUID().toString();
            requestIdTL.set(requestId);
        }
        log.info("requestId:{}", requestId);
        return requestId;
    }

    /**
     * 获取锁
     *
     * @param lockKey         锁key
     * @param lockTimeOut(毫秒) 持有锁的有效时间，防止死锁
     * @param getTimeOut(毫秒)  获取锁的超时时间，这个时间内获取不到将重试
     * @return
     */
    public static boolean lock(String lockKey, long lockTimeOut, int getTimeOut) throws Exception {
        log.info("start");
        boolean lockResult = false;

        /**
         * 单个jvm中可能有多个线程并发获取一个锁
         * 此时我们只允许一个线程去获取分布式锁
         * 所以如果同一个jvm中有多个线程尝试获取分布式锁，需要先获取jvm中的锁
         */
        ReentrantLock jvmLock = new ReentrantLock();
        ReentrantLock oldJvmLock = jvmLockMap.putIfAbsent(lockKey, jvmLock);
        oldJvmLock = oldJvmLock != null ? oldJvmLock : jvmLock;
        boolean jvmLockSuccess = oldJvmLock.tryLock(getTimeOut, TimeUnit.MILLISECONDS);
        //jvm锁获取失败，则直接失败
        if (!jvmLockSuccess) {
            return lockResult;
        } else {
            //jvm锁获取成功，则继续尝试获取分布式锁
            try {
                String request_id = getRequestId();
                long startTime = System.currentTimeMillis();
                //循环尝试获取锁
                while (true) {
                    //通过lockKey获取db中的记录
                    LockModel lockModel = DbLockUtil.get(lockKey);
                    if (Objects.isNull(lockModel)) {
                        //记录不存在，则先插入一条
                        DbLockUtil.insert(LockModel.builder().lock_key(lockKey).request_id("").lock_count(0).timeout(0L).version(0).build());
                    } else {
                        //获取请求id，稍后请求id会放入ThreadLocal中
                        String requestId = lockModel.getRequest_id();
                        //如果requestId为空字符，表示锁未被占用
                        if ("".equals(requestId)) {
                            lockModel.setRequest_id(request_id);
                            lockModel.setLock_count(1);
                            lockModel.setTimeout(System.currentTimeMillis() + lockTimeOut);
                            //并发情况下，采用cas方式更新记录
                            if (DbLockUtil.update(lockModel) == 1) {
                                lockResult = true;
                                break;
                            }
                        } else if (request_id.equals(requestId)) {
                            //如果requestId和表中request_id一样表示锁被当前线程持有者，此时需要加重入锁
                            lockModel.setTimeout(System.currentTimeMillis() + lockTimeOut);
                            lockModel.setLock_count(lockModel.getLock_count() + 1);
                            if (DbLockUtil.update(lockModel) == 1) {
                                lockResult = true;
                                break;
                            }
                        } else {
                            //锁不是自己的，并且已经超时了，则重置锁，继续重试
                            if (lockModel.getTimeout() < System.currentTimeMillis()) {
                                DbLockUtil.resetLock(lockModel);
                            } else {
                                //如果未超时，休眠100毫秒，继续重试
                                if (startTime + getTimeOut > System.currentTimeMillis()) {
                                    TimeUnit.MILLISECONDS.sleep(100);
                                } else {
                                    break;
                                }
                            }
                        }
                    }
                }
            } finally {
                //释放jvm锁，将其从map中异常
                jvmLock.unlock();
                jvmLockMap.remove(lockKey);
            }
        }
        log.info("end");
        return lockResult;
    }

    /**
     * 释放锁
     *
     * @param lock_key
     * @throws Exception
     */
    private static void unlock(String lock_key) throws Exception {
        //获取当前线程requestId
        String requestId = getRequestId();
        LockModel lockModel = DbLockUtil.get(lock_key);
        //当前线程requestId和库中request_id一致 && lock_count>0，表示可以释放锁
        if (Objects.nonNull(lockModel) && requestId.equals(lockModel.getRequest_id()) && lockModel.getLock_count() > 0) {
            if (lockModel.getLock_count() == 1) {
                //重置锁
                resetLock(lockModel);
            } else {
                lockModel.setLock_count(lockModel.getLock_count() - 1);
                DbLockUtil.update(lockModel);
            }
        }
    }

    /**
     * 重置锁
     *
     * @param lockModel
     * @return
     * @throws Exception
     */
    private static int resetLock(LockModel lockModel) throws Exception {
        lockModel.setRequest_id("");
        lockModel.setLock_count(0);
        lockModel.setTimeout(0L);
        return DbLockUtil.update(lockModel);
    }

    /**
     * 更新lockModel信息，内部采用乐观锁来更新
     *
     * @param lockModel
     * @return
     * @throws Exception
     */
    private static int update(LockModel lockModel) throws Exception {
        return exec(conn -> {
            String sql = "UPDATE t_lock SET request_id = ?,lock_count = ?,timeout = ?,version = version + 1 WHERE lock_key = ? AND  version = ?";
            PreparedStatement ps = conn.prepareStatement(sql);
            int colIndex = 1;
            ps.setString(colIndex++, lockModel.getRequest_id());
            ps.setInt(colIndex++, lockModel.getLock_count());
            ps.setLong(colIndex++, lockModel.getTimeout());
            ps.setString(colIndex++, lockModel.getLock_key());
            ps.setInt(colIndex++, lockModel.getVersion());
            return ps.executeUpdate();
        });
    }

    private static LockModel get(String lock_key) throws Exception {
        return exec(conn -> {
            String sql = "select * from t_lock t WHERE t.lock_key=?";
            PreparedStatement ps = conn.prepareStatement(sql);
            int colIndex = 1;
            ps.setString(colIndex++, lock_key);
            ResultSet rs = ps.executeQuery();
            if (rs.next()) {
                return LockModel.builder().
                        lock_key(lock_key).
                        request_id(rs.getString("request_id")).
                        lock_count(rs.getInt("lock_count")).
                        timeout(rs.getLong("timeout")).
                        version(rs.getInt("version")).build();
            }
            return null;
        });
    }

    private static int insert(LockModel lockModel) throws Exception {
        return exec(conn -> {
            String sql = "insert into t_lock (lock_key, request_id, lock_count, timeout, version) VALUES (?,?,?,?,?)";
            PreparedStatement ps = conn.prepareStatement(sql);
            int colIndex = 1;
            ps.setString(colIndex++, lockModel.getLock_key());
            ps.setString(colIndex++, lockModel.getRequest_id());
            ps.setInt(colIndex++, lockModel.getLock_count());
            ps.setLong(colIndex++, lockModel.getTimeout());
            ps.setInt(colIndex++, lockModel.getVersion());
            return ps.executeUpdate();
        });
    }

    private static <T> T exec(SqlExec<T> sqlExec) throws Exception {
        Connection conn = getConn();
        try {
            return sqlExec.exec(conn);
        } finally {
            closeConn(conn);
        }
    }

    @FunctionalInterface
    public interface SqlExec<T> {
        T exec(Connection conn) throws Exception;
    }

    @Getter
    @Setter
    @Builder
    public static class LockModel {
        private String lock_key;
        private String request_id;
        private Integer lock_count;
        private Long timeout;
        private Integer version;
    }

    private static final String url = "jdbc:mysql://localhost:3306/dlock?useSSL=false";        //数据库地址
    private static final String username = "";        //数据库用户名
    private static final String password = "";        //数据库密码
    private static final String driver = "com.mysql.jdbc.Driver";        //mysql驱动

    /**
     * 连接数据库
     *
     * @return
     */
    private static Connection getConn() {
        Connection conn = null;
        try {
            Class.forName(driver);  //加载数据库驱动
            try {
                conn = DriverManager.getConnection(url, username, password);  //连接数据库
            } catch (SQLException e) {
                e.printStackTrace();
            }
        } catch (ClassNotFoundException e) {
            e.printStackTrace();
        }
        return conn;
    }

    /**
     * 关闭数据库链接
     *
     * @return
     */
    private static void closeConn(Connection conn) {
        if (conn != null) {
            try {
                conn.close();  //关闭数据库链接
            } catch (SQLException e) {
                e.printStackTrace();
            }
        }
    }
}

4、方式2：redis 的方式

4.1、用到的几个命令

setnx
命令格式：SETNX key value；是『SET if Not eXists』(如果不存在，则 SET)的简写，只在键 key 不存在的情况下，将键 key 的值设置为 value 。若键 key 已经存在，则 SETNX 命令不做任何动作。命令在设置成功时返回 1 ，设置失败时返回 0 。
getset
命令格式：GETSET key value，将键 key 的值设为 value ，并返回键 key 在被设置之前的旧的value。返回值：如果键 key 没有旧值，也即是说，键 key 在被设置之前并不存在，那么命令返回 nil 。当键 key 存在但不是字符串类型时，命令返回一个错误。
expire
命令格式：EXPIRE key seconds，使用：为给定 key 设置生存时间，当 key 过期时(生存时间为 0 )，它会被自动删除。返回值：设置成功返回 1 。当 key 不存在或者不能为 key 设置生存时间时(比如在低于 2.1.3 版本的 Redis 中你尝试更新 key 的生存时间)，返回 0 。

del
命令格式：DEL key [key …]，使用：删除给定的一个或多个 key ，不存在的 key 会被忽略。返回值：被删除 key 的数量。

4.2、原理

卧槽，头条4面：这个问题砍了我10万！！！

过程分析，先看图左边过程：

1、A尝试去获取锁lockkey，通过setnx(lockkey,currenttime+timeout)命令，对lockkey进行setnx,将value值设置为当前时间+锁超时时间；
2、如果返回值为1，说明redis服务器中还没有lockkey，也就是没有其他用户拥有这个锁，A就能获取锁成功；
3、在进行相关业务执行之前，先执行expire(lockkey)，对lockkey设置有效期，防止死锁；因为如果不设置有效期的话，lockkey将一直存在于redis中，其他用户尝试获取锁时，执行到setnx(lockkey,currenttime+timeout)时，将不能成功获取到该锁；
4、执行相关业务
5、释放锁，A完成相关业务之后，要释放拥有的锁，也就是删除redis中该锁的内容，del(lockkey)，接下来的用户才能进行重新设置锁新值

再看右边过程

6、当A通过setnx(lockkey,currenttime+timeout)命令不能成功设置lockkey时，这是不能直接断定获取锁失败；因为我们在设置锁时，设置了锁的超时时间timeout，当当前时间大于redis中存储键值为lockkey的value值时，可以认为上一任的拥有者对锁的使用权已经失效了，A就可以强行拥有该锁；具体判定过程如下；
7、A通过get(lockkey)，获取redis中的存储键值为lockkey的value值，即获取锁的相对时间lockvalueA
8、lockvalueA!=null && currenttime>lockvalue，A通过当前的时间与锁设置的时间做比较，如果当前时间已经大于锁设置的时间临界，即可以进一步判断是否可以获取锁，否则说明该锁还在被占用，A就还不能获取该锁，结束，获取锁失败；
9、步骤4返回结果为true后，通过getSet设置新的超时时间，并返回旧值lockvalueB，以作判断，因为在分布式环境，在进入这里时可能另外的进程获取到锁并对值进行了修改，只有旧值与返回的值一致才能说明中间未被其他进程获取到这个锁
10、lockvalueB == null || lockvalueA==lockvalueB，判断：若果lockvalueB为null，说明该锁已经被释放了，此时该进程可以获取锁；旧值与返回的lockvalueB一致说明中间未被其他进程获取该锁，可以获取锁；否则不能获取锁，结束，获取锁失败。

4.3、代码

留给给大家，按照上面的过程实现下。

5、方式3：zookeeper

5.1、原理

zookeeper是什么？是一个开源的中间件，可以做高可用配置中心使用，简单点理解：可以用来保存用户的一些数据。
zookeeper有3个特点比较重要，这2个特点是实现分布式锁的关
键。

第1个特点：节点天然有序

zookeeper中存储数据是树结构，树下面可以创建很多节点，节点中可以存储用户的数据。
在每一个节点下面创建子节点时，只要选择的创建类型是有序类型，那么，此节点将自动在客户端指定的节点名后面添加一个单调递增序号，重点是，并发创建子节点的情况下，也可以确保多个子节点的有序性。
比如并发在/lock/lock1下面创建4个有序子节点，如下：
卧槽，头条4面：这个问题砍了我10万！！！
客户端可以判断创建的节点序号是不是最小的，如果编号是子节点中最小的，则获取锁成功。

第2个特点：临时节点

客户端操作zookeeper，需要和zookeeper之间建立连接，如果客户端请求在zookeeper上创建的节点类型是临时节点，那么当客户端和zookeeper之间连接断开的时候，创建的临时节点自动会被zookeeper删除。
这个可以防止死锁多功能，比如客户端获取锁之后挂了，那么节点会自动被删除，此时锁的其他获取者才有机会获取锁。

第3个特点：监听器

客户端可以对某个节点添加监听器，当节点信息发生变化的时候，zookeeper会通知客户端，比如节点数据被修改、节点被删除等等，都会通知客户端；
这个特性特别牛逼：这个特别爽，后面的节点只需要监听他前面的一个节点，当前面的一个节点被删除时，zookeeper会通知监听者，监听者可以判断自己创建的节点编号是不是最小的，如果是最小的，即获取锁成功，这个是不是比上面数据库和redis的方式好一些，db和redis的方式需要自旋（获取失败了，休眠稍许，继续循环尝试），而zookeeper不需要自旋，锁被释放的时候，zookeeper会通知等待者。

5.2、代码

重点理解原理，代码大家可以在网上找找，比较多，这里就不贴出来了。

6、方式4：etcd

etcd 和 zookeeper功能差不多，也可以作为高可用配置中心，不过etcd基于Go语言实现，也可以用来实现分布式锁，实现原理上和zookeeper差不多，这里就不细说了。

7、总结

本文主要介绍了4种方式实现分布式锁，大家重点要理解每种方式的原理。
db和redis的方式原理差不多，内部在获取失败的情况下，都需要采用自旋的方式重新尝试获取锁，而zookeeper采用监听的方式。
redis和zookeeper这2种方式用的比较多，性能上面redis更好一些，并发量比较大的可以采用redis的方式。
设计中还有一点：获取锁的时候分2步走，先获取jvm中的锁，然后在尝试获取分布式锁。

8、更多面试题

B站上有哪些值得推荐学习的视频？
经典面试题：重写equals方法时，为什么必须重写hashCode方法？
经典面试题：HashMap的默认容量为什么是16 ？
经典面试题：Arraylist和Linkedlist到底有什么区别？？？
经典面试题：NoClassDefFoundError 和 ClassNotFoundException 有什么区别？
经典面试题：Throwable、Exception、Error、RuntimeException到底有什么区别？
经典面试题：try、finally中都有return时，代码如何执行？？？？
面对亿级数据，MySQL到底行不行，一起来看看！！
经典面试题：ThreadLocal连环炮！！
经典面试题：强引用、软引用、弱引用、虚引用有什么区别？
面试官：线程有几种状态？他们是如何相互转换的？

·END·
卧槽，头条4面：这个问题砍了我10万！！！
扫描二维码｜关注我们