redis常用面试题总结

redis常用面试题总结

一、雪崩问题
  在海量数据时,现在电商系统已经对缓存的依赖性非常高。有一种情况。当海量的请求过来时,缓存宕机,海量的请求继续涌向数据库,数据库服务器宕机。将数据库服务器重启,重启后,刚起来,海量的请求又来了数据库服务器都无法启动。这种情况称为雪崩。
  解决办法:必须使用分布式缓存。集群,可以通过多台的服务器分担缓存。这时如果一台服务器宕机,这时少量的请求涌向数据库,这时数据库可以承担。不会宕机。如果访问压力还非常巨大,可以继续增加服务器。然后分布的备份内容。形成缓存的主从。前面的方案还会有少量的缓存的数据丢失,但高可用后数据就不会丢失。
二、redis能否替代mysql
  不能,redis NO-SQL no SQL,none SQL。它没有复杂结构,不支持强关系型数据。
  例如:关系型数据:部门和用户。一个部门下有多个用户,一个用户从属一个部门。非结构化数据:html/xml/json、视频、图片。
  根据应用场景分类存储:结构化的依然使用mysql传统结构化数据库。对非结构化但是很大的存储到mongodb(视频、word/excel/pdf等文件)。对非结构的但是需要快速查询的memCache或者Redis中(json)。对海量的非结构化的数据,还想对其进行类似关系型数据的分析hbase(列)。对需要分词检索的使用solr或者elasticSearch。
三、redis实现消息队列
  redis能做消息队列得益于他list对象blpop brpop接口以及Pub/Sub(发布/订阅)的某些接口。他们都是阻塞版的,所以可以用来做消息队列。
四、redis持久化
  redis直接将数据存储到内存中,可通过两种方式持久化:定时快照和基于语句的追加。定时快照的方法是指每隔一段时间将整个数据库的数据写到磁盘上,很明显,每次均是写全部数据,代价非常高;而基于语句的追加方法值追踪变化的数据,这类似于MySQL的binlog方法,但追加log可能过大,同时所有操作均要重新执行一遍,回写速度慢。
  两种实现方式分别为RDB和AOF,具体的实现方式参考这篇文章:https://www.cnblogs.com/xingzc/p/5988080.html
五、redis举例应用
  1、缓存(数据查询、短连接、新闻内容、商品内容等等)。(最多使用)
  2、分布式集群架构中的session分离。
  3、聊天室的在线好友列表
  4、任务队列。(秒杀、抢购、12306等等)(先进先出)
  5、应用排行榜。(可以给每个元素设置一个打分,这样就可以排序)
  6、网站访问统计。
  7、数据过期处理(可以精确到毫秒)。
  8、分布式锁
  (1) 取最新N个数据的操作:
   比如典型的取你网站的最新文章,通过下面方式,我们可以将最新的5000条评论的ID放在Redis的List集合中,并将超出集合部分从数据库获取
    1)使用LPUSH latest.comments命令,向list集合中插入数据
    2)插入完成后再用LTRIM latest.comments 0 5000命令使其永远只保存最近5000个ID。
  (2) 聊天室好友在线列表
   假设A存放你的好友,B存放所有在线的人,它们的交集就是你的在线好友 — sinter setA setB
  (3)spring 定时任务
   @schedule注解可以实现简单的定时任务,但当有多台服务同时部署时,这时需要一个分布式锁来控制只能有一台服务器能执行定时任务。 
   jedis.setnx可以做到原子性操作,设置值成功返回1,失败返回0,同时访问只有一台服务器能设置成功,即拿到了这个锁,接着执行定时任务,设置成功后对这个key加一个过期时间,最后在finally里将这个key删掉,避免影响下次的定时任务触发。
  (4)一次写入大的数据量
   pipeline适用于批处理。当有大量的操作需要一次性执行的时候,可以用管道。

Jedis jedis = new Jedis(String, int);
Pipeline p = jedis.pipelined();
p.set(key,value);//每个操作都发送请求给redis-server
p.get(key,value);

p.sync();//这段代码获取所有的response

管道通过一次性写入请求,然后一次性读取响应。也就是说jedis是:request response,request response,…;pipeline则是:request request… response response的方式。这样无需每次请求都等待server端的响应。
   (5)分布式锁实现
    1. 通过jedis.setnx(key,value)实现
    2. 通过事务(multi)实现

public boolean lock_2(long timeout) {
        long nano = System.nanoTime();
        timeout *= ONE_MILLI_NANOS;
        try {
            while ((System.nanoTime() - nano) < timeout) {
                Transaction t = jedis.multi();
                // 开启事务,当server端收到multi指令
                // 会将该client的命令放入一个队列,然后依次执行,知道收到exec指令
                t.getSet(key, LOCKED);
                t.expire(key, EXPIRE);
                String ret = (String) t.exec().get(0);
                if (ret == null || ret.equals("UNLOCK")) {
                    return true;
                }
                // 短暂休眠,nano避免出现活锁
                Thread.sleep(3, r.nextInt(500));
            }
        } catch (Exception e) {
        }
        return false;
    } 

3. 通过事务+监听实现

public boolean lock_3(long timeout) {
        long nano = System.nanoTime();
        timeout *= ONE_MILLI_NANOS;
        try {
            while ((System.nanoTime() - nano) < timeout) {
                jedis.watch(key);
                // 开启watch之后,如果key的值被修改,则事务失败,exec方法返回null
                String value = jedis.get(key);
                if (value == null || value.equals("UNLOCK")) {
                    Transaction t = jedis.multi();
                    t.setex(key, EXPIRE, LOCKED);
                    if (t.exec() != null) {
                        return true;
                    }
                }
                jedis.unwatch();
                // 短暂休眠,nano避免出现活锁
                Thread.sleep(3, r.nextInt(500));
            }
        } catch (Exception e) {
        }
        return false;
    }

六、mySQL里有2000w数据,redis中只存20w的数据,如何保证redis中的数据都是热点数据
  redis 内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略(回收策略)。redis 提供 6种数据淘汰策略:
   volatile-lru:从已设置过期时间的数据集(server.db[i].expires)中挑选最近最少使用的数据淘汰。
   volatile-ttl:从已设置过期时间的数据集(server.db[i].expires)中挑选将要过期的数据淘汰。
   volatile-random:从已设置过期时间的数据集(server.db[i].expires)中任意选择数据淘汰。
   allkeys-lru:从数据集(server.db[i].dict)中挑选最近最少使用的数据淘汰。
   allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰。
   no-enviction(驱逐):禁止驱逐数据。
   相关缓存淘汰算法–LRU算法:https://blog.csdn.net/wangxilong1991/article/details/70172302
七、限制1小时内每用户Id最多只能登录5次
  用列表实现:列表中每个元素代表登陆时间,只要最后的第5次登陆时间和现在时间差不超过1小时就禁止登陆。
八、redis事物的了解CAS(check-and-set 操作实现乐观锁 )?
  Redis作为NoSQL数据库也同样提供了事务机制。在Redis中,MULTI/EXEC/DISCARD/WATCH这四个命令是我们实现事务的基石
  事务的实现特征:
   1). 在事务中的所有命令都将会被串行化的顺序执行,事务执行期间,Redis不会再为其它客户端的请求提供任何服务,从而保证了事物中的所有命令被原子的执行。
   2). 和关系型数据库中的事务相比,在Redis事务中如果有某一条命令执行失败,其后的命令仍然会被继续执行。
   3). 我们可以通过MULTI命令开启一个事务,有关系型数据库开发经验的人可以将其理解为"BEGIN TRANSACTION"语句。在该语句之后执行的命令都将被视为事务之内的操作,最后我们可以通过执行EXEC/DISCARD命令来提交/回滚该事务内的所有操作。这两个Redis命令可被视为等同于关系型数据库中的COMMIT/ROLLBACK语句。
   4). 在事务开启之前,如果客户端与服务器之间出现通讯故障并导致网络断开,其后所有待执行的语句都将不会被服务器执行。然而如果网络中断事件是发生在客户端执行EXEC命令之后,那么该事务中的所有命令都会被服务器执行。
   5). 当使用Append-Only模式时,Redis会通过调用系统函数write将该事务内的所有写操作在本次调用中全部写入磁盘。然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。
   Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会立即退出并给出相应的错误提示。此时,我们就要充分利用Redis工具包中提供的redis-check-aof工具,该工具可以帮助我们定位到数据不一致的错误,并将已经写入的部分数据进行回滚。修复之后我们就可以再次重新启动Redis服务器了。
九、WATCH命令和基于CAS的乐观锁:
  在Redis的事务中,WATCH命令可用于提供CAS(check-and-set)功能。假设我们通过WATCH命令在事务执行之前监控了多个Keys,倘若在WATCH之后有任何Key的值发生了变化,EXEC命令执行的事务都将被放弃,同时返回Null multi-bulk应答以通知调用者事务。执行失败。例如,我们再次假设Redis中并未提供incr命令来完成键值的原子性递增,如果要实现该功能,我们只能自行编写相应的代码。其伪码如下:

val = GET mykey
val = val + 1
SET mykey $val

以上代码只有在单连接的情况下才可以保证执行结果是正确的,因为如果在同一时刻有多个客户端在同时执行该段代码,那么就会出现多线程程序中经常出现的一种错误场景–竞态争用(race condition)。比如,客户端A和B都在同一时刻读取了mykey的原有值,假设该值为10,此后两个客户端又均将该值加一后set回Redis服务器,这样就会导致mykey的结果为11,而不是我们认为的12。为了解决类似的问题,我们需要借助WATCH命令的帮助,见如下代码:

WATCH mykey
val = GET mykey
val = val + 1
MULTI
SET mykey $val
EXEC

此前代码不同的是,新代码在获取mykey的值之前先通过WATCH命令监控了该键,此后又将set命令包围在事务中,这样就可以有效的保证每个连接在执行EXEC之前,如果当前连接获取的mykey的值被其它连接的客户端修改,那么当前连接的EXEC命令将执行失败。这样调用者在判断返回值后就可以获悉val是否被重新设置成功。
十、redis配置文件
  常用到的配置项如下:
   port 服务端口
   bind 绑定ip其他ip不能访问(多个ip空格隔开)
   databases 数据库数量,默认16个
   daemonize设置为守护进程(linux平台)
   maxmemory最大的内存大小(1MB、1GB、1m、1g)
   maxmemory-policy达到内存限制后的处理策略(见第6点)
   默认RDB持久化机制配置
    save 900 1 #900秒内如果超过1个key被修改,则发起快照保存
    save 300 10 #300秒内容如超过10个key被修改,则发起快照保存
   appendonly yes //启用aof持久化方式
   #appendfsync always //每次收到写命令就立即强制写入磁盘,最慢的,但是保证完全的持久化,不推荐使用
   appendfsync everysec //每秒钟强制写入磁盘一次,在性能和持久化方面做了很好的折中,推荐(默认)
   #appendfsync no //完全依赖os,性能最好,持久化没保证

猜你喜欢

转载自blog.csdn.net/qq_38019655/article/details/83931998