阿里二面:Redis分布式锁过期了但业务还没有执行完,怎么办

阿里二面:Redis分布式锁过期了但业务还没有执行完,怎么办

作者: jinjunzhu 2021-08-30 18:20:58

开发

前端

分布式

Redis 我们使用了redis的分布式锁。具体做法是后端接收到请求后加入一个分布式锁,如果加锁成功,就执行业务,如果加锁失败就等待锁或者拒绝请求。业务执行完成后释放锁。

涟水网站制作公司哪家好,找创新互联公司!从网页设计、网站建设、微信开发、APP开发、响应式网站建设等网站项目制作,到程序开发,运营维护。创新互联公司于2013年成立到现在10年的时间,我们拥有了丰富的建站经验和运维经验,来保证我们的工作的顺利进行。专注于网站建设就选创新互联公司

面试官:你们系统是怎么实现分布式锁的?

:我们使用了redis的分布式锁。具体做法是后端接收到请求后加入一个分布式锁,如果加锁成功,就执行业务,如果加锁失败就等待锁或者拒绝请求。业务执行完成后释放锁。

面试官:能说一下具体使用的命令吗?

:我们使用的是SETNX命令,具体如下:

  
 
 
 
  1. SETNX KEY_NAME VALUE

设置成功返回1,设置失败返回0。如下图,客户端1加锁成功,客户端2获取锁失败:

面试官:这样设置会不会有问题呢?如果加锁成功的客户端挂了怎么办?

:比如上图中的客户端1挂了,这个锁就不能释放了。可以设置一个过期时间,命令如下:

  
 
 
 
  1. SET key value [EX seconds] [PX milliseconds] NX

面试官:设置了过期时间,如果业务还没有执行完成,但是redis锁过期了,怎么办?

:需要对锁进行续约。

面试官:能说一下具体怎么操作吗?

:设置锁成功后,启动一个watchdog,每隔一段时间(比如10s)为当前分布式锁续约,也就是每隔10s重新设置当前key的超时时间。命令如下:

  
 
 
 
  1. EXPIRE  

整个流程如下:

面试官:watchdog怎么实现呢?

:当客户端加锁成功后,可以启动一个定时任务,每隔10s(最好支持配置)来检测业务是否处理完成,检测的依据就是判断分布式锁的key是否还存在,如果存在,就进行续约。

面试官:如果当前线程已经处理完,这个key是被其他客户端写入的呢?

:可以为每个客户端指定一个clientID,在VALUE中增加一个clientID的前缀,这样在续锁的时候,可以判断当前分布式锁的value前缀来确定是不是当前客户端的,如果是再续锁,否则不做处理。

面试官:你们的续锁功能是自己实现的吗?

:我们用的redisson的分布式锁方案,使用redisson获取分布式锁非常简单,代码如下:

  
 
 
 
  1. RLock lock = redisson.getLock("client-lock");
  2. lock.lock();
  3. try {
  4.     //处理业务
  5. } catch (Exception e) {
  6.     //处理异常
  7. } finally {
  8.     lock.unlock();
  9. }

具体原理是:如果客户端1加锁成功,这个分布式锁超时时间默认是30秒(可以通过Config.lockWatchdogTimeout来修改)。加锁成功后,就会启动一个watchdog,watchdog是一个后台线程,会每隔10秒检查一下客户端1是否还持有锁key,如果是,就延长锁key的生存时间,延长操作就是再次把锁key的超时时间设置成30s。

面试官:redisson里的定时器怎么实现的?

:redisson定时器使用的是netty-common包中的HashedWheelTime来实现的。

面试官:如果client1宕机了,这时分布式锁还可以续期吗?

:因为分布式锁的续期是在客户端执行的,所以如果client1宕机了,续期线程就不能工作了,也就不能续期了。这时应该把分布式锁删除,让其他客户端来获取。

面试官:那如果client1宕机了,其他客户端需要等待30s才能有机会获取到锁,有办法立刻删除锁吗?

:因为client1宕机了,只能等到超时时间后锁被自动删除。如果要立刻删除,需要增加额外的工作,比如增加哨兵机制,让哨兵来维护所有redis客户端的列表。哨兵定时监控客户端是否宕机,如果检测到宕机,立刻删除这个客户端的锁。如下图:

这里的哨兵并不是redis的哨兵,而且为了检测客户端故障业务系统自己做的哨兵。

面试官:如果不用redisson,怎么实现分布式锁续锁呢?比如springboot2.0默认使用redis客户端是Lettuce。

:Lettuce并没有提供像redisson这样的watchdog机制,所以续锁需要业务系统自己实现。可以分为以下几步来实现:

1.加锁的命令,我们参照spring包里的分布式锁代码,如果锁存在并且是当前客户端加的锁,那就续锁,如果锁不存在,则加锁。代码如下:

  
 
 
 
  1. private static final String OBTAIN_LOCK_SCRIPT =
  2.         "local lockClientId = redis.call('GET', KEYS[1])\n" +
  3.                 "if lockClientId == ARGV[1] then\n" +
  4.                 "  redis.call('PEXPIRE', KEYS[1], ARGV[2])\n" +
  5.                 "  return true\n" +
  6.                 "elseif not lockClientId then\n" +
  7.                 "  redis.call('SET', KEYS[1], ARGV[1], 'PX', ARGV[2])\n" +
  8.                 "  return true\n" +
  9.                 "end\n" +
  10.                 "return false";

2.把锁保存在一个数据结构里,比如HashMap,定时任务定时扫描这个map,对每个锁进行续锁操作。代码如下:

  
 
 
 
  1. private final Map locks = new ConcurrentHashMap<>();

3.续锁命令

  
 
 
 
  1. private static final String RENEW_LOCK_SCRIPT =
  2.             "local lockClientId = redis.call('GET', KEYS[1])\n" +
  3.                     "if lockClientId == ARGV[1] then\n" +
  4.                     "  redis.call('PEXPIRE', KEYS[1], ARGV[2])\n" +
  5.                     "  return true\n" +
  6.                     "end\n" +
  7.                     "return false";

4.如果锁是当前客户端加的,那就续锁,否则失败。

写一个定时任务,定时执行续锁代码:

  
 
 
 
  1. redisTemplate.execute(renewLockScript,
  2.                         Collections.singletonList(lockKey), clientId,
  3.                         String.valueOf(expireAfter));

面试官:这个问题就聊到这里,咱们下一个问题...

分享名称:阿里二面:Redis分布式锁过期了但业务还没有执行完,怎么办
分享URL:http://www.mswzjz.cn/qtweb/news37/33637.html

攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能