聊聊红包雨背后的逻辑

2017年临近年关的时候接到开发年会红包雨的任务，时间紧任务重且之前没有这块经验。这个项目看似很简单，如果参加年会人数少，一个晚上可以搞出demo，如果是几万人则难度成指数级。领导说，当天现场有几百位参会，场外全集团估计有几万人，公司下属子公司从事的业务多，这次年会基本上每家子公司都有预算，如机票，饮料券，商场代金券，积分，现金，保养券，合作方赠送的礼品等全部以红包雨的形式发放出去，当天会有多场红包雨活动。

经过和产品，技术一个晚上的需求讨论基本上把项目拆分完毕。

系统划分大致如下

1、后台管理服务，方便年会人员的工作，比如上架奖品；设置合适的活动时间，规则；开启活动；暂停活动；拉黑企业成员；禁止某些人抢红包；发布公告；统一推送消息；发送短信等。

2、鉴权服务，所有进来抢红包的用户都需要经过这个服务，统一鉴权用户（是否登录，合法性，平衡性，活动状态等），如果流量太大或者中奖人数不平衡还要根据用户标签（司龄，中奖次数，所属子公司）进行限流。目的是尽可能的平均化各个子公司中奖人数。举个例子，A子公司人数有几千人，第一场红包雨奖品大部分被A子公司抢走，那么就要适当对A子公司人员进行管控，第二场活动可能大部分A子公司成员在鉴权时候直接踢掉，无法进入中奖服务。

3、中奖服务，用户通过鉴权之后，开始进入真正的抢红包业务，所点即所得，如果中奖（log4j2+disruptor）会记录一条详细日志（这是最原始的中奖依据）。

4、消息消费服务，统一处理用户中奖信息，每场红包雨活动的奖品数量和持续时间是不一致的，比如第一场活动1分钟，100000份奖品，如果中奖纪录直接入库则压力是很大的。所以这里使用消息中间件流量削峰，异步批量存入缓存，DB入库。

5、定时服务，提前预热活动任务，中奖核对任务，过期作废任务，提现任务等。比如张三的中奖日志和中奖DB数据不一致，中奖核对任务需要清洗出类似这样的异常情况，及时通知技术，运营排查，防止出现不愉快。张三中了一张有期限的购物卡，过期了就需要作废掉不允许兑换。

6、查询服务，活动进行中和结束后，大量用户会查看活动详情和自己中奖信息，这一块采取措施是H5本地缓存和服务端缓存，CND相结合，例如整场年会我就抢了3个红包，那么直接将这三个中奖信息写到本地缓存。活动未开始用户会看到公司相应的宣传片，公司领导讲话视频，banner等统一走CND。

7、现金红包提现服务，因为集团下属有自己的银行，所以本次活动涉及钱的全部走自己的银行，用户提现，需要绑卡，开户。提现需要审核，确认无误会交给定时任务处理，一般在2个小时之内会打到绑卡的银行账户。

服务按职责划分出来之后优点是按需分配节约了服务器资源，避免单点故障拖垮整个服务，缺点是增加运维负担。

中奖逻辑

首先中奖是无规律的，即用户点击的红包，谁也不确定是否中奖，谁也不确定奖品是什么，为了满足这个条件且为了增加用户体验，我们采取的是先预热活动也就是初始化活动数据。提前30分钟预热即将开始的活动数据到缓存队列。主要用到了redis，quartz

例如以下表格（demo数据）：

红包场次	开始时间	结束时间	红包总数	现金总数	现金总金额	xx超市代金券总数	xx超市代金券总金额
第一场	2017/12/25 13:30:00	2017/12/25 13:40:00	4	3	100000	1	5000
第二场	2017/12/25 14:30:00	2017/12/25 13:35:00	10	9	50000	1	20000

在2017/12/25 13:00定时任务会预热第一场活动数据，发送消息到钉钉群里提醒所有相关人员。

首先sql根据时间纬度查到第一场活动，开始初始化数据，整个初始化后的数据就是一个令牌桶，每个奖就是一个令牌。它们整个对应关系如下：

这种令牌桶设计一般通用于秒杀，红包雨，红包等场景。整个桶使用redis的list数据结构存储，优点是拿了就走，不需要更新库存，效率高。

代码逻辑

1、初始化令牌的产生，结束时间戳-开始时间戳得到活动的时间区间，用开始时间戳+时间区间的随机数生成生成四个令牌（每个令牌对应一个奖品）并将令牌按照从小到大的顺序排序，rpush到redis中，并且设置key的expire为10分钟。这里尤其注意令牌不能重复，而按照这种设计如果时间短而奖品多的情况下可能就会重复，解决思路，如果1分钟，1000份奖品，则0-999，那就用时间戳*1000 + redis自增(incr)不够前面补上0，真正时间对比的时候令牌/1000 才是真正的时间戳。如下

System.out.println(new Date().getTime());
System.out.println(1584866007408L*1000+999);
System.out.println(1584866007408999L/1000);

2、令牌和奖品之间是k-v存储到redis，并且设置key的expire为10分钟

3、用户经过前面的鉴权逻辑，进入中奖服务，lpop拿到令牌，我们设置的中奖逻辑是，拿到令牌并不代表中奖，比如令牌1时间戳对应时间是13:31，活动是13:30开始，用户在13:30 第10秒抢到这个令牌13:30:10 < 13:31:00（令牌）所以不算中奖，这时候用户需要把令牌lpush回去，这里需要注意的是抢令牌，对比令牌，还回令牌必须是原子操作，可以使用分布式锁或者lua脚本来完成，目的是防止并发情况下，拿到令牌和放回去的令牌顺序错乱。如果用户是13:31:01秒抢到令牌1 ，系统就认为中奖，整个逻辑就是当前时间小于令牌时间戳不中奖，大于令牌时间戳中奖。

4、当前活动对应的活动策略，比如最大中奖次数，司龄中奖次数等，hset到redis中，并且设置key的expire为10分钟

5、预热完成，更新活动状态，并发送消息到钉钉群提醒工作人员。用户可抢的红包一定是已经预热后的活动，如果预热环节出现问题管控平台立刻启用备用活动顶替。

6、用户确定中奖，直接返回奖品信息，为了节省带宽返回的奖品信息越少越好。同时发送MQ消息，后台中奖数据异步入库