三、RedisBeat

重写RedisScheduler，重写后需要重写安装

# -*- coding: utf-8 -*-
# Copyright 2014 Kong Luoxing

# Licensed under the Apache License, Version 2.0 (the 'License'); you may not
# use this file except in compliance with the License. You may obtain a copy
# of the License at http://www.apache.org/licenses/LICENSE-2.0
import sys
import pickle
import traceback
from time import mktime
from functools import partial

from celery.five import values
from celery.beat import Scheduler
from redis import StrictRedis
from celery import current_app

from celery.utils.log import get_logger
from redis.exceptions import LockError

logger = get_logger(__name__)
debug, linfo, error, warning = (logger.debug, logger.info, logger.error,
                                logger.warning)
try:
    MAXINT = sys.maxint
except AttributeError:
    # python3
    MAXINT = sys.maxsize


class RedisScheduler(Scheduler):
    def __init__(self, *args, **kwargs):
        app = kwargs['app']
        #CELERY_INCLUDE=app.conf.get('CELERY_INCLUDE')
        #app.conf.update()
        self.key = app.conf.get("CELERY_REDIS_SCHEDULER_KEY",
                                "celery:beat:order_tasks")
        self.del_key = app.conf.get("CELERY_REDIS_SCHEDULER_DELBAD_KEY",
                                "celery:beat:delbad_tasks")
        self.schedule_url = app.conf.get("CELERY_REDIS_SCHEDULER_URL",
                                         "redis://localhost:6379")
        self.rdb = StrictRedis.from_url(self.schedule_url)
        Scheduler.__init__(self, *args, **kwargs)
        app.add_task = partial(self.add, self)

        self.multi_node = app.conf.get("CELERY_REDIS_MULTI_NODE_MODE", False)
        # how long we should hold on to the redis lock in seconds
        if self.multi_node:
            self.lock_ttl = current_app.conf.get("CELERY_REDIS_SCHEDULER_LOCK_TTL", 30)
            self._lock_acquired = False
            self._lock = self.rdb.lock('celery:beat:task_lock', timeout=self.lock_ttl)
            self._lock_acquired = self._lock.acquire(blocking=False)

    def _remove_db(self):
        linfo("remove db now")
        self.rdb.delete(self.key)

    def _when(self, entry, next_time_to_run):
        return mktime(entry.schedule.now().timetuple()) + (self.adjust(next_time_to_run) or 0)

    def setup_schedule(self):
        # init entries
        self.merge_inplace(self.app.conf.CELERYBEAT_SCHEDULE)
        tasks = self.rdb.zrangebyscore(self.key, 0, -1)
        linfo('Current schedule:
' + '
'.join(
            repr(pickle.loads(entry)) for entry in tasks))

    def merge_inplace(self, tasks):
        #重启调度会执行该函数
        old_entries = self.rdb.zrangebyscore(self.key, 0, MAXINT, withscores=True)
        old_entries_dict = dict({})
        for task, score in old_entries:
            entry = pickle.loads(task)
            old_entries_dict[entry.name] = (entry, score)
        debug("old_entries: {}".format(old_entries_dict))
        #清空调度任务
        self.rdb.delete(self.key)
        #
        for key in tasks:
            #tasks是配置文件中写的定时任务
            last_run_at = 0
            e = self.Entry(**dict(tasks[key], name=key, app=self.app))
            if key in old_entries_dict:
                # replace entry and remain old score
                #若配置文件和已存数据库中的任务重叠，获取数据库中上次运行的时间后从旧数据中删除
                last_run_at = old_entries_dict[key][1]
                del old_entries_dict[key]
            self.rdb.zadd(self.key, min(last_run_at, self._when(e, e.is_due()[1]) or 0), pickle.dumps(e))
        debug("old_entries: {}".format(old_entries_dict))
        for key, tasks in old_entries_dict.items():
            debug("key: {}".format(key))
            debug("tasks: {}".format(tasks))
            #将旧任务重新添加到调度任务当中
            res=self.rdb.zadd(self.key, tasks[1], pickle.dumps(tasks[0]))
            debug("zadd: {}".format(res))
        debug(self.rdb.zrange(self.key, 0, -1))

    def is_due(self, entry):
        return entry.is_due()

    def adjust(self, n, drift=-0.010):
        if n and n > 0:
            return n + drift
        return n

    def add(self, **kwargs):
        e = self.Entry(app=current_app, **kwargs)
        #这里应该判断是否有重复任务
        newtask_name=e.name
        old_entries = self.rdb.zrangebyscore(self.key, 0, MAXINT, withscores=True)
        flg=False
        
        for task, score in old_entries:
            old_entrie=pickle.loads(task)
            if old_entrie.name==newtask_name:
                last_run_at=score
                flg=True
                break
        if flg:
            #有同名任务存在
            self.rdb.zrem(self.key, task)
        self.rdb.zadd(self.key, min(last_run_at,self._when(e, e.is_due()[1]) or 0), pickle.dumps(e))
        return e.name

    def remove(self, task_name):
        if not self.rdb.exists(self.key):
            logger.warn("key: {} not in rdb".format(self.key))
        self.rdb.hset(self.del_key,task_name,self.app.now())
    def tick(self):
        if not self.rdb.exists(self.key):
            logger.warn("key: {} not in rdb".format(self.key))
            for e in values(self.schedule):
                self.rdb.zadd(self.key, self._when(e, e.is_due()[1]) or 0, pickle.dumps(e))

        tasks = self.rdb.zrangebyscore(
            self.key, 0,
            self.adjust(mktime(self.app.now().timetuple()), drift=0.010),
            withscores=True) or []

        next_times = [self.max_interval, ]
        for task, score in tasks:
            entry = pickle.loads(task)
            #每个任务重新调度会执行,这里可根据任务名称进行判断，添加删除功能
            if self.rdb.hexists(self.del_key,entry.name):
                self.rdb.zrem(self.key, task)#删除需要删除的任务
                self.rdb.hdel(self.del_key,entry.name)
                continue
            is_due, next_time_to_run = self.is_due(entry)

            next_times.append(next_time_to_run)
            if is_due:
                next_entry = self.reserve(entry)
                try:
                    linfo("add task entry: {} to publisher".format(entry.name))
                    result = self.apply_async(entry)#添加任务到worker队列
                except Exception as exc:
                    error('Message Error: %s
%s',
                          exc, traceback.format_stack(), exc_info=True)
                else:
                    debug('%s sent. id->%s', entry.task, result.id)
                self.rdb.zrem(self.key, task)#删除旧的任务
                self.rdb.zadd(self.key, self._when(next_entry, next_time_to_run) or 0, pickle.dumps(next_entry))#将旧任务重新计算时间后再添加

        next_task = self.rdb.zrangebyscore(self.key, 0, MAXINT, withscores=True, num=1, start=0)
        if not next_task:
            linfo("no next task found")
            return min(next_times)
        entry = pickle.loads(next_task[0][0])
        next_times.append(self.is_due(entry)[1])

        return min(next_times)

    def close(self):
        # it would be call after cycle end
        if self.multi_node:
            try:
                self._lock.release()
            except LockError:
                pass
        self.sync()

    @property
    def info(self):
        # return infomation about Schedule
        return '    . db -> {self.schedule_url}, key -> {self.key}'.format(self=self)

View Code

重写了如下功能：

重写add方法：

def add(self, **kwargs):
        e = self.Entry(app=current_app, **kwargs)
        #这里应该判断是否有重复任务
        newtask_name=e.name
        old_entries = self.rdb.zrangebyscore(self.key, 0, MAXINT, withscores=True)
        flg=False
        last_run_at=0
        for task, score in old_entries:
            old_entrie=pickle.loads(task)
            if old_entrie.name==newtask_name:
                last_run_at=score
                flg=True
                break
        if flg:
            #有同名任务存在
            self.rdb.zrem(self.key, task)
        self.rdb.zadd(self.key, min(last_run_at,self._when(e, e.is_due()[1]) or 0), pickle.dumps(e))
        return e.name

View Code

重写remove方法

def remove(self, task_name):
        if not self.rdb.exists(self.key):
            logger.warn("key: {} not in rdb".format(self.key))
        self.rdb.hset(self.del_key,task_name,self.app.now())

View Code

重写tick方法，添加任务删除功能

def tick(self):
        if not self.rdb.exists(self.key):
            logger.warn("key: {} not in rdb".format(self.key))
            for e in values(self.schedule):
                self.rdb.zadd(self.key, self._when(e, e.is_due()[1]) or 0, pickle.dumps(e))

        tasks = self.rdb.zrangebyscore(
            self.key, 0,
            self.adjust(mktime(self.app.now().timetuple()), drift=0.010),
            withscores=True) or []

        next_times = [self.max_interval, ]
        for task, score in tasks:
            entry = pickle.loads(task)
            #每个任务重新调度会执行,这里可根据任务名称进行判断，添加删除功能
            if self.rdb.hexists(self.del_key,entry.name):
                self.rdb.zrem(self.key, task)#删除需要删除的任务
                self.rdb.hdel(self.del_key,entry.name)
                continue
            is_due, next_time_to_run = self.is_due(entry)

            next_times.append(next_time_to_run)
            if is_due:
                next_entry = self.reserve(entry)
                try:
                    linfo("add task entry: {} to publisher".format(entry.name))
                    result = self.apply_async(entry)#添加任务到worker队列
                except Exception as exc:
                    error('Message Error: %s
%s',
                          exc, traceback.format_stack(), exc_info=True)
                else:
                    debug('%s sent. id->%s', entry.task, result.id)
                self.rdb.zrem(self.key, task)#删除旧的任务
                self.rdb.zadd(self.key, self._when(next_entry, next_time_to_run) or 0, pickle.dumps(next_entry))#将旧任务重新计算时间后再添加

        next_task = self.rdb.zrangebyscore(self.key, 0, MAXINT, withscores=True, num=1, start=0)
        if not next_task:
            linfo("no next task found")
            return min(next_times)
        entry = pickle.loads(next_task[0][0])
        next_times.append(self.is_due(entry)[1])

        return min(next_times)

View Code