libco源码解析---poll

引言

　　poll是libco中所有hook后的函数中可以说是最重要的一个，因为我们不但可以这个函数来隐式的转移CPU执行权，而且其他hook后的函数还可以使用这个hook后的poll在不切换线程的情况下去监听套接字，并在超时或者套接字有事件到来的时候唤醒这个调用poll的协程。

　　在example_cond.cpp中我们也可以看到使用poll去切换执行权的操作，也正因为此，我们才得以完成使用一个线程去完成一个完整的生产者消费者模型。

正文

libco中hook技术的作用是使用自己的函数去替换库函数就可以了。我们先来看看hook后的poll函数的实现：

 1 typedef int (*poll_pfn_t)(struct pollfd fds[], nfds_t nfds, int timeout);
 2 static poll_pfn_t g_sys_poll_func         = (poll_pfn_t)dlsym(RTLD_NEXT,"poll");
 3 
 4 // 在hook以后的poll中应该执行协程的调度
 5 int poll(struct pollfd fds[], nfds_t nfds, int timeout)
 6 { 
 7     HOOK_SYS_FUNC( poll );
 8 
 9     // 如果本线程不存在协程或者超时时间为零的话调用hook前的poll
10     if (!co_is_enable_sys_hook() || timeout == 0) {
11         return g_sys_poll_func(fds, nfds, timeout);
12     }
13 
14     pollfd *fds_merge = NULL;
15     nfds_t nfds_merge = 0; // 相当于一个单调递增的标志位
16     std::map<int, int> m;  // fd --> idx
17     std::map<int, int>::iterator it;
18     if (nfds > 1) {
19         fds_merge = (pollfd *)malloc(sizeof(pollfd) * nfds);
20         for (size_t i = 0; i < nfds; i++) {
21             if ((it = m.find(fds[i].fd)) == m.end()) { // 在mp中没有找到
22                 fds_merge[nfds_merge] = fds[i]; // 放入merge链表
23                 m[fds[i].fd] = nfds_merge; // 没找到就放进去
24                 nfds_merge++; // 游标递增
25             } else {
26                 int j = it->second;
27                 fds_merge[j].events |= fds[i].events;  // merge in j slot
28             }
29         } 
30     } 
31     // 以上就相当于是一个小优化,就是查看此次poll中是否有fd相同的事件,有的话合并一下,仅此而已
32 
33     int ret = 0; 
34     if (nfds_merge == nfds || nfds == 1) {// 没有执行合并
35         // fds为poll的事件;nfds为事件数;timeout为超时时间;g_sys_poll_func为未hook的poll函数
36         // 返回值为此次就绪的事件数 
37         // 在co_poll_inner中有一个协程的切换
38         ret = co_poll_inner(co_get_epoll_ct(), fds, nfds, timeout, g_sys_poll_func);
39     } else {
40         ret = co_poll_inner(co_get_epoll_ct(), fds_merge, nfds_merge, timeout,
41                 g_sys_poll_func);
42         if (ret > 0) {
43             // 把merge的事件还原一下
44             for (size_t i = 0; i < nfds; i++) {
45                 it = m.find(fds[i].fd);
46                 if (it != m.end()) {
47                     int j = it->second;
48                     fds[i].revents = fds_merge[j].revents & fds[i].events;
49                 }
50             }
51         }
52     }
53     free(fds_merge);
54     return ret;
55 }

　　其实hook后的poll函数最重要的一步就是调用了co_poll_inner，其他的只不过是一些检查罢了。co_is_enable_sys_hook函数其实就是获取当前线程正在执行的协程，并查看其cEnableSysHook，cEnableSysHook在我们的函数中执行co_enable_hook_sys时设置为1。你可能会问，如果没有执行cEnableSysHook的话根本就不会使用hook后的poll啊，因为这个文件没有被链接进入项目，那么想想看两个函数，一个有cEnableSysHook，一个没有，没有的那个我们显然不希望使用hook后的函数。这也是这段检查的目的所在。

　　这里还蕴藏着一点，就是co_is_enable_sys_hook中判断co是否为空，而GetCurrThreadCo会在当前env没有被初始化的时候返回空。GetCurrThreadCo为什么不在判断为空时创建一个呢？因为在函数中可能主协程去运行一个带有cEnableSysHook的函数，这个时候我们显然不希望执行hook后的poll。具体这种情况可参见example_poll.cpp。

 1 bool co_is_enable_sys_hook()
 2 {    
 3     // co_enable_sys_hook 会把cEnableSysHook设置成1
 4     stCoRoutine_t *co = GetCurrThreadCo();
 5     return ( co && co->cEnableSysHook );
 6 }
 7 
 8 stCoRoutine_t *GetCurrThreadCo( ) 
 9 {
10     stCoRoutineEnv_t *env = co_get_curr_thread_env();
11     // 为什么返回0而不就地初始化呢?看似简单的一笔,与example_poll相关
12     if( !env ) return 0;    
13     return GetCurrCo(env);
14 }

　　注意一点，就是所有经由hook后的socket创建的套接字都是非阻塞的，可能用户想要创建一个阻塞的，但是在libco看来它们都是非阻塞的，而显示给用户的时候还是阻塞的。所以在timeout为0的时候直接执行原poll就可以了，因为非阻塞，这里也不会发生线程的切换，始终在一个线程内运行。

　　接下来就是合并传入的poll事件，至于合并，也就是把不同项但是同一fd的各个poll的项和起来，进行了小小的优化，仅此而已。当然在执行完co_poll_inner之后还需要把合并后的事件再展开，使得整个过程对于用户而言是无感知的。

co_poll_inner函数

　　接下来看看co_poll_inner函数的实现，这个还是比较麻烦的，其中涉及到了协程的切换，其实也就是这个正在执行的协程让出自己的执行权给调用它的哪一个协程，从这里也可以看出libco是一个典型的非对称协程。

  1 int co_poll_inner( stCoEpoll_t *ctx,struct pollfd fds[], nfds_t nfds, int timeout, poll_pfn_t pollfunc)
  2 {
  3     // 超时时间为零 直接执行系统调用 感觉这直接在hook的poll中判断就好了
  4     if (timeout == 0) 
  5     {
  6         return pollfunc(fds, nfds, timeout);
  7     }
  8     if (timeout < 0) // 搞不懂这是什么意思,小于零就看做无限阻塞?
  9     {
 10         timeout = INT_MAX;
 11     }
 12     // epoll fd
 13     int epfd = ctx->iEpollFd;
 14     // 获取当前线程正在运行的协程
 15     stCoRoutine_t* self = co_self();
 16 
 17     //1.struct change
 18     // 一定要把这stPoll_t, stPollItem_t之间的关系看清楚
 19     stPoll_t& arg = *((stPoll_t*)malloc(sizeof(stPoll_t)));
 20     // 指针的初始化,非常关键,不加的话在addtail的条件判断中会出现问题
 21     memset( &arg,0,sizeof(arg) );
 22 
 23     arg.iEpollFd = epfd;
 24     arg.fds = (pollfd*)calloc(nfds, sizeof(pollfd));
 25     arg.nfds = nfds;
 26 
 27     // 一个小优化 数据量少的时候少一次系统调用
 28     stPollItem_t arr[2];
 29     if( nfds < sizeof(arr) / sizeof(arr[0]) && !self->cIsShareStack)
 30     {
 31         // 如果poll中监听的描述符只有1个或者0个， 并且目前的不是共享栈模型
 32         arg.pPollItems = arr;
 33     }    
 34     else
 35     {
 36         arg.pPollItems = (stPollItem_t*)malloc( nfds * sizeof( stPollItem_t ) );
 37     }
 38     memset( arg.pPollItems,0,nfds * sizeof(stPollItem_t) );
 39 
 40     // 在eventloop中调用的处理函数,功能是唤醒pArg中的协程,也就是这个调用poll的协程
 41     arg.pfnProcess = OnPollProcessEvent;  
 42     arg.pArg = GetCurrCo( co_get_curr_thread_env());
 43     
 44     
 45     //2. add epoll
 46     for(nfds_t i=0;i<nfds;i++)
 47     {
 48         arg.pPollItems[i].pSelf = arg.fds + i; // 第i个poll事件
 49         arg.pPollItems[i].pPoll = &arg;
 50 
 51         // 设置一个预处理回调 这个回调做的事情是把此事件从超时队列转到就绪队列
 52         arg.pPollItems[i].pfnPrepare = OnPollPreparePfn;
 53         // ev是arg.pPollItems[i].stEvent的一个引用,这里就相当于是缩写了
 54 
 55         // epoll_event 就是epoll需要的事件类型
 56         // 这个结构直接插在红黑树中,时间到来或超时我们可以拿到其中的data
 57         // 一般我用的时候枚举中只使用fd,这里使用了一个指针
 58         struct epoll_event &ev = arg.pPollItems[i].stEvent;
 59 
 60         if( fds[i].fd > -1 ) // fd有效
 61         {
 62             ev.data.ptr = arg.pPollItems + i;
 63             ev.events = PollEvent2Epoll( fds[i].events );
 64 
 65             // 把事件加入poll中的事件进行封装以后加入epoll
 66             int ret = co_epoll_ctl( epfd,EPOLL_CTL_ADD, fds[i].fd, &ev );
 67             if (ret < 0 && errno == EPERM && nfds == 1 && pollfunc != NULL)
 68             { //加入epoll失败 且nfds只有一个
 69                 if( arg.pPollItems != arr )
 70                 {
 71                     free( arg.pPollItems );
 72                     arg.pPollItems = NULL;
 73                 }
 74                 free(arg.fds);
 75                 free(&arg);
 76                 return pollfunc(fds, nfds, timeout);
 77             }
 78         }
 79         //if fail,the timeout would work
 80     }
 81 
 82     //3.add timeout
 83 
 84     // 获取当前时间
 85     unsigned long long now = GetTickMS();
 86 
 87     // 超时时间
 88     arg.ullExpireTime = now + timeout;
 89     
 90     // 添加到超时链表中 
 91     int ret = AddTimeout( ctx->pTimeout,&arg,now );
 92     int iRaiseCnt = 0;
 93 
 94     // 正常返回return 0
 95     if( ret != 0 )
 96     {
 97         co_log_err("CO_ERR: AddTimeout ret %d now %lld timeout %d arg.ullExpireTime %lld",
 98                 ret,now,timeout,arg.ullExpireTime);
 99         errno = EINVAL;
100         iRaiseCnt = -1;
101 
102     }
103     else
104     {
105         // 让出CPU, 切换到其他协程, 当事件到来的时候就会调用callback,那里会唤醒此协程
106         co_yield_env( co_get_curr_thread_env() );
107 
108         // --------------我是分割线---------------
109         // 在预处理中执行+1, 也就是此次阻塞等待的事件中有几个是实际发生了
110         iRaiseCnt = arg.iRaiseCnt;
111     }
112 
113     {
114         // clear epoll status and memory
115         // 将该项从时间轮中删除
116         RemoveFromLink<stTimeoutItem_t,stTimeoutItemLink_t>( &arg );
117         // 将此次poll中涉及到的时间全部从epoll中删除 
118         // 这意味着有一些事件没有发生就被终止了 
119         // 比如poll中3个事件,实际触发了两个,最后一个在这里就被移出epoll了
120         for(nfds_t i = 0;i < nfds;i++)
121         {
122             int fd = fds[i].fd;
123             if( fd > -1 )
124             {
125                 co_epoll_ctl( epfd,EPOLL_CTL_DEL,fd,&arg.pPollItems[i].stEvent );
126             }
127             fds[i].revents = arg.fds[i].revents;
128         }
129 
130 
131         // 释放内存 当然使用智能指针就没这事了
132         if( arg.pPollItems != arr )
133         {
134             free( arg.pPollItems );
135             arg.pPollItems = NULL;
136         }
137 
138         free(arg.fds);
139         free(&arg);
140     }
141     // 返回此次就绪或者超时的事件
142     return iRaiseCnt;
143 }

libco中本来的注释把这个函数分为三个部分：

struct change：把poll的结构改为epoll的结构。
add epoll：把改变后的结构加入epoll。
add timeout：把这个事件加入超时链表。这里面涉及到了stPoll_t，stPollItem_t，stTimeoutItem_t，三个结构的转化，前两者都继承于stTimeoutItem_t。搞清楚三个结构的转换是理解这个函数的关键之处。总的来说stPoll_t是一个单独的事件，可以放入到时间轮中，其中包含着stPollItem_t。每一个stPollItem_t是一个poll中的事件，都在转化为epoll事件后插入到epoll中。stTimeoutItem_t是前两者的基类，一般用于函数接口，使得可以接收上面两种参数，这里配套了一些基于模板的链表的操作。

自己对stPoll_t，stPollItem_t，stTimeoutItem_t的一些理解：

　　stPoll_t中当前协程的所有文件描述符的所有事件都是以pollfd类型存储的，存储在struct pollfd *fds数组中，而stPollItem_t会将fds数组中的每一文件描述符和对应的事件重新封装成一个stPollItem_t，将其作为epoll监控事件epoll_event结构体变量的参数；stTimeoutItem_t是stPollItem_t和stPoll_t的基类，目的就是可以使用stTimeoutItem_t类型指针操作stPollItem_t和stPoll_t对象；stPollItem_t中包含着一个文件描述监听的事件pollfd类型变量转化为epoll_event的结果。

struct change

stPoll_t结构：

 1 struct stPoll_t : public stTimeoutItem_t 
 2 {
 3     struct pollfd *fds; // 描述poll中的事件
 4     nfds_t nfds; // typedef unsigned long int nfds_t;
 5 
 6     stPollItem_t *pPollItems; // 要加入epoll的事件 长度为nfds
 7 
 8     int iAllEventDetach; // 标识是否已经处理过了这个对象了
 9 
10     int iEpollFd; // epoll fd
11 
12     int iRaiseCnt; // 此次触发的事件数
13 };
14 
15 struct stPollItem_t : public stTimeoutItem_t
16 {
17     struct pollfd *pSelf;// 对应的poll结构
18     stPoll_t *pPoll;    // 所属的stPoll_t
19 
20     struct epoll_event stEvent;    // poll结构所转换的epoll结构
21 };

　　在第一部分设置了一个回调OnPollProcessEvent，它的作用是epoll中检测到事件超时或者事件就绪的时候执行的一个回调的，其实也就是执行了co_resume，从这里我们可以看到执行协程切换我们实际上只需要一个co结构而已。

1 void OnPollProcessEvent( stTimeoutItem_t * ap )
2 {
3     stCoRoutine_t *co = (stCoRoutine_t*)ap->pArg;
4     co_resume( co );
5 }

add epoll

　　设置了一个预处理回调，算上前面那个回调，它们两个都是在eventloop中被使用。

 1 void OnPollPreparePfn( stTimeoutItem_t * ap,struct epoll_event &e,stTimeoutItemLink_t *active )
 2 {
 3     stPollItem_t *lp = (stPollItem_t *)ap;
 4     // 把epoll此次触发的事件转换成poll中的事件
 5     lp->pSelf->revents = EpollEvent2Poll( e.events );
 6 
 7 
 8     stPoll_t *pPoll = lp->pPoll;
 9     // 已经触发的事件数加一
10     pPoll->iRaiseCnt++;
11 
12     // 若此事件还未被触发过
13     if( !pPoll->iAllEventDetach )
14     {
15         // 设置已经被触发的标志
16         pPoll->iAllEventDetach = 1;
17 
18         // 将该事件从时间轮中移除
19         // 因为事件已经触发了，肯定不能再超时了
20         RemoveFromLink<stTimeoutItem_t,stTimeoutItemLink_t>( pPoll );
21 
22         // 将该事件添加到active列表中
23         AddTail( active,pPoll );
24     }
25 }

add timeout

　　上一部分中已经把所有poll中的事件转化成epoll事件，并插入到epoll中了。并且给每一个poll事件分配了一个stPollItem_t结构，这些stPollItem_t都是属于结构为stPoll_t的arg的，时间轮的链表中存的实际是stPoll_t。如何把一个stPoll_t插入一个时间轮：

 1 /*
 2 * 将事件添加到定时器中
 3 * @param apTimeout - (ref) 超时管理器
 4 * @param apItem    - (in) 即将插入的超时事件
 5 * @param allNow    - (in) 当前时间
 6 */
 7 int AddTimeout( stTimeout_t *apTimeout,stTimeoutItem_t *apItem ,unsigned long long allNow )
 8 {
 9     // 当前时间管理器的最早超时时间
10     if( apTimeout->ullStart == 0 )
11     {
12         // 设置时间轮的最早时间是当前时间
13         apTimeout->ullStart = allNow;
14         // 设置最早时间对应的index 为 0
15         apTimeout->llStartIdx = 0;
16     }
17     // 插入时间小于初始时间肯定是错的
18     if( allNow < apTimeout->ullStart )
19     {
20         co_log_err("CO_ERR: AddTimeout line %d allNow %llu apTimeout->ullStart %llu",
21                     __LINE__,allNow,apTimeout->ullStart);
22 
23         return __LINE__;
24     }
25     // 预期时间小于插入时间也是有问题的
26     if( apItem->ullExpireTime < allNow )
27     {
28         co_log_err("CO_ERR: AddTimeout line %d apItem->ullExpireTime %llu allNow %llu apTimeout->ullStart %llu",
29                     __LINE__,apItem->ullExpireTime,allNow,apTimeout->ullStart);
30 
31         return __LINE__;
32     }
33     // 计算事件还有多长时间会超时
34     unsigned long long diff = apItem->ullExpireTime - apTimeout->ullStart; 
35 
36     // 预期时间到现在不能超过时间轮的大小
37     // 其实是可以的，只需要取余放进去并加上一个圈数的成员就可以了
38     // 遍历时圈数不为零就说明实际超时时间还有一个时间轮的长度，
39     // 遍历完一项以后圈数不为零就减1即可
40     if( diff >= (unsigned long long)apTimeout->iItemSize )
41     {
42         diff = apTimeout->iItemSize - 1;
43         co_log_err("CO_ERR: AddTimeout line %d diff %d",
44                     __LINE__,diff);
45 
46         //return __LINE__;
47     }
48     // 时间轮粒度为1毫秒，即一项代表一毫秒，说实话精度确实算是比较高了，我以前写的是秒。不过毫秒必然会有很多项是空闲的吧。
49     AddTail( apTimeout->pItems + ( apTimeout->llStartIdx + diff ) % apTimeout->iItemSize , apItem );
50 
51     return 0;
52 }

　　AddTail实际执行了把stPoll_t插入到时间轮中，使用的是基类指针指向派生类对象，基类是stTimeoutItem_t，派生类是stPoll_t，stPollItem_t类型是作为epoll监听参数使用的。我们可以看到在把时间加入到时间轮中成功以后会调用co_yield_env，这个函数会使得当前协程让出CPU，把执行权交给调用此协程的协程。想想其实是非常合理的，已经把所有的事件加入到epoll了，这个函数也没有什么执行的必要了，静静等待事件完成或超时就可以了。

 1 void co_yield_env( stCoRoutineEnv_t *env )
 2 {
 3     
 4     stCoRoutine_t *last = env->pCallStack[ env->iCallStackSize - 2 ]; // 要切换的协程
 5     stCoRoutine_t *curr = env->pCallStack[ env->iCallStackSize - 1 ]; // 即当前正在执行的协程
 6 
 7     env->iCallStackSize--;
 8 
 9     co_swap( curr, last);
10 }

　　可以看到其实就是在线程独有的调用栈中拿最新的两个协程，正在执行的协程和调用正在执行的协程的协程，然后把它们的上下文切换，即切换协程。然后就是等待协程被切换回来了。

被切换回来以后可能只有一部分事件被触发，这个时候libco的做法是把没有被触发的全部移出epoll，这样避免了协程已经被epoll 中的回调调用，后面仍会触发，并执行回调，就core dump了。然后就是一般的资源释放啦。

转载：

https://blog.csdn.net/weixin_43705457/article/details/106889805

本文来自博客园，作者：Mr-xxx，转载请注明原文链接：https://www.cnblogs.com/MrLiuZF/p/15046868.html