Linux下select调用的过程:
1.用户层应用程序调用select(),底层调用poll())
2.核心层调用sys_select() ------> do_select()
最终调用文件描述符fd对应的struct file类型变量的struct file_operations *f_op的poll函数。
poll指向的函数返回当前可否读写的信息。
1)如果当前可读写,返回读写信息。
2)如果当前不可读写,则阻塞进程,并等待驱动程序唤醒,重新调用poll函数,或超时返回。
3.驱动需要实现poll函数。
当驱动发现有数据可以读写时,通知核心层,核心层重新调用poll指向的函数查询信息。
poll_wait(filp,&wait_q,wait) // 此处将当前进程加入到等待队列中,但并不阻塞
在中断中使用wake_up_interruptible(&wait_q)唤醒等待队列
对select与非阻塞I/O实现的分析
咔咔,space改版后的第一篇文章,嘿嘿
--------------------------
使用非阻塞I/O的应用程序经常使用select,poll等系统调用,他们本质上都允许决定是否可以对一个或多个打开的文件做非阻塞的读取或写入,这些调用也会阻塞进程。
ldd3详细阐述了非阻塞I/O的实现方法,以及poll的数据结构,但是select是如何利用驱动程序中 f_op->poll相对应的方法来实现这种阻塞的呢?向老哥请教并查看了源码后,基本弄清了在对设备文件调用select之后,到底发生了什么。下面先简要介绍select系统调用及驱动中的相关实现,再说明两者之间的联系。
select的函数原型如下:
int select(int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds,
struct timeval *timeout);
用于等待fd集合中的对应的文件改变状态。注意timeout参数是timeval结构体而不是timespec,三个fd集合分别用于等待文件可读、可写、例外。对这些集合的操作非常方便,内核提供了以FD_开头的宏。第一个参数n应该等于三个集合中最大的fd值加1。timeout为0时,select立即返回不会阻塞,这在轮询(polling)时很有用;若要一直阻塞直到有fd可用,timeout应设为NULL。
select系统调用需要来自设备驱动程序的相应支持,也就是poll方法,它做两件事:
1. 在一个或多个可指示poll状态变化的等待队列上调用poll_wait;
2. 返回一个用来描述操作是否可以立即无阻塞执行的位掩码。
一个典型的poll方法的实现如下(摘自ldd3):
struct scull_pipe *dev = filp->private_data;
unsigned int mask = 0;
/*
* The buffer is circular; it is considered full
* if "wp" is right behind "rp" and empty if the
* two are equal.
*/
down(&dev->sem);
poll_wait(filp, &dev->inq, wait);
poll_wait(filp, &dev->outq, wait);
if (dev->rp != dev->wp)
mask |= POLLIN | POLLRDNORM; /* readable */
if (spacefree(dev))
mask |= POLLOUT | POLLWRNORM; /* writable */
up(&dev->sem);
return mask;
这段代码增加某设备的两个等待队列到poll_table中,然后根据数据的可读或可写状态设置相应的位掩码。当用户应用程序调用了select函数时,内核会调用由该系统调用引用的全部文件的poll方法,并向他们传递同一个poll_table。
select系统调用过程如下:
select <-> sys_select <-> do_select <-> *fop->poll
sys_select作一些准备工作和检查,比如检查传递进来的timeout参数,用rcu更新max_fdset的值,为in/out/ex分配bitmap并为fds赋值,然后调用do_select:
ret = do_select(n, &fds, &timeout);
进入do_select之后,首先初始化poll_wqueues类型的table,再将poll_table赋给wait,poll_table是构成实际数据结构的一个简单封装(可以查看linux/poll.h,这里不详述):
struct poll_wqueues table;
poll_table *wait;
poll_initwait(&table);
wait = &table.pt;
下面就是真正干活的代码了,这是一个for的无限循环,下面是核心代码:
for (j = 0; j < __NFDBITS; ++j, ++i, bit <<= 1) {
......
if (file) {
f_op = file->f_op;
mask = DEFAULT_POLLMASK;
if (f_op && f_op->poll)
mask = (*f_op->poll)(file, retval ? NULL : wait);
......
}
cond_resched();
}
现在终于知道f_op->poll中干的两件事是用来做什么的了,给mask赋值,是为了传递给do_select里的mask,而调用poll_wait就是为了加入设备的等待队列然后给cond_resched()用,如果没有一个被唤醒,那么cond_resched()就是立刻切换其他进程,用户空间select休眠(timeout非0时)。注意到poll方法的第二个参数有两种可能,这是为什么呢?先别急,等会看看retval是干嘛的就知道了。
代码中有两个地方可以跳出这个无限循环:
if (retval || !__timeout || signal_pending(current))
break;
if(table.error) {
retval = table.error;
break;
}
retval非零,timeout为0(即立刻跳出),休眠过程中收到信号以及出错。后面三个很好理解,第一个是怎么回事呢?我们来看看有关retval赋值的代码:
retval = max_select_fd(n, fds);
n = retval;
retval = 0;
n保存最大的文件描述符,retval在进入for无限循环前被置为0。通过比较相关的位,一旦发现可以进行I/O,retval的值就会加1,变成非零,这个时候(*f_op->poll)(file, retval ? NULL : wait)的第二个参数变成NULL,原因显而易见,因为内核知道此时不会发生任何等待,因此也不需要构造等待队列。另外,当timeout为0时,wait会被设为NULL,因此这种情况下即使retval为0,即没有可用I/O,poll的第二个参数还是NULL,系统不需要处理等待队列。跳出循环之后将进程状态设置为TASK_RUNNING,并对poll_table进行清空,最后将retval返回给sys_select做一些“善后”工作。
由于水平有限,暂时就说这么多,感兴趣的朋友可以去看ldd3哈,还有和源码,poll系统调用的实现和select差不多,恩。对了,如果觉得这种非阻塞的轮询实现缺乏时效性,可以考虑采用异步通知的方法,指定一个进程作为文件的属主(filp->f_owner),标志位增加FASYNC,具体看ldd3吧,我就不罗唆了。
哈哈,写完了,休息一下下~~ :)
--------------------------
使用非阻塞I/O的应用程序经常使用select,poll等系统调用,他们本质上都允许决定是否可以对一个或多个打开的文件做非阻塞的读取或写入,这些调用也会阻塞进程。
ldd3详细阐述了非阻塞I/O的实现方法,以及poll的数据结构,但是select是如何利用驱动程序中 f_op->poll相对应的方法来实现这种阻塞的呢?向老哥请教并查看了源码后,基本弄清了在对设备文件调用select之后,到底发生了什么。下面先简要介绍select系统调用及驱动中的相关实现,再说明两者之间的联系。
select的函数原型如下:
int select(int n, fd_set *readfds, fd_set *writefds, fd_set *exceptfds,
struct timeval *timeout);
用于等待fd集合中的对应的文件改变状态。注意timeout参数是timeval结构体而不是timespec,三个fd集合分别用于等待文件可读、可写、例外。对这些集合的操作非常方便,内核提供了以FD_开头的宏。第一个参数n应该等于三个集合中最大的fd值加1。timeout为0时,select立即返回不会阻塞,这在轮询(polling)时很有用;若要一直阻塞直到有fd可用,timeout应设为NULL。
select系统调用需要来自设备驱动程序的相应支持,也就是poll方法,它做两件事:
1. 在一个或多个可指示poll状态变化的等待队列上调用poll_wait;
2. 返回一个用来描述操作是否可以立即无阻塞执行的位掩码。
一个典型的poll方法的实现如下(摘自ldd3):
struct scull_pipe *dev = filp->private_data;
unsigned int mask = 0;
/*
* The buffer is circular; it is considered full
* if "wp" is right behind "rp" and empty if the
* two are equal.
*/
down(&dev->sem);
poll_wait(filp, &dev->inq, wait);
poll_wait(filp, &dev->outq, wait);
if (dev->rp != dev->wp)
mask |= POLLIN | POLLRDNORM; /* readable */
if (spacefree(dev))
mask |= POLLOUT | POLLWRNORM; /* writable */
up(&dev->sem);
return mask;
这段代码增加某设备的两个等待队列到poll_table中,然后根据数据的可读或可写状态设置相应的位掩码。当用户应用程序调用了select函数时,内核会调用由该系统调用引用的全部文件的poll方法,并向他们传递同一个poll_table。
select系统调用过程如下:
select <-> sys_select <-> do_select <-> *fop->poll
sys_select作一些准备工作和检查,比如检查传递进来的timeout参数,用rcu更新max_fdset的值,为in/out/ex分配bitmap并为fds赋值,然后调用do_select:
ret = do_select(n, &fds, &timeout);
进入do_select之后,首先初始化poll_wqueues类型的table,再将poll_table赋给wait,poll_table是构成实际数据结构的一个简单封装(可以查看linux/poll.h,这里不详述):
struct poll_wqueues table;
poll_table *wait;
poll_initwait(&table);
wait = &table.pt;
下面就是真正干活的代码了,这是一个for的无限循环,下面是核心代码:
for (j = 0; j < __NFDBITS; ++j, ++i, bit <<= 1) {
......
if (file) {
f_op = file->f_op;
mask = DEFAULT_POLLMASK;
if (f_op && f_op->poll)
mask = (*f_op->poll)(file, retval ? NULL : wait);
......
}
cond_resched();
}
现在终于知道f_op->poll中干的两件事是用来做什么的了,给mask赋值,是为了传递给do_select里的mask,而调用poll_wait就是为了加入设备的等待队列然后给cond_resched()用,如果没有一个被唤醒,那么cond_resched()就是立刻切换其他进程,用户空间select休眠(timeout非0时)。注意到poll方法的第二个参数有两种可能,这是为什么呢?先别急,等会看看retval是干嘛的就知道了。
代码中有两个地方可以跳出这个无限循环:
if (retval || !__timeout || signal_pending(current))
break;
if(table.error) {
retval = table.error;
break;
}
retval非零,timeout为0(即立刻跳出),休眠过程中收到信号以及出错。后面三个很好理解,第一个是怎么回事呢?我们来看看有关retval赋值的代码:
retval = max_select_fd(n, fds);
n = retval;
retval = 0;
n保存最大的文件描述符,retval在进入for无限循环前被置为0。通过比较相关的位,一旦发现可以进行I/O,retval的值就会加1,变成非零,这个时候(*f_op->poll)(file, retval ? NULL : wait)的第二个参数变成NULL,原因显而易见,因为内核知道此时不会发生任何等待,因此也不需要构造等待队列。另外,当timeout为0时,wait会被设为NULL,因此这种情况下即使retval为0,即没有可用I/O,poll的第二个参数还是NULL,系统不需要处理等待队列。跳出循环之后将进程状态设置为TASK_RUNNING,并对poll_table进行清空,最后将retval返回给sys_select做一些“善后”工作。
由于水平有限,暂时就说这么多,感兴趣的朋友可以去看ldd3哈,还有
哈哈,写完了,休息一下下~~ :)