epoll - I/O event notification facility
在linux的網絡編程中,非常長的時間都在使用select來做事件觸發。在linux新的內核中,有了一種替換它的機制,就是epoll。
相比于select,epoll最大的優點在于它不會隨著監聽fd數目的增長而減少效率。由于在內核中的select實現中,它是採用輪詢來處理的,輪詢的fd數目越多,自然耗時越多。而且,在linux/posix_types.h頭文件有這種聲明:
#define __FD_SETSIZE??? 1024
表示select最多同一時候監聽1024個fd,當然,能夠通過改動頭文件再重編譯內核來擴大這個數目,但這似乎并不治本。
epoll的接口非常easy,一共就三個函數:
1. int epoll_create(int size);
創建一個epoll的句柄,size用來告訴內核這個監聽的數目一共同擁有多大。這個參數不同于select()中的第一個參數,給出最大監聽的fd+1的值。須要注意的是,當創建好epoll句柄后,它就是會占用一個fd值,在linux下假設查看/proc/進程id/fd/,是能夠看到這個fd的,所以在使用完epoll后,必須調用close()關閉,否則可能導致fd被耗盡。
2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注冊函數,它不同與select()是在監聽事件時告訴內核要監聽什么類型的事件,而是在這里先注冊要監聽的事件類型。第一個參數是epoll_create()的返回值,第二個參數表示動作,用三個宏來表示:
EPOLL_CTL_ADD:注冊新的fd到epfd中;
EPOLL_CTL_MOD:改動已經注冊的fd的監聽事件;
EPOLL_CTL_DEL:從epfd中刪除一個fd;
第三個參數是須要監聽的fd,第四個參數是告訴內核須要監聽什么事,struct epoll_event結構例如以下:
typedef union epoll_data {
?? ?void *ptr;
?? ?int fd;
?? ?__uint32_t u32;
?? ?__uint64_t u64;
} epoll_data_t;
struct epoll_event {
?? ?__uint32_t events; /* Epoll events */
?? ?epoll_data_t data; /* User data variable */
};
events能夠是以下幾個宏的集合:
EPOLLIN :表示相應的文件描寫敘述符能夠讀(包含對端SOCKET正常關閉);
EPOLLOUT:表示相應的文件描寫敘述符能夠寫;
EPOLLPRI:表示相應的文件描寫敘述符有緊急的數據可讀(這里應該表示有帶外數據到來);
EPOLLERR:表示相應的文件描寫敘述符錯誤發生;
EPOLLHUP:表示相應的文件描寫敘述符被掛斷;
EPOLLET: 將EPOLL設為邊緣觸發(Edge Triggered)模式,這是相對于水平觸發(Level Triggered)來說的。
EPOLLONESHOT:僅僅監聽一次事件,當監聽完這次事件之后,假設還須要繼續監聽這個socket的話,須要再次把這個socket加入到EPOLL隊列里
3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的產生,相似于select()調用。參數events用來從內核得到事件的集合,maxevents告之內核這個events有多大,這個 maxevents的值不能大于創建epoll_create()時的size,參數timeout是超時時間(毫秒,0會立即返回,-1將不確定,也有說法說是永久堵塞)。該函數返回須要處理的事件數目,如返回0表示已超時。
4、關于ET、LT兩種工作模式:
能夠得出這種結論:
ET模式僅當狀態發生變化的時候才獲得通知,這里所謂的狀態的變化并不包含緩沖區中還有未處理的數據,也就是說,假設要採用ET模式,須要一直read/write直到出錯為止,非常多人反映為什么採用ET模式僅僅接收了一部分數據就再也得不到通知了,大多由于這樣;而LT模式是僅僅要有數據沒有處理就會一直通知下去的.
那么到底怎樣來使用epoll呢?事實上非常easy。
通過在包含一個頭文件#include <sys/epoll.h> 以及幾個簡單的API將能夠大大的提高你的網絡server的支持人數。
首先通過create_epoll(int maxfds)來創建一個epoll的句柄,當中maxfds為你epoll所支持的最大句柄數。這個函數會返回一個新的epoll句柄,之后的全部操作將通過這個句柄來進行操作。在用完之后,記得用close()來關閉這個創建出來的epoll句柄。
之后在你的網絡主循環里面,每一幀的調用epoll_wait(int epfd, epoll_event events, int max events, int timeout)來查詢全部的網絡接口,看哪一個能夠讀,哪一個能夠寫了。主要的語法為:
nfds = epoll_wait(kdpfd, events, maxevents, -1);
當中kdpfd為用epoll_create創建之后的句柄,events是一個epoll_event*的指針,當epoll_wait這個函數操作成功之后,epoll_events里面將儲存全部的讀寫事件。max_events是當前須要監聽的全部socket句柄數。最后一個timeout是 epoll_wait的超時,為0的時候表示立即返回,為-1的時候表示一直等下去,直到有事件范圍,為隨意正整數的時候表示等這么長的時間,假設一直沒有事件,則范圍。一般假設網絡主循環是單獨的線程的話,能夠用-1來等,這樣能夠保證一些效率,假設是和主邏輯在同一個線程的話,則能夠用0來保證主循環的效率。
epoll_wait范圍之后應該是一個循環,遍利全部的事件。
差點兒全部的epoll程序都使用以下的框架:
?? ?for( ; ; )
?? ?{
?? ??? ?nfds = epoll_wait(epfd,events,20,500);
?? ??? ?for(i=0;i<nfds;++i)
?? ??? ?{
?? ??? ??? ?if(events[i].data.fd==listenfd) //有新的連接
?? ??? ??? ?{
?? ??? ??? ??? ?connfd = accept(listenfd,(sockaddr *)&clientaddr, &clilen); //accept這個連接
?? ??? ??? ??? ?ev.data.fd=connfd;
?? ??? ??? ??? ?ev.events=EPOLLIN|EPOLLET;
?? ??? ??? ??? ?epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev); //將新的fd加入到epoll的監聽隊列中
?? ??? ??? ?}
?? ??? ??? ?else if( events[i].events&EPOLLIN ) //接收到數據,讀socket
?? ??? ??? ?{
?? ??? ??? ??? ?n = read(sockfd, line, MAXLINE)) < 0?? ?//讀
?? ??? ??? ??? ?ev.data.ptr = md; ?? ?//md為自己定義類型,加入數據
?? ??? ??? ??? ?ev.events=EPOLLOUT|EPOLLET;
?? ??? ??? ??? ?epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);//改動標識符,等待下一個循環時發送數據,異步處理的精髓
?? ??? ??? ?}
?? ??? ??? ?else if(events[i].events&EPOLLOUT) //有數據待發送,寫socket
?? ??? ??? ?{
?? ??? ??? ??? ?struct myepoll_data* md = (myepoll_data*)events[i].data.ptr;?? ?//取數據
?? ??? ??? ??? ?sockfd = md->fd;
?? ??? ??? ??? ?send( sockfd, md->ptr, strlen((char*)md->ptr), 0 );?? ??? ?//發送數據
?? ??? ??? ??? ?ev.data.fd=sockfd;
?? ??? ??? ??? ?ev.events=EPOLLIN|EPOLLET;
?? ??? ??? ??? ?epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); //改動標識符,等待下一個循環時接收數據
?? ??? ??? ?}
?? ??? ??? ?else
?? ??? ??? ?{
?? ??? ??? ??? ?//其它的處理
?? ??? ??? ?}
?? ??? ?}
?? ?}
以下給出一個完整的server端樣例:
#
include
<
iostream
>
#
include
<
sys
/
socket
.
h
>
#
include
<
sys
/
epoll
.
h
>
#
include
<
netinet
/
in
.
h
>
#
include
<
arpa
/
inet
.
h
>
#
include
<
fcntl
.
h
>
#
include
<
unistd
.
h
>
#
include
<
stdio
.
h
>
#
include
<
errno
.
h
>
using
namespace
std
;
#
define
MAXLINE 5
#
define
OPEN_MAX 100
#
define
LISTENQ 20
#
define
SERV_PORT 5000
#
define
INFTIM 1000
void
setnonblocking
(
int
sock
)
{
????
int
opts
;
????opts
=
fcntl
(
sock
,
F_GETFL
)
;
????
if
(
opts
<
0
)
????
{
????????
perror
(
"fcntl(sock,GETFL)"
)
;
????????
exit
(
1
)
;
????
}
????opts
=
opts
|
O_NONBLOCK
;
????
if
(
fcntl
(
sock
,
F_SETFL
,
opts
)
<
0
)
????
{
????????
perror
(
"fcntl(sock,SETFL,opts)"
)
;
????????
exit
(
1
)
;
????
}
}
int
main
(
int
argc
,
char
*
argv
[
]
)
{
????
int
i
,
maxi
,
listenfd
,
connfd
,
sockfd
,
epfd
,
nfds
,
portnumber
;
????ssize_t n
;
????
char
line
[
MAXLINE
]
;
????
socklen_t
clilen
;
????
if
(
2
=
=
argc
)
????
{
????????
if
(
(
portnumber
=
atoi
(
argv
[
1
]
)
)
<
0
)
????????
{
????????????
fprintf
(
stderr
,
"Usage:%s portnumber/a/n"
,
argv
[
0
]
)
;
????????????
return
1
;
????????
}
????
}
????
else
????
{
????????
fprintf
(
stderr
,
"Usage:%s portnumber/a/n"
,
argv
[
0
]
)
;
????????
return
1
;
????
}
????
//聲明epoll_event結構體的變量,ev用于注冊事件,數組用于回傳要處理的事件
????
struct
epoll_event ev
,
events
[
20
]
;
????
//生成用于處理accept的epoll專用的文件描寫敘述符
????epfd
=
epoll_create
(
256
)
;
????
struct
sockaddr_in
clientaddr
;
????
struct
sockaddr_in
serveraddr
;
????listenfd
=
socket
(
AF_INET
,
SOCK_STREAM
,
0
)
;
????
//把socket設置為非堵塞方式
????
//setnonblocking(listenfd);
????
//設置與要處理的事件相關的文件描寫敘述符
????ev
.
data
.
fd
=
listenfd
;
????
//設置要處理的事件類型
????ev
.
events
=
EPOLLIN
|
EPOLLET
;
????
//ev.events=EPOLLIN;
????
//注冊epoll事件
????epoll_ctl
(
epfd
,
EPOLL_CTL_ADD
,
listenfd
,
&
ev
)
;
????bzero
(
&
serveraddr
,
sizeof
(
serveraddr
)
)
;
????serveraddr
.
sin_family
=
AF_INET
;
????
char
*
local_addr
=
"127.0.0.1"
;
????inet_aton
(
local_addr
,
&
(
serveraddr
.
sin_addr
)
)
;
//htons(portnumber);
????serveraddr
.
sin_port
=
htons
(
portnumber
)
;
????
bind
(
listenfd
,
(
sockaddr
*
)
&
serveraddr
,
sizeof
(
serveraddr
)
)
;
????
listen
(
listenfd
,
LISTENQ
)
;
????maxi
=
0
;
????
for
(
;
;
)
{
????????
//等待epoll事件的發生
????????nfds
=
epoll_wait
(
epfd
,
events
,
20
,
500
)
;
????????
//處理所發生的全部事件
????????
for
(
i
=
0
;
i
<
nfds
;
+
+
i
)
????????
{
????????????
if
(
events
[
i
]
.
data
.
fd
=
=
listenfd
)
//假設新監測到一個SOCKET用戶連接到了綁定的SOCKET端口,建立新的連接。
????????????
{
????????????????connfd
=
accept
(
listenfd
,
(
sockaddr
*
)
&
clientaddr
,
&
clilen
)
;
????????????????
if
(
connfd
<
0
)
{
????????????????????
perror
(
"connfd<0"
)
;
????????????????????
exit
(
1
)
;
????????????????
}
????????????????
//setnonblocking(connfd);
????????????????
char
*
str
=
inet_ntoa
(
clientaddr
.
sin_addr
)
;
????????????????
cout
<
<
"accapt a connection from "
<
<
str
<
<
endl
;
????????????????
//設置用于讀操作的文件描寫敘述符
????????????????ev
.
data
.
fd
=
connfd
;
????????????????
//設置用于注測的讀操作事件
????????????????ev
.
events
=
EPOLLIN
|
EPOLLET
;
????????????????
//ev.events=EPOLLIN;
????????????????
//注冊ev
????????????????epoll_ctl
(
epfd
,
EPOLL_CTL_ADD
,
connfd
,
&
ev
)
;
????????????
}
????????????
else
if
(
events
[
i
]
.
events
&
EPOLLIN
)
//假設是已經連接的用戶,而且收到數據,那么進行讀入。
????????????
{
????????????????
cout
<
<
"EPOLLIN"
<
<
endl
;
????????????????
if
(
(
sockfd
=
events
[
i
]
.
data
.
fd
)
<
0
)
????????????????????
continue
;
????????????????
if
(
(
n
=
read
(
sockfd
,
line
,
MAXLINE
)
)
<
0
)
{
????????????????????
if
(
errno
=
=
ECONNRESET
)
{
????????????????????????
close
(
sockfd
)
;
????????????????????????events
[
i
]
.
data
.
fd
=
-
1
;
????????????????????
}
else
????????????????????????
std
:
:
cout
<
<
"readline error"
<
<
std
:
:
endl
;
????????????????
}
else
if
(
n
=
=
0
)
{
????????????????????
close
(
sockfd
)
;
????????????????????events
[
i
]
.
data
.
fd
=
-
1
;
????????????????
}
????????????????
line
[
n
]
=
'/0'
;
????????????????
cout
<
<
"read "
<
<
line
<
<
endl
;
????????????????
//設置用于寫操作的文件描寫敘述符
????????????????ev
.
data
.
fd
=
sockfd
;
????????????????
//設置用于注測的寫操作事件
????????????????ev
.
events
=
EPOLLOUT
|
EPOLLET
;
????????????????
//改動sockfd上要處理的事件為EPOLLOUT
????????????????
//epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);
????????????
}
????????????
else
if
(
events
[
i
]
.
events
&
EPOLLOUT
)
// 假設有數據發送
????????????
{
????????????????sockfd
=
events
[
i
]
.
data
.
fd
;
????????????????
write
(
sockfd
,
line
,
n
)
;
????????????????
//設置用于讀操作的文件描寫敘述符
????????????????ev
.
data
.
fd
=
sockfd
;
????????????????
//設置用于注測的讀操作事件
????????????????ev
.
events
=
EPOLLIN
|
EPOLLET
;
????????????????
//改動sockfd上要處理的事件為EPOLIN
????????????????epoll_ctl
(
epfd
,
EPOLL_CTL_MOD
,
sockfd
,
&
ev
)
;
????????????
}
????????
}
????
}
????
return
0
;
}
|
client直接連接到這個server就好了。。