netlink的网络实现

210阅读 0评论2021-08-01 hiyachen
分类:云计算

一、netlink介绍
    几种主要的IPC机制:管道(Pipe)及命名管道(Named Pipe),信号(Signal),消息队列(Message queue),共享内存(Shared Memory),信号量(Semaphore),套接字(Socket)。通过这些IPC机制,用户空间进程之间可以完成互相通信。为了完成内核空间与用户空间通信,Linux提供了基于socket的Netlink通信机制,可以实现内核与用户空间数据的及时交换。
     到目前Linux提供了9种机制完成内核与用户空间的数据交换,分别是内核启动参数、模块参数与 sysfs、sysctl、系统调用、netlink、procfs、seq_file、debugfs和relayfs,其中模块参数与sysfs、procfs、debugfs、relayfs是基于文件系统的通信机制,用于内核空间向用户控件输出信息; sysctl、系统调用是由用户空间发起的通信机制。由此可见,以上均为单工通信机制,在内核空间与用户空间的双向互动数据交换上略显不足。Netlink是基于socket的通信机制,由于socket本身的双共性、突发性、不阻塞特点,能够很好的满足内核与用户空间小量数据的及时交互,因此在Linux 2.6内核中广泛使用,例如SELinux,Linux系统的防火墙分为内核态的netfilter和用户态的iptables,netfilter与iptables的数据交换就是通过Netlink机制完成。
   Linux操作系统中当CPU处于内核状态时,可以分为有用户上下文的状态和执行硬件、软件中断两种。其中当处于有用户上下文时,由于内核态和用户态的内存映射机制不同,不可直接将本地变量传给用户态的内存区;处于硬件、软件中断时,无法直接向用户内存区传递数据,代码执行不可中断。针对传统的进程间通信机制,他们均无法直接在内核态和用户态之间使用,原因如下表:
----------------------------------------------------------------
通信方法|无法介于内核态与用户态的原因
管道(不包括命名管道)|局限于父子进程间的通信。
消息队列|在硬、软中断中无法无阻塞地接收数据。
信号量|无法介于内核态和用户态使用。
内存共享|需要信号量辅助,而信号量又无法使用。
套接字|在硬、软中断中无法无阻塞地接收数据。
----------------------------------------------------------------------
    解决内核态和用户态通信机制可分为两类:1)处于有用户上下文时,可以使用Linux提供的copy_from_user()和copy_to_user()函数完成,但由于这两个函数可能阻塞,因此不能在硬件、软件的中断过程中使用。2)处于硬、软件中断时。
    通过Netlink机制实现内核态和用户态通信机制。Netlink 套接字的通信依据是一个对应于进程的标识,一般定为该进程的 ID。Netlink通信最大的特点是对对中断过程的支持,它在内核空间接收用户空间数据时不再需要用户自行启动一个内核线程,而是通过另一个软中断调用用户事先指定的接收函数。通过软中断而不是自行启动内核线程保证了数据传输的及时性。
(linux-4.19.167/tools/include/uapi/linux/netlink.h)

#define NETLINK_ROUTE       0   /* Routing/device hook              */
#define NETLINK_UNUSED      1   /* Unused number                */
#define NETLINK_USERSOCK    2   /* Reserved for user mode socket protocols  */
#define NETLINK_FIREWALL    3   /* Unused number, formerly ip_queue     */
#define NETLINK_SOCK_DIAG   4   /* socket monitoring                */
#define NETLINK_NFLOG       5   /* netfilter/iptables ULOG */
#define NETLINK_XFRM        6   /* ipsec */
#define NETLINK_SELINUX     7   /* SELinux event notifications */
#define NETLINK_ISCSI       8   /* Open-iSCSI */
#define NETLINK_AUDIT       9   /* auditing */
#define NETLINK_FIB_LOOKUP  10  
#define NETLINK_CONNECTOR   11
#define NETLINK_NETFILTER   12  /* netfilter subsystem */
#define NETLINK_IP6_FW      13
#define NETLINK_DNRTMSG     14  /* DECnet routing messages */
#define NETLINK_KOBJECT_UEVENT  15  /* Kernel messages to userspace */
#define NETLINK_GENERIC     16
/* leave room for NETLINK_DM (DM Events) */
#define NETLINK_SCSITRANSPORT   18  /* SCSI Transports */
#define NETLINK_ECRYPTFS    19
#define NETLINK_RDMA        20
#define NETLINK_CRYPTO      21  /* Crypto layer */
#define NETLINK_SMC     22  /* SMC monitoring */

#define NETLINK_INET_DIAG   NETLINK_SOCK_DIAG

#define MAX_LINKS 32


二、NETLINK_ROUTE是内核的网络实现。
NETLINK_ROUTE消息:
renetlink(NETLINK_ROUTE)消息包括众多其他类型的renetlink消息。
NETLINK_ROUTE消息分为很多个消息簇:
LINK(网络接口)
ADDR(网络地址消息)
ROUTE(路由选择消息)
NEIGH(邻接子系统消息)
RULE(策略路由规则)
QDISC(排队准则)
TCLASS(流量类别)
ACTION(数据包操作API,参见net/sched/act_api.c)
NEIGHTBL(邻接表)
ADDRLABEL(地址标记)
每个消息簇都分为3类:
创建路由消息类型:RTM_NEWROUTE。
删除路由消息类型:RTM_DELROUTE。
检索路由消息类型:RTM_GETROUTE。
对于LINK消息簇还有一个修改链路的消息类型:RTM_STEROUTE。
当发生错误时,需要发出错误消息作出应答。Netlink错误消息用结构nlmsgerr表示。
在(linux-4.19.167/tools/include/uapi/linux/netlink.h)中描述:
struct nlmsgerr {
    int     error;
    struct nlmsghdr msg;
    /*
     * followed by the message contents unless NETLINK_CAP_ACK was set
     * or the ACK indicates success (error == 0)
     * message length is aligned with NLMSG_ALIGN()
     */
    /*
     * followed by TLVs defined in enum nlmsgerr_attrs
     * if NETLINK_EXT_ACK was set
     */
};

Netlink错误消息是使用Netlink消息报头和错误代码创建的。错误代码不为0时,将在错误代码字段后面附加导致错误的原始请求的Netlink消息报头。


三、netlink使用举例
  什么是Netlink?Netlink是linux提供的用于内核和用户态进程之间的通信方式。但是注意虽然Netlink主要用于用户空间和内核空间的通信,但是也能用于用户空间的两个进程通信。只是进程间通信有其他很多方式,一般不用Netlink。除非需要用到Netlink的广播特性时。
  那么Netlink有什么优势呢?一般来说用户空间和内核空间的通信方式有三种:/proc、ioctl、Netlink。而前两种都是单向的,但是Netlink可以实现双工通信。
  Netlink协议基于BSD socket和AF_NETLINK地址簇(address family),使用32位的端口号寻址(以前称作PID),每个Netlink协议(或称作总线,man手册中则称之为netlink family),通常与一个或一组内核服务/组件相关联,如NETLINK_ROUTE用于获取和设置路由与链路信息、NETLINK_KOBJECT_UEVENT用于内核向用户空间的udev进程发送通知等。netlink具有以下特点:
 ① 支持全双工、异步通信(当然同步也支持)
 ② 用户空间可使用标准的BSD socket接口(但netlink并没有屏蔽掉协议包的构造与解析过程,推荐使用libnl等第三方库)
 ③ 在内核空间使用专用的内核API接口
 ④ 支持多播(因此支持“总线”式通信,可实现消息订阅)
 ⑤ 在内核端可用于进程上下文与中断上下文
  如何学习Netlink?我觉得最好的方式就是将Netlink和UDP socket对比学习。因为他们真的很对地方相似。AF_NETLINK和AF_INET对应,是一个协议族,而NETLINK_ROUTE、NETLINK_GENERIC这些是协议,对应于UDP。
  那么我们主要关注Netlink和UDP socket之间的不同点,其中最重要的一点就是:使用UDP socket发送数据包时,用户无需构造UDP数据包的包头,内核协议栈会根据原、目的地址(sockaddr_in)填充头部信息。但是Netlink需要我们自己构造一个包头(这个包头有什么用,我们后面再说)。
  一般我们使用Netlink都要指定一个协议,我们可以使用内核为我们预留的NETLINK_GENERIC(定义在linux/netlink.h中),也可以使用我们自定义的协议,其实就是定义一个内核还没有占用的数字。下面我们用NETLINK_TEST做为我们定义的协议写一个例子(注意:自定义协议不一定非要添加到linux/netlink.h中,只要用户态和内核态代码都能找到该定义就行)。我们知道使用UDP发送报文有两种方式:sendto和sendmsg,同样Netlink也支持这两种方式。下面先看使用sendmsg的方式。

内核构造体




参考资料:
https://blog.csdn.net/youngauthor/article/details/106723982
https://www.cnblogs.com/x_wukong/p/5920437.html
https://blog.csdn.net/silent123go/article/details/78812981
http://blog.chinaunix.net/uid-28541347-id-5578403.html


上一篇:openflow1.3之TCAM原理介绍
下一篇:netlink监控路由表