Linux 原始套接字--myping的实现

839阅读 0评论2012-06-12 fjzhuozl
分类:

一、套接字的类型

A.流套接字(SOCK_STREAM) 

用于提供面向连接、可靠的数据传输服务,其使用传输层的TCP协议

B.数据报套接字(SOCK_DGRAM)

用于提供一个无连接、不可靠的服务,其使用传输层上的UDP协议

C.原始套接字(SOCK_RAM)

原始套接字是相对表中套接字(即前面两种套接字)而言的。它与标准套接字的区别是原始套接字可以读写内核没有处理的IP数据包,流套接字只能读取TCP协议的数据,数据报套接字只能读取UDP协议的数据。

所以要访问其他协议的数据必须使用原始套接字。


二、ping命令

ping命令是用来查看网络上另一个主机系统的网络连接是否正常的一个工具。
ping命令的工作原理:向网络上的另一个主机系统发送ICMP报文,如果指定系统得到了报文,它将把报文一模一样地传回给发送者。

来看看在linux下使用ping命令的效果:



从上面可以看到,ping命令执行后显示出被系统主机名(或域名)和相应 IP地址、返回给当前主机的ICMP报文顺序号、ttl生存时间和往返时间rtt(单位是豪秒,即千分之一秒)。这些信息对我们后面要实现的myping有提示作用。

三、ICMP的介绍

ICMP(Internet Control Message,网际控制报文协议)是为网关和目标主机而提供的一种差错控制机制,使它们在遇到差错时能把错误报告发给报文源发方。ICMP协议是IP层的一个协议,但是由于差错报告在发送给报文源发方时可能也要经过若干子网,因此牵涉到路由选择等问题,所以ICMP报文需通过IP协议来发送。



ICMP数据报的数据发送前需要两级封装:首先添加ICMP报头形成ICMP报文,在添加IP头形成IP数据报。

注意:IP头不需要我们实现,由内核协议栈自动添加,我们只需要实现ICMP报文。

A.在Linux环境下,IP头定义如下:



我们要实现ping,需要关注一下数据:

<1>IP报头长度IHL(Internet Header Length)

其以4字节为一个单位来记录IP报头的长度,由上述IP数据结构的ip_hl变量。所以实际IP报头的长度是ip_hl << 2。

<2>生存时间TTL(Time To Live),是以秒为单位,指出IP数据报能在网络上停留的最长时间,其值由发送方设定,并在经过路由的每一个节点减一,当该值为0时,数据报将被丢弃,是上述IP数据结构的ip_ttl变量。

B. ICMP报文

IPCMP报文分为两种:一是错误报告报文,二是查询报文。

注意:每个ICMP报头均包含类型、编码、校验和这三项内容,长度为:8位、8位、16位。其余选项则随ICMP的功能不同而不同。

ping命令只使用众多ICMP报文中的两种:"请求(ICMP_ECHO)"和"回应(ICMP_ECHOREPLY)"。在linux中定义如下:




这两种报文格式如下:



通过wirshark抓包格式如下:



ICMP报头在linux定义如下:

struct icmp
{
  u_int8_t  icmp_type; /* type of message, see below */
  u_int8_t  icmp_code; /* type sub code */
  u_int16_t icmp_cksum; /* ones complement checksum of struct */
  union
  {
    u_char ih_pptr; /* ICMP_PARAMPROB */
    struct in_addr ih_gwaddr; /* gateway address */
    struct ih_idseq /* echo datagram */
    {
      u_int16_t icd_id;
      u_int16_t icd_seq;
    } ih_idseq;
    u_int32_t ih_void;

    /* ICMP_UNREACH_NEEDFRAG -- Path MTU Discovery (RFC1191) */
    struct ih_pmtu
    {
      u_int16_t ipm_void;
      u_int16_t ipm_nextmtu;
    } ih_pmtu;

    struct ih_rtradv
    {
      u_int8_t irt_num_addrs;
      u_int8_t irt_wpa;
      u_int16_t irt_lifetime;
    } ih_rtradv;
  } icmp_hun;
#define icmp_pptr icmp_hun.ih_pptr
#define icmp_gwaddr icmp_hun.ih_gwaddr
#define icmp_id icmp_hun.ih_idseq.icd_id(标识一个ICMP报文,一般我们用PID标识)
#define icmp_seq icmp_hun.ih_idseq.icd_seq(发送报文的序号)
#define icmp_void icmp_hun.ih_void
#define icmp_pmvoid icmp_hun.ih_pmtu.ipm_void
#define icmp_nextmtu icmp_hun.ih_pmtu.ipm_nextmtu
#define icmp_num_addrs icmp_hun.ih_rtradv.irt_num_addrs
#define icmp_wpa icmp_hun.ih_rtradv.irt_wpa
#define icmp_lifetime icmp_hun.ih_rtradv.irt_lifetime
  union
  {
    struct
    {
      u_int32_t its_otime;
      u_int32_t its_rtime;
      u_int32_t its_ttime;
    } id_ts;
    struct
    {
      struct ip idi_ip;
      /* options and then 64 bits of data */
    } id_ip;
    struct icmp_ra_addr id_radv;
    u_int32_t   id_mask;
    u_int8_t    id_data[1];
  } icmp_dun;
#define icmp_otime icmp_dun.id_ts.its_otime
#define icmp_rtime icmp_dun.id_ts.its_rtime
#define icmp_ttime icmp_dun.id_ts.its_ttime
#define icmp_ip icmp_dun.id_ip.idi_ip
#define icmp_radv icmp_dun.id_radv
#define icmp_mask icmp_dun.id_mask
#define icmp_data icmp_dun.id_data(可以看到id_data是含有一个元素的数组名,为什么这样干呀?思考...)
};

以上红色部分使我们实现ping需要填充的部分。

规定:ICMP报头为8字节

<1>协议头校验和算法

unsigned short chksum(addr,len)   
    unsigned short *addr;  // 校验数据开始地址(注意是以2字节为单位)    
    int len;                // 校验数据的长度大小,以字节为单位
{  
    int sum = 0;        // 校验和 
    int nleft = len;    // 未累加的数据长度    
    unsigned short *p;  // 走动的临时指针,2字节为单位     
    unsigned short tmp = 0; // 奇数字节长度时用到     
  
   while( nleft > 1)   
   {       
       sum += *p++;    // 累加         
       nleft -= 2;   
    }  

  
// 奇数字节长度    
   if(nleft == 1)   
   {      
      
// 将最后字节压如2字节的高位        
       *(unsigned char *)&tmp = *(unsigned char *)p;
       sum += tmp;   
   } 
    
//高位低位相加  
    sum = (sum >> 16) + (sum & 0xffff);    
  
   // 上一步溢出时(十六进制相加进位),将溢出位也加到sum中      
   sum += sum >> 16;
  

   // 注意类型转换,现在的校验和为16位
    tmp = ~sum;         
  
   return tmp;
}

网际校验和算法,把被校验的数据16位进行累加,然后取反码,若数据字节长度为奇数,则数据尾部补一个字节的0以凑成偶数。此算法适用于IPv4、ICMPv4、IGMPV4、ICMPv6、UDP和TCP校验和,更详细的信息请参考RFC1071。

<2>rtt往返时间

为了实现这一功能,可利用ICMP数据报携带一个时间戳。使用以下函数生成时间戳:



获取系统时间,放在struct timeval的变量中,第二个参数tzp指针表示时区,一般都是NULL,大多数代码都是这样,我也没关注过。



其中tv_sec为秒数,tv_usec微秒数。在发送和接收报文时由gettimeofday分别生成两个timeval结构,两者之差即为往返时间,即ICMP报文发送与接收的时间差。

<3>数据统计

系统自带的ping命令当它发送完所有ICMP报文后,会对所有发送和所有接收的ICMP报文进行统计,从而计算ICMP报文丢失的比率。

注意:为达到此目标,我们在编写代码时,定义两个全局变量:接收计数器和发送计数器,用于记录ICMP报文接收和发送数目。丢失数目 =  发送总数 - 接收总数,丢失比率 = 丢失数目 / 发送总数。


四、myping的实现

<1>补充知识

判断一个字符串是否是  string :"192.168.1.45" 这样的字符串



if(   inet_addr(string) == INADDR_NONE  )
{
        .........
}

<2>补充知识

通过协议名如"icmp"获取对应的协议编号



解释如下:




注意:

创建原始套接字的时候,就需要指定其协议编号.

struct  protoent  *protocol;
int sockfd_ram;

if((protocol = getprotobyname("icmp")) == NULL)
{
    perror("Fail to getprotobyname");
    exit(EXIT_FAILURE);
}

//我们一般在创建,流套接字和数据包套接字时指定的是0,代表让系统自己自动去识别
if((sockfd_ram = socket(AF_INET,SOCK_RAM,protocol->p_proto)) < 0)
{
    perror("Fail to socket");
    exit(EXIT_FAILURE);    
}

<3>补充知识

通过主机名或域名获取其对应的ip地址



这个函数的传入值是域名或者主机名,例如""等等。传出值,是一个hostent的结构。如果函数调用失败,将返回NULL。



  hostent->h_name
    表示的是主机的规范名。例如的规范名其实是。
    hostent->h_aliases
    表示的是主机的别名.就是google他自己的别名。有的时候,有的主机可能有好几个别名,这些,其实都是为了易于用户记忆而为自己的网站多取的名字。
    hostent->h_addrtype     
    表示的是主机ip地址的类型,到底是ipv4(AF_INET),还是pv6(AF_INET6)
    hostent->h_length       
    表示的是主机ip地址的长度
    hostent->h_addr_lisst 
    表示的是主机的ip地址,注意,这个是以网络字节序存储的。千万不要直接用printf带%s参数来打这个东西,会有问题的哇。所以到真正需要打印出这个IP的话,需要调用inet_ntop()。



  这个函数,是将类型为af的网络地址结构src,转换成主机序的字符串形式,存放在长度为cnt的字符串中。返回指向dst的一个指针。如果函数调用错误,返回值是NULL。


#include
#include
#include

int main(int argc, char **argv)
{
    char   *ptr, **pptr;
    struct hostent *hptr;
    char   str[32];
    ptr = argv[1];

    if((hptr = gethostbyname(ptr)) == NULL)
    {
        printf(" gethostbyname error for host:%s\n", ptr);
        return 0; 
    }

    printf("official hostname:%s\n",hptr->h_name);
    for(pptr = hptr->h_aliases; *pptr != NULL; pptr++)
        printf(" alias:%s\n",*pptr);

    switch(hptr->h_addrtype)
    {
        case AF_INET:
        case AF_INET6:
            pptr=hptr->h_addr_list;
            for(; *pptr!=NULL; pptr++)
                printf(" address:%s\n", 
                       inet_ntop(hptr->h_addrtype, *pptr, str, sizeof(str)));
            printf(" first address: %s\n", 
                       inet_ntop(hptr->h_addrtype, hptr->h_addr, str, sizeof(str)));
        break;
        default:
            printf("unknown address type\n");
        break;
    }

    return 0;
}


编译运行
-----------------------------
# gcc test.c
# ./a.out
official hostname:
alias:
address:121.14.88.11
address:121.14.89.11
first address: 121.14.88.11

<4>myping源码

  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <errno.h>
  5. #include <sys/socket.h>
  6. #include <sys/types.h>
  7. #include <netinet/in.h>
  8. #include <arpa/inet.h>
  9. #include <netdb.h>
  10. #include <sys/time.h>
  11. #include <netinet/ip_icmp.h>
  12. #include <unistd.h>
  13. #include <signal.h>

  14. #define MAX_SIZE 1024

  15. char send_buf[MAX_SIZE];
  16. char recv_buf[MAX_SIZE];
  17. int nsend = 0,nrecv = 0;
  18. int datalen = 56;

  19. //统计结果
  20. void statistics(int signum)
  21. {
  22.     printf("\n----------------PING statistics---------------\n");
  23.     printf("%d packets transmitted,%d recevid,%%%d lost\n",nsend,nrecv,(nsend - nrecv)/nsend * 100);
  24.     exit(EXIT_SUCCESS);
  25. }

  26. //校验和算法
  27. int calc_chsum(unsigned short *addr,int len)
  28. {
  29.     int sum = 0,n = len;
  30.     unsigned short answer = 0;
  31.     unsigned short *p = addr;
  32.     
  33.     //每两个字节相加
  34.     while(n > 1)
  35.     {
  36.         sum += *p ++;
  37.         n -= 2;
  38.     }
  39.     
  40.     //处理数据大小是奇数,在最后一个字节后面补0
  41.     if(n == 1)
  42.     {
  43.         *((unsigned char *)&answer) = *(unsigned char *)p;
  44.         sum += answer;
  45.     }
  46.     
  47.     //将得到的sum值的高2字节和低2字节相加
  48.     sum = (sum >> 16) + (sum & 0xffff);
  49.     
  50.     //处理溢出的情况
  51.     sum += sum >> 16;
  52.     answer = ~sum;

  53.     return answer;
  54. }

  55. int pack(int pack_num)
  56. {
  57.     int packsize;
  58.     struct icmp *icmp;
  59.     struct timeval *tv;

  60.     icmp = (struct icmp *)send_buf;
  61.     icmp->icmp_type = ICMP_ECHO;
  62.     icmp->icmp_code = 0;
  63.     icmp->icmp_cksum = 0;
  64.     icmp->icmp_id = htons(getpid());
  65.     icmp->icmp_seq = htons(pack_num);
  66.     tv = (struct timeval *)icmp->icmp_data;

  67.     //记录发送时间
  68.     if(gettimeofday(tv,NULL) < 0)
  69.     {
  70.         perror("Fail to gettimeofday");
  71.         return -1;
  72.     }
  73.     
  74.     packsize = 8 + datalen;
  75.     icmp->icmp_cksum = calc_chsum((unsigned short *)icmp,packsize);
  76.     
  77.     return packsize;
  78. }

  79. int send_packet(int sockfd,struct sockaddr *paddr)
  80. {
  81.     int packsize;
  82.     
  83.     //将send_buf填上a
  84.     memset(send_buf,'a',sizeof(send_buf));

  85.     nsend ++;
  86.     //打icmp包
  87.     packsize = pack(nsend);

  88.     if(sendto(sockfd,send_buf,packsize,0,paddr,sizeof(struct sockaddr)) < 0)
  89.     {
  90.         perror("Fail to sendto");
  91.         return -1;
  92.     }

  93.     return 0;
  94. }

  95. struct timeval time_sub(struct timeval *tv_send,struct timeval *tv_recv)
  96. {
  97.     struct timeval ts;

  98.     if(tv_recv->tv_usec - tv_send->tv_usec < 0)
  99.     {
  100.         tv_recv->tv_sec --;
  101.         tv_recv->tv_usec += 1000000;
  102.     }

  103.     ts.tv_sec = tv_recv->tv_sec - tv_send->tv_sec;
  104.     ts.tv_usec = tv_recv->tv_usec - tv_send->tv_usec;

  105.     return ts;
  106. }

  107. int unpack(int len,struct timeval *tv_recv,struct sockaddr *paddr,char *ipname)
  108. {
  109.     struct ip *ip;
  110.     struct icmp *icmp;
  111.     struct timeval *tv_send,ts;
  112.     int ip_head_len;
  113.     float rtt;

  114.     ip = (struct ip *)recv_buf;
  115.     ip_head_len = ip->ip_hl << 2;
  116.     icmp = (struct icmp *)(recv_buf + ip_head_len);
  117.     
  118.     len -= ip_head_len;
  119.     if(len < 8)
  120.     {
  121.         printf("ICMP packets\'s is less than 8.\n");
  122.         return -1;
  123.     }
  124.         
  125.     if(ntohs(icmp->icmp_id) == getpid() && icmp->icmp_type == ICMP_ECHOREPLY)
  126.     {
  127.         nrecv ++;
  128.         tv_send = (struct timeval *)icmp->icmp_data;
  129.         ts = time_sub(tv_send,tv_recv);
  130.         rtt = ts.tv_sec * 1000 + (float)ts.tv_usec/1000;//以毫秒为单位
  131.         printf("%d bytes from %s (%s):icmp_req = %d ttl=%d time=%.3fms.\n",
  132.             len,ipname,inet_ntoa(((struct sockaddr_in *)paddr)->sin_addr),ntohs(icmp->icmp_seq),ip->ip_ttl,rtt);
  133.     }
  134.     
  135.     return 0;
  136. }

  137. int recv_packet(int sockfd,char *ipname)
  138. {
  139.     int addr_len ,n;
  140.     struct timeval tv;
  141.     struct sockaddr from_addr;
  142.     
  143.     addr_len = sizeof(struct sockaddr);
  144.     if((n = recvfrom(sockfd,recv_buf,sizeof(recv_buf),0,&from_addr,&addr_len)) < 0)
  145.     {
  146.         perror("Fail to recvfrom");
  147.         return -1;
  148.     }

  149.     if(gettimeofday(&tv,NULL) < 0)
  150.     {
  151.         perror("Fail to gettimeofday");
  152.         return -1;
  153.     }

  154.     unpack(n,&tv,&from_addr,ipname);

  155.     return 0;
  156. }


  157. int main(int argc,char *argv[])
  158. {
  159.     int size = 50 * 1024;
  160.     int sockfd,netaddr;
  161.     struct protoent *protocol;
  162.     struct hostent *host;
  163.     struct sockaddr_in peer_addr;
  164.     
  165.     if(argc < 2)
  166.     {
  167.         fprintf(stderr,"usage : %s ip.\n",argv[0]);
  168.         exit(EXIT_FAILURE);
  169.     }
  170.     
  171.     //获取icmp的信息
  172.     if((protocol = getprotobyname("icmp")) == NULL)
  173.     {
  174.         perror("Fail to getprotobyname");
  175.         exit(EXIT_FAILURE);
  176.     }
  177.     
  178.     //创建原始套接字
  179.     if((sockfd = socket(AF_INET,SOCK_RAW,protocol->p_proto)) < 0)
  180.     {
  181.         perror("Fail to socket");
  182.         exit(EXIT_FAILURE);
  183.     }

  184.     //回收root权限,设置当前用户权限
  185.     setuid(getuid());

  186.     /*
  187.      扩大套接子接收缓冲区到50k,这样做主要为了减少接收缓冲区溢出的可能性
  188.      若无影中ping一个广播地址或多播地址,将会引来大量应答
  189.      */
  190.     if(setsockopt(sockfd,SOL_SOCKET,SO_RCVBUF,&size,sizeof(size)) < 0)
  191.     {
  192.         perror("Fail to setsockopt");
  193.         exit(EXIT_FAILURE);
  194.     }

  195.     //填充对方的地址
  196.     bzero(&peer_addr,sizeof(peer_addr));
  197.     peer_addr.sin_family = AF_INET;
  198.     //判断是主机名(域名)还是ip
  199.     if((netaddr = inet_addr(argv[1])) == INADDR_NONE)
  200.     {    
  201.         //是主机名(域名)
  202.         if((host = gethostbyname(argv[1])) == NULL)
  203.         {
  204.             fprintf(stderr,"%s unknown host : %s.\n",argv[0],argv[1]);
  205.             exit(EXIT_FAILURE);
  206.         }

  207.         memcpy((char *)&peer_addr.sin_addr,host->h_addr,host->h_length);
  208.         
  209.     }else{//ip地址
  210.         peer_addr.sin_addr.s_addr = netaddr;
  211.     }
  212.     
  213.     //注册信号处理函数
  214.     signal(SIGALRM,statistics);
  215.     signal(SIGINT,statistics);
  216.     alarm(5);

  217.     //开始信息
  218.     printf("PING %s(%s) %d bytes of data.\n",argv[1],inet_ntoa(peer_addr.sin_addr),datalen);

  219.     //发送包文和接收报文
  220.     while(1)
  221.     {
  222.         send_packet(sockfd,(struct sockaddr *)&peer_addr);
  223.         recv_packet(sockfd,argv[1]);
  224.         alarm(5);
  225.         sleep(1);
  226.     }

  227.     exit(EXIT_SUCCESS);
  228. }

注意:由于原始套接字的创建只能是拥有超级权限的进程创建,所以我们需要将我们编译好的可执行文件,把其文件所有者改为root,再将其set-uid-bit位进行设置。操作如下:


上一篇:设计模式原则--面向对象基本原则
下一篇:通信协议之序列化