6053a6277c0cd6368c5ad83f03de20c3f499547b
[dpdk.git] / examples / l3fwd / l3fwd_em.c
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2016 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 #include <stdio.h>
35 #include <stdlib.h>
36 #include <stdint.h>
37 #include <inttypes.h>
38 #include <sys/types.h>
39 #include <string.h>
40 #include <sys/queue.h>
41 #include <stdarg.h>
42 #include <errno.h>
43 #include <getopt.h>
44 #include <stdbool.h>
45 #include <netinet/in.h>
46
47 #include <rte_debug.h>
48 #include <rte_ether.h>
49 #include <rte_ethdev.h>
50 #include <rte_ring.h>
51 #include <rte_mempool.h>
52 #include <rte_cycles.h>
53 #include <rte_mbuf.h>
54 #include <rte_ip.h>
55 #include <rte_tcp.h>
56 #include <rte_udp.h>
57 #include <rte_hash.h>
58
59 #include "l3fwd.h"
60
61 #ifdef RTE_MACHINE_CPUFLAG_SSE4_2
62 #include <rte_hash_crc.h>
63 #define DEFAULT_HASH_FUNC       rte_hash_crc
64 #else
65 #include <rte_jhash.h>
66 #define DEFAULT_HASH_FUNC       rte_jhash
67 #endif /* RTE_MACHINE_CPUFLAG_SSE4_2 */
68
69 #define IPV6_ADDR_LEN 16
70
71 struct ipv4_5tuple {
72         uint32_t ip_dst;
73         uint32_t ip_src;
74         uint16_t port_dst;
75         uint16_t port_src;
76         uint8_t  proto;
77 } __attribute__((__packed__));
78
79 union ipv4_5tuple_host {
80         struct {
81                 uint8_t  pad0;
82                 uint8_t  proto;
83                 uint16_t pad1;
84                 uint32_t ip_src;
85                 uint32_t ip_dst;
86                 uint16_t port_src;
87                 uint16_t port_dst;
88         };
89         xmm_t xmm;
90 };
91
92 #define XMM_NUM_IN_IPV6_5TUPLE 3
93
94 struct ipv6_5tuple {
95         uint8_t  ip_dst[IPV6_ADDR_LEN];
96         uint8_t  ip_src[IPV6_ADDR_LEN];
97         uint16_t port_dst;
98         uint16_t port_src;
99         uint8_t  proto;
100 } __attribute__((__packed__));
101
102 union ipv6_5tuple_host {
103         struct {
104                 uint16_t pad0;
105                 uint8_t  proto;
106                 uint8_t  pad1;
107                 uint8_t  ip_src[IPV6_ADDR_LEN];
108                 uint8_t  ip_dst[IPV6_ADDR_LEN];
109                 uint16_t port_src;
110                 uint16_t port_dst;
111                 uint64_t reserve;
112         };
113         xmm_t xmm[XMM_NUM_IN_IPV6_5TUPLE];
114 };
115
116
117
118 struct ipv4_l3fwd_em_route {
119         struct ipv4_5tuple key;
120         uint8_t if_out;
121 };
122
123 struct ipv6_l3fwd_em_route {
124         struct ipv6_5tuple key;
125         uint8_t if_out;
126 };
127
128 static struct ipv4_l3fwd_em_route ipv4_l3fwd_em_route_array[] = {
129         {{IPv4(101, 0, 0, 0), IPv4(100, 10, 0, 1),  101, 11, IPPROTO_TCP}, 0},
130         {{IPv4(201, 0, 0, 0), IPv4(200, 20, 0, 1),  102, 12, IPPROTO_TCP}, 1},
131         {{IPv4(111, 0, 0, 0), IPv4(100, 30, 0, 1),  101, 11, IPPROTO_TCP}, 2},
132         {{IPv4(211, 0, 0, 0), IPv4(200, 40, 0, 1),  102, 12, IPPROTO_TCP}, 3},
133 };
134
135 static struct ipv6_l3fwd_em_route ipv6_l3fwd_em_route_array[] = {
136         {{
137         {0xfe, 0x80, 0, 0, 0, 0, 0, 0, 0x02, 0x1e, 0x67, 0xff, 0xfe, 0, 0, 0},
138         {0xfe, 0x80, 0, 0, 0, 0, 0, 0, 0x02, 0x1b, 0x21, 0xff, 0xfe, 0x91, 0x38, 0x05},
139         101, 11, IPPROTO_TCP}, 0},
140
141         {{
142         {0xfe, 0x90, 0, 0, 0, 0, 0, 0, 0x02, 0x1e, 0x67, 0xff, 0xfe, 0, 0, 0},
143         {0xfe, 0x90, 0, 0, 0, 0, 0, 0, 0x02, 0x1b, 0x21, 0xff, 0xfe, 0x91, 0x38, 0x05},
144         102, 12, IPPROTO_TCP}, 1},
145
146         {{
147         {0xfe, 0xa0, 0, 0, 0, 0, 0, 0, 0x02, 0x1e, 0x67, 0xff, 0xfe, 0, 0, 0},
148         {0xfe, 0xa0, 0, 0, 0, 0, 0, 0, 0x02, 0x1b, 0x21, 0xff, 0xfe, 0x91, 0x38, 0x05},
149         101, 11, IPPROTO_TCP}, 2},
150
151         {{
152         {0xfe, 0xb0, 0, 0, 0, 0, 0, 0, 0x02, 0x1e, 0x67, 0xff, 0xfe, 0, 0, 0},
153         {0xfe, 0xb0, 0, 0, 0, 0, 0, 0, 0x02, 0x1b, 0x21, 0xff, 0xfe, 0x91, 0x38, 0x05},
154         102, 12, IPPROTO_TCP}, 3},
155 };
156
157 struct rte_hash *ipv4_l3fwd_em_lookup_struct[NB_SOCKETS];
158 struct rte_hash *ipv6_l3fwd_em_lookup_struct[NB_SOCKETS];
159
160 static inline uint32_t
161 ipv4_hash_crc(const void *data, __rte_unused uint32_t data_len,
162                 uint32_t init_val)
163 {
164         const union ipv4_5tuple_host *k;
165         uint32_t t;
166         const uint32_t *p;
167
168         k = data;
169         t = k->proto;
170         p = (const uint32_t *)&k->port_src;
171
172 #ifdef RTE_MACHINE_CPUFLAG_SSE4_2
173         init_val = rte_hash_crc_4byte(t, init_val);
174         init_val = rte_hash_crc_4byte(k->ip_src, init_val);
175         init_val = rte_hash_crc_4byte(k->ip_dst, init_val);
176         init_val = rte_hash_crc_4byte(*p, init_val);
177 #else /* RTE_MACHINE_CPUFLAG_SSE4_2 */
178         init_val = rte_jhash_1word(t, init_val);
179         init_val = rte_jhash_1word(k->ip_src, init_val);
180         init_val = rte_jhash_1word(k->ip_dst, init_val);
181         init_val = rte_jhash_1word(*p, init_val);
182 #endif /* RTE_MACHINE_CPUFLAG_SSE4_2 */
183
184         return init_val;
185 }
186
187 static inline uint32_t
188 ipv6_hash_crc(const void *data, __rte_unused uint32_t data_len,
189                 uint32_t init_val)
190 {
191         const union ipv6_5tuple_host *k;
192         uint32_t t;
193         const uint32_t *p;
194 #ifdef RTE_MACHINE_CPUFLAG_SSE4_2
195         const uint32_t  *ip_src0, *ip_src1, *ip_src2, *ip_src3;
196         const uint32_t  *ip_dst0, *ip_dst1, *ip_dst2, *ip_dst3;
197 #endif /* RTE_MACHINE_CPUFLAG_SSE4_2 */
198
199         k = data;
200         t = k->proto;
201         p = (const uint32_t *)&k->port_src;
202
203 #ifdef RTE_MACHINE_CPUFLAG_SSE4_2
204         ip_src0 = (const uint32_t *) k->ip_src;
205         ip_src1 = (const uint32_t *)(k->ip_src+4);
206         ip_src2 = (const uint32_t *)(k->ip_src+8);
207         ip_src3 = (const uint32_t *)(k->ip_src+12);
208         ip_dst0 = (const uint32_t *) k->ip_dst;
209         ip_dst1 = (const uint32_t *)(k->ip_dst+4);
210         ip_dst2 = (const uint32_t *)(k->ip_dst+8);
211         ip_dst3 = (const uint32_t *)(k->ip_dst+12);
212         init_val = rte_hash_crc_4byte(t, init_val);
213         init_val = rte_hash_crc_4byte(*ip_src0, init_val);
214         init_val = rte_hash_crc_4byte(*ip_src1, init_val);
215         init_val = rte_hash_crc_4byte(*ip_src2, init_val);
216         init_val = rte_hash_crc_4byte(*ip_src3, init_val);
217         init_val = rte_hash_crc_4byte(*ip_dst0, init_val);
218         init_val = rte_hash_crc_4byte(*ip_dst1, init_val);
219         init_val = rte_hash_crc_4byte(*ip_dst2, init_val);
220         init_val = rte_hash_crc_4byte(*ip_dst3, init_val);
221         init_val = rte_hash_crc_4byte(*p, init_val);
222 #else /* RTE_MACHINE_CPUFLAG_SSE4_2 */
223         init_val = rte_jhash_1word(t, init_val);
224         init_val = rte_jhash(k->ip_src,
225                         sizeof(uint8_t) * IPV6_ADDR_LEN, init_val);
226         init_val = rte_jhash(k->ip_dst,
227                         sizeof(uint8_t) * IPV6_ADDR_LEN, init_val);
228         init_val = rte_jhash_1word(*p, init_val);
229 #endif /* RTE_MACHINE_CPUFLAG_SSE4_2 */
230         return init_val;
231 }
232
233 #define IPV4_L3FWD_EM_NUM_ROUTES \
234         (sizeof(ipv4_l3fwd_em_route_array) / sizeof(ipv4_l3fwd_em_route_array[0]))
235
236 #define IPV6_L3FWD_EM_NUM_ROUTES \
237         (sizeof(ipv6_l3fwd_em_route_array) / sizeof(ipv6_l3fwd_em_route_array[0]))
238
239 static uint8_t ipv4_l3fwd_out_if[L3FWD_HASH_ENTRIES] __rte_cache_aligned;
240 static uint8_t ipv6_l3fwd_out_if[L3FWD_HASH_ENTRIES] __rte_cache_aligned;
241
242 static rte_xmm_t mask0;
243 static rte_xmm_t mask1;
244 static rte_xmm_t mask2;
245
246 #if defined(__SSE2__)
247 static inline xmm_t
248 em_mask_key(void *key, xmm_t mask)
249 {
250         __m128i data = _mm_loadu_si128((__m128i *)(key));
251
252         return _mm_and_si128(data, mask);
253 }
254 #elif defined(RTE_MACHINE_CPUFLAG_NEON)
255 static inline xmm_t
256 em_mask_key(void *key, xmm_t mask)
257 {
258         int32x4_t data = vld1q_s32((int32_t *)key);
259
260         return vandq_s32(data, mask);
261 }
262 #elif defined(RTE_MACHINE_CPUFLAG_ALTIVEC)
263 static inline xmm_t
264 em_mask_key(void *key, xmm_t mask)
265 {
266         xmm_t data = vec_ld(0, (xmm_t *)(key));
267
268         return vec_and(data, mask);
269 }
270 #else
271 #error No vector engine (SSE, NEON, ALTIVEC) available, check your toolchain
272 #endif
273
274 static inline uint8_t
275 em_get_ipv4_dst_port(void *ipv4_hdr, uint8_t portid, void *lookup_struct)
276 {
277         int ret = 0;
278         union ipv4_5tuple_host key;
279         struct rte_hash *ipv4_l3fwd_lookup_struct =
280                 (struct rte_hash *)lookup_struct;
281
282         ipv4_hdr = (uint8_t *)ipv4_hdr + offsetof(struct ipv4_hdr, time_to_live);
283
284         /*
285          * Get 5 tuple: dst port, src port, dst IP address,
286          * src IP address and protocol.
287          */
288         key.xmm = em_mask_key(ipv4_hdr, mask0.x);
289
290         /* Find destination port */
291         ret = rte_hash_lookup(ipv4_l3fwd_lookup_struct, (const void *)&key);
292         return (uint8_t)((ret < 0) ? portid : ipv4_l3fwd_out_if[ret]);
293 }
294
295 static inline uint8_t
296 em_get_ipv6_dst_port(void *ipv6_hdr,  uint8_t portid, void *lookup_struct)
297 {
298         int ret = 0;
299         union ipv6_5tuple_host key;
300         struct rte_hash *ipv6_l3fwd_lookup_struct =
301                 (struct rte_hash *)lookup_struct;
302
303         ipv6_hdr = (uint8_t *)ipv6_hdr + offsetof(struct ipv6_hdr, payload_len);
304         void *data0 = ipv6_hdr;
305         void *data1 = ((uint8_t *)ipv6_hdr) + sizeof(xmm_t);
306         void *data2 = ((uint8_t *)ipv6_hdr) + sizeof(xmm_t) + sizeof(xmm_t);
307
308         /* Get part of 5 tuple: src IP address lower 96 bits and protocol */
309         key.xmm[0] = em_mask_key(data0, mask1.x);
310
311         /*
312          * Get part of 5 tuple: dst IP address lower 96 bits
313          * and src IP address higher 32 bits.
314          */
315         key.xmm[1] = *(xmm_t *)data1;
316
317         /*
318          * Get part of 5 tuple: dst port and src port
319          * and dst IP address higher 32 bits.
320          */
321         key.xmm[2] = em_mask_key(data2, mask2.x);
322
323         /* Find destination port */
324         ret = rte_hash_lookup(ipv6_l3fwd_lookup_struct, (const void *)&key);
325         return (uint8_t)((ret < 0) ? portid : ipv6_l3fwd_out_if[ret]);
326 }
327
328 #if defined(__SSE4_1__)
329 #if defined(NO_HASH_MULTI_LOOKUP)
330 #include "l3fwd_em_sse.h"
331 #else
332 #include "l3fwd_em_hlm_sse.h"
333 #endif
334 #else
335 #include "l3fwd_em.h"
336 #endif
337
338 static void
339 convert_ipv4_5tuple(struct ipv4_5tuple *key1,
340                 union ipv4_5tuple_host *key2)
341 {
342         key2->ip_dst = rte_cpu_to_be_32(key1->ip_dst);
343         key2->ip_src = rte_cpu_to_be_32(key1->ip_src);
344         key2->port_dst = rte_cpu_to_be_16(key1->port_dst);
345         key2->port_src = rte_cpu_to_be_16(key1->port_src);
346         key2->proto = key1->proto;
347         key2->pad0 = 0;
348         key2->pad1 = 0;
349 }
350
351 static void
352 convert_ipv6_5tuple(struct ipv6_5tuple *key1,
353                 union ipv6_5tuple_host *key2)
354 {
355         uint32_t i;
356
357         for (i = 0; i < 16; i++) {
358                 key2->ip_dst[i] = key1->ip_dst[i];
359                 key2->ip_src[i] = key1->ip_src[i];
360         }
361         key2->port_dst = rte_cpu_to_be_16(key1->port_dst);
362         key2->port_src = rte_cpu_to_be_16(key1->port_src);
363         key2->proto = key1->proto;
364         key2->pad0 = 0;
365         key2->pad1 = 0;
366         key2->reserve = 0;
367 }
368
369 #define BYTE_VALUE_MAX 256
370 #define ALL_32_BITS 0xffffffff
371 #define BIT_8_TO_15 0x0000ff00
372
373 static inline void
374 populate_ipv4_few_flow_into_table(const struct rte_hash *h)
375 {
376         uint32_t i;
377         int32_t ret;
378
379         mask0 = (rte_xmm_t){.u32 = {BIT_8_TO_15, ALL_32_BITS,
380                                 ALL_32_BITS, ALL_32_BITS} };
381
382         for (i = 0; i < IPV4_L3FWD_EM_NUM_ROUTES; i++) {
383                 struct ipv4_l3fwd_em_route  entry;
384                 union ipv4_5tuple_host newkey;
385
386                 entry = ipv4_l3fwd_em_route_array[i];
387                 convert_ipv4_5tuple(&entry.key, &newkey);
388                 ret = rte_hash_add_key(h, (void *) &newkey);
389                 if (ret < 0) {
390                         rte_exit(EXIT_FAILURE, "Unable to add entry %" PRIu32
391                                 " to the l3fwd hash.\n", i);
392                 }
393                 ipv4_l3fwd_out_if[ret] = entry.if_out;
394         }
395         printf("Hash: Adding 0x%" PRIx64 " keys\n",
396                 (uint64_t)IPV4_L3FWD_EM_NUM_ROUTES);
397 }
398
399 #define BIT_16_TO_23 0x00ff0000
400 static inline void
401 populate_ipv6_few_flow_into_table(const struct rte_hash *h)
402 {
403         uint32_t i;
404         int32_t ret;
405
406         mask1 = (rte_xmm_t){.u32 = {BIT_16_TO_23, ALL_32_BITS,
407                                 ALL_32_BITS, ALL_32_BITS} };
408
409         mask2 = (rte_xmm_t){.u32 = {ALL_32_BITS, ALL_32_BITS, 0, 0} };
410
411         for (i = 0; i < IPV6_L3FWD_EM_NUM_ROUTES; i++) {
412                 struct ipv6_l3fwd_em_route entry;
413                 union ipv6_5tuple_host newkey;
414
415                 entry = ipv6_l3fwd_em_route_array[i];
416                 convert_ipv6_5tuple(&entry.key, &newkey);
417                 ret = rte_hash_add_key(h, (void *) &newkey);
418                 if (ret < 0) {
419                         rte_exit(EXIT_FAILURE, "Unable to add entry %" PRIu32
420                                 " to the l3fwd hash.\n", i);
421                 }
422                 ipv6_l3fwd_out_if[ret] = entry.if_out;
423         }
424         printf("Hash: Adding 0x%" PRIx64 "keys\n",
425                 (uint64_t)IPV6_L3FWD_EM_NUM_ROUTES);
426 }
427
428 #define NUMBER_PORT_USED 4
429 static inline void
430 populate_ipv4_many_flow_into_table(const struct rte_hash *h,
431                 unsigned int nr_flow)
432 {
433         unsigned i;
434
435         mask0 = (rte_xmm_t){.u32 = {BIT_8_TO_15, ALL_32_BITS,
436                                 ALL_32_BITS, ALL_32_BITS} };
437
438         for (i = 0; i < nr_flow; i++) {
439                 struct ipv4_l3fwd_em_route entry;
440                 union ipv4_5tuple_host newkey;
441
442                 uint8_t a = (uint8_t)
443                         ((i/NUMBER_PORT_USED)%BYTE_VALUE_MAX);
444                 uint8_t b = (uint8_t)
445                         (((i/NUMBER_PORT_USED)/BYTE_VALUE_MAX)%BYTE_VALUE_MAX);
446                 uint8_t c = (uint8_t)
447                         ((i/NUMBER_PORT_USED)/(BYTE_VALUE_MAX*BYTE_VALUE_MAX));
448
449                 /* Create the ipv4 exact match flow */
450                 memset(&entry, 0, sizeof(entry));
451                 switch (i & (NUMBER_PORT_USED - 1)) {
452                 case 0:
453                         entry = ipv4_l3fwd_em_route_array[0];
454                         entry.key.ip_dst = IPv4(101, c, b, a);
455                         break;
456                 case 1:
457                         entry = ipv4_l3fwd_em_route_array[1];
458                         entry.key.ip_dst = IPv4(201, c, b, a);
459                         break;
460                 case 2:
461                         entry = ipv4_l3fwd_em_route_array[2];
462                         entry.key.ip_dst = IPv4(111, c, b, a);
463                         break;
464                 case 3:
465                         entry = ipv4_l3fwd_em_route_array[3];
466                         entry.key.ip_dst = IPv4(211, c, b, a);
467                         break;
468                 };
469                 convert_ipv4_5tuple(&entry.key, &newkey);
470                 int32_t ret = rte_hash_add_key(h, (void *) &newkey);
471
472                 if (ret < 0)
473                         rte_exit(EXIT_FAILURE, "Unable to add entry %u\n", i);
474
475                 ipv4_l3fwd_out_if[ret] = (uint8_t) entry.if_out;
476
477         }
478         printf("Hash: Adding 0x%x keys\n", nr_flow);
479 }
480
481 static inline void
482 populate_ipv6_many_flow_into_table(const struct rte_hash *h,
483                 unsigned int nr_flow)
484 {
485         unsigned i;
486
487         mask1 = (rte_xmm_t){.u32 = {BIT_16_TO_23, ALL_32_BITS,
488                                 ALL_32_BITS, ALL_32_BITS} };
489         mask2 = (rte_xmm_t){.u32 = {ALL_32_BITS, ALL_32_BITS, 0, 0} };
490
491         for (i = 0; i < nr_flow; i++) {
492                 struct ipv6_l3fwd_em_route entry;
493                 union ipv6_5tuple_host newkey;
494
495                 uint8_t a = (uint8_t)
496                         ((i/NUMBER_PORT_USED)%BYTE_VALUE_MAX);
497                 uint8_t b = (uint8_t)
498                         (((i/NUMBER_PORT_USED)/BYTE_VALUE_MAX)%BYTE_VALUE_MAX);
499                 uint8_t c = (uint8_t)
500                         ((i/NUMBER_PORT_USED)/(BYTE_VALUE_MAX*BYTE_VALUE_MAX));
501
502                 /* Create the ipv6 exact match flow */
503                 memset(&entry, 0, sizeof(entry));
504                 switch (i & (NUMBER_PORT_USED - 1)) {
505                 case 0:
506                         entry = ipv6_l3fwd_em_route_array[0];
507                         break;
508                 case 1:
509                         entry = ipv6_l3fwd_em_route_array[1];
510                         break;
511                 case 2:
512                         entry = ipv6_l3fwd_em_route_array[2];
513                         break;
514                 case 3:
515                         entry = ipv6_l3fwd_em_route_array[3];
516                         break;
517                 };
518                 entry.key.ip_dst[13] = c;
519                 entry.key.ip_dst[14] = b;
520                 entry.key.ip_dst[15] = a;
521                 convert_ipv6_5tuple(&entry.key, &newkey);
522                 int32_t ret = rte_hash_add_key(h, (void *) &newkey);
523
524                 if (ret < 0)
525                         rte_exit(EXIT_FAILURE, "Unable to add entry %u\n", i);
526
527                 ipv6_l3fwd_out_if[ret] = (uint8_t) entry.if_out;
528
529         }
530         printf("Hash: Adding 0x%x keys\n", nr_flow);
531 }
532
533 /* Requirements:
534  * 1. IP packets without extension;
535  * 2. L4 payload should be either TCP or UDP.
536  */
537 int
538 em_check_ptype(int portid)
539 {
540         int i, ret;
541         int ptype_l3_ipv4_ext = 0;
542         int ptype_l3_ipv6_ext = 0;
543         int ptype_l4_tcp = 0;
544         int ptype_l4_udp = 0;
545         uint32_t ptype_mask = RTE_PTYPE_L3_MASK | RTE_PTYPE_L4_MASK;
546
547         ret = rte_eth_dev_get_supported_ptypes(portid, ptype_mask, NULL, 0);
548         if (ret <= 0)
549                 return 0;
550
551         uint32_t ptypes[ret];
552
553         ret = rte_eth_dev_get_supported_ptypes(portid, ptype_mask, ptypes, ret);
554         for (i = 0; i < ret; ++i) {
555                 switch (ptypes[i]) {
556                 case RTE_PTYPE_L3_IPV4_EXT:
557                         ptype_l3_ipv4_ext = 1;
558                         break;
559                 case RTE_PTYPE_L3_IPV6_EXT:
560                         ptype_l3_ipv6_ext = 1;
561                         break;
562                 case RTE_PTYPE_L4_TCP:
563                         ptype_l4_tcp = 1;
564                         break;
565                 case RTE_PTYPE_L4_UDP:
566                         ptype_l4_udp = 1;
567                         break;
568                 }
569         }
570
571         if (ptype_l3_ipv4_ext == 0)
572                 printf("port %d cannot parse RTE_PTYPE_L3_IPV4_EXT\n", portid);
573         if (ptype_l3_ipv6_ext == 0)
574                 printf("port %d cannot parse RTE_PTYPE_L3_IPV6_EXT\n", portid);
575         if (!ptype_l3_ipv4_ext || !ptype_l3_ipv6_ext)
576                 return 0;
577
578         if (ptype_l4_tcp == 0)
579                 printf("port %d cannot parse RTE_PTYPE_L4_TCP\n", portid);
580         if (ptype_l4_udp == 0)
581                 printf("port %d cannot parse RTE_PTYPE_L4_UDP\n", portid);
582         if (ptype_l4_tcp && ptype_l4_udp)
583                 return 1;
584
585         return 0;
586 }
587
588 static inline void
589 em_parse_ptype(struct rte_mbuf *m)
590 {
591         struct ether_hdr *eth_hdr;
592         uint32_t packet_type = RTE_PTYPE_UNKNOWN;
593         uint16_t ether_type;
594         void *l3;
595         int hdr_len;
596         struct ipv4_hdr *ipv4_hdr;
597         struct ipv6_hdr *ipv6_hdr;
598
599         eth_hdr = rte_pktmbuf_mtod(m, struct ether_hdr *);
600         ether_type = eth_hdr->ether_type;
601         l3 = (uint8_t *)eth_hdr + sizeof(struct ether_hdr);
602         if (ether_type == rte_cpu_to_be_16(ETHER_TYPE_IPv4)) {
603                 ipv4_hdr = (struct ipv4_hdr *)l3;
604                 hdr_len = (ipv4_hdr->version_ihl & IPV4_HDR_IHL_MASK) *
605                           IPV4_IHL_MULTIPLIER;
606                 if (hdr_len == sizeof(struct ipv4_hdr)) {
607                         packet_type |= RTE_PTYPE_L3_IPV4;
608                         if (ipv4_hdr->next_proto_id == IPPROTO_TCP)
609                                 packet_type |= RTE_PTYPE_L4_TCP;
610                         else if (ipv4_hdr->next_proto_id == IPPROTO_UDP)
611                                 packet_type |= RTE_PTYPE_L4_UDP;
612                 } else
613                         packet_type |= RTE_PTYPE_L3_IPV4_EXT;
614         } else if (ether_type == rte_cpu_to_be_16(ETHER_TYPE_IPv4)) {
615                 ipv6_hdr = (struct ipv6_hdr *)l3;
616                 if (ipv6_hdr->proto == IPPROTO_TCP)
617                         packet_type |= RTE_PTYPE_L3_IPV6 | RTE_PTYPE_L4_TCP;
618                 else if (ipv6_hdr->proto == IPPROTO_UDP)
619                         packet_type |= RTE_PTYPE_L3_IPV6 | RTE_PTYPE_L4_UDP;
620                 else
621                         packet_type |= RTE_PTYPE_L3_IPV6_EXT_UNKNOWN;
622         }
623
624         m->packet_type = packet_type;
625 }
626
627 uint16_t
628 em_cb_parse_ptype(uint8_t port __rte_unused, uint16_t queue __rte_unused,
629                   struct rte_mbuf *pkts[], uint16_t nb_pkts,
630                   uint16_t max_pkts __rte_unused,
631                   void *user_param __rte_unused)
632 {
633         unsigned i;
634
635         for (i = 0; i < nb_pkts; ++i)
636                 em_parse_ptype(pkts[i]);
637
638         return nb_pkts;
639 }
640
641 /* main processing loop */
642 int
643 em_main_loop(__attribute__((unused)) void *dummy)
644 {
645         struct rte_mbuf *pkts_burst[MAX_PKT_BURST];
646         unsigned lcore_id;
647         uint64_t prev_tsc, diff_tsc, cur_tsc;
648         int i, nb_rx;
649         uint8_t portid, queueid;
650         struct lcore_conf *qconf;
651         const uint64_t drain_tsc = (rte_get_tsc_hz() + US_PER_S - 1) /
652                 US_PER_S * BURST_TX_DRAIN_US;
653
654         prev_tsc = 0;
655
656         lcore_id = rte_lcore_id();
657         qconf = &lcore_conf[lcore_id];
658
659         if (qconf->n_rx_queue == 0) {
660                 RTE_LOG(INFO, L3FWD, "lcore %u has nothing to do\n", lcore_id);
661                 return 0;
662         }
663
664         RTE_LOG(INFO, L3FWD, "entering main loop on lcore %u\n", lcore_id);
665
666         for (i = 0; i < qconf->n_rx_queue; i++) {
667
668                 portid = qconf->rx_queue_list[i].port_id;
669                 queueid = qconf->rx_queue_list[i].queue_id;
670                 RTE_LOG(INFO, L3FWD,
671                         " -- lcoreid=%u portid=%hhu rxqueueid=%hhu\n",
672                         lcore_id, portid, queueid);
673         }
674
675         while (!force_quit) {
676
677                 cur_tsc = rte_rdtsc();
678
679                 /*
680                  * TX burst queue drain
681                  */
682                 diff_tsc = cur_tsc - prev_tsc;
683                 if (unlikely(diff_tsc > drain_tsc)) {
684
685                         for (i = 0; i < qconf->n_tx_port; ++i) {
686                                 portid = qconf->tx_port_id[i];
687                                 if (qconf->tx_mbufs[portid].len == 0)
688                                         continue;
689                                 send_burst(qconf,
690                                         qconf->tx_mbufs[portid].len,
691                                         portid);
692                                 qconf->tx_mbufs[portid].len = 0;
693                         }
694
695                         prev_tsc = cur_tsc;
696                 }
697
698                 /*
699                  * Read packet from RX queues
700                  */
701                 for (i = 0; i < qconf->n_rx_queue; ++i) {
702                         portid = qconf->rx_queue_list[i].port_id;
703                         queueid = qconf->rx_queue_list[i].queue_id;
704                         nb_rx = rte_eth_rx_burst(portid, queueid, pkts_burst,
705                                 MAX_PKT_BURST);
706                         if (nb_rx == 0)
707                                 continue;
708
709 #if defined(__SSE4_1__)
710                         l3fwd_em_send_packets(nb_rx, pkts_burst,
711                                                         portid, qconf);
712 #else
713                         l3fwd_em_no_opt_send_packets(nb_rx, pkts_burst,
714                                                         portid, qconf);
715 #endif /* __SSE_4_1__ */
716                 }
717         }
718
719         return 0;
720 }
721
722 /*
723  * Initialize exact match (hash) parameters.
724  */
725 void
726 setup_hash(const int socketid)
727 {
728         struct rte_hash_parameters ipv4_l3fwd_hash_params = {
729                 .name = NULL,
730                 .entries = L3FWD_HASH_ENTRIES,
731                 .key_len = sizeof(union ipv4_5tuple_host),
732                 .hash_func = ipv4_hash_crc,
733                 .hash_func_init_val = 0,
734         };
735
736         struct rte_hash_parameters ipv6_l3fwd_hash_params = {
737                 .name = NULL,
738                 .entries = L3FWD_HASH_ENTRIES,
739                 .key_len = sizeof(union ipv6_5tuple_host),
740                 .hash_func = ipv6_hash_crc,
741                 .hash_func_init_val = 0,
742         };
743
744         char s[64];
745
746         /* create ipv4 hash */
747         snprintf(s, sizeof(s), "ipv4_l3fwd_hash_%d", socketid);
748         ipv4_l3fwd_hash_params.name = s;
749         ipv4_l3fwd_hash_params.socket_id = socketid;
750         ipv4_l3fwd_em_lookup_struct[socketid] =
751                 rte_hash_create(&ipv4_l3fwd_hash_params);
752         if (ipv4_l3fwd_em_lookup_struct[socketid] == NULL)
753                 rte_exit(EXIT_FAILURE,
754                         "Unable to create the l3fwd hash on socket %d\n",
755                         socketid);
756
757         /* create ipv6 hash */
758         snprintf(s, sizeof(s), "ipv6_l3fwd_hash_%d", socketid);
759         ipv6_l3fwd_hash_params.name = s;
760         ipv6_l3fwd_hash_params.socket_id = socketid;
761         ipv6_l3fwd_em_lookup_struct[socketid] =
762                 rte_hash_create(&ipv6_l3fwd_hash_params);
763         if (ipv6_l3fwd_em_lookup_struct[socketid] == NULL)
764                 rte_exit(EXIT_FAILURE,
765                         "Unable to create the l3fwd hash on socket %d\n",
766                         socketid);
767
768         if (hash_entry_number != HASH_ENTRY_NUMBER_DEFAULT) {
769                 /* For testing hash matching with a large number of flows we
770                  * generate millions of IP 5-tuples with an incremented dst
771                  * address to initialize the hash table. */
772                 if (ipv6 == 0) {
773                         /* populate the ipv4 hash */
774                         populate_ipv4_many_flow_into_table(
775                                 ipv4_l3fwd_em_lookup_struct[socketid],
776                                 hash_entry_number);
777                 } else {
778                         /* populate the ipv6 hash */
779                         populate_ipv6_many_flow_into_table(
780                                 ipv6_l3fwd_em_lookup_struct[socketid],
781                                 hash_entry_number);
782                 }
783         } else {
784                 /*
785                  * Use data in ipv4/ipv6 l3fwd lookup table
786                  * directly to initialize the hash table.
787                  */
788                 if (ipv6 == 0) {
789                         /* populate the ipv4 hash */
790                         populate_ipv4_few_flow_into_table(
791                                 ipv4_l3fwd_em_lookup_struct[socketid]);
792                 } else {
793                         /* populate the ipv6 hash */
794                         populate_ipv6_few_flow_into_table(
795                                 ipv6_l3fwd_em_lookup_struct[socketid]);
796                 }
797         }
798 }
799
800 /* Return ipv4/ipv6 em fwd lookup struct. */
801 void *
802 em_get_ipv4_l3fwd_lookup_struct(const int socketid)
803 {
804         return ipv4_l3fwd_em_lookup_struct[socketid];
805 }
806
807 void *
808 em_get_ipv6_l3fwd_lookup_struct(const int socketid)
809 {
810         return ipv6_l3fwd_em_lookup_struct[socketid];
811 }