examples/l3fwd: add vector stubs for RISC-V
[dpdk.git] / examples / l3fwd / l3fwd_em.c
1 /* SPDX-License-Identifier: BSD-3-Clause
2  * Copyright(c) 2010-2016 Intel Corporation
3  */
4
5 #include <stdio.h>
6 #include <stdlib.h>
7 #include <stdint.h>
8 #include <inttypes.h>
9 #include <sys/types.h>
10 #include <string.h>
11 #include <sys/queue.h>
12 #include <stdarg.h>
13 #include <errno.h>
14 #include <getopt.h>
15 #include <stdbool.h>
16 #include <netinet/in.h>
17
18 #include <rte_debug.h>
19 #include <rte_ether.h>
20 #include <rte_ethdev.h>
21 #include <rte_cycles.h>
22 #include <rte_mbuf.h>
23 #include <rte_ip.h>
24 #include <rte_tcp.h>
25 #include <rte_udp.h>
26 #include <rte_hash.h>
27
28 #include "l3fwd.h"
29 #include "l3fwd_event.h"
30 #include "em_route_parse.c"
31
32 #if defined(RTE_ARCH_X86) || defined(__ARM_FEATURE_CRC32)
33 #define EM_HASH_CRC 1
34 #endif
35
36 #ifdef EM_HASH_CRC
37 #include <rte_hash_crc.h>
38 #define DEFAULT_HASH_FUNC       rte_hash_crc
39 #else
40 #include <rte_jhash.h>
41 #define DEFAULT_HASH_FUNC       rte_jhash
42 #endif
43
44 #define IPV6_ADDR_LEN 16
45
46 union ipv4_5tuple_host {
47         struct {
48                 uint8_t  pad0;
49                 uint8_t  proto;
50                 uint16_t pad1;
51                 uint32_t ip_src;
52                 uint32_t ip_dst;
53                 uint16_t port_src;
54                 uint16_t port_dst;
55         };
56         xmm_t xmm;
57 };
58
59 #define XMM_NUM_IN_IPV6_5TUPLE 3
60
61 union ipv6_5tuple_host {
62         struct {
63                 uint16_t pad0;
64                 uint8_t  proto;
65                 uint8_t  pad1;
66                 uint8_t  ip_src[IPV6_ADDR_LEN];
67                 uint8_t  ip_dst[IPV6_ADDR_LEN];
68                 uint16_t port_src;
69                 uint16_t port_dst;
70                 uint64_t reserve;
71         };
72         xmm_t xmm[XMM_NUM_IN_IPV6_5TUPLE];
73 };
74
75 /* 198.18.0.0/16 are set aside for RFC2544 benchmarking (RFC5735).
76  * Use RFC863 Discard Protocol.
77  */
78 const struct ipv4_l3fwd_em_route ipv4_l3fwd_em_route_array[] = {
79         {{RTE_IPV4(198, 18, 0, 0), RTE_IPV4(198, 18, 0, 1),  9, 9, IPPROTO_UDP}, 0},
80         {{RTE_IPV4(198, 18, 1, 0), RTE_IPV4(198, 18, 1, 1),  9, 9, IPPROTO_UDP}, 1},
81         {{RTE_IPV4(198, 18, 2, 0), RTE_IPV4(198, 18, 2, 1),  9, 9, IPPROTO_UDP}, 2},
82         {{RTE_IPV4(198, 18, 3, 0), RTE_IPV4(198, 18, 3, 1),  9, 9, IPPROTO_UDP}, 3},
83         {{RTE_IPV4(198, 18, 4, 0), RTE_IPV4(198, 18, 4, 1),  9, 9, IPPROTO_UDP}, 4},
84         {{RTE_IPV4(198, 18, 5, 0), RTE_IPV4(198, 18, 5, 1),  9, 9, IPPROTO_UDP}, 5},
85         {{RTE_IPV4(198, 18, 6, 0), RTE_IPV4(198, 18, 6, 1),  9, 9, IPPROTO_UDP}, 6},
86         {{RTE_IPV4(198, 18, 7, 0), RTE_IPV4(198, 18, 7, 1),  9, 9, IPPROTO_UDP}, 7},
87         {{RTE_IPV4(198, 18, 8, 0), RTE_IPV4(198, 18, 8, 1),  9, 9, IPPROTO_UDP}, 8},
88         {{RTE_IPV4(198, 18, 9, 0), RTE_IPV4(198, 18, 9, 1),  9, 9, IPPROTO_UDP}, 9},
89         {{RTE_IPV4(198, 18, 10, 0), RTE_IPV4(198, 18, 10, 1),  9, 9, IPPROTO_UDP}, 10},
90         {{RTE_IPV4(198, 18, 11, 0), RTE_IPV4(198, 18, 11, 1),  9, 9, IPPROTO_UDP}, 11},
91         {{RTE_IPV4(198, 18, 12, 0), RTE_IPV4(198, 18, 12, 1),  9, 9, IPPROTO_UDP}, 12},
92         {{RTE_IPV4(198, 18, 13, 0), RTE_IPV4(198, 18, 13, 1),  9, 9, IPPROTO_UDP}, 13},
93         {{RTE_IPV4(198, 18, 14, 0), RTE_IPV4(198, 18, 14, 1),  9, 9, IPPROTO_UDP}, 14},
94         {{RTE_IPV4(198, 18, 15, 0), RTE_IPV4(198, 18, 15, 1),  9, 9, IPPROTO_UDP}, 15},
95 };
96
97 /* 2001:0200::/48 is IANA reserved range for IPv6 benchmarking (RFC5180).
98  * Use RFC863 Discard Protocol.
99  */
100 const struct ipv6_l3fwd_em_route ipv6_l3fwd_em_route_array[] = {
101         {{{32, 1, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0},
102           {32, 1, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 0},
103         {{{32, 1, 2, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0},
104           {32, 1, 2, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 1},
105         {{{32, 1, 2, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 0},
106           {32, 1, 2, 0, 0, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 2},
107         {{{32, 1, 2, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, 0},
108           {32, 1, 2, 0, 0, 0, 0, 3, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 3},
109         {{{32, 1, 2, 0, 0, 0, 0, 4, 0, 0, 0, 0, 0, 0, 0, 0},
110           {32, 1, 2, 0, 0, 0, 0, 4, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 4},
111         {{{32, 1, 2, 0, 0, 0, 0, 5, 0, 0, 0, 0, 0, 0, 0, 0},
112           {32, 1, 2, 0, 0, 0, 0, 5, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 5},
113         {{{32, 1, 2, 0, 0, 0, 0, 6, 0, 0, 0, 0, 0, 0, 0, 0},
114           {32, 1, 2, 0, 0, 0, 0, 6, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 6},
115         {{{32, 1, 2, 0, 0, 0, 0, 7, 0, 0, 0, 0, 0, 0, 0, 0},
116           {32, 1, 2, 0, 0, 0, 0, 7, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 7},
117         {{{32, 1, 2, 0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 0, 0, 0},
118           {32, 1, 2, 0, 0, 0, 0, 8, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 8},
119         {{{32, 1, 2, 0, 0, 0, 0, 9, 0, 0, 0, 0, 0, 0, 0, 0},
120           {32, 1, 2, 0, 0, 0, 0, 9, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 9},
121         {{{32, 1, 2, 0, 0, 0, 0, 10, 0, 0, 0, 0, 0, 0, 0, 0},
122           {32, 1, 2, 0, 0, 0, 0, 10, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 10},
123         {{{32, 1, 2, 0, 0, 0, 0, 11, 0, 0, 0, 0, 0, 0, 0, 0},
124           {32, 1, 2, 0, 0, 0, 0, 11, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 11},
125         {{{32, 1, 2, 0, 0, 0, 0, 12, 0, 0, 0, 0, 0, 0, 0, 0},
126           {32, 1, 2, 0, 0, 0, 0, 12, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 12},
127         {{{32, 1, 2, 0, 0, 0, 0, 13, 0, 0, 0, 0, 0, 0, 0, 0},
128           {32, 1, 2, 0, 0, 0, 0, 13, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 13},
129         {{{32, 1, 2, 0, 0, 0, 0, 14, 0, 0, 0, 0, 0, 0, 0, 0},
130           {32, 1, 2, 0, 0, 0, 0, 14, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 14},
131         {{{32, 1, 2, 0, 0, 0, 0, 15, 0, 0, 0, 0, 0, 0, 0, 0},
132           {32, 1, 2, 0, 0, 0, 0, 15, 0, 0, 0, 0, 0, 0, 0, 1}, 9, 9, IPPROTO_UDP}, 15},
133 };
134
135 struct rte_hash *ipv4_l3fwd_em_lookup_struct[NB_SOCKETS];
136 struct rte_hash *ipv6_l3fwd_em_lookup_struct[NB_SOCKETS];
137
138 static inline uint32_t
139 ipv4_hash_crc(const void *data, __rte_unused uint32_t data_len,
140                 uint32_t init_val)
141 {
142         const union ipv4_5tuple_host *k;
143         uint32_t t;
144         const uint32_t *p;
145
146         k = data;
147         t = k->proto;
148         p = (const uint32_t *)&k->port_src;
149
150 #ifdef EM_HASH_CRC
151         init_val = rte_hash_crc_4byte(t, init_val);
152         init_val = rte_hash_crc_4byte(k->ip_src, init_val);
153         init_val = rte_hash_crc_4byte(k->ip_dst, init_val);
154         init_val = rte_hash_crc_4byte(*p, init_val);
155 #else
156         init_val = rte_jhash_1word(t, init_val);
157         init_val = rte_jhash_1word(k->ip_src, init_val);
158         init_val = rte_jhash_1word(k->ip_dst, init_val);
159         init_val = rte_jhash_1word(*p, init_val);
160 #endif
161
162         return init_val;
163 }
164
165 static inline uint32_t
166 ipv6_hash_crc(const void *data, __rte_unused uint32_t data_len,
167                 uint32_t init_val)
168 {
169         const union ipv6_5tuple_host *k;
170         uint32_t t;
171         const uint32_t *p;
172 #ifdef EM_HASH_CRC
173         const uint32_t  *ip_src0, *ip_src1, *ip_src2, *ip_src3;
174         const uint32_t  *ip_dst0, *ip_dst1, *ip_dst2, *ip_dst3;
175 #endif
176
177         k = data;
178         t = k->proto;
179         p = (const uint32_t *)&k->port_src;
180
181 #ifdef EM_HASH_CRC
182         ip_src0 = (const uint32_t *) k->ip_src;
183         ip_src1 = (const uint32_t *)(k->ip_src+4);
184         ip_src2 = (const uint32_t *)(k->ip_src+8);
185         ip_src3 = (const uint32_t *)(k->ip_src+12);
186         ip_dst0 = (const uint32_t *) k->ip_dst;
187         ip_dst1 = (const uint32_t *)(k->ip_dst+4);
188         ip_dst2 = (const uint32_t *)(k->ip_dst+8);
189         ip_dst3 = (const uint32_t *)(k->ip_dst+12);
190         init_val = rte_hash_crc_4byte(t, init_val);
191         init_val = rte_hash_crc_4byte(*ip_src0, init_val);
192         init_val = rte_hash_crc_4byte(*ip_src1, init_val);
193         init_val = rte_hash_crc_4byte(*ip_src2, init_val);
194         init_val = rte_hash_crc_4byte(*ip_src3, init_val);
195         init_val = rte_hash_crc_4byte(*ip_dst0, init_val);
196         init_val = rte_hash_crc_4byte(*ip_dst1, init_val);
197         init_val = rte_hash_crc_4byte(*ip_dst2, init_val);
198         init_val = rte_hash_crc_4byte(*ip_dst3, init_val);
199         init_val = rte_hash_crc_4byte(*p, init_val);
200 #else
201         init_val = rte_jhash_1word(t, init_val);
202         init_val = rte_jhash(k->ip_src,
203                         sizeof(uint8_t) * IPV6_ADDR_LEN, init_val);
204         init_val = rte_jhash(k->ip_dst,
205                         sizeof(uint8_t) * IPV6_ADDR_LEN, init_val);
206         init_val = rte_jhash_1word(*p, init_val);
207 #endif
208         return init_val;
209 }
210
211 static uint8_t ipv4_l3fwd_out_if[L3FWD_HASH_ENTRIES] __rte_cache_aligned;
212 static uint8_t ipv6_l3fwd_out_if[L3FWD_HASH_ENTRIES] __rte_cache_aligned;
213
214 static rte_xmm_t mask0;
215 static rte_xmm_t mask1;
216 static rte_xmm_t mask2;
217
218 #if defined(__SSE2__)
219 static inline xmm_t
220 em_mask_key(void *key, xmm_t mask)
221 {
222         __m128i data = _mm_loadu_si128((__m128i *)(key));
223
224         return _mm_and_si128(data, mask);
225 }
226 #elif defined(__ARM_NEON)
227 static inline xmm_t
228 em_mask_key(void *key, xmm_t mask)
229 {
230         int32x4_t data = vld1q_s32((int32_t *)key);
231
232         return vandq_s32(data, mask);
233 }
234 #elif defined(__ALTIVEC__)
235 static inline xmm_t
236 em_mask_key(void *key, xmm_t mask)
237 {
238         xmm_t data = vec_ld(0, (xmm_t *)(key));
239
240         return vec_and(data, mask);
241 }
242 #elif defined(RTE_ARCH_RISCV)
243 static inline xmm_t
244 em_mask_key(void *key, xmm_t mask)
245 {
246         xmm_t data = vect_load_128(key);
247
248         return vect_and(data, mask);
249 }
250 #else
251 #error No vector engine (SSE, NEON, ALTIVEC) available, check your toolchain
252 #endif
253
254 /* Performing hash-based lookups. 8< */
255 static inline uint16_t
256 em_get_ipv4_dst_port(void *ipv4_hdr, uint16_t portid, void *lookup_struct)
257 {
258         int ret = 0;
259         union ipv4_5tuple_host key;
260         struct rte_hash *ipv4_l3fwd_lookup_struct =
261                 (struct rte_hash *)lookup_struct;
262
263         ipv4_hdr = (uint8_t *)ipv4_hdr +
264                 offsetof(struct rte_ipv4_hdr, time_to_live);
265
266         /*
267          * Get 5 tuple: dst port, src port, dst IP address,
268          * src IP address and protocol.
269          */
270         key.xmm = em_mask_key(ipv4_hdr, mask0.x);
271
272         /* Find destination port */
273         ret = rte_hash_lookup(ipv4_l3fwd_lookup_struct, (const void *)&key);
274         return (ret < 0) ? portid : ipv4_l3fwd_out_if[ret];
275 }
276 /* >8 End of performing hash-based lookups. */
277
278 static inline uint16_t
279 em_get_ipv6_dst_port(void *ipv6_hdr, uint16_t portid, void *lookup_struct)
280 {
281         int ret = 0;
282         union ipv6_5tuple_host key;
283         struct rte_hash *ipv6_l3fwd_lookup_struct =
284                 (struct rte_hash *)lookup_struct;
285
286         ipv6_hdr = (uint8_t *)ipv6_hdr +
287                 offsetof(struct rte_ipv6_hdr, payload_len);
288         void *data0 = ipv6_hdr;
289         void *data1 = ((uint8_t *)ipv6_hdr) + sizeof(xmm_t);
290         void *data2 = ((uint8_t *)ipv6_hdr) + sizeof(xmm_t) + sizeof(xmm_t);
291
292         /* Get part of 5 tuple: src IP address lower 96 bits and protocol */
293         key.xmm[0] = em_mask_key(data0, mask1.x);
294
295         /*
296          * Get part of 5 tuple: dst IP address lower 96 bits
297          * and src IP address higher 32 bits.
298          */
299 #if defined RTE_ARCH_X86
300         key.xmm[1] = _mm_loadu_si128(data1);
301 #else
302         key.xmm[1] = *(xmm_t *)data1;
303 #endif
304
305         /*
306          * Get part of 5 tuple: dst port and src port
307          * and dst IP address higher 32 bits.
308          */
309         key.xmm[2] = em_mask_key(data2, mask2.x);
310
311         /* Find destination port */
312         ret = rte_hash_lookup(ipv6_l3fwd_lookup_struct, (const void *)&key);
313         return (ret < 0) ? portid : ipv6_l3fwd_out_if[ret];
314 }
315
316 #if defined RTE_ARCH_X86 || defined __ARM_NEON
317 #if defined(NO_HASH_MULTI_LOOKUP)
318 #include "l3fwd_em_sequential.h"
319 #else
320 #include "l3fwd_em_hlm.h"
321 #endif
322 #else
323 #include "l3fwd_em.h"
324 #endif
325
326 static void
327 convert_ipv4_5tuple(struct ipv4_5tuple *key1,
328                 union ipv4_5tuple_host *key2)
329 {
330         key2->ip_dst = rte_cpu_to_be_32(key1->ip_dst);
331         key2->ip_src = rte_cpu_to_be_32(key1->ip_src);
332         key2->port_dst = rte_cpu_to_be_16(key1->port_dst);
333         key2->port_src = rte_cpu_to_be_16(key1->port_src);
334         key2->proto = key1->proto;
335         key2->pad0 = 0;
336         key2->pad1 = 0;
337 }
338
339 static void
340 convert_ipv6_5tuple(struct ipv6_5tuple *key1,
341                 union ipv6_5tuple_host *key2)
342 {
343         uint32_t i;
344
345         for (i = 0; i < 16; i++) {
346                 key2->ip_dst[i] = key1->ip_dst[i];
347                 key2->ip_src[i] = key1->ip_src[i];
348         }
349         key2->port_dst = rte_cpu_to_be_16(key1->port_dst);
350         key2->port_src = rte_cpu_to_be_16(key1->port_src);
351         key2->proto = key1->proto;
352         key2->pad0 = 0;
353         key2->pad1 = 0;
354         key2->reserve = 0;
355 }
356
357 #define BYTE_VALUE_MAX 256
358 #define ALL_32_BITS 0xffffffff
359 #define BIT_8_TO_15 0x0000ff00
360
361 static inline void
362 populate_ipv4_flow_into_table(const struct rte_hash *h)
363 {
364         int i;
365         int32_t ret;
366         struct rte_eth_dev_info dev_info;
367         char srcbuf[INET6_ADDRSTRLEN];
368         char dstbuf[INET6_ADDRSTRLEN];
369
370         mask0 = (rte_xmm_t){.u32 = {BIT_8_TO_15, ALL_32_BITS,
371                                 ALL_32_BITS, ALL_32_BITS} };
372
373         for (i = 0; i < route_num_v4; i++) {
374                 struct em_rule *entry;
375                 union ipv4_5tuple_host newkey;
376                 struct in_addr src;
377                 struct in_addr dst;
378
379                 if ((1 << em_route_base_v4[i].if_out &
380                                 enabled_port_mask) == 0)
381                         continue;
382
383                 entry = &em_route_base_v4[i];
384                 convert_ipv4_5tuple(&(entry->v4_key), &newkey);
385                 ret = rte_hash_add_key(h, (void *) &newkey);
386                 if (ret < 0) {
387                         rte_exit(EXIT_FAILURE, "Unable to add entry %" PRIu32
388                                 " to the l3fwd hash.\n", i);
389                 }
390                 ipv4_l3fwd_out_if[ret] = entry->if_out;
391                 ret = rte_eth_dev_info_get(em_route_base_v4[i].if_out,
392                                      &dev_info);
393                 if (ret != 0)
394                         rte_exit(EXIT_FAILURE,
395                                 "Error during getting device (port %u) info: %s\n",
396                                 em_route_base_v4[i].if_out, strerror(-ret));
397
398                 src.s_addr = htonl(em_route_base_v4[i].v4_key.ip_src);
399                 dst.s_addr = htonl(em_route_base_v4[i].v4_key.ip_dst);
400                 printf("EM: Adding route %s, %s, %d, %d, %d (%d) [%s]\n",
401                            inet_ntop(AF_INET, &dst, dstbuf, sizeof(dstbuf)),
402                        inet_ntop(AF_INET, &src, srcbuf, sizeof(srcbuf)),
403                            em_route_base_v4[i].v4_key.port_dst,
404                            em_route_base_v4[i].v4_key.port_src,
405                            em_route_base_v4[i].v4_key.proto,
406                        em_route_base_v4[i].if_out, dev_info.device->name);
407         }
408         printf("Hash: Adding 0x%" PRIx64 " keys\n",
409                 (uint64_t)route_num_v4);
410 }
411
412 #define BIT_16_TO_23 0x00ff0000
413 static inline void
414 populate_ipv6_flow_into_table(const struct rte_hash *h)
415 {
416         int i;
417         int32_t ret;
418         struct rte_eth_dev_info dev_info;
419         char srcbuf[INET6_ADDRSTRLEN];
420         char dstbuf[INET6_ADDRSTRLEN];
421
422         mask1 = (rte_xmm_t){.u32 = {BIT_16_TO_23, ALL_32_BITS,
423                                 ALL_32_BITS, ALL_32_BITS} };
424
425         mask2 = (rte_xmm_t){.u32 = {ALL_32_BITS, ALL_32_BITS, 0, 0} };
426
427         for (i = 0; i < route_num_v6; i++) {
428                 struct em_rule *entry;
429                 union ipv6_5tuple_host newkey;
430
431                 if ((1 << em_route_base_v6[i].if_out &
432                                 enabled_port_mask) == 0)
433                         continue;
434
435                 entry = &em_route_base_v6[i];
436                 convert_ipv6_5tuple(&(entry->v6_key), &newkey);
437                 ret = rte_hash_add_key(h, (void *) &newkey);
438                 if (ret < 0) {
439                         rte_exit(EXIT_FAILURE, "Unable to add entry %" PRIu32
440                                 " to the l3fwd hash.\n", i);
441                 }
442                 ipv6_l3fwd_out_if[ret] = entry->if_out;
443                 ret = rte_eth_dev_info_get(em_route_base_v6[i].if_out,
444                                      &dev_info);
445                 if (ret != 0)
446                         rte_exit(EXIT_FAILURE,
447                                 "Error during getting device (port %u) info: %s\n",
448                                 em_route_base_v6[i].if_out, strerror(-ret));
449
450                 printf("EM: Adding route %s, %s, %d, %d, %d (%d) [%s]\n",
451                            inet_ntop(AF_INET6, em_route_base_v6[i].v6_key.ip_dst,
452                            dstbuf, sizeof(dstbuf)),
453                        inet_ntop(AF_INET6, em_route_base_v6[i].v6_key.ip_src,
454                            srcbuf, sizeof(srcbuf)),
455                            em_route_base_v6[i].v6_key.port_dst,
456                            em_route_base_v6[i].v6_key.port_src,
457                            em_route_base_v6[i].v6_key.proto,
458                        em_route_base_v6[i].if_out, dev_info.device->name);
459         }
460         printf("Hash: Adding 0x%" PRIx64 "keys\n",
461                 (uint64_t)route_num_v6);
462 }
463
464 /* Requirements:
465  * 1. IP packets without extension;
466  * 2. L4 payload should be either TCP or UDP.
467  */
468 int
469 em_check_ptype(int portid)
470 {
471         int i, ret;
472         int ptype_l3_ipv4_ext = 0;
473         int ptype_l3_ipv6_ext = 0;
474         int ptype_l4_tcp = 0;
475         int ptype_l4_udp = 0;
476         uint32_t ptype_mask = RTE_PTYPE_L3_MASK | RTE_PTYPE_L4_MASK;
477
478         ret = rte_eth_dev_get_supported_ptypes(portid, ptype_mask, NULL, 0);
479         if (ret <= 0)
480                 return 0;
481
482         uint32_t ptypes[ret];
483
484         ret = rte_eth_dev_get_supported_ptypes(portid, ptype_mask, ptypes, ret);
485         for (i = 0; i < ret; ++i) {
486                 switch (ptypes[i]) {
487                 case RTE_PTYPE_L3_IPV4_EXT:
488                         ptype_l3_ipv4_ext = 1;
489                         break;
490                 case RTE_PTYPE_L3_IPV6_EXT:
491                         ptype_l3_ipv6_ext = 1;
492                         break;
493                 case RTE_PTYPE_L4_TCP:
494                         ptype_l4_tcp = 1;
495                         break;
496                 case RTE_PTYPE_L4_UDP:
497                         ptype_l4_udp = 1;
498                         break;
499                 }
500         }
501
502         if (ptype_l3_ipv4_ext == 0)
503                 printf("port %d cannot parse RTE_PTYPE_L3_IPV4_EXT\n", portid);
504         if (ptype_l3_ipv6_ext == 0)
505                 printf("port %d cannot parse RTE_PTYPE_L3_IPV6_EXT\n", portid);
506         if (!ptype_l3_ipv4_ext || !ptype_l3_ipv6_ext)
507                 return 0;
508
509         if (ptype_l4_tcp == 0)
510                 printf("port %d cannot parse RTE_PTYPE_L4_TCP\n", portid);
511         if (ptype_l4_udp == 0)
512                 printf("port %d cannot parse RTE_PTYPE_L4_UDP\n", portid);
513         if (ptype_l4_tcp && ptype_l4_udp)
514                 return 1;
515
516         return 0;
517 }
518
519 static inline void
520 em_parse_ptype(struct rte_mbuf *m)
521 {
522         struct rte_ether_hdr *eth_hdr;
523         uint32_t packet_type = RTE_PTYPE_UNKNOWN;
524         uint16_t ether_type;
525         void *l3;
526         int hdr_len;
527         struct rte_ipv4_hdr *ipv4_hdr;
528         struct rte_ipv6_hdr *ipv6_hdr;
529
530         eth_hdr = rte_pktmbuf_mtod(m, struct rte_ether_hdr *);
531         ether_type = eth_hdr->ether_type;
532         l3 = (uint8_t *)eth_hdr + sizeof(struct rte_ether_hdr);
533         if (ether_type == rte_cpu_to_be_16(RTE_ETHER_TYPE_IPV4)) {
534                 ipv4_hdr = (struct rte_ipv4_hdr *)l3;
535                 hdr_len = rte_ipv4_hdr_len(ipv4_hdr);
536                 if (hdr_len == sizeof(struct rte_ipv4_hdr)) {
537                         packet_type |= RTE_PTYPE_L3_IPV4;
538                         if (ipv4_hdr->next_proto_id == IPPROTO_TCP)
539                                 packet_type |= RTE_PTYPE_L4_TCP;
540                         else if (ipv4_hdr->next_proto_id == IPPROTO_UDP)
541                                 packet_type |= RTE_PTYPE_L4_UDP;
542                 } else
543                         packet_type |= RTE_PTYPE_L3_IPV4_EXT;
544         } else if (ether_type == rte_cpu_to_be_16(RTE_ETHER_TYPE_IPV6)) {
545                 ipv6_hdr = (struct rte_ipv6_hdr *)l3;
546                 if (ipv6_hdr->proto == IPPROTO_TCP)
547                         packet_type |= RTE_PTYPE_L3_IPV6 | RTE_PTYPE_L4_TCP;
548                 else if (ipv6_hdr->proto == IPPROTO_UDP)
549                         packet_type |= RTE_PTYPE_L3_IPV6 | RTE_PTYPE_L4_UDP;
550                 else
551                         packet_type |= RTE_PTYPE_L3_IPV6_EXT_UNKNOWN;
552         }
553
554         m->packet_type = packet_type;
555 }
556
557 uint16_t
558 em_cb_parse_ptype(uint16_t port __rte_unused, uint16_t queue __rte_unused,
559                   struct rte_mbuf *pkts[], uint16_t nb_pkts,
560                   uint16_t max_pkts __rte_unused,
561                   void *user_param __rte_unused)
562 {
563         unsigned i;
564
565         for (i = 0; i < nb_pkts; ++i)
566                 em_parse_ptype(pkts[i]);
567
568         return nb_pkts;
569 }
570
571 /* main processing loop */
572 int
573 em_main_loop(__rte_unused void *dummy)
574 {
575         struct rte_mbuf *pkts_burst[MAX_PKT_BURST];
576         unsigned lcore_id;
577         uint64_t prev_tsc, diff_tsc, cur_tsc;
578         int i, nb_rx;
579         uint8_t queueid;
580         uint16_t portid;
581         struct lcore_conf *qconf;
582         const uint64_t drain_tsc = (rte_get_tsc_hz() + US_PER_S - 1) /
583                 US_PER_S * BURST_TX_DRAIN_US;
584
585         lcore_id = rte_lcore_id();
586         qconf = &lcore_conf[lcore_id];
587
588         const uint16_t n_rx_q = qconf->n_rx_queue;
589         const uint16_t n_tx_p = qconf->n_tx_port;
590         if (n_rx_q == 0) {
591                 RTE_LOG(INFO, L3FWD, "lcore %u has nothing to do\n", lcore_id);
592                 return 0;
593         }
594
595         RTE_LOG(INFO, L3FWD, "entering main loop on lcore %u\n", lcore_id);
596
597         for (i = 0; i < n_rx_q; i++) {
598
599                 portid = qconf->rx_queue_list[i].port_id;
600                 queueid = qconf->rx_queue_list[i].queue_id;
601                 RTE_LOG(INFO, L3FWD,
602                         " -- lcoreid=%u portid=%u rxqueueid=%hhu\n",
603                         lcore_id, portid, queueid);
604         }
605
606         cur_tsc = rte_rdtsc();
607         prev_tsc = cur_tsc;
608
609         while (!force_quit) {
610
611                 /*
612                  * TX burst queue drain
613                  */
614                 diff_tsc = cur_tsc - prev_tsc;
615                 if (unlikely(diff_tsc > drain_tsc)) {
616
617                         for (i = 0; i < n_tx_p; ++i) {
618                                 portid = qconf->tx_port_id[i];
619                                 if (qconf->tx_mbufs[portid].len == 0)
620                                         continue;
621                                 send_burst(qconf,
622                                         qconf->tx_mbufs[portid].len,
623                                         portid);
624                                 qconf->tx_mbufs[portid].len = 0;
625                         }
626
627                         prev_tsc = cur_tsc;
628                 }
629
630                 /*
631                  * Read packet from RX queues
632                  */
633                 for (i = 0; i < n_rx_q; ++i) {
634                         portid = qconf->rx_queue_list[i].port_id;
635                         queueid = qconf->rx_queue_list[i].queue_id;
636                         nb_rx = rte_eth_rx_burst(portid, queueid, pkts_burst,
637                                 MAX_PKT_BURST);
638                         if (nb_rx == 0)
639                                 continue;
640
641 #if defined RTE_ARCH_X86 || defined __ARM_NEON
642                         l3fwd_em_send_packets(nb_rx, pkts_burst,
643                                                         portid, qconf);
644 #else
645                         l3fwd_em_no_opt_send_packets(nb_rx, pkts_burst,
646                                                         portid, qconf);
647 #endif
648                 }
649
650                 cur_tsc = rte_rdtsc();
651         }
652
653         return 0;
654 }
655
656 static __rte_always_inline void
657 em_event_loop_single(struct l3fwd_event_resources *evt_rsrc,
658                 const uint8_t flags)
659 {
660         const int event_p_id = l3fwd_get_free_event_port(evt_rsrc);
661         const uint8_t tx_q_id = evt_rsrc->evq.event_q_id[
662                 evt_rsrc->evq.nb_queues - 1];
663         const uint8_t event_d_id = evt_rsrc->event_d_id;
664         uint8_t deq = 0, enq = 0;
665         struct lcore_conf *lconf;
666         unsigned int lcore_id;
667         struct rte_event ev;
668
669         if (event_p_id < 0)
670                 return;
671
672         lcore_id = rte_lcore_id();
673         lconf = &lcore_conf[lcore_id];
674
675         RTE_LOG(INFO, L3FWD, "entering %s on lcore %u\n", __func__, lcore_id);
676         while (!force_quit) {
677                 deq = rte_event_dequeue_burst(event_d_id, event_p_id, &ev, 1,
678                                               0);
679                 if (!deq)
680                         continue;
681
682                 struct rte_mbuf *mbuf = ev.mbuf;
683
684 #if defined RTE_ARCH_X86 || defined __ARM_NEON
685                 mbuf->port = em_get_dst_port(lconf, mbuf, mbuf->port);
686                 process_packet(mbuf, &mbuf->port);
687 #else
688                 l3fwd_em_simple_process(mbuf, lconf);
689 #endif
690                 if (mbuf->port == BAD_PORT) {
691                         rte_pktmbuf_free(mbuf);
692                         continue;
693                 }
694
695                 if (flags & L3FWD_EVENT_TX_ENQ) {
696                         ev.queue_id = tx_q_id;
697                         ev.op = RTE_EVENT_OP_FORWARD;
698                         do {
699                                 enq = rte_event_enqueue_burst(
700                                         event_d_id, event_p_id, &ev, 1);
701                         } while (!enq && !force_quit);
702                 }
703
704                 if (flags & L3FWD_EVENT_TX_DIRECT) {
705                         rte_event_eth_tx_adapter_txq_set(mbuf, 0);
706                         do {
707                                 enq = rte_event_eth_tx_adapter_enqueue(
708                                         event_d_id, event_p_id, &ev, 1, 0);
709                         } while (!enq && !force_quit);
710                 }
711         }
712
713         l3fwd_event_worker_cleanup(event_d_id, event_p_id, &ev, enq, deq, 0);
714 }
715
716 static __rte_always_inline void
717 em_event_loop_burst(struct l3fwd_event_resources *evt_rsrc,
718                 const uint8_t flags)
719 {
720         const int event_p_id = l3fwd_get_free_event_port(evt_rsrc);
721         const uint8_t tx_q_id = evt_rsrc->evq.event_q_id[
722                 evt_rsrc->evq.nb_queues - 1];
723         const uint8_t event_d_id = evt_rsrc->event_d_id;
724         const uint16_t deq_len = evt_rsrc->deq_depth;
725         struct rte_event events[MAX_PKT_BURST];
726         int i, nb_enq = 0, nb_deq = 0;
727         struct lcore_conf *lconf;
728         unsigned int lcore_id;
729
730         if (event_p_id < 0)
731                 return;
732
733         lcore_id = rte_lcore_id();
734
735         lconf = &lcore_conf[lcore_id];
736
737         RTE_LOG(INFO, L3FWD, "entering %s on lcore %u\n", __func__, lcore_id);
738
739         while (!force_quit) {
740                 /* Read events from RX queues */
741                 nb_deq = rte_event_dequeue_burst(event_d_id, event_p_id,
742                                 events, deq_len, 0);
743                 if (nb_deq == 0) {
744                         rte_pause();
745                         continue;
746                 }
747
748 #if defined RTE_ARCH_X86 || defined __ARM_NEON
749                 l3fwd_em_process_events(nb_deq, (struct rte_event **)&events,
750                                         lconf);
751 #else
752                 l3fwd_em_no_opt_process_events(nb_deq,
753                                                (struct rte_event **)&events,
754                                                lconf);
755 #endif
756                 for (i = 0; i < nb_deq; i++) {
757                         if (flags & L3FWD_EVENT_TX_ENQ) {
758                                 events[i].queue_id = tx_q_id;
759                                 events[i].op = RTE_EVENT_OP_FORWARD;
760                         }
761
762                         if (flags & L3FWD_EVENT_TX_DIRECT)
763                                 rte_event_eth_tx_adapter_txq_set(events[i].mbuf,
764                                                                  0);
765                 }
766
767                 if (flags & L3FWD_EVENT_TX_ENQ) {
768                         nb_enq = rte_event_enqueue_burst(event_d_id, event_p_id,
769                                         events, nb_deq);
770                         while (nb_enq < nb_deq && !force_quit)
771                                 nb_enq += rte_event_enqueue_burst(event_d_id,
772                                                 event_p_id, events + nb_enq,
773                                                 nb_deq - nb_enq);
774                 }
775
776                 if (flags & L3FWD_EVENT_TX_DIRECT) {
777                         nb_enq = rte_event_eth_tx_adapter_enqueue(event_d_id,
778                                         event_p_id, events, nb_deq, 0);
779                         while (nb_enq < nb_deq && !force_quit)
780                                 nb_enq += rte_event_eth_tx_adapter_enqueue(
781                                                 event_d_id, event_p_id,
782                                                 events + nb_enq,
783                                                 nb_deq - nb_enq, 0);
784                 }
785         }
786
787         l3fwd_event_worker_cleanup(event_d_id, event_p_id, events, nb_enq,
788                                    nb_deq, 0);
789 }
790
791 static __rte_always_inline void
792 em_event_loop(struct l3fwd_event_resources *evt_rsrc,
793                  const uint8_t flags)
794 {
795         if (flags & L3FWD_EVENT_SINGLE)
796                 em_event_loop_single(evt_rsrc, flags);
797         if (flags & L3FWD_EVENT_BURST)
798                 em_event_loop_burst(evt_rsrc, flags);
799 }
800
801 int __rte_noinline
802 em_event_main_loop_tx_d(__rte_unused void *dummy)
803 {
804         struct l3fwd_event_resources *evt_rsrc =
805                                         l3fwd_get_eventdev_rsrc();
806
807         em_event_loop(evt_rsrc, L3FWD_EVENT_TX_DIRECT | L3FWD_EVENT_SINGLE);
808         return 0;
809 }
810
811 int __rte_noinline
812 em_event_main_loop_tx_d_burst(__rte_unused void *dummy)
813 {
814         struct l3fwd_event_resources *evt_rsrc =
815                                         l3fwd_get_eventdev_rsrc();
816
817         em_event_loop(evt_rsrc, L3FWD_EVENT_TX_DIRECT | L3FWD_EVENT_BURST);
818         return 0;
819 }
820
821 int __rte_noinline
822 em_event_main_loop_tx_q(__rte_unused void *dummy)
823 {
824         struct l3fwd_event_resources *evt_rsrc =
825                                         l3fwd_get_eventdev_rsrc();
826
827         em_event_loop(evt_rsrc, L3FWD_EVENT_TX_ENQ | L3FWD_EVENT_SINGLE);
828         return 0;
829 }
830
831 int __rte_noinline
832 em_event_main_loop_tx_q_burst(__rte_unused void *dummy)
833 {
834         struct l3fwd_event_resources *evt_rsrc =
835                                         l3fwd_get_eventdev_rsrc();
836
837         em_event_loop(evt_rsrc, L3FWD_EVENT_TX_ENQ | L3FWD_EVENT_BURST);
838         return 0;
839 }
840
841 /* Same eventdev loop for single and burst of vector */
842 static __rte_always_inline void
843 em_event_loop_vector(struct l3fwd_event_resources *evt_rsrc,
844                      const uint8_t flags)
845 {
846         const int event_p_id = l3fwd_get_free_event_port(evt_rsrc);
847         const uint8_t tx_q_id =
848                 evt_rsrc->evq.event_q_id[evt_rsrc->evq.nb_queues - 1];
849         const uint8_t event_d_id = evt_rsrc->event_d_id;
850         const uint16_t deq_len = evt_rsrc->deq_depth;
851         struct rte_event events[MAX_PKT_BURST];
852         int i, nb_enq = 0, nb_deq = 0;
853         struct lcore_conf *lconf;
854         unsigned int lcore_id;
855
856         if (event_p_id < 0)
857                 return;
858
859         lcore_id = rte_lcore_id();
860         lconf = &lcore_conf[lcore_id];
861
862         RTE_LOG(INFO, L3FWD, "entering %s on lcore %u\n", __func__, lcore_id);
863
864         while (!force_quit) {
865                 /* Read events from RX queues */
866                 nb_deq = rte_event_dequeue_burst(event_d_id, event_p_id, events,
867                                                  deq_len, 0);
868                 if (nb_deq == 0) {
869                         rte_pause();
870                         continue;
871                 }
872
873                 for (i = 0; i < nb_deq; i++) {
874                         if (flags & L3FWD_EVENT_TX_ENQ) {
875                                 events[i].queue_id = tx_q_id;
876                                 events[i].op = RTE_EVENT_OP_FORWARD;
877                         }
878
879 #if defined RTE_ARCH_X86 || defined __ARM_NEON
880                         l3fwd_em_process_event_vector(events[i].vec, lconf);
881 #else
882                         l3fwd_em_no_opt_process_event_vector(events[i].vec,
883                                                              lconf);
884 #endif
885                         if (flags & L3FWD_EVENT_TX_DIRECT)
886                                 event_vector_txq_set(events[i].vec, 0);
887                 }
888
889                 if (flags & L3FWD_EVENT_TX_ENQ) {
890                         nb_enq = rte_event_enqueue_burst(event_d_id, event_p_id,
891                                                          events, nb_deq);
892                         while (nb_enq < nb_deq && !force_quit)
893                                 nb_enq += rte_event_enqueue_burst(
894                                         event_d_id, event_p_id, events + nb_enq,
895                                         nb_deq - nb_enq);
896                 }
897
898                 if (flags & L3FWD_EVENT_TX_DIRECT) {
899                         nb_enq = rte_event_eth_tx_adapter_enqueue(
900                                 event_d_id, event_p_id, events, nb_deq, 0);
901                         while (nb_enq < nb_deq && !force_quit)
902                                 nb_enq += rte_event_eth_tx_adapter_enqueue(
903                                         event_d_id, event_p_id, events + nb_enq,
904                                         nb_deq - nb_enq, 0);
905                 }
906         }
907
908         l3fwd_event_worker_cleanup(event_d_id, event_p_id, events, nb_enq,
909                                    nb_deq, 1);
910 }
911
912 int __rte_noinline
913 em_event_main_loop_tx_d_vector(__rte_unused void *dummy)
914 {
915         struct l3fwd_event_resources *evt_rsrc = l3fwd_get_eventdev_rsrc();
916
917         em_event_loop_vector(evt_rsrc, L3FWD_EVENT_TX_DIRECT);
918         return 0;
919 }
920
921 int __rte_noinline
922 em_event_main_loop_tx_d_burst_vector(__rte_unused void *dummy)
923 {
924         struct l3fwd_event_resources *evt_rsrc = l3fwd_get_eventdev_rsrc();
925
926         em_event_loop_vector(evt_rsrc, L3FWD_EVENT_TX_DIRECT);
927         return 0;
928 }
929
930 int __rte_noinline
931 em_event_main_loop_tx_q_vector(__rte_unused void *dummy)
932 {
933         struct l3fwd_event_resources *evt_rsrc = l3fwd_get_eventdev_rsrc();
934
935         em_event_loop_vector(evt_rsrc, L3FWD_EVENT_TX_ENQ);
936         return 0;
937 }
938
939 int __rte_noinline
940 em_event_main_loop_tx_q_burst_vector(__rte_unused void *dummy)
941 {
942         struct l3fwd_event_resources *evt_rsrc = l3fwd_get_eventdev_rsrc();
943
944         em_event_loop_vector(evt_rsrc, L3FWD_EVENT_TX_ENQ);
945         return 0;
946 }
947
948 /* Initialize exact match (hash) parameters. 8< */
949 void
950 setup_hash(const int socketid)
951 {
952         struct rte_hash_parameters ipv4_l3fwd_hash_params = {
953                 .name = NULL,
954                 .entries = L3FWD_HASH_ENTRIES,
955                 .key_len = sizeof(union ipv4_5tuple_host),
956                 .hash_func = ipv4_hash_crc,
957                 .hash_func_init_val = 0,
958         };
959
960         struct rte_hash_parameters ipv6_l3fwd_hash_params = {
961                 .name = NULL,
962                 .entries = L3FWD_HASH_ENTRIES,
963                 .key_len = sizeof(union ipv6_5tuple_host),
964                 .hash_func = ipv6_hash_crc,
965                 .hash_func_init_val = 0,
966         };
967
968         char s[64];
969
970         /* create ipv4 hash */
971         snprintf(s, sizeof(s), "ipv4_l3fwd_hash_%d", socketid);
972         ipv4_l3fwd_hash_params.name = s;
973         ipv4_l3fwd_hash_params.socket_id = socketid;
974         ipv4_l3fwd_em_lookup_struct[socketid] =
975                 rte_hash_create(&ipv4_l3fwd_hash_params);
976         if (ipv4_l3fwd_em_lookup_struct[socketid] == NULL)
977                 rte_exit(EXIT_FAILURE,
978                         "Unable to create the l3fwd hash on socket %d\n",
979                         socketid);
980
981         /* create ipv6 hash */
982         snprintf(s, sizeof(s), "ipv6_l3fwd_hash_%d", socketid);
983         ipv6_l3fwd_hash_params.name = s;
984         ipv6_l3fwd_hash_params.socket_id = socketid;
985         ipv6_l3fwd_em_lookup_struct[socketid] =
986                 rte_hash_create(&ipv6_l3fwd_hash_params);
987         if (ipv6_l3fwd_em_lookup_struct[socketid] == NULL)
988                 rte_exit(EXIT_FAILURE,
989                         "Unable to create the l3fwd hash on socket %d\n",
990                         socketid);
991
992         /*
993          * Use data from ipv4/ipv6 l3fwd config file
994          * directly to initialize the hash table.
995          */
996         if (ipv6 == 0) {
997                 /* populate the ipv4 hash */
998                 populate_ipv4_flow_into_table(
999                         ipv4_l3fwd_em_lookup_struct[socketid]);
1000         } else {
1001                 /* populate the ipv6 hash */
1002                 populate_ipv6_flow_into_table(
1003                         ipv6_l3fwd_em_lookup_struct[socketid]);
1004         }
1005 }
1006 /* >8 End of initialization of hash parameters. */
1007
1008 /* Return ipv4/ipv6 em fwd lookup struct. */
1009 void *
1010 em_get_ipv4_l3fwd_lookup_struct(const int socketid)
1011 {
1012         return ipv4_l3fwd_em_lookup_struct[socketid];
1013 }
1014
1015 void *
1016 em_get_ipv6_l3fwd_lookup_struct(const int socketid)
1017 {
1018         return ipv6_l3fwd_em_lookup_struct[socketid];
1019 }