vhost: combine select with sleep
[dpdk.git] / examples / kni / main.c
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 #include <stdio.h>
35 #include <stdlib.h>
36 #include <stdint.h>
37 #include <inttypes.h>
38 #include <string.h>
39 #include <sys/queue.h>
40 #include <stdarg.h>
41 #include <errno.h>
42 #include <getopt.h>
43
44 #include <netinet/in.h>
45 #include <linux/if.h>
46 #include <linux/if_tun.h>
47 #include <fcntl.h>
48 #include <sys/ioctl.h>
49 #include <unistd.h>
50 #include <signal.h>
51
52 #include <rte_common.h>
53 #include <rte_log.h>
54 #include <rte_memory.h>
55 #include <rte_memcpy.h>
56 #include <rte_memzone.h>
57 #include <rte_tailq.h>
58 #include <rte_eal.h>
59 #include <rte_per_lcore.h>
60 #include <rte_launch.h>
61 #include <rte_atomic.h>
62 #include <rte_lcore.h>
63 #include <rte_branch_prediction.h>
64 #include <rte_interrupts.h>
65 #include <rte_pci.h>
66 #include <rte_debug.h>
67 #include <rte_ether.h>
68 #include <rte_ethdev.h>
69 #include <rte_ring.h>
70 #include <rte_log.h>
71 #include <rte_mempool.h>
72 #include <rte_mbuf.h>
73 #include <rte_string_fns.h>
74 #include <rte_cycles.h>
75 #include <rte_malloc.h>
76 #include <rte_kni.h>
77
78 /* Macros for printing using RTE_LOG */
79 #define RTE_LOGTYPE_APP RTE_LOGTYPE_USER1
80
81 /* Max size of a single packet */
82 #define MAX_PACKET_SZ           2048
83
84 /* Number of bytes needed for each mbuf */
85 #define MBUF_SZ \
86         (MAX_PACKET_SZ + sizeof(struct rte_mbuf) + RTE_PKTMBUF_HEADROOM)
87
88 /* Number of mbufs in mempool that is created */
89 #define NB_MBUF                 (8192 * 16)
90
91 /* How many packets to attempt to read from NIC in one go */
92 #define PKT_BURST_SZ            32
93
94 /* How many objects (mbufs) to keep in per-lcore mempool cache */
95 #define MEMPOOL_CACHE_SZ        PKT_BURST_SZ
96
97 /* Number of RX ring descriptors */
98 #define NB_RXD                  128
99
100 /* Number of TX ring descriptors */
101 #define NB_TXD                  512
102
103 /* Total octets in ethernet header */
104 #define KNI_ENET_HEADER_SIZE    14
105
106 /* Total octets in the FCS */
107 #define KNI_ENET_FCS_SIZE       4
108
109 #define KNI_US_PER_SECOND       1000000
110 #define KNI_SECOND_PER_DAY      86400
111
112 #define KNI_MAX_KTHREAD 32
113 /*
114  * Structure of port parameters
115  */
116 struct kni_port_params {
117         uint8_t port_id;/* Port ID */
118         unsigned lcore_rx; /* lcore ID for RX */
119         unsigned lcore_tx; /* lcore ID for TX */
120         uint32_t nb_lcore_k; /* Number of lcores for KNI multi kernel threads */
121         uint32_t nb_kni; /* Number of KNI devices to be created */
122         unsigned lcore_k[KNI_MAX_KTHREAD]; /* lcore ID list for kthreads */
123         struct rte_kni *kni[KNI_MAX_KTHREAD]; /* KNI context pointers */
124 } __rte_cache_aligned;
125
126 static struct kni_port_params *kni_port_params_array[RTE_MAX_ETHPORTS];
127
128
129 /* Options for configuring ethernet port */
130 static struct rte_eth_conf port_conf = {
131         .rxmode = {
132                 .header_split = 0,      /* Header Split disabled */
133                 .hw_ip_checksum = 0,    /* IP checksum offload disabled */
134                 .hw_vlan_filter = 0,    /* VLAN filtering disabled */
135                 .jumbo_frame = 0,       /* Jumbo Frame Support disabled */
136                 .hw_strip_crc = 0,      /* CRC stripped by hardware */
137         },
138         .txmode = {
139                 .mq_mode = ETH_MQ_TX_NONE,
140         },
141 };
142
143 /* Mempool for mbufs */
144 static struct rte_mempool * pktmbuf_pool = NULL;
145
146 /* Mask of enabled ports */
147 static uint32_t ports_mask = 0;
148 /* Ports set in promiscuous mode off by default. */
149 static int promiscuous_on = 0;
150
151 /* Structure type for recording kni interface specific stats */
152 struct kni_interface_stats {
153         /* number of pkts received from NIC, and sent to KNI */
154         uint64_t rx_packets;
155
156         /* number of pkts received from NIC, but failed to send to KNI */
157         uint64_t rx_dropped;
158
159         /* number of pkts received from KNI, and sent to NIC */
160         uint64_t tx_packets;
161
162         /* number of pkts received from KNI, but failed to send to NIC */
163         uint64_t tx_dropped;
164 };
165
166 /* kni device statistics array */
167 static struct kni_interface_stats kni_stats[RTE_MAX_ETHPORTS];
168
169 static int kni_change_mtu(uint8_t port_id, unsigned new_mtu);
170 static int kni_config_network_interface(uint8_t port_id, uint8_t if_up);
171
172 static rte_atomic32_t kni_stop = RTE_ATOMIC32_INIT(0);
173
174 /* Print out statistics on packets handled */
175 static void
176 print_stats(void)
177 {
178         uint8_t i;
179
180         printf("\n**KNI example application statistics**\n"
181                "======  ==============  ============  ============  ============  ============\n"
182                " Port    Lcore(RX/TX)    rx_packets    rx_dropped    tx_packets    tx_dropped\n"
183                "------  --------------  ------------  ------------  ------------  ------------\n");
184         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
185                 if (!kni_port_params_array[i])
186                         continue;
187
188                 printf("%7d %10u/%2u %13"PRIu64" %13"PRIu64" %13"PRIu64" "
189                                                         "%13"PRIu64"\n", i,
190                                         kni_port_params_array[i]->lcore_rx,
191                                         kni_port_params_array[i]->lcore_tx,
192                                                 kni_stats[i].rx_packets,
193                                                 kni_stats[i].rx_dropped,
194                                                 kni_stats[i].tx_packets,
195                                                 kni_stats[i].tx_dropped);
196         }
197         printf("======  ==============  ============  ============  ============  ============\n");
198 }
199
200 /* Custom handling of signals to handle stats and kni processing */
201 static void
202 signal_handler(int signum)
203 {
204         /* When we receive a USR1 signal, print stats */
205         if (signum == SIGUSR1) {
206                 print_stats();
207         }
208
209         /* When we receive a USR2 signal, reset stats */
210         if (signum == SIGUSR2) {
211                 memset(&kni_stats, 0, sizeof(kni_stats));
212                 printf("\n**Statistics have been reset**\n");
213                 return;
214         }
215
216         /* When we receive a RTMIN or SIGINT signal, stop kni processing */
217         if (signum == SIGRTMIN || signum == SIGINT){
218                 printf("SIGRTMIN is received, and the KNI processing is "
219                                                         "going to stop\n");
220                 rte_atomic32_inc(&kni_stop);
221                 return;
222         }
223 }
224
225 static void
226 kni_burst_free_mbufs(struct rte_mbuf **pkts, unsigned num)
227 {
228         unsigned i;
229
230         if (pkts == NULL)
231                 return;
232
233         for (i = 0; i < num; i++) {
234                 rte_pktmbuf_free(pkts[i]);
235                 pkts[i] = NULL;
236         }
237 }
238
239 /**
240  * Interface to burst rx and enqueue mbufs into rx_q
241  */
242 static void
243 kni_ingress(struct kni_port_params *p)
244 {
245         uint8_t i, port_id;
246         unsigned nb_rx, num;
247         uint32_t nb_kni;
248         struct rte_mbuf *pkts_burst[PKT_BURST_SZ];
249
250         if (p == NULL)
251                 return;
252
253         nb_kni = p->nb_kni;
254         port_id = p->port_id;
255         for (i = 0; i < nb_kni; i++) {
256                 /* Burst rx from eth */
257                 nb_rx = rte_eth_rx_burst(port_id, 0, pkts_burst, PKT_BURST_SZ);
258                 if (unlikely(nb_rx > PKT_BURST_SZ)) {
259                         RTE_LOG(ERR, APP, "Error receiving from eth\n");
260                         return;
261                 }
262                 /* Burst tx to kni */
263                 num = rte_kni_tx_burst(p->kni[i], pkts_burst, nb_rx);
264                 kni_stats[port_id].rx_packets += num;
265
266                 rte_kni_handle_request(p->kni[i]);
267                 if (unlikely(num < nb_rx)) {
268                         /* Free mbufs not tx to kni interface */
269                         kni_burst_free_mbufs(&pkts_burst[num], nb_rx - num);
270                         kni_stats[port_id].rx_dropped += nb_rx - num;
271                 }
272         }
273 }
274
275 /**
276  * Interface to dequeue mbufs from tx_q and burst tx
277  */
278 static void
279 kni_egress(struct kni_port_params *p)
280 {
281         uint8_t i, port_id;
282         unsigned nb_tx, num;
283         uint32_t nb_kni;
284         struct rte_mbuf *pkts_burst[PKT_BURST_SZ];
285
286         if (p == NULL)
287                 return;
288
289         nb_kni = p->nb_kni;
290         port_id = p->port_id;
291         for (i = 0; i < nb_kni; i++) {
292                 /* Burst rx from kni */
293                 num = rte_kni_rx_burst(p->kni[i], pkts_burst, PKT_BURST_SZ);
294                 if (unlikely(num > PKT_BURST_SZ)) {
295                         RTE_LOG(ERR, APP, "Error receiving from KNI\n");
296                         return;
297                 }
298                 /* Burst tx to eth */
299                 nb_tx = rte_eth_tx_burst(port_id, 0, pkts_burst, (uint16_t)num);
300                 kni_stats[port_id].tx_packets += nb_tx;
301                 if (unlikely(nb_tx < num)) {
302                         /* Free mbufs not tx to NIC */
303                         kni_burst_free_mbufs(&pkts_burst[nb_tx], num - nb_tx);
304                         kni_stats[port_id].tx_dropped += num - nb_tx;
305                 }
306         }
307 }
308
309 static int
310 main_loop(__rte_unused void *arg)
311 {
312         uint8_t i, nb_ports = rte_eth_dev_count();
313         int32_t f_stop;
314         const unsigned lcore_id = rte_lcore_id();
315         enum lcore_rxtx {
316                 LCORE_NONE,
317                 LCORE_RX,
318                 LCORE_TX,
319                 LCORE_MAX
320         };
321         enum lcore_rxtx flag = LCORE_NONE;
322
323         nb_ports = (uint8_t)(nb_ports < RTE_MAX_ETHPORTS ?
324                                 nb_ports : RTE_MAX_ETHPORTS);
325         for (i = 0; i < nb_ports; i++) {
326                 if (!kni_port_params_array[i])
327                         continue;
328                 if (kni_port_params_array[i]->lcore_rx == (uint8_t)lcore_id) {
329                         flag = LCORE_RX;
330                         break;
331                 } else if (kni_port_params_array[i]->lcore_tx ==
332                                                 (uint8_t)lcore_id) {
333                         flag = LCORE_TX;
334                         break;
335                 }
336         }
337
338         if (flag == LCORE_RX) {
339                 RTE_LOG(INFO, APP, "Lcore %u is reading from port %d\n",
340                                         kni_port_params_array[i]->lcore_rx,
341                                         kni_port_params_array[i]->port_id);
342                 while (1) {
343                         f_stop = rte_atomic32_read(&kni_stop);
344                         if (f_stop)
345                                 break;
346                         kni_ingress(kni_port_params_array[i]);
347                 }
348         } else if (flag == LCORE_TX) {
349                 RTE_LOG(INFO, APP, "Lcore %u is writing to port %d\n",
350                                         kni_port_params_array[i]->lcore_tx,
351                                         kni_port_params_array[i]->port_id);
352                 while (1) {
353                         f_stop = rte_atomic32_read(&kni_stop);
354                         if (f_stop)
355                                 break;
356                         kni_egress(kni_port_params_array[i]);
357                 }
358         } else
359                 RTE_LOG(INFO, APP, "Lcore %u has nothing to do\n", lcore_id);
360
361         return 0;
362 }
363
364 /* Display usage instructions */
365 static void
366 print_usage(const char *prgname)
367 {
368         RTE_LOG(INFO, APP, "\nUsage: %s [EAL options] -- -p PORTMASK -P "
369                    "[--config (port,lcore_rx,lcore_tx,lcore_kthread...)"
370                    "[,(port,lcore_rx,lcore_tx,lcore_kthread...)]]\n"
371                    "    -p PORTMASK: hex bitmask of ports to use\n"
372                    "    -P : enable promiscuous mode\n"
373                    "    --config (port,lcore_rx,lcore_tx,lcore_kthread...): "
374                    "port and lcore configurations\n",
375                    prgname);
376 }
377
378 /* Convert string to unsigned number. 0 is returned if error occurs */
379 static uint32_t
380 parse_unsigned(const char *portmask)
381 {
382         char *end = NULL;
383         unsigned long num;
384
385         num = strtoul(portmask, &end, 16);
386         if ((portmask[0] == '\0') || (end == NULL) || (*end != '\0'))
387                 return 0;
388
389         return (uint32_t)num;
390 }
391
392 static void
393 print_config(void)
394 {
395         uint32_t i, j;
396         struct kni_port_params **p = kni_port_params_array;
397
398         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
399                 if (!p[i])
400                         continue;
401                 RTE_LOG(DEBUG, APP, "Port ID: %d\n", p[i]->port_id);
402                 RTE_LOG(DEBUG, APP, "Rx lcore ID: %u, Tx lcore ID: %u\n",
403                                         p[i]->lcore_rx, p[i]->lcore_tx);
404                 for (j = 0; j < p[i]->nb_lcore_k; j++)
405                         RTE_LOG(DEBUG, APP, "Kernel thread lcore ID: %u\n",
406                                                         p[i]->lcore_k[j]);
407         }
408 }
409
410 static int
411 parse_config(const char *arg)
412 {
413         const char *p, *p0 = arg;
414         char s[256], *end;
415         unsigned size;
416         enum fieldnames {
417                 FLD_PORT = 0,
418                 FLD_LCORE_RX,
419                 FLD_LCORE_TX,
420                 _NUM_FLD = KNI_MAX_KTHREAD + 3,
421         };
422         int i, j, nb_token;
423         char *str_fld[_NUM_FLD];
424         unsigned long int_fld[_NUM_FLD];
425         uint8_t port_id, nb_kni_port_params = 0;
426
427         memset(&kni_port_params_array, 0, sizeof(kni_port_params_array));
428         while (((p = strchr(p0, '(')) != NULL) &&
429                 nb_kni_port_params < RTE_MAX_ETHPORTS) {
430                 p++;
431                 if ((p0 = strchr(p, ')')) == NULL)
432                         goto fail;
433                 size = p0 - p;
434                 if (size >= sizeof(s)) {
435                         printf("Invalid config parameters\n");
436                         goto fail;
437                 }
438                 snprintf(s, sizeof(s), "%.*s", size, p);
439                 nb_token = rte_strsplit(s, sizeof(s), str_fld, _NUM_FLD, ',');
440                 if (nb_token <= FLD_LCORE_TX) {
441                         printf("Invalid config parameters\n");
442                         goto fail;
443                 }
444                 for (i = 0; i < nb_token; i++) {
445                         errno = 0;
446                         int_fld[i] = strtoul(str_fld[i], &end, 0);
447                         if (errno != 0 || end == str_fld[i]) {
448                                 printf("Invalid config parameters\n");
449                                 goto fail;
450                         }
451                 }
452
453                 i = 0;
454                 port_id = (uint8_t)int_fld[i++];
455                 if (port_id >= RTE_MAX_ETHPORTS) {
456                         printf("Port ID %d could not exceed the maximum %d\n",
457                                                 port_id, RTE_MAX_ETHPORTS);
458                         goto fail;
459                 }
460                 if (kni_port_params_array[port_id]) {
461                         printf("Port %d has been configured\n", port_id);
462                         goto fail;
463                 }
464                 kni_port_params_array[port_id] =
465                         rte_zmalloc("KNI_port_params",
466                                     sizeof(struct kni_port_params), RTE_CACHE_LINE_SIZE);
467                 kni_port_params_array[port_id]->port_id = port_id;
468                 kni_port_params_array[port_id]->lcore_rx =
469                                         (uint8_t)int_fld[i++];
470                 kni_port_params_array[port_id]->lcore_tx =
471                                         (uint8_t)int_fld[i++];
472                 if (kni_port_params_array[port_id]->lcore_rx >= RTE_MAX_LCORE ||
473                 kni_port_params_array[port_id]->lcore_tx >= RTE_MAX_LCORE) {
474                         printf("lcore_rx %u or lcore_tx %u ID could not "
475                                                 "exceed the maximum %u\n",
476                                 kni_port_params_array[port_id]->lcore_rx,
477                                 kni_port_params_array[port_id]->lcore_tx,
478                                                 (unsigned)RTE_MAX_LCORE);
479                         goto fail;
480                 }
481                 for (j = 0; i < nb_token && j < KNI_MAX_KTHREAD; i++, j++)
482                         kni_port_params_array[port_id]->lcore_k[j] =
483                                                 (uint8_t)int_fld[i];
484                 kni_port_params_array[port_id]->nb_lcore_k = j;
485         }
486         print_config();
487
488         return 0;
489
490 fail:
491         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
492                 if (kni_port_params_array[i]) {
493                         rte_free(kni_port_params_array[i]);
494                         kni_port_params_array[i] = NULL;
495                 }
496         }
497
498         return -1;
499 }
500
501 static int
502 validate_parameters(uint32_t portmask)
503 {
504         uint32_t i;
505
506         if (!portmask) {
507                 printf("No port configured in port mask\n");
508                 return -1;
509         }
510
511         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
512                 if (((portmask & (1 << i)) && !kni_port_params_array[i]) ||
513                         (!(portmask & (1 << i)) && kni_port_params_array[i]))
514                         rte_exit(EXIT_FAILURE, "portmask is not consistent "
515                                 "to port ids specified in --config\n");
516
517                 if (kni_port_params_array[i] && !rte_lcore_is_enabled(\
518                         (unsigned)(kni_port_params_array[i]->lcore_rx)))
519                         rte_exit(EXIT_FAILURE, "lcore id %u for "
520                                         "port %d receiving not enabled\n",
521                                         kni_port_params_array[i]->lcore_rx,
522                                         kni_port_params_array[i]->port_id);
523
524                 if (kni_port_params_array[i] && !rte_lcore_is_enabled(\
525                         (unsigned)(kni_port_params_array[i]->lcore_tx)))
526                         rte_exit(EXIT_FAILURE, "lcore id %u for "
527                                         "port %d transmitting not enabled\n",
528                                         kni_port_params_array[i]->lcore_tx,
529                                         kni_port_params_array[i]->port_id);
530
531         }
532
533         return 0;
534 }
535
536 #define CMDLINE_OPT_CONFIG  "config"
537
538 /* Parse the arguments given in the command line of the application */
539 static int
540 parse_args(int argc, char **argv)
541 {
542         int opt, longindex, ret = 0;
543         const char *prgname = argv[0];
544         static struct option longopts[] = {
545                 {CMDLINE_OPT_CONFIG, required_argument, NULL, 0},
546                 {NULL, 0, NULL, 0}
547         };
548
549         /* Disable printing messages within getopt() */
550         opterr = 0;
551
552         /* Parse command line */
553         while ((opt = getopt_long(argc, argv, "p:P", longopts,
554                                                 &longindex)) != EOF) {
555                 switch (opt) {
556                 case 'p':
557                         ports_mask = parse_unsigned(optarg);
558                         break;
559                 case 'P':
560                         promiscuous_on = 1;
561                         break;
562                 case 0:
563                         if (!strncmp(longopts[longindex].name,
564                                      CMDLINE_OPT_CONFIG,
565                                      sizeof(CMDLINE_OPT_CONFIG))) {
566                                 ret = parse_config(optarg);
567                                 if (ret) {
568                                         printf("Invalid config\n");
569                                         print_usage(prgname);
570                                         return -1;
571                                 }
572                         }
573                         break;
574                 default:
575                         print_usage(prgname);
576                         rte_exit(EXIT_FAILURE, "Invalid option specified\n");
577                 }
578         }
579
580         /* Check that options were parsed ok */
581         if (validate_parameters(ports_mask) < 0) {
582                 print_usage(prgname);
583                 rte_exit(EXIT_FAILURE, "Invalid parameters\n");
584         }
585
586         return ret;
587 }
588
589 /* Initialize KNI subsystem */
590 static void
591 init_kni(void)
592 {
593         unsigned int num_of_kni_ports = 0, i;
594         struct kni_port_params **params = kni_port_params_array;
595
596         /* Calculate the maximum number of KNI interfaces that will be used */
597         for (i = 0; i < RTE_MAX_ETHPORTS; i++) {
598                 if (kni_port_params_array[i]) {
599                         num_of_kni_ports += (params[i]->nb_lcore_k ?
600                                 params[i]->nb_lcore_k : 1);
601                 }
602         }
603
604         /* Invoke rte KNI init to preallocate the ports */
605         rte_kni_init(num_of_kni_ports);
606 }
607
608 /* Initialise a single port on an Ethernet device */
609 static void
610 init_port(uint8_t port)
611 {
612         int ret;
613
614         /* Initialise device and RX/TX queues */
615         RTE_LOG(INFO, APP, "Initialising port %u ...\n", (unsigned)port);
616         fflush(stdout);
617         ret = rte_eth_dev_configure(port, 1, 1, &port_conf);
618         if (ret < 0)
619                 rte_exit(EXIT_FAILURE, "Could not configure port%u (%d)\n",
620                             (unsigned)port, ret);
621
622         ret = rte_eth_rx_queue_setup(port, 0, NB_RXD,
623                 rte_eth_dev_socket_id(port), NULL, pktmbuf_pool);
624         if (ret < 0)
625                 rte_exit(EXIT_FAILURE, "Could not setup up RX queue for "
626                                 "port%u (%d)\n", (unsigned)port, ret);
627
628         ret = rte_eth_tx_queue_setup(port, 0, NB_TXD,
629                 rte_eth_dev_socket_id(port), NULL);
630         if (ret < 0)
631                 rte_exit(EXIT_FAILURE, "Could not setup up TX queue for "
632                                 "port%u (%d)\n", (unsigned)port, ret);
633
634         ret = rte_eth_dev_start(port);
635         if (ret < 0)
636                 rte_exit(EXIT_FAILURE, "Could not start port%u (%d)\n",
637                                                 (unsigned)port, ret);
638
639         if (promiscuous_on)
640                 rte_eth_promiscuous_enable(port);
641 }
642
643 /* Check the link status of all ports in up to 9s, and print them finally */
644 static void
645 check_all_ports_link_status(uint8_t port_num, uint32_t port_mask)
646 {
647 #define CHECK_INTERVAL 100 /* 100ms */
648 #define MAX_CHECK_TIME 90 /* 9s (90 * 100ms) in total */
649         uint8_t portid, count, all_ports_up, print_flag = 0;
650         struct rte_eth_link link;
651
652         printf("\nChecking link status\n");
653         fflush(stdout);
654         for (count = 0; count <= MAX_CHECK_TIME; count++) {
655                 all_ports_up = 1;
656                 for (portid = 0; portid < port_num; portid++) {
657                         if ((port_mask & (1 << portid)) == 0)
658                                 continue;
659                         memset(&link, 0, sizeof(link));
660                         rte_eth_link_get_nowait(portid, &link);
661                         /* print link status if flag set */
662                         if (print_flag == 1) {
663                                 if (link.link_status)
664                                         printf("Port %d Link Up - speed %u "
665                                                 "Mbps - %s\n", (uint8_t)portid,
666                                                 (unsigned)link.link_speed,
667                                 (link.link_duplex == ETH_LINK_FULL_DUPLEX) ?
668                                         ("full-duplex") : ("half-duplex\n"));
669                                 else
670                                         printf("Port %d Link Down\n",
671                                                 (uint8_t)portid);
672                                 continue;
673                         }
674                         /* clear all_ports_up flag if any link down */
675                         if (link.link_status == 0) {
676                                 all_ports_up = 0;
677                                 break;
678                         }
679                 }
680                 /* after finally printing all link status, get out */
681                 if (print_flag == 1)
682                         break;
683
684                 if (all_ports_up == 0) {
685                         printf(".");
686                         fflush(stdout);
687                         rte_delay_ms(CHECK_INTERVAL);
688                 }
689
690                 /* set the print_flag if all ports up or timeout */
691                 if (all_ports_up == 1 || count == (MAX_CHECK_TIME - 1)) {
692                         print_flag = 1;
693                         printf("done\n");
694                 }
695         }
696 }
697
698 /* Callback for request of changing MTU */
699 static int
700 kni_change_mtu(uint8_t port_id, unsigned new_mtu)
701 {
702         int ret;
703         struct rte_eth_conf conf;
704
705         if (port_id >= rte_eth_dev_count()) {
706                 RTE_LOG(ERR, APP, "Invalid port id %d\n", port_id);
707                 return -EINVAL;
708         }
709
710         RTE_LOG(INFO, APP, "Change MTU of port %d to %u\n", port_id, new_mtu);
711
712         /* Stop specific port */
713         rte_eth_dev_stop(port_id);
714
715         memcpy(&conf, &port_conf, sizeof(conf));
716         /* Set new MTU */
717         if (new_mtu > ETHER_MAX_LEN)
718                 conf.rxmode.jumbo_frame = 1;
719         else
720                 conf.rxmode.jumbo_frame = 0;
721
722         /* mtu + length of header + length of FCS = max pkt length */
723         conf.rxmode.max_rx_pkt_len = new_mtu + KNI_ENET_HEADER_SIZE +
724                                                         KNI_ENET_FCS_SIZE;
725         ret = rte_eth_dev_configure(port_id, 1, 1, &conf);
726         if (ret < 0) {
727                 RTE_LOG(ERR, APP, "Fail to reconfigure port %d\n", port_id);
728                 return ret;
729         }
730
731         /* Restart specific port */
732         ret = rte_eth_dev_start(port_id);
733         if (ret < 0) {
734                 RTE_LOG(ERR, APP, "Fail to restart port %d\n", port_id);
735                 return ret;
736         }
737
738         return 0;
739 }
740
741 /* Callback for request of configuring network interface up/down */
742 static int
743 kni_config_network_interface(uint8_t port_id, uint8_t if_up)
744 {
745         int ret = 0;
746
747         if (port_id >= rte_eth_dev_count() || port_id >= RTE_MAX_ETHPORTS) {
748                 RTE_LOG(ERR, APP, "Invalid port id %d\n", port_id);
749                 return -EINVAL;
750         }
751
752         RTE_LOG(INFO, APP, "Configure network interface of %d %s\n",
753                                         port_id, if_up ? "up" : "down");
754
755         if (if_up != 0) { /* Configure network interface up */
756                 rte_eth_dev_stop(port_id);
757                 ret = rte_eth_dev_start(port_id);
758         } else /* Configure network interface down */
759                 rte_eth_dev_stop(port_id);
760
761         if (ret < 0)
762                 RTE_LOG(ERR, APP, "Failed to start port %d\n", port_id);
763
764         return ret;
765 }
766
767 static int
768 kni_alloc(uint8_t port_id)
769 {
770         uint8_t i;
771         struct rte_kni *kni;
772         struct rte_kni_conf conf;
773         struct kni_port_params **params = kni_port_params_array;
774
775         if (port_id >= RTE_MAX_ETHPORTS || !params[port_id])
776                 return -1;
777
778         params[port_id]->nb_kni = params[port_id]->nb_lcore_k ?
779                                 params[port_id]->nb_lcore_k : 1;
780
781         for (i = 0; i < params[port_id]->nb_kni; i++) {
782                 /* Clear conf at first */
783                 memset(&conf, 0, sizeof(conf));
784                 if (params[port_id]->nb_lcore_k) {
785                         snprintf(conf.name, RTE_KNI_NAMESIZE,
786                                         "vEth%u_%u", port_id, i);
787                         conf.core_id = params[port_id]->lcore_k[i];
788                         conf.force_bind = 1;
789                 } else
790                         snprintf(conf.name, RTE_KNI_NAMESIZE,
791                                                 "vEth%u", port_id);
792                 conf.group_id = (uint16_t)port_id;
793                 conf.mbuf_size = MAX_PACKET_SZ;
794                 /*
795                  * The first KNI device associated to a port
796                  * is the master, for multiple kernel thread
797                  * environment.
798                  */
799                 if (i == 0) {
800                         struct rte_kni_ops ops;
801                         struct rte_eth_dev_info dev_info;
802
803                         memset(&dev_info, 0, sizeof(dev_info));
804                         rte_eth_dev_info_get(port_id, &dev_info);
805                         conf.addr = dev_info.pci_dev->addr;
806                         conf.id = dev_info.pci_dev->id;
807
808                         memset(&ops, 0, sizeof(ops));
809                         ops.port_id = port_id;
810                         ops.change_mtu = kni_change_mtu;
811                         ops.config_network_if = kni_config_network_interface;
812
813                         kni = rte_kni_alloc(pktmbuf_pool, &conf, &ops);
814                 } else
815                         kni = rte_kni_alloc(pktmbuf_pool, &conf, NULL);
816
817                 if (!kni)
818                         rte_exit(EXIT_FAILURE, "Fail to create kni for "
819                                                 "port: %d\n", port_id);
820                 params[port_id]->kni[i] = kni;
821         }
822
823         return 0;
824 }
825
826 static int
827 kni_free_kni(uint8_t port_id)
828 {
829         uint8_t i;
830         struct kni_port_params **p = kni_port_params_array;
831
832         if (port_id >= RTE_MAX_ETHPORTS || !p[port_id])
833                 return -1;
834
835         for (i = 0; i < p[i]->nb_kni; i++) {
836                 rte_kni_release(p[i]->kni[i]);
837                 p[i]->kni[i] = NULL;
838         }
839         rte_eth_dev_stop(port_id);
840
841         return 0;
842 }
843
844 /* Initialise ports/queues etc. and start main loop on each core */
845 int
846 main(int argc, char** argv)
847 {
848         int ret;
849         uint8_t nb_sys_ports, port;
850         unsigned i;
851
852         /* Associate signal_hanlder function with USR signals */
853         signal(SIGUSR1, signal_handler);
854         signal(SIGUSR2, signal_handler);
855         signal(SIGRTMIN, signal_handler);
856         signal(SIGINT, signal_handler);
857
858         /* Initialise EAL */
859         ret = rte_eal_init(argc, argv);
860         if (ret < 0)
861                 rte_exit(EXIT_FAILURE, "Could not initialise EAL (%d)\n", ret);
862         argc -= ret;
863         argv += ret;
864
865         /* Parse application arguments (after the EAL ones) */
866         ret = parse_args(argc, argv);
867         if (ret < 0)
868                 rte_exit(EXIT_FAILURE, "Could not parse input parameters\n");
869
870         /* Create the mbuf pool */
871         pktmbuf_pool = rte_mempool_create("mbuf_pool", NB_MBUF, MBUF_SZ,
872                         MEMPOOL_CACHE_SZ,
873                         sizeof(struct rte_pktmbuf_pool_private),
874                         rte_pktmbuf_pool_init, NULL, rte_pktmbuf_init, NULL,
875                         rte_socket_id(), 0);
876         if (pktmbuf_pool == NULL) {
877                 rte_exit(EXIT_FAILURE, "Could not initialise mbuf pool\n");
878                 return -1;
879         }
880
881         /* Get number of ports found in scan */
882         nb_sys_ports = rte_eth_dev_count();
883         if (nb_sys_ports == 0)
884                 rte_exit(EXIT_FAILURE, "No supported Ethernet device found\n");
885
886         /* Check if the configured port ID is valid */
887         for (i = 0; i < RTE_MAX_ETHPORTS; i++)
888                 if (kni_port_params_array[i] && i >= nb_sys_ports)
889                         rte_exit(EXIT_FAILURE, "Configured invalid "
890                                                 "port ID %u\n", i);
891
892         /* Initialize KNI subsystem */
893         init_kni();
894
895         /* Initialise each port */
896         for (port = 0; port < nb_sys_ports; port++) {
897                 /* Skip ports that are not enabled */
898                 if (!(ports_mask & (1 << port)))
899                         continue;
900                 init_port(port);
901
902                 if (port >= RTE_MAX_ETHPORTS)
903                         rte_exit(EXIT_FAILURE, "Can not use more than "
904                                 "%d ports for kni\n", RTE_MAX_ETHPORTS);
905
906                 kni_alloc(port);
907         }
908         check_all_ports_link_status(nb_sys_ports, ports_mask);
909
910         /* Launch per-lcore function on every lcore */
911         rte_eal_mp_remote_launch(main_loop, NULL, CALL_MASTER);
912         RTE_LCORE_FOREACH_SLAVE(i) {
913                 if (rte_eal_wait_lcore(i) < 0)
914                         return -1;
915         }
916
917         /* Release resources */
918         for (port = 0; port < nb_sys_ports; port++) {
919                 if (!(ports_mask & (1 << port)))
920                         continue;
921                 kni_free_kni(port);
922         }
923 #ifdef RTE_LIBRTE_XEN_DOM0
924         rte_kni_close();
925 #endif
926         for (i = 0; i < RTE_MAX_ETHPORTS; i++)
927                 if (kni_port_params_array[i]) {
928                         rte_free(kni_port_params_array[i]);
929                         kni_port_params_array[i] = NULL;
930                 }
931
932         return 0;
933 }
934