net/ngbe: support Rx checksum offload
[dpdk.git] / doc / guides / nics / bnxt.rst
1 .. SPDX-License-Identifier: BSD-3-Clause
2    Copyright 2020 Broadcom Inc.
3
4 BNXT Poll Mode Driver
5 =====================
6
7 The Broadcom BNXT PMD (**librte_net_bnxt**) implements support for adapters
8 based on Ethernet controllers and SoCs belonging to the Broadcom
9 BCM5741X/BCM575XX NetXtreme-E® Family of Ethernet Network Controllers,
10 the Broadcom BCM588XX Stingray Family of Smart NIC Adapters, and the Broadcom
11 StrataGX® BCM5873X Series of Communications Processors.
12
13 A complete list with links to reference material is in the Appendix section.
14
15 CPU Support
16 -----------
17
18 BNXT PMD supports multiple CPU architectures, including x86-32, x86-64, and ARMv8.
19
20 Kernel Dependency
21 -----------------
22
23 BNXT PMD requires a kernel module (VFIO or UIO) for setting up a device, mapping
24 device memory to userspace, registering interrupts, etc.
25 VFIO is more secure than UIO, relying on IOMMU protection.
26 UIO requires the IOMMU disabled or configured to pass-through mode.
27
28 The BNXT PMD supports operating with:
29
30 * Linux vfio-pci
31 * Linux uio_pci_generic
32 * Linux igb_uio
33 * BSD nic_uio
34
35 Running BNXT PMD
36 ----------------
37
38 Bind the device to one of the kernel modules listed above
39
40 .. code-block:: console
41
42     ./dpdk-devbind.py -b vfio-pci|igb_uio|uio_pci_generic bus_id:device_id.function_id
43
44 The BNXT PMD can run on PF or VF.
45
46 PCI-SIG Single Root I/O Virtualization (SR-IOV) involves the direct assignment
47 of part of the network port resources to guest operating systems using the
48 SR-IOV standard.
49 NIC is logically distributed among multiple virtual machines (VMs), while still
50 having global data in common to share with the PF and other VFs.
51
52 Sysadmin can create and configure VFs:
53
54 .. code-block:: console
55
56   echo num_vfs > /sys/bus/pci/devices/domain_id:bus_id:device_id:function_id/sriov_numvfs
57   (ex) echo 4 > /sys/bus/pci/devices/0000:82:00:0/sriov_numvfs
58
59 Sysadmin also can change the VF property such as MAC address, transparent VLAN,
60 TX rate limit, and trusted VF:
61
62 .. code-block:: console
63
64   ip link set pf_id vf vf_id mac (mac_address) vlan (vlan_id) txrate (rate_value) trust (enable|disable)
65   (ex) ip link set 0 vf 0 mac 00:11:22:33:44:55 vlan 0x100 txrate 100 trust disable
66
67 Running on VF
68 ~~~~~~~~~~~~~
69
70 Flow Bifurcation
71 ^^^^^^^^^^^^^^^^
72
73 The Flow Bifurcation splits the incoming data traffic to user space applications
74 (such as DPDK applications) and/or kernel space programs (such as the Linux
75 kernel stack).
76 It can direct some traffic, for example data plane traffic, to DPDK.
77 Rest of the traffic, for example control plane traffic, would be redirected to
78 the traditional Linux networking stack.
79
80 Refer to :doc:`../howto/flow_bifurcation`
81
82 Benefits of the flow bifurcation include:
83
84 * Better performance with less CPU overhead, as user application can directly
85   access the NIC for data path
86 * NIC is still being controlled by the kernel, as control traffic is forwarded
87   only to the kernel driver
88 * Control commands, e.g. ethtool, will work as usual
89
90 Running on a VF, the BXNT PMD supports the flow bifurcation with a combination
91 of SR-IOV and packet classification and/or forwarding capability.
92 In the simplest case of flow bifurcation, a PF driver configures a NIC to
93 forward all user traffic directly to VFs with matching destination MAC address,
94 while the rest of the traffic is forwarded to a PF.
95 Note that the broadcast packets will be forwarded to both PF and VF.
96
97 .. code-block:: console
98
99     (ex) ethtool --config-ntuple ens2f0 flow-type ether dst 00:01:02:03:00:01 vlan 10 vlan-mask 0xf000 action 0x100000000
100
101 Trusted VF
102 ^^^^^^^^^^
103
104 By default, VFs are *not* allowed to perform privileged operations, such as
105 modifying the VF’s MAC address in the guest. These security measures are
106 designed to prevent possible attacks.
107 However, when a DPDK application can be trusted (e.g., OVS-DPDK, here), these
108 operations performed by a VF would be legitimate and can be allowed.
109
110 To enable VF to request "trusted mode," a new trusted VF concept was introduced
111 in Linux kernel 4.4 and allowed VFs to become “trusted” and perform some
112 privileged operations.
113
114 The BNXT PMD supports the trusted VF mode of operation. Only a PF can enable the
115 trusted attribute on the VF. It is preferable to enable the Trusted setting on a
116 VF before starting applications.
117 However, the BNXT PMD handles dynamic changes in trusted settings as well.
118
119 Note that control commands, e.g., ethtool, will work via the kernel PF driver,
120 *not* via the trusted VF driver.
121
122 Operations supported by trusted VF:
123
124 * MAC address configuration
125 * Flow rule creation
126
127 Operations *not* supported by trusted VF:
128
129 * Firmware upgrade
130 * Promiscuous mode setting
131
132 Running on PF
133 ~~~~~~~~~~~~~
134
135 Unlike the VF when BNXT PMD runs on a PF there are no restrictions placed on the
136 features which the PF can enable or request. In a multiport NIC, each port will
137 have a corresponding PF. Also depending on the configuration of the NIC there
138 can be more than one PF associated per port.
139 A sysadmin can load the kernel driver on one PF, and run BNXT PMD on the other
140 PF or run the PMD on both the PFs. In such cases, the firmware picks one of the
141 PFs as a master PF.
142
143 Much like in the trusted VF, the DPDK application must be *trusted* and expected
144 to be *well-behaved*.
145
146 Features
147 --------
148
149 The BNXT PMD supports the following features:
150
151 * Port Control
152     * Port MTU
153     * LED
154     * Flow Control and Autoneg
155 * Packet Filtering
156     * Unicast MAC Filter
157     * Multicast MAC Filter
158     * VLAN Filtering
159     * Allmulticast Mode
160     * Promiscuous Mode
161 * Stateless Offloads
162     * CRC Offload
163     * Checksum Offload (IPv4, TCP, and UDP)
164     * Multi-Queue (TSS and RSS)
165     * Segmentation and Reassembly (TSO and LRO)
166 * VLAN insert strip
167 * Stats Collection
168 * Generic Flow Offload
169
170 Port Control
171 ~~~~~~~~~~~~
172
173 **Port MTU**: BNXT PMD supports the MTU (Maximum Transmission Unit) up to 9,574
174 bytes:
175
176 .. code-block:: console
177
178     testpmd> port config mtu (port_id) mtu_value
179     testpmd> show port info (port_id)
180
181 **LED**: Application tunes on (or off) a port LED, typically for a port
182 identification:
183
184 .. code-block:: console
185
186     int rte_eth_led_on (uint16_t port_id)
187     int rte_eth_led_off (uint16_t port_id)
188
189 **Flow Control and Autoneg**: Application tunes on (or off) flow control and/or
190 auto-negotiation on a port:
191
192 .. code-block:: console
193
194     testpmd> set flow_ctrl rx (on|off) (port_id)
195     testpmd> set flow_ctrl tx (on|off) (port_id)
196     testpmd> set flow_ctrl autoneg (on|off) (port_id)
197
198 Note that the BNXT PMD does *not* support some options and ignores them when
199 requested:
200
201 * high_water
202 * low_water
203 * pause_time
204 * mac_ctrl_frame_fwd
205 * send_xon
206
207 Packet Filtering
208 ~~~~~~~~~~~~~~~~
209
210 Applications control the packet-forwarding behaviors with packet filters.
211
212 The BNXT PMD supports hardware-based packet filtering:
213
214 * UC (Unicast) MAC Filters
215     * No unicast packets are forwarded to an application except the one with
216       DMAC address added to the port
217     * At initialization, the station MAC address is added to the port
218 * MC (Multicast) MAC Filters
219     * No multicast packets are forwarded to an application except the one with
220       MC address added to the port
221     * When the application listens to a multicast group, it adds the MC address
222       to the port
223 * VLAN Filtering Mode
224     * When enabled, no packets are forwarded to an application except the ones
225       with the VLAN tag assigned to the port
226 * Allmulticast Mode
227     * When enabled, every multicast packet received on the port is forwarded to
228       the application
229     * Typical usage is routing applications
230 * Promiscuous Mode
231     * When enabled, every packet received on the port is forwarded to the
232       application
233
234 Unicast MAC Filter
235 ^^^^^^^^^^^^^^^^^^
236
237 The application can add (or remove) MAC addresses to enable (or disable)
238 filtering on MAC address used to accept packets.
239
240 .. code-block:: console
241
242     testpmd> show port (port_id) macs
243     testpmd> mac_addr (add|remove) (port_id) (XX:XX:XX:XX:XX:XX)
244
245 Multicast MAC Filter
246 ^^^^^^^^^^^^^^^^^^^^
247
248 The application can add (or remove) Multicast addresses that enable (or disable)
249 filtering on multicast MAC address used to accept packets.
250
251 .. code-block:: console
252
253     testpmd> show port (port_id) mcast_macs
254     testpmd> mcast_addr (add|remove) (port_id) (XX:XX:XX:XX:XX:XX)
255
256 Application adds (or removes) Multicast addresses to enable (or disable)
257 allowlist filtering to accept packets.
258
259 Note that the BNXT PMD supports up to 16 MC MAC filters. if the user adds more
260 than 16 MC MACs, the BNXT PMD puts the port into the Allmulticast mode.
261
262 VLAN Filtering
263 ^^^^^^^^^^^^^^
264
265 The application enables (or disables) VLAN filtering mode. When the mode is
266 enabled, no packets are forwarded to an application except ones with VLAN tag
267 assigned for the application.
268
269 .. code-block:: console
270
271     testpmd> vlan set filter (on|off) (port_id)
272     testpmd> rx_vlan (add|rm) (vlan_id) (port_id)
273
274 Allmulticast Mode
275 ^^^^^^^^^^^^^^^^^
276
277 The application enables (or disables) the allmulticast mode. When the mode is
278 enabled, every multicast packet received is forwarded to the application.
279
280 .. code-block:: console
281
282     testpmd> show port info (port_id)
283     testpmd> set allmulti (port_id) (on|off)
284
285 Promiscuous Mode
286 ^^^^^^^^^^^^^^^^
287
288 The application enables (or disables) the promiscuous mode. When the mode is
289 enabled on a port, every packet received on the port is forwarded to the
290 application.
291
292 .. code-block:: console
293
294     testpmd> show port info (port_id)
295     testpmd> set promisc port_id (on|off)
296
297 Stateless Offloads
298 ~~~~~~~~~~~~~~~~~~
299
300 Like Linux, DPDK provides enabling hardware offload of some stateless processing
301 (such as checksum calculation) of the stack, alleviating the CPU from having to
302 burn cycles on every packet.
303
304 Listed below are the stateless offloads supported by the BNXT PMD:
305
306 * CRC offload (for both TX and RX packets)
307 * Checksum Offload (for both TX and RX packets)
308     * IPv4 Checksum Offload
309     * TCP Checksum Offload
310     * UDP Checksum Offload
311 * Segmentation/Reassembly Offloads
312     * TCP Segmentation Offload (TSO)
313     * Large Receive Offload (LRO)
314 * Multi-Queue
315     * Transmit Side Scaling (TSS)
316     * Receive Side Scaling (RSS)
317
318 Also, the BNXT PMD supports stateless offloads on inner frames for tunneled
319 packets. Listed below are the tunneling protocols supported by the BNXT PMD:
320
321 * VXLAN
322 * GRE
323 * NVGRE
324
325 Note that enabling (or disabling) stateless offloads requires applications to
326 stop DPDK before changing configuration.
327
328 CRC Offload
329 ^^^^^^^^^^^
330
331 The FCS (Frame Check Sequence) in the Ethernet frame is a four-octet CRC (Cyclic
332 Redundancy Check) that allows detection of corrupted data within the entire
333 frame as received on the receiver side.
334
335 The BNXT PMD supports hardware-based CRC offload:
336
337 * TX: calculate and insert CRC
338 * RX: check and remove CRC, notify the application on CRC error
339
340 Note that the CRC offload is always turned on.
341
342 Checksum Offload
343 ^^^^^^^^^^^^^^^^
344
345 The application enables hardware checksum calculation for IPv4, TCP, and UDP.
346
347 .. code-block:: console
348
349     testpmd> port stop (port_id)
350     testpmd> csum set (ip|tcp|udp|outer-ip|outer-udp) (sw|hw) (port_id)
351     testpmd> set fwd csum
352
353 Multi-Queue
354 ^^^^^^^^^^^
355
356 Multi-Queue, also known as TSS (Transmit Side Scaling) or RSS (Receive Side
357 Scaling), is a common networking technique that allows for more efficient load
358 balancing across multiple CPU cores.
359
360 The application enables multiple TX and RX queues when it is started.
361
362 .. code-block:: console
363
364     dpdk-testpmd -l 1,3,5 --main-lcore 1 --txq=2 –rxq=2 --nb-cores=2
365
366 **TSS**
367
368 TSS distributes network transmit processing across several hardware-based
369 transmit queues, allowing outbound network traffic to be processed by multiple
370 CPU cores.
371
372 **RSS**
373
374 RSS distributes network receive processing across several hardware-based receive
375 queues, allowing inbound network traffic to be processed by multiple CPU cores.
376
377 The application can select the RSS mode, i.e. select the header fields that are
378 included for hash calculation. The BNXT PMD supports the RSS mode of
379 ``default|ip|tcp|udp|none``, where default mode is L3 and L4.
380
381 For tunneled packets, RSS hash is calculated over inner frame header fields.
382 Applications may want to select the tunnel header fields for hash calculation,
383 and it will be supported in 20.08 using RSS level.
384
385 .. code-block:: console
386
387     testpmd> port config (port_id) rss (all|default|ip|tcp|udp|none)
388
389     // note that the testpmd defaults the RSS mode to ip
390     // ensure to issue the command below to enable L4 header (TCP or UDP) along with IPv4 header
391     testpmd> port config (port_id) rss default
392
393     // to check the current RSS configuration, such as RSS function and RSS key
394     testpmd> show port (port_id) rss-hash key
395
396     // RSS is enabled by default. However, application can disable RSS as follows
397     testpmd> port config (port_id) rss none
398
399 Application can change the flow distribution, i.e. remap the received traffic to
400 CPU cores, using RSS RETA (Redirection Table).
401
402 .. code-block:: console
403
404     // application queries the current RSS RETA configuration
405     testpmd> show port (port_id) rss reta size (mask0, mask1)
406
407     // application changes the RSS RETA configuration
408     testpmd> port config (port_id) rss reta (hash, queue) [, (hash, queue)]
409
410 TSO
411 ^^^
412
413 TSO (TCP Segmentation Offload), also known as LSO (Large Send Offload), enables
414 the TCP/IP stack to pass to the NIC a larger datagram than the MTU (Maximum
415 Transmit Unit). NIC breaks it into multiple segments before sending it to the
416 network.
417
418 The BNXT PMD supports hardware-based TSO.
419
420 .. code-block:: console
421
422     // display the status of TSO
423     testpmd> tso show (port_id)
424
425     // enable/disable TSO
426     testpmd> port config (port_id) tx_offload tcp_tso (on|off)
427
428     // set TSO segment size
429     testpmd> tso set segment_size (port_id)
430
431 The BNXT PMD also supports hardware-based tunneled TSO.
432
433 .. code-block:: console
434
435     // display the status of tunneled TSO
436     testpmd> tunnel_tso show (port_id)
437
438     // enable/disable tunneled TSO
439     testpmd> port config (port_id) tx_offload vxlan_tnl_tso|gre_tnl_tso (on|off)
440
441     // set tunneled TSO segment size
442     testpmd> tunnel_tso set segment_size (port_id)
443
444 Note that the checksum offload is always assumed to be enabled for TSO.
445
446 LRO
447 ^^^
448
449 LRO (Large Receive Offload) enables NIC to aggregate multiple incoming TCP/IP
450 packets from a single stream into a larger buffer, before passing to the
451 networking stack.
452
453 The BNXT PMD supports hardware-based LRO.
454
455 .. code-block:: console
456
457     // display the status of LRO
458     testpmd> show port (port_id) rx_offload capabilities
459     testpmd> show port (port_id) rx_offload configuration
460
461     // enable/disable LRO
462     testpmd> port config (port_id) rx_offload tcp_lro (on|off)
463
464     // set max LRO packet (datagram) size
465     testpmd> port config (port_id) max-lro-pkt-size (max_size)
466
467 The BNXT PMD also supports tunneled LRO.
468
469 Some applications, such as routing, should *not* change the packet headers as
470 they pass through (i.e. received from and sent back to the network). In such a
471 case, GRO (Generic Receive Offload) should be used instead of LRO.
472
473 VLAN Insert/Strip
474 ~~~~~~~~~~~~~~~~~
475
476 DPDK application offloads VLAN insert/strip to improve performance. The BNXT PMD
477 supports hardware-based VLAN insert/strip offload for both single and double
478 VLAN packets.
479
480
481 VLAN Insert
482 ^^^^^^^^^^^
483
484 Application configures the VLAN TPID (Tag Protocol ID). By default, the TPID is
485 0x8100.
486
487 .. code-block:: console
488
489     // configure outer TPID value for a port
490     testpmd> vlan set outer tpid (tpid_value) (port_id)
491
492 The inner TPID set will be rejected as the BNXT PMD supports inserting only an
493 outer VLAN. Note that when a packet has a single VLAN, the tag is considered as
494 outer, i.e. the inner VLAN is relevant only when a packet is double-tagged.
495
496 The BNXT PMD supports various TPID values shown below. Any other values will be
497 rejected.
498
499 * ``0x8100``
500 * ``0x88a8``
501 * ``0x9100``
502 * ``0x9200``
503 * ``0x9300``
504
505 The BNXT PMD supports the VLAN insert offload per-packet basis. The application
506 provides the TCI (Tag Control Info) for a packet via mbuf. In turn, the BNXT PMD
507 inserts the VLAN tag (via hardware) using the provided TCI along with the
508 configured TPID.
509
510 .. code-block:: console
511
512     // enable VLAN insert offload
513     testpmd> port config (port_id) rx_offload vlan_insert|qinq_insert (on|off)
514
515     if (mbuf->ol_flags && RTE_MBUF_F_TX_QINQ)       // case-1: insert VLAN to single-tagged packet
516         tci_value = mbuf->vlan_tci_outer
517     else if (mbuf->ol_flags && RTE_MBUF_F_TX_VLAN)  // case-2: insert VLAN to untagged packet
518         tci_value = mbuf->vlan_tci
519
520 VLAN Strip
521 ^^^^^^^^^^
522
523 The application configures the per-port VLAN strip offload.
524
525 .. code-block:: console
526
527     // enable VLAN strip on a port
528     testpmd> port config (port_id) tx_offload vlan_strip (on|off)
529
530     // notify application VLAN strip via mbuf
531     mbuf->ol_flags |= RTE_MBUF_F_RX_VLAN | RTE_MBUF_F_RX_STRIPPED // outer VLAN is found and stripped
532     mbuf->vlan_tci = tci_value                      // TCI of the stripped VLAN
533
534 Time Synchronization
535 ~~~~~~~~~~~~~~~~~~~~
536
537 System operators may run a PTP (Precision Time Protocol) client application to
538 synchronize the time on the NIC (and optionally, on the system) to a PTP master.
539
540 The BNXT PMD supports a PTP client application to communicate with a PTP master
541 clock using DPDK IEEE1588 APIs. Note that the PTP client application needs to
542 run on PF and vector mode needs to be disabled.
543
544 .. code-block:: console
545
546     testpmd> set fwd ieee1588 // enable IEEE 1588 mode
547
548 When enabled, the BNXT PMD configures hardware to insert IEEE 1588 timestamps to
549 the outgoing PTP packets and reports IEEE 1588 timestamps from the incoming PTP
550 packets to application via mbuf.
551
552 .. code-block:: console
553
554     // RX packet completion will indicate whether the packet is PTP
555     mbuf->ol_flags |= RTE_MBUF_F_RX_IEEE1588_PTP
556
557 Statistics Collection
558 ~~~~~~~~~~~~~~~~~~~~~
559
560 In Linux, the *ethtool -S* enables us to query the NIC stats. DPDK provides the
561 similar functionalities via rte_eth_stats and rte_eth_xstats.
562
563 The BNXT PMD supports both basic and extended stats collection:
564
565 * Basic stats
566 * Extended stats
567
568 Basic Stats
569 ^^^^^^^^^^^
570
571 The application collects per-port and per-queue stats using rte_eth_stats APIs.
572
573 .. code-block:: console
574
575     testpmd> show port stats (port_id)
576
577 Basic stats include:
578
579 * ipackets
580 * ibytes
581 * opackets
582 * obytes
583 * imissed
584 * ierrors
585 * oerrors
586
587 By default, per-queue stats for 16 queues are supported. For more than 16
588 queues, BNXT PMD should be compiled with ``RTE_ETHDEV_QUEUE_STAT_CNTRS``
589 set to the desired number of queues.
590
591 Extended Stats
592 ^^^^^^^^^^^^^^
593
594 Unlike basic stats, the extended stats are vendor-specific, i.e. each vendor
595 provides its own set of counters.
596
597 The BNXT PMD provides a rich set of counters, including per-flow counters,
598 per-cos counters, per-priority counters, etc.
599
600 .. code-block:: console
601
602     testpmd> show port xstats (port_id)
603
604 Shown below is the elaborated sequence to retrieve extended stats:
605
606 .. code-block:: console
607
608     // application queries the number of xstats
609     len = rte_eth_xstats_get(port_id, NULL, 0);
610     // BNXT PMD returns the size of xstats array (i.e. the number of entries)
611     // BNXT PMD returns 0, if the feature is compiled out or disabled
612
613     // application allocates memory for xstats
614     struct rte_eth_xstats_name *names; // name is 64 character or less
615     struct rte_eth_xstats *xstats;
616     names = calloc(len, sizeof(*names));
617     xstats = calloc(len, sizeof(*xstats));
618
619     // application retrieves xstats // names and values
620     ret = rte_eth_xstats_get_names(port_id, *names, len);
621     ret = rte_eth_xstats_get(port_id, *xstats, len);
622
623     // application checks the xstats
624     // application may repeat the below:
625     len = rte_eth_xstats_reset(port_id); // reset the xstats
626
627     // reset can be skipped, if application wants to see accumulated stats
628     // run traffic
629     // probably stop the traffic
630     // retrieve xstats // no need to retrieve xstats names again
631     // check xstats
632
633 Generic Flow Offload
634 ~~~~~~~~~~~~~~~~~~~~
635
636 Applications can get benefit by offloading all or part of flow processing to
637 hardware. For example, applications can offload packet classification only
638 (partial offload) or whole match-action (full offload).
639
640 DPDK offers the Generic Flow API (rte_flow API) to configure hardware to
641 perform flow processing.
642
643 Listed below are the rte_flow APIs BNXT PMD supports:
644
645 * rte_flow_validate
646 * rte_flow_create
647 * rte_flow_destroy
648 * rte_flow_flush
649
650 Host Based Flow Table Management
651 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
652
653 Starting with 20.05 BNXT PMD supports host based flow table management. This is
654 a new mechanism that should allow higher flow scalability than what is currently
655 supported. This new approach also defines a new rte_flow parser, and mapper
656 which currently supports basic packet classification in the receive path.
657
658 The feature uses a newly implemented control-plane firmware interface which
659 optimizes flow insertions and deletions.
660
661 This feature is currently supported on Whitney+, Stingray and Thor devices.
662
663 Notes
664 -----
665
666 - On stopping a device port, all the flows created on a port by the
667   application will be flushed from the hardware and any tables maintained
668   by the PMD. After stopping the device port, all flows on the port become
669   invalid and are not represented in the system anymore.
670   Instead of destroying or flushing such flows an application should discard
671   all references to these flows and re-create the flows as required after the
672   port is restarted.
673
674 - While an application is free to use the group id attribute to group flows
675   together using a specific criteria, the BNXT PMD currently associates this
676   group id to a VNIC id. One such case is grouping of flows which are filtered
677   on the same source or destination MAC address. This allows packets of such
678   flows to be directed to one or more queues associated with the VNIC id.
679   This implementation is supported only when TRUFLOW functionality is disabled.
680
681 - An application can issue a VXLAN decap offload request using rte_flow API
682   either as a single rte_flow request or a combination of two stages.
683   The PMD currently supports the two stage offload design.
684   In this approach the offload request may come as two flow offload requests
685   Flow1 & Flow2.  The match criteria for Flow1 is O_DMAC, O_SMAC, O_DST_IP,
686   O_UDP_DPORT and actions are COUNT, MARK, JUMP. The match criteria for Flow2
687   is O_SRC_IP, O_DST_IP, VNI and inner header fields.
688   Flow1 and Flow2 flow offload requests can come in any order. If Flow2 flow
689   offload request comes first then Flow2 can’t be offloaded as there is
690   no O_DMAC information in Flow2. In this case, Flow2 will be deferred until
691   Flow1 flow offload request arrives. When Flow1 flow offload request is
692   received it will have O_DMAC information. Using Flow1’s O_DMAC, driver
693   creates an L2 context entry in the hardware as part of offloading Flow1.
694   Flow2 will now use Flow1’s O_DMAC to get the L2 context id associated with
695   this O_DMAC and other flow fields that are cached already at the time
696   of deferring Flow2 for offloading. Flow2 that arrive after Flow1 is offloaded
697   will be directly programmed and not cached.
698
699 - PMD supports thread-safe rte_flow operations.
700
701 Note: A VNIC represents a virtual interface in the hardware. It is a resource
702 in the RX path of the chip and is used to setup various target actions such as
703 RSS, MAC filtering etc. for the physical function in use.
704
705 Virtual Function Port Representors
706 ----------------------------------
707 The BNXT PMD supports the creation of VF port representors for the control
708 and monitoring of BNXT virtual function devices. Each port representor
709 corresponds to a single virtual function of that device that is connected to a
710 VF. When there is no hardware flow offload, each packet transmitted by the VF
711 will be received by the corresponding representor. Similarly each packet that is
712 sent to a representor will be received by the VF. Applications can take
713 advantage of this feature when SRIOV is enabled. The representor will allow the
714 first packet that is transmitted by the VF to be received by the DPDK
715 application which can then decide if the flow should be offloaded to the
716 hardware. Once the flow is offloaded in the hardware, any packet matching the
717 flow will be received by the VF while the DPDK application will not receive it
718 any more. The BNXT PMD supports creation and handling of the port representors
719 when the PMD is initialized on a PF or trusted-VF. The user can specify the list
720 of VF IDs of the VFs for which the representors are needed by using the
721 ``devargs`` option ``representor``.::
722
723   -a DBDF,representor=[0,1,4]
724
725 Note that currently hot-plugging of representor ports is not supported so all
726 the required representors must be specified on the creation of the PF or the
727 trusted VF.
728
729 Representors on Stingray SoC
730 ----------------------------
731 A representor created on X86 host typically represents a VF running in the same
732 X86 domain. But in case of the SoC, the application can run on the CPU complex
733 inside the SoC. The representor can be created on the SoC to represent a PF or a
734 VF running in the x86 domain. Since the representator creation requires passing
735 the bus:device.function of the PCI device endpoint which is not necessarily in the
736 same host domain, additional dev args have been added to the PMD.
737
738 * rep_is_vf - false to indicate VF representor
739 * rep_is_pf - true to indicate PF representor
740 * rep_based_pf - Physical index of the PF
741 * rep_q_r2f - Logical COS Queue index for the rep to endpoint direction
742 * rep_q_f2r - Logical COS Queue index for the endpoint to rep direction
743 * rep_fc_r2f - Flow control for the representor to endpoint direction
744 * rep_fc_f2r - Flow control for the endpoint to representor direction
745
746 The sample command line with the new ``devargs`` looks like this::
747
748   -a 0000:06:02.0,representor=[1],rep-based-pf=8,\
749         rep-is-pf=1,rep-q-r2f=1,rep-fc-r2f=0,rep-q-f2r=1,rep-fc-f2r=1
750
751 .. code-block:: console
752
753         dpdk-testpmd -l1-4 -n2 -a 0008:01:00.0,\
754         representor=[0], rep-based-pf=8,rep-is-pf=0,rep-q-r2f=1,rep-fc-r2f=1,\
755         rep-q-f2r=0,rep-fc-f2r=1 --log-level="pmd.*",8 -- -i --rxq=3 --txq=3
756
757 Number of flows supported
758 -------------------------
759 The number of flows that can be support can be changed using the devargs
760 parameter ``max_num_kflows``. The default number of flows supported is 16K each
761 in ingress and egress path.
762
763 Selecting EM vs EEM
764 -------------------
765 Broadcom devices can support filter creation in the onchip memory or the
766 external memory. This is referred to as EM or EEM mode respectively.
767 The decision for internal/external EM support is based on the ``devargs``
768 parameter ``max_num_kflows``.  If this is set by the user, external EM is used.
769 Otherwise EM support is enabled with flows created in internal memory.
770
771 Application Support
772 -------------------
773
774 Firmware
775 ~~~~~~~~
776
777 The BNXT PMD supports the application to retrieve the firmware version.
778
779 .. code-block:: console
780
781     testpmd> show port info (port_id)
782
783 Note that the applications cannot update the firmware using BNXT PMD.
784
785 Multiple Processes
786 ~~~~~~~~~~~~~~~~~~
787
788 When two or more DPDK applications (e.g., testpmd and dpdk-pdump) share a single
789 instance of DPDK, the BNXT PMD supports a single primary application and one or
790 more secondary applications. Note that the DPDK-layer (not the PMD) ensures
791 there is only one primary application.
792
793 There are two modes:
794
795 Manual mode
796
797 * Application notifies whether it is primary or secondary using *proc-type* flag
798 * 1st process should be spawned with ``--proc-type=primary``
799 * All subsequent processes should be spawned with ``--proc-type=secondary``
800
801 Auto detection mode
802
803 * Application is using ``proc-type=auto`` flag
804 * A process is spawned as a secondary if a primary is already running
805
806 The BNXT PMD uses the info to skip a device initialization, i.e. performs a
807 device initialization only when being brought up by a primary application.
808
809 Runtime Queue Setup
810 ~~~~~~~~~~~~~~~~~~~
811
812 Typically, a DPDK application allocates TX and RX queues statically: i.e. queues
813 are allocated at start. However, an application may want to increase (or
814 decrease) the number of queues dynamically for various reasons, e.g. power
815 savings.
816
817 The BNXT PMD supports applications to increase or decrease queues at runtime.
818
819 .. code-block:: console
820
821     testpmd> port config all (rxq|txq) (num_queues)
822
823 Note that a DPDK application must allocate default queues (one for TX and one
824 for RX at minimum) at initialization.
825
826 Descriptor Status
827 ~~~~~~~~~~~~~~~~~
828
829 Applications may use the descriptor status for various reasons, e.g. for power
830 savings. For example, an application may stop polling and change to interrupt
831 mode when the descriptor status shows no packets to service for a while.
832
833 The BNXT PMD supports the application to retrieve both TX and RX descriptor
834 status.
835
836 .. code-block:: console
837
838     testpmd> show port (port_id) (rxq|txq) (queue_id) desc (desc_id) status
839
840 Bonding
841 ~~~~~~~
842
843 DPDK implements a light-weight library to allow PMDs to be bonded together and provide a single logical PMD to the application.
844
845 .. code-block:: console
846
847     dpdk-testpmd -l 0-3 -n4 --vdev 'net_bonding0,mode=0,slave=<PCI B:D.F device 1>,slave=<PCI B:D.F device 2>,mac=XX:XX:XX:XX:XX:XX’ – --socket_num=1 – -i --port-topology=chained
848     (ex) dpdk-testpmd -l 1,3,5,7,9 -n4 --vdev 'net_bonding0,mode=0,slave=0000:82:00.0,slave=0000:82:00.1,mac=00:1e:67:1d:fd:1d' – --socket-num=1 – -i --port-topology=chained
849
850 Vector Processing
851 -----------------
852
853 The BNXT PMD provides vectorized burst transmit/receive function implementations
854 on x86-based platforms using SSE (Streaming SIMD Extensions) and AVX2 (Advanced
855 Vector Extensions 2) instructions, and on Arm-based platforms using Arm Neon
856 Advanced SIMD instructions. Vector processing support is currently implemented
857 only for Intel/AMD and Arm CPU architectures.
858
859 Vector processing provides significantly improved performance over scalar
860 processing. This improved performance is derived from a number of optimizations:
861
862 * Using SIMD instructions to operate on multiple packets in parallel.
863 * Using SIMD instructions to do more work per instruction than is possible
864   with scalar instructions, for example by leveraging 128-bit and 256-bi
865   load/store instructions or by using SIMD shuffle and permute operations.
866 * Batching
867
868     * TX: transmit completions are processed in bulk.
869     * RX: bulk allocation of mbufs is used when allocating rxq buffers.
870
871 * Simplifications enabled by not supporting chained mbufs in vector mode.
872 * Simplifications enabled by not supporting some stateless offloads in vector
873   mode:
874
875     * TX: only the following reduced set of transmit offloads is supported in
876       vector mode::
877
878        RTE_ETH_TX_OFFLOAD_MBUF_FAST_FREE
879
880     * RX: only the following reduced set of receive offloads is supported in
881       vector mode (note that jumbo MTU is allowed only when the MTU setting
882       does not require `RTE_ETH_RX_OFFLOAD_SCATTER` to be enabled)::
883
884        RTE_ETH_RX_OFFLOAD_VLAN_STRIP
885        RTE_ETH_RX_OFFLOAD_KEEP_CRC
886        RTE_ETH_RX_OFFLOAD_IPV4_CKSUM
887        RTE_ETH_RX_OFFLOAD_UDP_CKSUM
888        RTE_ETH_RX_OFFLOAD_TCP_CKSUM
889        RTE_ETH_RX_OFFLOAD_OUTER_IPV4_CKSUM
890        RTE_ETH_RX_OFFLOAD_OUTER_UDP_CKSUM
891        RTE_ETH_RX_OFFLOAD_RSS_HASH
892        RTE_ETH_RX_OFFLOAD_VLAN_FILTER
893
894 The BNXT Vector PMD is enabled in DPDK builds by default. The decision to enable
895 vector processing is made at run-time when the port is started; if no transmit
896 offloads outside the set supported for vector mode are enabled then vector mode
897 transmit will be enabled, and if no receive offloads outside the set supported
898 for vector mode are enabled then vector mode receive will be enabled.  Offload
899 configuration changes that impact the decision to enable vector mode are allowed
900 only when the port is stopped.
901
902 Note that TX (or RX) vector mode can be enabled independently from RX (or TX)
903 vector mode.
904
905 Appendix
906 --------
907
908 Supported Chipsets and Adapters
909 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
910
911 BCM5730x NetXtreme-C® Family of Ethernet Network Controllers
912 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
913
914 Information about Ethernet adapters in the NetXtreme family of adapters can be
915 found in the `NetXtreme® Brand section <https://www.broadcom.com/products/ethernet-connectivity/network-adapters/>`_ of the `Broadcom website <http://www.broadcom.com/>`_.
916
917 * ``M150c ... Single-port 40/50 Gigabit Ethernet Adapter``
918 * ``P150c ... Single-port 40/50 Gigabit Ethernet Adapter``
919 * ``P225c ... Dual-port 10/25 Gigabit Ethernet Adapter``
920
921 BCM574xx/575xx NetXtreme-E® Family of Ethernet Network Controllers
922 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
923
924 Information about Ethernet adapters in the NetXtreme family of adapters can be
925 found in the `NetXtreme® Brand section <https://www.broadcom.com/products/ethernet-connectivity/network-adapters/>`_ of the `Broadcom website <http://www.broadcom.com/>`_.
926
927 * ``M125P .... Single-port OCP 2.0 10/25 Gigabit Ethernet Adapter``
928 * ``M150P .... Single-port OCP 2.0 50 Gigabit Ethernet Adapter``
929 * ``M150PM ... Single-port OCP 2.0 Multi-Host 50 Gigabit Ethernet Adapter``
930 * ``M210P .... Dual-port OCP 2.0 10 Gigabit Ethernet Adapter``
931 * ``M210TP ... Dual-port OCP 2.0 10 Gigabit Ethernet Adapter``
932 * ``M1100G ... Single-port OCP 2.0 10/25/50/100 Gigabit Ethernet Adapter``
933 * ``N150G .... Single-port OCP 3.0 50 Gigabit Ethernet Adapter``
934 * ``M225P .... Dual-port OCP 2.0 10/25 Gigabit Ethernet Adapter``
935 * ``N210P .... Dual-port OCP 3.0 10 Gigabit Ethernet Adapter``
936 * ``N210TP ... Dual-port OCP 3.0 10 Gigabit Ethernet Adapter``
937 * ``N225P .... Dual-port OCP 3.0 10/25 Gigabit Ethernet Adapter``
938 * ``N250G .... Dual-port OCP 3.0 50 Gigabit Ethernet Adapter``
939 * ``N410SG ... Quad-port OCP 3.0 10 Gigabit Ethernet Adapter``
940 * ``N410SGBT . Quad-port OCP 3.0 10 Gigabit Ethernet Adapter``
941 * ``N425G .... Quad-port OCP 3.0 10/25 Gigabit Ethernet Adapter``
942 * ``N1100G ... Single-port OCP 3.0 10/25/50/100 Gigabit Ethernet Adapter``
943 * ``N2100G ... Dual-port OCP 3.0 10/25/50/100 Gigabit Ethernet Adapter``
944 * ``N2200G ... Dual-port OCP 3.0 10/25/50/100/200 Gigabit Ethernet Adapter``
945 * ``P150P .... Single-port 50 Gigabit Ethernet Adapter``
946 * ``P210P .... Dual-port 10 Gigabit Ethernet Adapter``
947 * ``P210TP ... Dual-port 10 Gigabit Ethernet Adapter``
948 * ``P225P .... Dual-port 10/25 Gigabit Ethernet Adapter``
949 * ``P410SG ... Quad-port 10 Gigabit Ethernet Adapter``
950 * ``P410SGBT . Quad-port 10 Gigabit Ethernet Adapter``
951 * ``P425G .... Quad-port 10/25 Gigabit Ethernet Adapter``
952 * ``P1100G ... Single-port 10/25/50/100 Gigabit Ethernet Adapter``
953 * ``P2100G ... Dual-port 10/25/50/100 Gigabit Ethernet Adapter``
954 * ``P2200G ... Dual-port 10/25/50/100/200 Gigabit Ethernet Adapter``
955
956 BCM588xx NetXtreme-S® Family of SmartNIC Network Controllers
957 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
958
959 Information about the Stingray family of SmartNIC adapters can be found in the
960 `Stingray® Brand section <https://www.broadcom.com/products/ethernet-connectivity/smartnic/>`_ of the `Broadcom website <http://www.broadcom.com/>`_.
961
962 * ``PS225 ... Dual-port 25 Gigabit Ethernet SmartNIC``
963
964 BCM5873x StrataGX® Family of Communications Processors
965 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
966
967 These ARM-based processors target a broad range of networking applications,
968 including virtual CPE (vCPE) and NFV appliances, 10G service routers and
969 gateways, control plane processing for Ethernet switches, and network-attached
970 storage (NAS).
971
972 * ``StrataGX BCM58732 ... Octal-Core 3.0GHz 64-bit ARM®v8 Cortex®-A72 based SoC``