3398c12c84334b69de1458ff779c4cc5a701b886
[dpdk.git] / lib / librte_mbuf / rte_mbuf_core.h
1 /* SPDX-License-Identifier: BSD-3-Clause
2  * Copyright(c) 2010-2014 Intel Corporation.
3  * Copyright 2014 6WIND S.A.
4  */
5
6 #ifndef _RTE_MBUF_CORE_H_
7 #define _RTE_MBUF_CORE_H_
8
9 /**
10  * @file
11  * This file contains definion of RTE mbuf structure itself,
12  * packet offload flags and some related macros.
13  * For majority of DPDK entities, it is not recommended to include
14  * this file directly, use include <rte_mbuf.h> instead.
15  */
16
17 #include <stdint.h>
18 #include <rte_compat.h>
19 #include <generic/rte_atomic.h>
20
21 #ifdef __cplusplus
22 extern "C" {
23 #endif
24
25 /*
26  * Packet Offload Features Flags. It also carry packet type information.
27  * Critical resources. Both rx/tx shared these bits. Be cautious on any change
28  *
29  * - RX flags start at bit position zero, and get added to the left of previous
30  *   flags.
31  * - The most-significant 3 bits are reserved for generic mbuf flags
32  * - TX flags therefore start at bit position 60 (i.e. 63-3), and new flags get
33  *   added to the right of the previously defined flags i.e. they should count
34  *   downwards, not upwards.
35  *
36  * Keep these flags synchronized with rte_get_rx_ol_flag_name() and
37  * rte_get_tx_ol_flag_name().
38  */
39
40 /**
41  * The RX packet is a 802.1q VLAN packet, and the tci has been
42  * saved in in mbuf->vlan_tci.
43  * If the flag PKT_RX_VLAN_STRIPPED is also present, the VLAN
44  * header has been stripped from mbuf data, else it is still
45  * present.
46  */
47 #define PKT_RX_VLAN          (1ULL << 0)
48
49 /** RX packet with RSS hash result. */
50 #define PKT_RX_RSS_HASH      (1ULL << 1)
51
52  /** RX packet with FDIR match indicate. */
53 #define PKT_RX_FDIR          (1ULL << 2)
54
55 /**
56  * Deprecated.
57  * Checking this flag alone is deprecated: check the 2 bits of
58  * PKT_RX_L4_CKSUM_MASK.
59  * This flag was set when the L4 checksum of a packet was detected as
60  * wrong by the hardware.
61  */
62 #define PKT_RX_L4_CKSUM_BAD  (1ULL << 3)
63
64 /**
65  * Deprecated.
66  * Checking this flag alone is deprecated: check the 2 bits of
67  * PKT_RX_IP_CKSUM_MASK.
68  * This flag was set when the IP checksum of a packet was detected as
69  * wrong by the hardware.
70  */
71 #define PKT_RX_IP_CKSUM_BAD  (1ULL << 4)
72
73  /** External IP header checksum error. */
74 #define PKT_RX_EIP_CKSUM_BAD (1ULL << 5)
75
76 /**
77  * A vlan has been stripped by the hardware and its tci is saved in
78  * mbuf->vlan_tci. This can only happen if vlan stripping is enabled
79  * in the RX configuration of the PMD.
80  * When PKT_RX_VLAN_STRIPPED is set, PKT_RX_VLAN must also be set.
81  */
82 #define PKT_RX_VLAN_STRIPPED (1ULL << 6)
83
84 /**
85  * Mask of bits used to determine the status of RX IP checksum.
86  * - PKT_RX_IP_CKSUM_UNKNOWN: no information about the RX IP checksum
87  * - PKT_RX_IP_CKSUM_BAD: the IP checksum in the packet is wrong
88  * - PKT_RX_IP_CKSUM_GOOD: the IP checksum in the packet is valid
89  * - PKT_RX_IP_CKSUM_NONE: the IP checksum is not correct in the packet
90  *   data, but the integrity of the IP header is verified.
91  */
92 #define PKT_RX_IP_CKSUM_MASK ((1ULL << 4) | (1ULL << 7))
93
94 #define PKT_RX_IP_CKSUM_UNKNOWN 0
95 #define PKT_RX_IP_CKSUM_BAD     (1ULL << 4)
96 #define PKT_RX_IP_CKSUM_GOOD    (1ULL << 7)
97 #define PKT_RX_IP_CKSUM_NONE    ((1ULL << 4) | (1ULL << 7))
98
99 /**
100  * Mask of bits used to determine the status of RX L4 checksum.
101  * - PKT_RX_L4_CKSUM_UNKNOWN: no information about the RX L4 checksum
102  * - PKT_RX_L4_CKSUM_BAD: the L4 checksum in the packet is wrong
103  * - PKT_RX_L4_CKSUM_GOOD: the L4 checksum in the packet is valid
104  * - PKT_RX_L4_CKSUM_NONE: the L4 checksum is not correct in the packet
105  *   data, but the integrity of the L4 data is verified.
106  */
107 #define PKT_RX_L4_CKSUM_MASK ((1ULL << 3) | (1ULL << 8))
108
109 #define PKT_RX_L4_CKSUM_UNKNOWN 0
110 #define PKT_RX_L4_CKSUM_BAD     (1ULL << 3)
111 #define PKT_RX_L4_CKSUM_GOOD    (1ULL << 8)
112 #define PKT_RX_L4_CKSUM_NONE    ((1ULL << 3) | (1ULL << 8))
113
114 /** RX IEEE1588 L2 Ethernet PT Packet. */
115 #define PKT_RX_IEEE1588_PTP  (1ULL << 9)
116
117 /** RX IEEE1588 L2/L4 timestamped packet.*/
118 #define PKT_RX_IEEE1588_TMST (1ULL << 10)
119
120 /** FD id reported if FDIR match. */
121 #define PKT_RX_FDIR_ID       (1ULL << 13)
122
123 /** Flexible bytes reported if FDIR match. */
124 #define PKT_RX_FDIR_FLX      (1ULL << 14)
125
126 /**
127  * The 2 vlans have been stripped by the hardware and their tci are
128  * saved in mbuf->vlan_tci (inner) and mbuf->vlan_tci_outer (outer).
129  * This can only happen if vlan stripping is enabled in the RX
130  * configuration of the PMD.
131  * When PKT_RX_QINQ_STRIPPED is set, the flags (PKT_RX_VLAN |
132  * PKT_RX_VLAN_STRIPPED | PKT_RX_QINQ) must also be set.
133  */
134 #define PKT_RX_QINQ_STRIPPED (1ULL << 15)
135
136 /**
137  * When packets are coalesced by a hardware or virtual driver, this flag
138  * can be set in the RX mbuf, meaning that the m->tso_segsz field is
139  * valid and is set to the segment size of original packets.
140  */
141 #define PKT_RX_LRO           (1ULL << 16)
142
143 /**
144  * Indicate that the timestamp field in the mbuf is valid.
145  */
146 #define PKT_RX_TIMESTAMP     (1ULL << 17)
147
148 /**
149  * Indicate that security offload processing was applied on the RX packet.
150  */
151 #define PKT_RX_SEC_OFFLOAD      (1ULL << 18)
152
153 /**
154  * Indicate that security offload processing failed on the RX packet.
155  */
156 #define PKT_RX_SEC_OFFLOAD_FAILED       (1ULL << 19)
157
158 /**
159  * The RX packet is a double VLAN, and the outer tci has been
160  * saved in in mbuf->vlan_tci_outer. If PKT_RX_QINQ set, PKT_RX_VLAN
161  * also should be set and inner tci should be saved to mbuf->vlan_tci.
162  * If the flag PKT_RX_QINQ_STRIPPED is also present, both VLANs
163  * headers have been stripped from mbuf data, else they are still
164  * present.
165  */
166 #define PKT_RX_QINQ          (1ULL << 20)
167
168 /**
169  * Mask of bits used to determine the status of outer RX L4 checksum.
170  * - PKT_RX_OUTER_L4_CKSUM_UNKNOWN: no info about the outer RX L4 checksum
171  * - PKT_RX_OUTER_L4_CKSUM_BAD: the outer L4 checksum in the packet is wrong
172  * - PKT_RX_OUTER_L4_CKSUM_GOOD: the outer L4 checksum in the packet is valid
173  * - PKT_RX_OUTER_L4_CKSUM_INVALID: invalid outer L4 checksum state.
174  *
175  * The detection of PKT_RX_OUTER_L4_CKSUM_GOOD shall be based on the given
176  * HW capability, At minimum, the PMD should support
177  * PKT_RX_OUTER_L4_CKSUM_UNKNOWN and PKT_RX_OUTER_L4_CKSUM_BAD states
178  * if the DEV_RX_OFFLOAD_OUTER_UDP_CKSUM offload is available.
179  */
180 #define PKT_RX_OUTER_L4_CKSUM_MASK      ((1ULL << 21) | (1ULL << 22))
181
182 #define PKT_RX_OUTER_L4_CKSUM_UNKNOWN   0
183 #define PKT_RX_OUTER_L4_CKSUM_BAD       (1ULL << 21)
184 #define PKT_RX_OUTER_L4_CKSUM_GOOD      (1ULL << 22)
185 #define PKT_RX_OUTER_L4_CKSUM_INVALID   ((1ULL << 21) | (1ULL << 22))
186
187 /* add new RX flags here */
188
189 /* add new TX flags here */
190
191 /**
192  * Indicate that the metadata field in the mbuf is in use.
193  */
194 #define PKT_TX_METADATA (1ULL << 40)
195
196 /**
197  * Outer UDP checksum offload flag. This flag is used for enabling
198  * outer UDP checksum in PMD. To use outer UDP checksum, the user needs to
199  * 1) Enable the following in mbuf,
200  * a) Fill outer_l2_len and outer_l3_len in mbuf.
201  * b) Set the PKT_TX_OUTER_UDP_CKSUM flag.
202  * c) Set the PKT_TX_OUTER_IPV4 or PKT_TX_OUTER_IPV6 flag.
203  * 2) Configure DEV_TX_OFFLOAD_OUTER_UDP_CKSUM offload flag.
204  */
205 #define PKT_TX_OUTER_UDP_CKSUM     (1ULL << 41)
206
207 /**
208  * UDP Fragmentation Offload flag. This flag is used for enabling UDP
209  * fragmentation in SW or in HW. When use UFO, mbuf->tso_segsz is used
210  * to store the MSS of UDP fragments.
211  */
212 #define PKT_TX_UDP_SEG  (1ULL << 42)
213
214 /**
215  * Request security offload processing on the TX packet.
216  */
217 #define PKT_TX_SEC_OFFLOAD      (1ULL << 43)
218
219 /**
220  * Offload the MACsec. This flag must be set by the application to enable
221  * this offload feature for a packet to be transmitted.
222  */
223 #define PKT_TX_MACSEC        (1ULL << 44)
224
225 /**
226  * Bits 45:48 used for the tunnel type.
227  * The tunnel type must be specified for TSO or checksum on the inner part
228  * of tunnel packets.
229  * These flags can be used with PKT_TX_TCP_SEG for TSO, or PKT_TX_xxx_CKSUM.
230  * The mbuf fields for inner and outer header lengths are required:
231  * outer_l2_len, outer_l3_len, l2_len, l3_len, l4_len and tso_segsz for TSO.
232  */
233 #define PKT_TX_TUNNEL_VXLAN   (0x1ULL << 45)
234 #define PKT_TX_TUNNEL_GRE     (0x2ULL << 45)
235 #define PKT_TX_TUNNEL_IPIP    (0x3ULL << 45)
236 #define PKT_TX_TUNNEL_GENEVE  (0x4ULL << 45)
237 /** TX packet with MPLS-in-UDP RFC 7510 header. */
238 #define PKT_TX_TUNNEL_MPLSINUDP (0x5ULL << 45)
239 #define PKT_TX_TUNNEL_VXLAN_GPE (0x6ULL << 45)
240 #define PKT_TX_TUNNEL_GTP       (0x7ULL << 45)
241 /**
242  * Generic IP encapsulated tunnel type, used for TSO and checksum offload.
243  * It can be used for tunnels which are not standards or listed above.
244  * It is preferred to use specific tunnel flags like PKT_TX_TUNNEL_GRE
245  * or PKT_TX_TUNNEL_IPIP if possible.
246  * The ethdev must be configured with DEV_TX_OFFLOAD_IP_TNL_TSO.
247  * Outer and inner checksums are done according to the existing flags like
248  * PKT_TX_xxx_CKSUM.
249  * Specific tunnel headers that contain payload length, sequence id
250  * or checksum are not expected to be updated.
251  */
252 #define PKT_TX_TUNNEL_IP (0xDULL << 45)
253 /**
254  * Generic UDP encapsulated tunnel type, used for TSO and checksum offload.
255  * UDP tunnel type implies outer IP layer.
256  * It can be used for tunnels which are not standards or listed above.
257  * It is preferred to use specific tunnel flags like PKT_TX_TUNNEL_VXLAN
258  * if possible.
259  * The ethdev must be configured with DEV_TX_OFFLOAD_UDP_TNL_TSO.
260  * Outer and inner checksums are done according to the existing flags like
261  * PKT_TX_xxx_CKSUM.
262  * Specific tunnel headers that contain payload length, sequence id
263  * or checksum are not expected to be updated.
264  */
265 #define PKT_TX_TUNNEL_UDP (0xEULL << 45)
266 /* add new TX TUNNEL type here */
267 #define PKT_TX_TUNNEL_MASK    (0xFULL << 45)
268
269 /**
270  * Double VLAN insertion (QinQ) request to driver, driver may offload the
271  * insertion based on device capability.
272  * mbuf 'vlan_tci' & 'vlan_tci_outer' must be valid when this flag is set.
273  */
274 #define PKT_TX_QINQ        (1ULL << 49)
275 /* this old name is deprecated */
276 #define PKT_TX_QINQ_PKT    PKT_TX_QINQ
277
278 /**
279  * TCP segmentation offload. To enable this offload feature for a
280  * packet to be transmitted on hardware supporting TSO:
281  *  - set the PKT_TX_TCP_SEG flag in mbuf->ol_flags (this flag implies
282  *    PKT_TX_TCP_CKSUM)
283  *  - set the flag PKT_TX_IPV4 or PKT_TX_IPV6
284  *  - if it's IPv4, set the PKT_TX_IP_CKSUM flag
285  *  - fill the mbuf offload information: l2_len, l3_len, l4_len, tso_segsz
286  */
287 #define PKT_TX_TCP_SEG       (1ULL << 50)
288
289 /** TX IEEE1588 packet to timestamp. */
290 #define PKT_TX_IEEE1588_TMST (1ULL << 51)
291
292 /**
293  * Bits 52+53 used for L4 packet type with checksum enabled: 00: Reserved,
294  * 01: TCP checksum, 10: SCTP checksum, 11: UDP checksum. To use hardware
295  * L4 checksum offload, the user needs to:
296  *  - fill l2_len and l3_len in mbuf
297  *  - set the flags PKT_TX_TCP_CKSUM, PKT_TX_SCTP_CKSUM or PKT_TX_UDP_CKSUM
298  *  - set the flag PKT_TX_IPV4 or PKT_TX_IPV6
299  */
300 #define PKT_TX_L4_NO_CKSUM   (0ULL << 52) /**< Disable L4 cksum of TX pkt. */
301
302 /** TCP cksum of TX pkt. computed by NIC. */
303 #define PKT_TX_TCP_CKSUM     (1ULL << 52)
304
305 /** SCTP cksum of TX pkt. computed by NIC. */
306 #define PKT_TX_SCTP_CKSUM    (2ULL << 52)
307
308 /** UDP cksum of TX pkt. computed by NIC. */
309 #define PKT_TX_UDP_CKSUM     (3ULL << 52)
310
311 /** Mask for L4 cksum offload request. */
312 #define PKT_TX_L4_MASK       (3ULL << 52)
313
314 /**
315  * Offload the IP checksum in the hardware. The flag PKT_TX_IPV4 should
316  * also be set by the application, although a PMD will only check
317  * PKT_TX_IP_CKSUM.
318  *  - fill the mbuf offload information: l2_len, l3_len
319  */
320 #define PKT_TX_IP_CKSUM      (1ULL << 54)
321
322 /**
323  * Packet is IPv4. This flag must be set when using any offload feature
324  * (TSO, L3 or L4 checksum) to tell the NIC that the packet is an IPv4
325  * packet. If the packet is a tunneled packet, this flag is related to
326  * the inner headers.
327  */
328 #define PKT_TX_IPV4          (1ULL << 55)
329
330 /**
331  * Packet is IPv6. This flag must be set when using an offload feature
332  * (TSO or L4 checksum) to tell the NIC that the packet is an IPv6
333  * packet. If the packet is a tunneled packet, this flag is related to
334  * the inner headers.
335  */
336 #define PKT_TX_IPV6          (1ULL << 56)
337
338 /**
339  * VLAN tag insertion request to driver, driver may offload the insertion
340  * based on the device capability.
341  * mbuf 'vlan_tci' field must be valid when this flag is set.
342  */
343 #define PKT_TX_VLAN          (1ULL << 57)
344 /* this old name is deprecated */
345 #define PKT_TX_VLAN_PKT      PKT_TX_VLAN
346
347 /**
348  * Offload the IP checksum of an external header in the hardware. The
349  * flag PKT_TX_OUTER_IPV4 should also be set by the application, although
350  * a PMD will only check PKT_TX_OUTER_IP_CKSUM.
351  *  - fill the mbuf offload information: outer_l2_len, outer_l3_len
352  */
353 #define PKT_TX_OUTER_IP_CKSUM   (1ULL << 58)
354
355 /**
356  * Packet outer header is IPv4. This flag must be set when using any
357  * outer offload feature (L3 or L4 checksum) to tell the NIC that the
358  * outer header of the tunneled packet is an IPv4 packet.
359  */
360 #define PKT_TX_OUTER_IPV4   (1ULL << 59)
361
362 /**
363  * Packet outer header is IPv6. This flag must be set when using any
364  * outer offload feature (L4 checksum) to tell the NIC that the outer
365  * header of the tunneled packet is an IPv6 packet.
366  */
367 #define PKT_TX_OUTER_IPV6    (1ULL << 60)
368
369 /**
370  * Bitmask of all supported packet Tx offload features flags,
371  * which can be set for packet.
372  */
373 #define PKT_TX_OFFLOAD_MASK (    \
374                 PKT_TX_OUTER_IPV6 |      \
375                 PKT_TX_OUTER_IPV4 |      \
376                 PKT_TX_OUTER_IP_CKSUM |  \
377                 PKT_TX_VLAN_PKT |        \
378                 PKT_TX_IPV6 |            \
379                 PKT_TX_IPV4 |            \
380                 PKT_TX_IP_CKSUM |        \
381                 PKT_TX_L4_MASK |         \
382                 PKT_TX_IEEE1588_TMST |   \
383                 PKT_TX_TCP_SEG |         \
384                 PKT_TX_QINQ_PKT |        \
385                 PKT_TX_TUNNEL_MASK |     \
386                 PKT_TX_MACSEC |          \
387                 PKT_TX_SEC_OFFLOAD |     \
388                 PKT_TX_UDP_SEG |         \
389                 PKT_TX_OUTER_UDP_CKSUM | \
390                 PKT_TX_METADATA)
391
392 /**
393  * Mbuf having an external buffer attached. shinfo in mbuf must be filled.
394  */
395 #define EXT_ATTACHED_MBUF    (1ULL << 61)
396
397 #define IND_ATTACHED_MBUF    (1ULL << 62) /**< Indirect attached mbuf */
398
399 /** Alignment constraint of mbuf private area. */
400 #define RTE_MBUF_PRIV_ALIGN 8
401
402 /**
403  * Some NICs need at least 2KB buffer to RX standard Ethernet frame without
404  * splitting it into multiple segments.
405  * So, for mbufs that planned to be involved into RX/TX, the recommended
406  * minimal buffer length is 2KB + RTE_PKTMBUF_HEADROOM.
407  */
408 #define RTE_MBUF_DEFAULT_DATAROOM       2048
409 #define RTE_MBUF_DEFAULT_BUF_SIZE       \
410         (RTE_MBUF_DEFAULT_DATAROOM + RTE_PKTMBUF_HEADROOM)
411
412 /*
413  * define a set of marker types that can be used to refer to set points in the
414  * mbuf.
415  */
416 __extension__
417 typedef void    *MARKER[0];   /**< generic marker for a point in a structure */
418 __extension__
419 typedef uint8_t  MARKER8[0];  /**< generic marker with 1B alignment */
420
421  /** marker that allows us to overwrite 8 bytes with a single assignment */
422 __extension__
423 typedef uint64_t MARKER64[0];
424
425 struct rte_mbuf_sched {
426         uint32_t queue_id;   /**< Queue ID. */
427         uint8_t traffic_class;
428         /**< Traffic class ID. Traffic class 0
429          * is the highest priority traffic class.
430          */
431         uint8_t color;
432         /**< Color. @see enum rte_color.*/
433         uint16_t reserved;   /**< Reserved. */
434 }; /**< Hierarchical scheduler */
435
436 /**
437  * enum for the tx_offload bit-fields lengths and offsets.
438  * defines the layout of rte_mbuf tx_offload field.
439  */
440 enum {
441         RTE_MBUF_L2_LEN_BITS = 7,
442         RTE_MBUF_L3_LEN_BITS = 9,
443         RTE_MBUF_L4_LEN_BITS = 8,
444         RTE_MBUF_TSO_SEGSZ_BITS = 16,
445         RTE_MBUF_OUTL3_LEN_BITS = 9,
446         RTE_MBUF_OUTL2_LEN_BITS = 7,
447         RTE_MBUF_TXOFLD_UNUSED_BITS = sizeof(uint64_t) * CHAR_BIT -
448                 RTE_MBUF_L2_LEN_BITS -
449                 RTE_MBUF_L3_LEN_BITS -
450                 RTE_MBUF_L4_LEN_BITS -
451                 RTE_MBUF_TSO_SEGSZ_BITS -
452                 RTE_MBUF_OUTL3_LEN_BITS -
453                 RTE_MBUF_OUTL2_LEN_BITS,
454 #if RTE_BYTE_ORDER == RTE_BIG_ENDIAN
455         RTE_MBUF_L2_LEN_OFS =
456                 sizeof(uint64_t) * CHAR_BIT - RTE_MBUF_L2_LEN_BITS,
457         RTE_MBUF_L3_LEN_OFS = RTE_MBUF_L2_LEN_OFS - RTE_MBUF_L3_LEN_BITS,
458         RTE_MBUF_L4_LEN_OFS = RTE_MBUF_L3_LEN_OFS - RTE_MBUF_L4_LEN_BITS,
459         RTE_MBUF_TSO_SEGSZ_OFS = RTE_MBUF_L4_LEN_OFS - RTE_MBUF_TSO_SEGSZ_BITS,
460         RTE_MBUF_OUTL3_LEN_OFS =
461                 RTE_MBUF_TSO_SEGSZ_OFS - RTE_MBUF_OUTL3_LEN_BITS,
462         RTE_MBUF_OUTL2_LEN_OFS =
463                 RTE_MBUF_OUTL3_LEN_OFS - RTE_MBUF_OUTL2_LEN_BITS,
464         RTE_MBUF_TXOFLD_UNUSED_OFS =
465                 RTE_MBUF_OUTL2_LEN_OFS - RTE_MBUF_TXOFLD_UNUSED_BITS,
466 #else
467         RTE_MBUF_L2_LEN_OFS = 0,
468         RTE_MBUF_L3_LEN_OFS = RTE_MBUF_L2_LEN_OFS + RTE_MBUF_L2_LEN_BITS,
469         RTE_MBUF_L4_LEN_OFS = RTE_MBUF_L3_LEN_OFS + RTE_MBUF_L3_LEN_BITS,
470         RTE_MBUF_TSO_SEGSZ_OFS = RTE_MBUF_L4_LEN_OFS + RTE_MBUF_L4_LEN_BITS,
471         RTE_MBUF_OUTL3_LEN_OFS =
472                 RTE_MBUF_TSO_SEGSZ_OFS + RTE_MBUF_TSO_SEGSZ_BITS,
473         RTE_MBUF_OUTL2_LEN_OFS =
474                 RTE_MBUF_OUTL3_LEN_OFS + RTE_MBUF_OUTL3_LEN_BITS,
475         RTE_MBUF_TXOFLD_UNUSED_OFS =
476                 RTE_MBUF_OUTL2_LEN_OFS + RTE_MBUF_OUTL2_LEN_BITS,
477 #endif
478 };
479
480 /**
481  * The generic rte_mbuf, containing a packet mbuf.
482  */
483 struct rte_mbuf {
484         MARKER cacheline0;
485
486         void *buf_addr;           /**< Virtual address of segment buffer. */
487         /**
488          * Physical address of segment buffer.
489          * Force alignment to 8-bytes, so as to ensure we have the exact
490          * same mbuf cacheline0 layout for 32-bit and 64-bit. This makes
491          * working on vector drivers easier.
492          */
493         RTE_STD_C11
494         union {
495                 rte_iova_t buf_iova;
496                 rte_iova_t buf_physaddr; /**< deprecated */
497         } __rte_aligned(sizeof(rte_iova_t));
498
499         /* next 8 bytes are initialised on RX descriptor rearm */
500         MARKER64 rearm_data;
501         uint16_t data_off;
502
503         /**
504          * Reference counter. Its size should at least equal to the size
505          * of port field (16 bits), to support zero-copy broadcast.
506          * It should only be accessed using the following functions:
507          * rte_mbuf_refcnt_update(), rte_mbuf_refcnt_read(), and
508          * rte_mbuf_refcnt_set(). The functionality of these functions (atomic,
509          * or non-atomic) is controlled by the CONFIG_RTE_MBUF_REFCNT_ATOMIC
510          * config option.
511          */
512         RTE_STD_C11
513         union {
514                 rte_atomic16_t refcnt_atomic; /**< Atomically accessed refcnt */
515                 /** Non-atomically accessed refcnt */
516                 uint16_t refcnt;
517         };
518         uint16_t nb_segs;         /**< Number of segments. */
519
520         /** Input port (16 bits to support more than 256 virtual ports).
521          * The event eth Tx adapter uses this field to specify the output port.
522          */
523         uint16_t port;
524
525         uint64_t ol_flags;        /**< Offload features. */
526
527         /* remaining bytes are set on RX when pulling packet from descriptor */
528         MARKER rx_descriptor_fields1;
529
530         /*
531          * The packet type, which is the combination of outer/inner L2, L3, L4
532          * and tunnel types. The packet_type is about data really present in the
533          * mbuf. Example: if vlan stripping is enabled, a received vlan packet
534          * would have RTE_PTYPE_L2_ETHER and not RTE_PTYPE_L2_VLAN because the
535          * vlan is stripped from the data.
536          */
537         RTE_STD_C11
538         union {
539                 uint32_t packet_type; /**< L2/L3/L4 and tunnel information. */
540                 struct {
541                         uint32_t l2_type:4; /**< (Outer) L2 type. */
542                         uint32_t l3_type:4; /**< (Outer) L3 type. */
543                         uint32_t l4_type:4; /**< (Outer) L4 type. */
544                         uint32_t tun_type:4; /**< Tunnel type. */
545                         RTE_STD_C11
546                         union {
547                                 uint8_t inner_esp_next_proto;
548                                 /**< ESP next protocol type, valid if
549                                  * RTE_PTYPE_TUNNEL_ESP tunnel type is set
550                                  * on both Tx and Rx.
551                                  */
552                                 __extension__
553                                 struct {
554                                         uint8_t inner_l2_type:4;
555                                         /**< Inner L2 type. */
556                                         uint8_t inner_l3_type:4;
557                                         /**< Inner L3 type. */
558                                 };
559                         };
560                         uint32_t inner_l4_type:4; /**< Inner L4 type. */
561                 };
562         };
563
564         uint32_t pkt_len;         /**< Total pkt len: sum of all segments. */
565         uint16_t data_len;        /**< Amount of data in segment buffer. */
566         /** VLAN TCI (CPU order), valid if PKT_RX_VLAN is set. */
567         uint16_t vlan_tci;
568
569         RTE_STD_C11
570         union {
571                 union {
572                         uint32_t rss;     /**< RSS hash result if RSS enabled */
573                         struct {
574                                 union {
575                                         struct {
576                                                 uint16_t hash;
577                                                 uint16_t id;
578                                         };
579                                         uint32_t lo;
580                                         /**< Second 4 flexible bytes */
581                                 };
582                                 uint32_t hi;
583                                 /**< First 4 flexible bytes or FD ID, dependent
584                                  * on PKT_RX_FDIR_* flag in ol_flags.
585                                  */
586                         } fdir; /**< Filter identifier if FDIR enabled */
587                         struct rte_mbuf_sched sched;
588                         /**< Hierarchical scheduler : 8 bytes */
589                         struct {
590                                 uint32_t reserved1;
591                                 uint16_t reserved2;
592                                 uint16_t txq;
593                                 /**< The event eth Tx adapter uses this field
594                                  * to store Tx queue id.
595                                  * @see rte_event_eth_tx_adapter_txq_set()
596                                  */
597                         } txadapter; /**< Eventdev ethdev Tx adapter */
598                         /**< User defined tags. See rte_distributor_process() */
599                         uint32_t usr;
600                 } hash;                   /**< hash information */
601                 struct {
602                         /**
603                          * Application specific metadata value
604                          * for egress flow rule match.
605                          * Valid if PKT_TX_METADATA is set.
606                          * Located here to allow conjunct use
607                          * with hash.sched.hi.
608                          */
609                         uint32_t tx_metadata;
610                         uint32_t reserved;
611                 };
612         };
613
614         /** Outer VLAN TCI (CPU order), valid if PKT_RX_QINQ is set. */
615         uint16_t vlan_tci_outer;
616
617         uint16_t buf_len;         /**< Length of segment buffer. */
618
619         /** Valid if PKT_RX_TIMESTAMP is set. The unit and time reference
620          * are not normalized but are always the same for a given port.
621          * Some devices allow to query rte_eth_read_clock that will return the
622          * current device timestamp.
623          */
624         uint64_t timestamp;
625
626         /* second cache line - fields only used in slow path or on TX */
627         MARKER cacheline1 __rte_cache_min_aligned;
628
629         RTE_STD_C11
630         union {
631                 void *userdata;   /**< Can be used for external metadata */
632                 uint64_t udata64; /**< Allow 8-byte userdata on 32-bit */
633         };
634
635         struct rte_mempool *pool; /**< Pool from which mbuf was allocated. */
636         struct rte_mbuf *next;    /**< Next segment of scattered packet. */
637
638         /* fields to support TX offloads */
639         RTE_STD_C11
640         union {
641                 uint64_t tx_offload;       /**< combined for easy fetch */
642                 __extension__
643                 struct {
644                         uint64_t l2_len:RTE_MBUF_L2_LEN_BITS;
645                         /**< L2 (MAC) Header Length for non-tunneling pkt.
646                          * Outer_L4_len + ... + Inner_L2_len for tunneling pkt.
647                          */
648                         uint64_t l3_len:RTE_MBUF_L3_LEN_BITS;
649                         /**< L3 (IP) Header Length. */
650                         uint64_t l4_len:RTE_MBUF_L4_LEN_BITS;
651                         /**< L4 (TCP/UDP) Header Length. */
652                         uint64_t tso_segsz:RTE_MBUF_TSO_SEGSZ_BITS;
653                         /**< TCP TSO segment size */
654
655                         /*
656                          * Fields for Tx offloading of tunnels.
657                          * These are undefined for packets which don't request
658                          * any tunnel offloads (outer IP or UDP checksum,
659                          * tunnel TSO).
660                          *
661                          * PMDs should not use these fields unconditionally
662                          * when calculating offsets.
663                          *
664                          * Applications are expected to set appropriate tunnel
665                          * offload flags when they fill in these fields.
666                          */
667                         uint64_t outer_l3_len:RTE_MBUF_OUTL3_LEN_BITS;
668                         /**< Outer L3 (IP) Hdr Length. */
669                         uint64_t outer_l2_len:RTE_MBUF_OUTL2_LEN_BITS;
670                         /**< Outer L2 (MAC) Hdr Length. */
671
672                         /* uint64_t unused:RTE_MBUF_TXOFLD_UNUSED_BITS; */
673                 };
674         };
675
676         /** Size of the application private data. In case of an indirect
677          * mbuf, it stores the direct mbuf private data size.
678          */
679         uint16_t priv_size;
680
681         /** Timesync flags for use with IEEE1588. */
682         uint16_t timesync;
683
684         /** Sequence number. See also rte_reorder_insert(). */
685         uint32_t seqn;
686
687         /** Shared data for external buffer attached to mbuf. See
688          * rte_pktmbuf_attach_extbuf().
689          */
690         struct rte_mbuf_ext_shared_info *shinfo;
691
692 } __rte_cache_aligned;
693
694 /**
695  * Function typedef of callback to free externally attached buffer.
696  */
697 typedef void (*rte_mbuf_extbuf_free_callback_t)(void *addr, void *opaque);
698
699 /**
700  * Shared data at the end of an external buffer.
701  */
702 struct rte_mbuf_ext_shared_info {
703         rte_mbuf_extbuf_free_callback_t free_cb; /**< Free callback function */
704         void *fcb_opaque;                        /**< Free callback argument */
705         rte_atomic16_t refcnt_atomic;        /**< Atomically accessed refcnt */
706 };
707
708 /**< Maximum number of nb_segs allowed. */
709 #define RTE_MBUF_MAX_NB_SEGS    UINT16_MAX
710
711 /**
712  * Returns TRUE if given mbuf is cloned by mbuf indirection, or FALSE
713  * otherwise.
714  *
715  * If a mbuf has its data in another mbuf and references it by mbuf
716  * indirection, this mbuf can be defined as a cloned mbuf.
717  */
718 #define RTE_MBUF_CLONED(mb)     ((mb)->ol_flags & IND_ATTACHED_MBUF)
719
720 /**
721  * Returns TRUE if given mbuf has an external buffer, or FALSE otherwise.
722  *
723  * External buffer is a user-provided anonymous buffer.
724  */
725 #define RTE_MBUF_HAS_EXTBUF(mb) ((mb)->ol_flags & EXT_ATTACHED_MBUF)
726
727 /**
728  * Returns TRUE if given mbuf is direct, or FALSE otherwise.
729  *
730  * If a mbuf embeds its own data after the rte_mbuf structure, this mbuf
731  * can be defined as a direct mbuf.
732  */
733 #define RTE_MBUF_DIRECT(mb) \
734         (!((mb)->ol_flags & (IND_ATTACHED_MBUF | EXT_ATTACHED_MBUF)))
735
736 #define MBUF_INVALID_PORT UINT16_MAX
737
738 /**
739  * A macro that points to an offset into the data in the mbuf.
740  *
741  * The returned pointer is cast to type t. Before using this
742  * function, the user must ensure that the first segment is large
743  * enough to accommodate its data.
744  *
745  * @param m
746  *   The packet mbuf.
747  * @param o
748  *   The offset into the mbuf data.
749  * @param t
750  *   The type to cast the result into.
751  */
752 #define rte_pktmbuf_mtod_offset(m, t, o)        \
753         ((t)((char *)(m)->buf_addr + (m)->data_off + (o)))
754
755 /**
756  * A macro that points to the start of the data in the mbuf.
757  *
758  * The returned pointer is cast to type t. Before using this
759  * function, the user must ensure that the first segment is large
760  * enough to accommodate its data.
761  *
762  * @param m
763  *   The packet mbuf.
764  * @param t
765  *   The type to cast the result into.
766  */
767 #define rte_pktmbuf_mtod(m, t) rte_pktmbuf_mtod_offset(m, t, 0)
768
769 /**
770  * A macro that returns the IO address that points to an offset of the
771  * start of the data in the mbuf
772  *
773  * @param m
774  *   The packet mbuf.
775  * @param o
776  *   The offset into the data to calculate address from.
777  */
778 #define rte_pktmbuf_iova_offset(m, o) \
779         (rte_iova_t)((m)->buf_iova + (m)->data_off + (o))
780
781 /**
782  * A macro that returns the IO address that points to the start of the
783  * data in the mbuf
784  *
785  * @param m
786  *   The packet mbuf.
787  */
788 #define rte_pktmbuf_iova(m) rte_pktmbuf_iova_offset(m, 0)
789
790 #ifdef __cplusplus
791 }
792 #endif
793
794 #endif /* _RTE_MBUF_CORE_H_ */