mbuf: add fields for tunnels
[dpdk.git] / lib / librte_mbuf / rte_mbuf.h
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 #ifndef _RTE_MBUF_H_
35 #define _RTE_MBUF_H_
36
37 /**
38  * @file
39  * RTE Mbuf
40  *
41  * The mbuf library provides the ability to create and destroy buffers
42  * that may be used by the RTE application to store message
43  * buffers. The message buffers are stored in a mempool, using the
44  * RTE mempool library.
45  *
46  * This library provide an API to allocate/free packet mbufs, which are
47  * used to carry network packets.
48  *
49  * To understand the concepts of packet buffers or mbufs, you
50  * should read "TCP/IP Illustrated, Volume 2: The Implementation,
51  * Addison-Wesley, 1995, ISBN 0-201-63354-X from Richard Stevens"
52  * http://www.kohala.com/start/tcpipiv2.html
53  */
54
55 #include <stdint.h>
56 #include <rte_mempool.h>
57 #include <rte_atomic.h>
58 #include <rte_prefetch.h>
59 #include <rte_branch_prediction.h>
60
61 #ifdef __cplusplus
62 extern "C" {
63 #endif
64
65 /* deprecated feature, renamed in RTE_MBUF_REFCNT */
66 #pragma GCC poison RTE_MBUF_SCATTER_GATHER
67
68 /*
69  * Packet Offload Features Flags. It also carry packet type information.
70  * Critical resources. Both rx/tx shared these bits. Be cautious on any change
71  *
72  * - RX flags start at bit position zero, and get added to the left of previous
73  *   flags.
74  * - The most-significant 8 bits are reserved for generic mbuf flags
75  * - TX flags therefore start at bit position 55 (i.e. 63-8), and new flags get
76  *   added to the right of the previously defined flags
77  */
78 #define PKT_RX_VLAN_PKT      (1ULL << 0)  /**< RX packet is a 802.1q VLAN packet. */
79 #define PKT_RX_RSS_HASH      (1ULL << 1)  /**< RX packet with RSS hash result. */
80 #define PKT_RX_FDIR          (1ULL << 2)  /**< RX packet with FDIR infos. */
81 #define PKT_RX_L4_CKSUM_BAD  (1ULL << 3)  /**< L4 cksum of RX pkt. is not OK. */
82 #define PKT_RX_IP_CKSUM_BAD  (1ULL << 4)  /**< IP cksum of RX pkt. is not OK. */
83 #define PKT_RX_EIP_CKSUM_BAD (0ULL << 0)  /**< External IP header checksum error. */
84 #define PKT_RX_OVERSIZE      (0ULL << 0)  /**< Num of desc of an RX pkt oversize. */
85 #define PKT_RX_HBUF_OVERFLOW (0ULL << 0)  /**< Header buffer overflow. */
86 #define PKT_RX_RECIP_ERR     (0ULL << 0)  /**< Hardware processing error. */
87 #define PKT_RX_MAC_ERR       (0ULL << 0)  /**< MAC error. */
88 #define PKT_RX_IPV4_HDR      (1ULL << 5)  /**< RX packet with IPv4 header. */
89 #define PKT_RX_IPV4_HDR_EXT  (1ULL << 6)  /**< RX packet with extended IPv4 header. */
90 #define PKT_RX_IPV6_HDR      (1ULL << 7)  /**< RX packet with IPv6 header. */
91 #define PKT_RX_IPV6_HDR_EXT  (1ULL << 8)  /**< RX packet with extended IPv6 header. */
92 #define PKT_RX_IEEE1588_PTP  (1ULL << 9)  /**< RX IEEE1588 L2 Ethernet PT Packet. */
93 #define PKT_RX_IEEE1588_TMST (1ULL << 10) /**< RX IEEE1588 L2/L4 timestamped packet.*/
94
95 #define PKT_TX_VLAN_PKT      (1ULL << 55) /**< TX packet is a 802.1q VLAN packet. */
96 #define PKT_TX_IP_CKSUM      (1ULL << 54) /**< IP cksum of TX pkt. computed by NIC. */
97 #define PKT_TX_IPV4_CSUM     PKT_TX_IP_CKSUM /**< Alias of PKT_TX_IP_CKSUM. */
98 #define PKT_TX_IPV4          PKT_RX_IPV4_HDR /**< IPv4 with no IP checksum offload. */
99 #define PKT_TX_IPV6          PKT_RX_IPV6_HDR /**< IPv6 packet */
100
101 /*
102  * Bits 52+53 used for L4 packet type with checksum enabled.
103  *     00: Reserved
104  *     01: TCP checksum
105  *     10: SCTP checksum
106  *     11: UDP checksum
107  */
108 #define PKT_TX_L4_NO_CKSUM   (0ULL << 52) /**< Disable L4 cksum of TX pkt. */
109 #define PKT_TX_TCP_CKSUM     (1ULL << 52) /**< TCP cksum of TX pkt. computed by NIC. */
110 #define PKT_TX_SCTP_CKSUM    (2ULL << 52) /**< SCTP cksum of TX pkt. computed by NIC. */
111 #define PKT_TX_UDP_CKSUM     (3ULL << 52) /**< UDP cksum of TX pkt. computed by NIC. */
112 #define PKT_TX_L4_MASK       (3ULL << 52) /**< Mask for L4 cksum offload request. */
113
114 /* Bit 51 - IEEE1588*/
115 #define PKT_TX_IEEE1588_TMST (1ULL << 51) /**< TX IEEE1588 packet to timestamp. */
116
117 /* Use final bit of flags to indicate a control mbuf */
118 #define CTRL_MBUF_FLAG       (1ULL << 63) /**< Mbuf contains control data */
119
120 /**
121  * Bit Mask to indicate what bits required for building TX context
122  */
123 #define PKT_TX_OFFLOAD_MASK (PKT_TX_VLAN_PKT | PKT_TX_IP_CKSUM | PKT_TX_L4_MASK)
124
125 /* define a set of marker types that can be used to refer to set points in the
126  * mbuf */
127 typedef void    *MARKER[0];   /**< generic marker for a point in a structure */
128 typedef uint64_t MARKER64[0]; /**< marker that allows us to overwrite 8 bytes
129                                * with a single assignment */
130 /**
131  * The generic rte_mbuf, containing a packet mbuf.
132  */
133 struct rte_mbuf {
134         MARKER cacheline0;
135
136         void *buf_addr;           /**< Virtual address of segment buffer. */
137         phys_addr_t buf_physaddr; /**< Physical address of segment buffer. */
138
139         /* next 8 bytes are initialised on RX descriptor rearm */
140         MARKER64 rearm_data;
141         uint16_t buf_len;         /**< Length of segment buffer. */
142         uint16_t data_off;
143
144         /**
145          * 16-bit Reference counter.
146          * It should only be accessed using the following functions:
147          * rte_mbuf_refcnt_update(), rte_mbuf_refcnt_read(), and
148          * rte_mbuf_refcnt_set(). The functionality of these functions (atomic,
149          * or non-atomic) is controlled by the CONFIG_RTE_MBUF_REFCNT_ATOMIC
150          * config option.
151          */
152         union {
153 #ifdef RTE_MBUF_REFCNT
154                 rte_atomic16_t refcnt_atomic; /**< Atomically accessed refcnt */
155                 uint16_t refcnt;              /**< Non-atomically accessed refcnt */
156 #endif
157                 uint16_t refcnt_reserved;     /**< Do not use this field */
158         };
159         uint8_t nb_segs;          /**< Number of segments. */
160         uint8_t port;             /**< Input port. */
161
162         uint64_t ol_flags;        /**< Offload features. */
163
164         /* remaining bytes are set on RX when pulling packet from descriptor */
165         MARKER rx_descriptor_fields1;
166
167         /**
168          * The packet type, which is used to indicate ordinary packet and also
169          * tunneled packet format, i.e. each number is represented a type of
170          * packet.
171          */
172         uint16_t packet_type;
173
174         uint16_t data_len;        /**< Amount of data in segment buffer. */
175         uint32_t pkt_len;         /**< Total pkt len: sum of all segments. */
176         uint16_t vlan_tci;        /**< VLAN Tag Control Identifier (CPU order) */
177         uint16_t reserved;
178         union {
179                 uint32_t rss;     /**< RSS hash result if RSS enabled */
180                 struct {
181                         uint16_t hash;
182                         uint16_t id;
183                 } fdir;           /**< Filter identifier if FDIR enabled */
184                 uint32_t sched;   /**< Hierarchical scheduler */
185         } hash;                   /**< hash information */
186
187         /* second cache line - fields only used in slow path or on TX */
188         MARKER cacheline1 __rte_cache_aligned;
189
190         union {
191                 void *userdata;   /**< Can be used for external metadata */
192                 uint64_t udata64; /**< Allow 8-byte userdata on 32-bit */
193         };
194
195         struct rte_mempool *pool; /**< Pool from which mbuf was allocated. */
196         struct rte_mbuf *next;    /**< Next segment of scattered packet. */
197
198         /* fields to support TX offloads */
199         union {
200                 uint16_t l2_l3_len; /**< combined l2/l3 lengths as single var */
201                 struct {
202                         uint16_t l3_len:9;      /**< L3 (IP) Header Length. */
203                         uint16_t l2_len:7;      /**< L2 (MAC) Header Length. */
204                 };
205         };
206
207         /* fields for TX offloading of tunnels */
208         union {
209                 uint16_t inner_l2_l3_len;
210                 /**< combined inner l2/l3 lengths as single var */
211                 struct {
212                         uint16_t inner_l3_len:9;
213                         /**< inner L3 (IP) Header Length. */
214                         uint16_t inner_l2_len:7;
215                         /**< inner L2 (MAC) Header Length. */
216                 };
217         };
218 } __rte_cache_aligned;
219
220 /**
221  * Given the buf_addr returns the pointer to corresponding mbuf.
222  */
223 #define RTE_MBUF_FROM_BADDR(ba)     (((struct rte_mbuf *)(ba)) - 1)
224
225 /**
226  * Given the pointer to mbuf returns an address where it's  buf_addr
227  * should point to.
228  */
229 #define RTE_MBUF_TO_BADDR(mb)       (((struct rte_mbuf *)(mb)) + 1)
230
231 /**
232  * Returns TRUE if given mbuf is indirect, or FALSE otherwise.
233  */
234 #define RTE_MBUF_INDIRECT(mb)   (RTE_MBUF_FROM_BADDR((mb)->buf_addr) != (mb))
235
236 /**
237  * Returns TRUE if given mbuf is direct, or FALSE otherwise.
238  */
239 #define RTE_MBUF_DIRECT(mb)     (RTE_MBUF_FROM_BADDR((mb)->buf_addr) == (mb))
240
241
242 /**
243  * Private data in case of pktmbuf pool.
244  *
245  * A structure that contains some pktmbuf_pool-specific data that are
246  * appended after the mempool structure (in private data).
247  */
248 struct rte_pktmbuf_pool_private {
249         uint16_t mbuf_data_room_size; /**< Size of data space in each mbuf.*/
250 };
251
252 #ifdef RTE_LIBRTE_MBUF_DEBUG
253
254 /**  check mbuf type in debug mode */
255 #define __rte_mbuf_sanity_check(m, is_h) rte_mbuf_sanity_check(m, is_h)
256
257 /**  check mbuf type in debug mode if mbuf pointer is not null */
258 #define __rte_mbuf_sanity_check_raw(m, is_h)    do {       \
259         if ((m) != NULL)                                   \
260                 rte_mbuf_sanity_check(m, is_h);          \
261 } while (0)
262
263 /**  MBUF asserts in debug mode */
264 #define RTE_MBUF_ASSERT(exp)                                         \
265 if (!(exp)) {                                                        \
266         rte_panic("line%d\tassert \"" #exp "\" failed\n", __LINE__); \
267 }
268
269 #else /*  RTE_LIBRTE_MBUF_DEBUG */
270
271 /**  check mbuf type in debug mode */
272 #define __rte_mbuf_sanity_check(m, is_h) do { } while (0)
273
274 /**  check mbuf type in debug mode if mbuf pointer is not null */
275 #define __rte_mbuf_sanity_check_raw(m, is_h) do { } while (0)
276
277 /**  MBUF asserts in debug mode */
278 #define RTE_MBUF_ASSERT(exp)                do { } while (0)
279
280 #endif /*  RTE_LIBRTE_MBUF_DEBUG */
281
282 #ifdef RTE_MBUF_REFCNT
283 #ifdef RTE_MBUF_REFCNT_ATOMIC
284
285 /**
286  * Adds given value to an mbuf's refcnt and returns its new value.
287  * @param m
288  *   Mbuf to update
289  * @param value
290  *   Value to add/subtract
291  * @return
292  *   Updated value
293  */
294 static inline uint16_t
295 rte_mbuf_refcnt_update(struct rte_mbuf *m, int16_t value)
296 {
297         return (uint16_t)(rte_atomic16_add_return(&m->refcnt_atomic, value));
298 }
299
300 /**
301  * Reads the value of an mbuf's refcnt.
302  * @param m
303  *   Mbuf to read
304  * @return
305  *   Reference count number.
306  */
307 static inline uint16_t
308 rte_mbuf_refcnt_read(const struct rte_mbuf *m)
309 {
310         return (uint16_t)(rte_atomic16_read(&m->refcnt_atomic));
311 }
312
313 /**
314  * Sets an mbuf's refcnt to a defined value.
315  * @param m
316  *   Mbuf to update
317  * @param new_value
318  *   Value set
319  */
320 static inline void
321 rte_mbuf_refcnt_set(struct rte_mbuf *m, uint16_t new_value)
322 {
323         rte_atomic16_set(&m->refcnt_atomic, new_value);
324 }
325
326 #else /* ! RTE_MBUF_REFCNT_ATOMIC */
327
328 /**
329  * Adds given value to an mbuf's refcnt and returns its new value.
330  */
331 static inline uint16_t
332 rte_mbuf_refcnt_update(struct rte_mbuf *m, int16_t value)
333 {
334         m->refcnt = (uint16_t)(m->refcnt + value);
335         return m->refcnt;
336 }
337
338 /**
339  * Reads the value of an mbuf's refcnt.
340  */
341 static inline uint16_t
342 rte_mbuf_refcnt_read(const struct rte_mbuf *m)
343 {
344         return m->refcnt;
345 }
346
347 /**
348  * Sets an mbuf's refcnt to the defined value.
349  */
350 static inline void
351 rte_mbuf_refcnt_set(struct rte_mbuf *m, uint16_t new_value)
352 {
353         m->refcnt = new_value;
354 }
355
356 #endif /* RTE_MBUF_REFCNT_ATOMIC */
357
358 /** Mbuf prefetch */
359 #define RTE_MBUF_PREFETCH_TO_FREE(m) do {       \
360         if ((m) != NULL)                        \
361                 rte_prefetch0(m);               \
362 } while (0)
363
364 #else /* ! RTE_MBUF_REFCNT */
365
366 /** Mbuf prefetch */
367 #define RTE_MBUF_PREFETCH_TO_FREE(m) do { } while(0)
368
369 #define rte_mbuf_refcnt_set(m,v) do { } while(0)
370
371 #endif /* RTE_MBUF_REFCNT */
372
373
374 /**
375  * Sanity checks on an mbuf.
376  *
377  * Check the consistency of the given mbuf. The function will cause a
378  * panic if corruption is detected.
379  *
380  * @param m
381  *   The mbuf to be checked.
382  * @param is_header
383  *   True if the mbuf is a packet header, false if it is a sub-segment
384  *   of a packet (in this case, some fields like nb_segs are not checked)
385  */
386 void
387 rte_mbuf_sanity_check(const struct rte_mbuf *m, int is_header);
388
389 /**
390  * @internal Allocate a new mbuf from mempool *mp*.
391  * The use of that function is reserved for RTE internal needs.
392  * Please use rte_pktmbuf_alloc().
393  *
394  * @param mp
395  *   The mempool from which mbuf is allocated.
396  * @return
397  *   - The pointer to the new mbuf on success.
398  *   - NULL if allocation failed.
399  */
400 static inline struct rte_mbuf *__rte_mbuf_raw_alloc(struct rte_mempool *mp)
401 {
402         struct rte_mbuf *m;
403         void *mb = NULL;
404         if (rte_mempool_get(mp, &mb) < 0)
405                 return NULL;
406         m = (struct rte_mbuf *)mb;
407 #ifdef RTE_MBUF_REFCNT
408         RTE_MBUF_ASSERT(rte_mbuf_refcnt_read(m) == 0);
409         rte_mbuf_refcnt_set(m, 1);
410 #endif /* RTE_MBUF_REFCNT */
411         return (m);
412 }
413
414 /**
415  * @internal Put mbuf back into its original mempool.
416  * The use of that function is reserved for RTE internal needs.
417  * Please use rte_pktmbuf_free().
418  *
419  * @param m
420  *   The mbuf to be freed.
421  */
422 static inline void __attribute__((always_inline))
423 __rte_mbuf_raw_free(struct rte_mbuf *m)
424 {
425 #ifdef RTE_MBUF_REFCNT
426         RTE_MBUF_ASSERT(rte_mbuf_refcnt_read(m) == 0);
427 #endif /* RTE_MBUF_REFCNT */
428         rte_mempool_put(m->pool, m);
429 }
430
431 /* Operations on ctrl mbuf */
432
433 /**
434  * The control mbuf constructor.
435  *
436  * This function initializes some fields in an mbuf structure that are
437  * not modified by the user once created (mbuf type, origin pool, buffer
438  * start address, and so on). This function is given as a callback function
439  * to rte_mempool_create() at pool creation time.
440  *
441  * @param mp
442  *   The mempool from which the mbuf is allocated.
443  * @param opaque_arg
444  *   A pointer that can be used by the user to retrieve useful information
445  *   for mbuf initialization. This pointer comes from the ``init_arg``
446  *   parameter of rte_mempool_create().
447  * @param m
448  *   The mbuf to initialize.
449  * @param i
450  *   The index of the mbuf in the pool table.
451  */
452 void rte_ctrlmbuf_init(struct rte_mempool *mp, void *opaque_arg,
453                 void *m, unsigned i);
454
455 /**
456  * Allocate a new mbuf (type is ctrl) from mempool *mp*.
457  *
458  * This new mbuf is initialized with data pointing to the beginning of
459  * buffer, and with a length of zero.
460  *
461  * @param mp
462  *   The mempool from which the mbuf is allocated.
463  * @return
464  *   - The pointer to the new mbuf on success.
465  *   - NULL if allocation failed.
466  */
467 #define rte_ctrlmbuf_alloc(mp) rte_pktmbuf_alloc(mp)
468
469 /**
470  * Free a control mbuf back into its original mempool.
471  *
472  * @param m
473  *   The control mbuf to be freed.
474  */
475 #define rte_ctrlmbuf_free(m) rte_pktmbuf_free(m)
476
477 /**
478  * A macro that returns the pointer to the carried data.
479  *
480  * The value that can be read or assigned.
481  *
482  * @param m
483  *   The control mbuf.
484  */
485 #define rte_ctrlmbuf_data(m) ((char *)((m)->buf_addr) + (m)->data_off)
486
487 /**
488  * A macro that returns the length of the carried data.
489  *
490  * The value that can be read or assigned.
491  *
492  * @param m
493  *   The control mbuf.
494  */
495 #define rte_ctrlmbuf_len(m) rte_pktmbuf_data_len(m)
496
497 /**
498  * Tests if an mbuf is a control mbuf
499  *
500  * @param m
501  *   The mbuf to be tested
502  * @return
503  *   - True (1) if the mbuf is a control mbuf
504  *   - False(0) otherwise
505  */
506 static inline int
507 rte_is_ctrlmbuf(struct rte_mbuf *m)
508 {
509         return (!!(m->ol_flags & CTRL_MBUF_FLAG));
510 }
511
512 /* Operations on pkt mbuf */
513
514 /**
515  * The packet mbuf constructor.
516  *
517  * This function initializes some fields in the mbuf structure that are
518  * not modified by the user once created (origin pool, buffer start
519  * address, and so on). This function is given as a callback function to
520  * rte_mempool_create() at pool creation time.
521  *
522  * @param mp
523  *   The mempool from which mbufs originate.
524  * @param opaque_arg
525  *   A pointer that can be used by the user to retrieve useful information
526  *   for mbuf initialization. This pointer comes from the ``init_arg``
527  *   parameter of rte_mempool_create().
528  * @param m
529  *   The mbuf to initialize.
530  * @param i
531  *   The index of the mbuf in the pool table.
532  */
533 void rte_pktmbuf_init(struct rte_mempool *mp, void *opaque_arg,
534                       void *m, unsigned i);
535
536
537 /**
538  * A  packet mbuf pool constructor.
539  *
540  * This function initializes the mempool private data in the case of a
541  * pktmbuf pool. This private data is needed by the driver. The
542  * function is given as a callback function to rte_mempool_create() at
543  * pool creation. It can be extended by the user, for example, to
544  * provide another packet size.
545  *
546  * @param mp
547  *   The mempool from which mbufs originate.
548  * @param opaque_arg
549  *   A pointer that can be used by the user to retrieve useful information
550  *   for mbuf initialization. This pointer comes from the ``init_arg``
551  *   parameter of rte_mempool_create().
552  */
553 void rte_pktmbuf_pool_init(struct rte_mempool *mp, void *opaque_arg);
554
555 /**
556  * Reset the fields of a packet mbuf to their default values.
557  *
558  * The given mbuf must have only one segment.
559  *
560  * @param m
561  *   The packet mbuf to be resetted.
562  */
563 static inline void rte_pktmbuf_reset(struct rte_mbuf *m)
564 {
565         m->next = NULL;
566         m->pkt_len = 0;
567         m->l2_l3_len = 0;
568         m->inner_l2_l3_len = 0;
569         m->vlan_tci = 0;
570         m->nb_segs = 1;
571         m->port = 0xff;
572
573         m->ol_flags = 0;
574         m->packet_type = 0;
575         m->data_off = (RTE_PKTMBUF_HEADROOM <= m->buf_len) ?
576                         RTE_PKTMBUF_HEADROOM : m->buf_len;
577
578         m->data_len = 0;
579         __rte_mbuf_sanity_check(m, 1);
580 }
581
582 /**
583  * Allocate a new mbuf from a mempool.
584  *
585  * This new mbuf contains one segment, which has a length of 0. The pointer
586  * to data is initialized to have some bytes of headroom in the buffer
587  * (if buffer size allows).
588  *
589  * @param mp
590  *   The mempool from which the mbuf is allocated.
591  * @return
592  *   - The pointer to the new mbuf on success.
593  *   - NULL if allocation failed.
594  */
595 static inline struct rte_mbuf *rte_pktmbuf_alloc(struct rte_mempool *mp)
596 {
597         struct rte_mbuf *m;
598         if ((m = __rte_mbuf_raw_alloc(mp)) != NULL)
599                 rte_pktmbuf_reset(m);
600         return (m);
601 }
602
603 #ifdef RTE_MBUF_REFCNT
604
605 /**
606  * Attach packet mbuf to another packet mbuf.
607  * After attachment we refer the mbuf we attached as 'indirect',
608  * while mbuf we attached to as 'direct'.
609  * Right now, not supported:
610  *  - attachment to indirect mbuf (e.g. - md  has to be direct).
611  *  - attachment for already indirect mbuf (e.g. - mi has to be direct).
612  *  - mbuf we trying to attach (mi) is used by someone else
613  *    e.g. it's reference counter is greater then 1.
614  *
615  * @param mi
616  *   The indirect packet mbuf.
617  * @param md
618  *   The direct packet mbuf.
619  */
620
621 static inline void rte_pktmbuf_attach(struct rte_mbuf *mi, struct rte_mbuf *md)
622 {
623         RTE_MBUF_ASSERT(RTE_MBUF_DIRECT(md) &&
624             RTE_MBUF_DIRECT(mi) &&
625             rte_mbuf_refcnt_read(mi) == 1);
626
627         rte_mbuf_refcnt_update(md, 1);
628         mi->buf_physaddr = md->buf_physaddr;
629         mi->buf_addr = md->buf_addr;
630         mi->buf_len = md->buf_len;
631
632         mi->next = md->next;
633         mi->data_off = md->data_off;
634         mi->data_len = md->data_len;
635         mi->port = md->port;
636         mi->vlan_tci = md->vlan_tci;
637         mi->l2_l3_len = md->l2_l3_len;
638         mi->inner_l2_l3_len = md->inner_l2_l3_len;
639         mi->hash = md->hash;
640
641         mi->next = NULL;
642         mi->pkt_len = mi->data_len;
643         mi->nb_segs = 1;
644         mi->ol_flags = md->ol_flags;
645         mi->packet_type = md->packet_type;
646
647         __rte_mbuf_sanity_check(mi, 1);
648         __rte_mbuf_sanity_check(md, 0);
649 }
650
651 /**
652  * Detach an indirect packet mbuf -
653  *  - restore original mbuf address and length values.
654  *  - reset pktmbuf data and data_len to their default values.
655  *  All other fields of the given packet mbuf will be left intact.
656  *
657  * @param m
658  *   The indirect attached packet mbuf.
659  */
660
661 static inline void rte_pktmbuf_detach(struct rte_mbuf *m)
662 {
663         const struct rte_mempool *mp = m->pool;
664         void *buf = RTE_MBUF_TO_BADDR(m);
665         uint32_t buf_len = mp->elt_size - sizeof(*m);
666         m->buf_physaddr = rte_mempool_virt2phy(mp, m) + sizeof (*m);
667
668         m->buf_addr = buf;
669         m->buf_len = (uint16_t)buf_len;
670
671         m->data_off = (RTE_PKTMBUF_HEADROOM <= m->buf_len) ?
672                         RTE_PKTMBUF_HEADROOM : m->buf_len;
673
674         m->data_len = 0;
675 }
676
677 #endif /* RTE_MBUF_REFCNT */
678
679
680 static inline struct rte_mbuf* __attribute__((always_inline))
681 __rte_pktmbuf_prefree_seg(struct rte_mbuf *m)
682 {
683         __rte_mbuf_sanity_check(m, 0);
684
685 #ifdef RTE_MBUF_REFCNT
686         if (likely (rte_mbuf_refcnt_read(m) == 1) ||
687                         likely (rte_mbuf_refcnt_update(m, -1) == 0)) {
688                 struct rte_mbuf *md = RTE_MBUF_FROM_BADDR(m->buf_addr);
689
690                 rte_mbuf_refcnt_set(m, 0);
691
692                 /* if this is an indirect mbuf, then
693                  *  - detach mbuf
694                  *  - free attached mbuf segment
695                  */
696                 if (unlikely (md != m)) {
697                         rte_pktmbuf_detach(m);
698                         if (rte_mbuf_refcnt_update(md, -1) == 0)
699                                 __rte_mbuf_raw_free(md);
700                 }
701 #endif
702                 return(m);
703 #ifdef RTE_MBUF_REFCNT
704         }
705         return (NULL);
706 #endif
707 }
708
709 /**
710  * Free a segment of a packet mbuf into its original mempool.
711  *
712  * Free an mbuf, without parsing other segments in case of chained
713  * buffers.
714  *
715  * @param m
716  *   The packet mbuf segment to be freed.
717  */
718 static inline void __attribute__((always_inline))
719 rte_pktmbuf_free_seg(struct rte_mbuf *m)
720 {
721         if (likely(NULL != (m = __rte_pktmbuf_prefree_seg(m)))) {
722                 m->next = NULL;
723                 __rte_mbuf_raw_free(m);
724         }
725 }
726
727 /**
728  * Free a packet mbuf back into its original mempool.
729  *
730  * Free an mbuf, and all its segments in case of chained buffers. Each
731  * segment is added back into its original mempool.
732  *
733  * @param m
734  *   The packet mbuf to be freed.
735  */
736 static inline void rte_pktmbuf_free(struct rte_mbuf *m)
737 {
738         struct rte_mbuf *m_next;
739
740         __rte_mbuf_sanity_check(m, 1);
741
742         while (m != NULL) {
743                 m_next = m->next;
744                 rte_pktmbuf_free_seg(m);
745                 m = m_next;
746         }
747 }
748
749 #ifdef RTE_MBUF_REFCNT
750
751 /**
752  * Creates a "clone" of the given packet mbuf.
753  *
754  * Walks through all segments of the given packet mbuf, and for each of them:
755  *  - Creates a new packet mbuf from the given pool.
756  *  - Attaches newly created mbuf to the segment.
757  * Then updates pkt_len and nb_segs of the "clone" packet mbuf to match values
758  * from the original packet mbuf.
759  *
760  * @param md
761  *   The packet mbuf to be cloned.
762  * @param mp
763  *   The mempool from which the "clone" mbufs are allocated.
764  * @return
765  *   - The pointer to the new "clone" mbuf on success.
766  *   - NULL if allocation fails.
767  */
768 static inline struct rte_mbuf *rte_pktmbuf_clone(struct rte_mbuf *md,
769                 struct rte_mempool *mp)
770 {
771         struct rte_mbuf *mc, *mi, **prev;
772         uint32_t pktlen;
773         uint8_t nseg;
774
775         if (unlikely ((mc = rte_pktmbuf_alloc(mp)) == NULL))
776                 return (NULL);
777
778         mi = mc;
779         prev = &mi->next;
780         pktlen = md->pkt_len;
781         nseg = 0;
782
783         do {
784                 nseg++;
785                 rte_pktmbuf_attach(mi, md);
786                 *prev = mi;
787                 prev = &mi->next;
788         } while ((md = md->next) != NULL &&
789             (mi = rte_pktmbuf_alloc(mp)) != NULL);
790
791         *prev = NULL;
792         mc->nb_segs = nseg;
793         mc->pkt_len = pktlen;
794
795         /* Allocation of new indirect segment failed */
796         if (unlikely (mi == NULL)) {
797                 rte_pktmbuf_free(mc);
798                 return (NULL);
799         }
800
801         __rte_mbuf_sanity_check(mc, 1);
802         return (mc);
803 }
804
805 /**
806  * Adds given value to the refcnt of all packet mbuf segments.
807  *
808  * Walks through all segments of given packet mbuf and for each of them
809  * invokes rte_mbuf_refcnt_update().
810  *
811  * @param m
812  *   The packet mbuf whose refcnt to be updated.
813  * @param v
814  *   The value to add to the mbuf's segments refcnt.
815  */
816 static inline void rte_pktmbuf_refcnt_update(struct rte_mbuf *m, int16_t v)
817 {
818         __rte_mbuf_sanity_check(m, 1);
819
820         do {
821                 rte_mbuf_refcnt_update(m, v);
822         } while ((m = m->next) != NULL);
823 }
824
825 #endif /* RTE_MBUF_REFCNT */
826
827 /**
828  * Get the headroom in a packet mbuf.
829  *
830  * @param m
831  *   The packet mbuf.
832  * @return
833  *   The length of the headroom.
834  */
835 static inline uint16_t rte_pktmbuf_headroom(const struct rte_mbuf *m)
836 {
837         __rte_mbuf_sanity_check(m, 1);
838         return m->data_off;
839 }
840
841 /**
842  * Get the tailroom of a packet mbuf.
843  *
844  * @param m
845  *   The packet mbuf.
846  * @return
847  *   The length of the tailroom.
848  */
849 static inline uint16_t rte_pktmbuf_tailroom(const struct rte_mbuf *m)
850 {
851         __rte_mbuf_sanity_check(m, 1);
852         return (uint16_t)(m->buf_len - rte_pktmbuf_headroom(m) -
853                           m->data_len);
854 }
855
856 /**
857  * Get the last segment of the packet.
858  *
859  * @param m
860  *   The packet mbuf.
861  * @return
862  *   The last segment of the given mbuf.
863  */
864 static inline struct rte_mbuf *rte_pktmbuf_lastseg(struct rte_mbuf *m)
865 {
866         struct rte_mbuf *m2 = (struct rte_mbuf *)m;
867
868         __rte_mbuf_sanity_check(m, 1);
869         while (m2->next != NULL)
870                 m2 = m2->next;
871         return m2;
872 }
873
874 /**
875  * A macro that points to the start of the data in the mbuf.
876  *
877  * The returned pointer is cast to type t. Before using this
878  * function, the user must ensure that m_headlen(m) is large enough to
879  * read its data.
880  *
881  * @param m
882  *   The packet mbuf.
883  * @param t
884  *   The type to cast the result into.
885  */
886 #define rte_pktmbuf_mtod(m, t) ((t)((char *)(m)->buf_addr + (m)->data_off))
887
888 /**
889  * A macro that returns the length of the packet.
890  *
891  * The value can be read or assigned.
892  *
893  * @param m
894  *   The packet mbuf.
895  */
896 #define rte_pktmbuf_pkt_len(m) ((m)->pkt_len)
897
898 /**
899  * A macro that returns the length of the segment.
900  *
901  * The value can be read or assigned.
902  *
903  * @param m
904  *   The packet mbuf.
905  */
906 #define rte_pktmbuf_data_len(m) ((m)->data_len)
907
908 /**
909  * Prepend len bytes to an mbuf data area.
910  *
911  * Returns a pointer to the new
912  * data start address. If there is not enough headroom in the first
913  * segment, the function will return NULL, without modifying the mbuf.
914  *
915  * @param m
916  *   The pkt mbuf.
917  * @param len
918  *   The amount of data to prepend (in bytes).
919  * @return
920  *   A pointer to the start of the newly prepended data, or
921  *   NULL if there is not enough headroom space in the first segment
922  */
923 static inline char *rte_pktmbuf_prepend(struct rte_mbuf *m,
924                                         uint16_t len)
925 {
926         __rte_mbuf_sanity_check(m, 1);
927
928         if (unlikely(len > rte_pktmbuf_headroom(m)))
929                 return NULL;
930
931         m->data_off -= len;
932         m->data_len = (uint16_t)(m->data_len + len);
933         m->pkt_len  = (m->pkt_len + len);
934
935         return (char *)m->buf_addr + m->data_off;
936 }
937
938 /**
939  * Append len bytes to an mbuf.
940  *
941  * Append len bytes to an mbuf and return a pointer to the start address
942  * of the added data. If there is not enough tailroom in the last
943  * segment, the function will return NULL, without modifying the mbuf.
944  *
945  * @param m
946  *   The packet mbuf.
947  * @param len
948  *   The amount of data to append (in bytes).
949  * @return
950  *   A pointer to the start of the newly appended data, or
951  *   NULL if there is not enough tailroom space in the last segment
952  */
953 static inline char *rte_pktmbuf_append(struct rte_mbuf *m, uint16_t len)
954 {
955         void *tail;
956         struct rte_mbuf *m_last;
957
958         __rte_mbuf_sanity_check(m, 1);
959
960         m_last = rte_pktmbuf_lastseg(m);
961         if (unlikely(len > rte_pktmbuf_tailroom(m_last)))
962                 return NULL;
963
964         tail = (char *)m_last->buf_addr + m_last->data_off + m_last->data_len;
965         m_last->data_len = (uint16_t)(m_last->data_len + len);
966         m->pkt_len  = (m->pkt_len + len);
967         return (char*) tail;
968 }
969
970 /**
971  * Remove len bytes at the beginning of an mbuf.
972  *
973  * Returns a pointer to the start address of the new data area. If the
974  * length is greater than the length of the first segment, then the
975  * function will fail and return NULL, without modifying the mbuf.
976  *
977  * @param m
978  *   The packet mbuf.
979  * @param len
980  *   The amount of data to remove (in bytes).
981  * @return
982  *   A pointer to the new start of the data.
983  */
984 static inline char *rte_pktmbuf_adj(struct rte_mbuf *m, uint16_t len)
985 {
986         __rte_mbuf_sanity_check(m, 1);
987
988         if (unlikely(len > m->data_len))
989                 return NULL;
990
991         m->data_len = (uint16_t)(m->data_len - len);
992         m->data_off += len;
993         m->pkt_len  = (m->pkt_len - len);
994         return (char *)m->buf_addr + m->data_off;
995 }
996
997 /**
998  * Remove len bytes of data at the end of the mbuf.
999  *
1000  * If the length is greater than the length of the last segment, the
1001  * function will fail and return -1 without modifying the mbuf.
1002  *
1003  * @param m
1004  *   The packet mbuf.
1005  * @param len
1006  *   The amount of data to remove (in bytes).
1007  * @return
1008  *   - 0: On success.
1009  *   - -1: On error.
1010  */
1011 static inline int rte_pktmbuf_trim(struct rte_mbuf *m, uint16_t len)
1012 {
1013         struct rte_mbuf *m_last;
1014
1015         __rte_mbuf_sanity_check(m, 1);
1016
1017         m_last = rte_pktmbuf_lastseg(m);
1018         if (unlikely(len > m_last->data_len))
1019                 return -1;
1020
1021         m_last->data_len = (uint16_t)(m_last->data_len - len);
1022         m->pkt_len  = (m->pkt_len - len);
1023         return 0;
1024 }
1025
1026 /**
1027  * Test if mbuf data is contiguous.
1028  *
1029  * @param m
1030  *   The packet mbuf.
1031  * @return
1032  *   - 1, if all data is contiguous (one segment).
1033  *   - 0, if there is several segments.
1034  */
1035 static inline int rte_pktmbuf_is_contiguous(const struct rte_mbuf *m)
1036 {
1037         __rte_mbuf_sanity_check(m, 1);
1038         return !!(m->nb_segs == 1);
1039 }
1040
1041 /**
1042  * Dump an mbuf structure to the console.
1043  *
1044  * Dump all fields for the given packet mbuf and all its associated
1045  * segments (in the case of a chained buffer).
1046  *
1047  * @param f
1048  *   A pointer to a file for output
1049  * @param m
1050  *   The packet mbuf.
1051  * @param dump_len
1052  *   If dump_len != 0, also dump the "dump_len" first data bytes of
1053  *   the packet.
1054  */
1055 void rte_pktmbuf_dump(FILE *f, const struct rte_mbuf *m, unsigned dump_len);
1056
1057 #ifdef __cplusplus
1058 }
1059 #endif
1060
1061 #endif /* _RTE_MBUF_H_ */