mempool: support no hugepage mode
[dpdk.git] / lib / librte_mempool / rte_mempool.h
index 640f622..e0aa698 100644 (file)
@@ -2,6 +2,7 @@
  *   BSD LICENSE
  *
  *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
+ *   Copyright(c) 2016 6WIND S.A.
  *   All rights reserved.
  *
  *   Redistribution and use in source and binary forms, with or without
@@ -124,17 +125,6 @@ struct rte_mempool_objsz {
 /* "MP_<name>" */
 #define        RTE_MEMPOOL_MZ_FORMAT   RTE_MEMPOOL_MZ_PREFIX "%s"
 
-#ifdef RTE_LIBRTE_XEN_DOM0
-
-/* "<name>_MP_elt" */
-#define        RTE_MEMPOOL_OBJ_NAME    "%s_" RTE_MEMPOOL_MZ_PREFIX "elt"
-
-#else
-
-#define        RTE_MEMPOOL_OBJ_NAME    RTE_MEMPOOL_MZ_FORMAT
-
-#endif /* RTE_LIBRTE_XEN_DOM0 */
-
 #define        MEMPOOL_PG_SHIFT_MAX    (sizeof(uintptr_t) * CHAR_BIT - 1)
 
 /** Mempool over one chunk of physically continuous memory */
@@ -150,17 +140,25 @@ struct rte_mempool_objsz {
  * Mempool object header structure
  *
  * Each object stored in mempools are prefixed by this header structure,
- * it allows to retrieve the mempool pointer from the object. When debug
- * is enabled, a cookie is also added in this structure preventing
- * corruptions and double-frees.
+ * it allows to retrieve the mempool pointer from the object and to
+ * iterate on all objects attached to a mempool. When debug is enabled,
+ * a cookie is also added in this structure preventing corruptions and
+ * double-frees.
  */
 struct rte_mempool_objhdr {
+       STAILQ_ENTRY(rte_mempool_objhdr) next; /**< Next in list. */
        struct rte_mempool *mp;          /**< The mempool owning the object. */
+       phys_addr_t physaddr;            /**< Physical address of the object. */
 #ifdef RTE_LIBRTE_MEMPOOL_DEBUG
        uint64_t cookie;                 /**< Debug cookie. */
 #endif
 };
 
+/**
+ * A list of object headers type
+ */
+STAILQ_HEAD(rte_mempool_objhdr_list, rte_mempool_objhdr);
+
 /**
  * Mempool object trailer structure
  *
@@ -173,6 +171,33 @@ struct rte_mempool_objtlr {
 #endif
 };
 
+/**
+ * A list of memory where objects are stored
+ */
+STAILQ_HEAD(rte_mempool_memhdr_list, rte_mempool_memhdr);
+
+/**
+ * Callback used to free a memory chunk
+ */
+typedef void (rte_mempool_memchunk_free_cb_t)(struct rte_mempool_memhdr *memhdr,
+       void *opaque);
+
+/**
+ * Mempool objects memory header structure
+ *
+ * The memory chunks where objects are stored. Each chunk is virtually
+ * and physically contiguous.
+ */
+struct rte_mempool_memhdr {
+       STAILQ_ENTRY(rte_mempool_memhdr) next; /**< Next in list. */
+       struct rte_mempool *mp;  /**< The mempool owning the chunk */
+       void *addr;              /**< Virtual address of the chunk */
+       phys_addr_t phys_addr;   /**< Physical address of the chunk */
+       size_t len;              /**< length of the chunk */
+       rte_mempool_memchunk_free_cb_t *free_cb; /**< Free callback */
+       void *opaque;            /**< Argument passed to the free callback */
+};
+
 /**
  * The RTE mempool structure.
  */
@@ -181,7 +206,8 @@ struct rte_mempool {
        struct rte_ring *ring;           /**< Ring to store objects. */
        phys_addr_t phys_addr;           /**< Phys. addr. of mempool struct. */
        int flags;                       /**< Flags of the mempool. */
-       uint32_t size;                   /**< Size of the mempool. */
+       int socket_id;                   /**< Socket id passed at mempool creation. */
+       uint32_t size;                   /**< Max size of the mempool. */
        uint32_t cache_size;             /**< Size of per-lcore local cache. */
        uint32_t cache_flushthresh;
        /**< Threshold before we flush excess elements. */
@@ -194,24 +220,15 @@ struct rte_mempool {
 
        struct rte_mempool_cache *local_cache; /**< Per-lcore local cache */
 
+       uint32_t populated_size;         /**< Number of populated objects. */
+       struct rte_mempool_objhdr_list elt_list; /**< List of objects in pool */
+       uint32_t nb_mem_chunks;          /**< Number of memory chunks */
+       struct rte_mempool_memhdr_list mem_list; /**< List of memory chunks */
+
 #ifdef RTE_LIBRTE_MEMPOOL_DEBUG
        /** Per-lcore statistics. */
        struct rte_mempool_debug_stats stats[RTE_MAX_LCORE];
 #endif
-
-       /* Address translation support, starts from next cache line. */
-
-       /** Number of elements in the elt_pa array. */
-       uint32_t    pg_num __rte_cache_aligned;
-       uint32_t    pg_shift;     /**< LOG2 of the physical pages. */
-       uintptr_t   pg_mask;      /**< physical page mask value. */
-       uintptr_t   elt_va_start;
-       /**< Virtual address of the first mempool object. */
-       uintptr_t   elt_va_end;
-       /**< Virtual address of the <size + 1> mempool object. */
-       phys_addr_t elt_pa[MEMPOOL_PG_NUM_DEFAULT];
-       /**< Array of physical page addresses for the mempool objects buffer. */
-
 }  __rte_cache_aligned;
 
 #define MEMPOOL_F_NO_SPREAD      0x0001 /**< Do not spread among memory channels. */
@@ -241,34 +258,18 @@ struct rte_mempool {
 #define __MEMPOOL_STAT_ADD(mp, name, n) do {} while(0)
 #endif
 
-/**
- * Size of elt_pa array size based on number of pages. (Internal use)
- */
-#define __PA_SIZE(mp, pgn) \
-       RTE_ALIGN_CEIL((((pgn) - RTE_DIM((mp)->elt_pa)) * \
-       sizeof((mp)->elt_pa[0])), RTE_CACHE_LINE_SIZE)
-
 /**
  * Calculate the size of the mempool header.
  *
  * @param mp
  *   Pointer to the memory pool.
- * @param pgn
- *   Number of pages used to store mempool objects.
  * @param cs
  *   Size of the per-lcore cache.
  */
-#define MEMPOOL_HEADER_SIZE(mp, pgn, cs) \
-       (sizeof(*(mp)) + __PA_SIZE(mp, pgn) + (((cs) == 0) ? 0 : \
+#define MEMPOOL_HEADER_SIZE(mp, cs) \
+       (sizeof(*(mp)) + (((cs) == 0) ? 0 : \
        (sizeof(struct rte_mempool_cache) * RTE_MAX_LCORE)))
 
-/**
- * Return true if the whole mempool is in contiguous memory.
- */
-#define        MEMPOOL_IS_CONTIG(mp)                      \
-       ((mp)->pg_num == MEMPOOL_PG_NUM_DEFAULT && \
-       (mp)->phys_addr == (mp)->elt_pa[0])
-
 /* return the header of a mempool object (internal) */
 static inline struct rte_mempool_objhdr *__mempool_get_header(void *obj)
 {
@@ -312,141 +313,33 @@ static inline struct rte_mempool_objtlr *__mempool_get_trailer(void *obj)
  *   - 1: object is supposed to be free, mark it as allocated
  *   - 2: just check that cookie is valid (free or allocated)
  */
+void rte_mempool_check_cookies(const struct rte_mempool *mp,
+       void * const *obj_table_const, unsigned n, int free);
+
 #ifdef RTE_LIBRTE_MEMPOOL_DEBUG
-#ifndef __INTEL_COMPILER
-#pragma GCC diagnostic ignored "-Wcast-qual"
-#endif
-static inline void __mempool_check_cookies(const struct rte_mempool *mp,
-                                          void * const *obj_table_const,
-                                          unsigned n, int free)
-{
-       struct rte_mempool_objhdr *hdr;
-       struct rte_mempool_objtlr *tlr;
-       uint64_t cookie;
-       void *tmp;
-       void *obj;
-       void **obj_table;
-
-       /* Force to drop the "const" attribute. This is done only when
-        * DEBUG is enabled */
-       tmp = (void *) obj_table_const;
-       obj_table = (void **) tmp;
-
-       while (n--) {
-               obj = obj_table[n];
-
-               if (rte_mempool_from_obj(obj) != mp)
-                       rte_panic("MEMPOOL: object is owned by another "
-                                 "mempool\n");
-
-               hdr = __mempool_get_header(obj);
-               cookie = hdr->cookie;
-
-               if (free == 0) {
-                       if (cookie != RTE_MEMPOOL_HEADER_COOKIE1) {
-                               rte_log_set_history(0);
-                               RTE_LOG(CRIT, MEMPOOL,
-                                       "obj=%p, mempool=%p, cookie=%" PRIx64 "\n",
-                                       obj, (const void *) mp, cookie);
-                               rte_panic("MEMPOOL: bad header cookie (put)\n");
-                       }
-                       hdr->cookie = RTE_MEMPOOL_HEADER_COOKIE2;
-               }
-               else if (free == 1) {
-                       if (cookie != RTE_MEMPOOL_HEADER_COOKIE2) {
-                               rte_log_set_history(0);
-                               RTE_LOG(CRIT, MEMPOOL,
-                                       "obj=%p, mempool=%p, cookie=%" PRIx64 "\n",
-                                       obj, (const void *) mp, cookie);
-                               rte_panic("MEMPOOL: bad header cookie (get)\n");
-                       }
-                       hdr->cookie = RTE_MEMPOOL_HEADER_COOKIE1;
-               }
-               else if (free == 2) {
-                       if (cookie != RTE_MEMPOOL_HEADER_COOKIE1 &&
-                           cookie != RTE_MEMPOOL_HEADER_COOKIE2) {
-                               rte_log_set_history(0);
-                               RTE_LOG(CRIT, MEMPOOL,
-                                       "obj=%p, mempool=%p, cookie=%" PRIx64 "\n",
-                                       obj, (const void *) mp, cookie);
-                               rte_panic("MEMPOOL: bad header cookie (audit)\n");
-                       }
-               }
-               tlr = __mempool_get_trailer(obj);
-               cookie = tlr->cookie;
-               if (cookie != RTE_MEMPOOL_TRAILER_COOKIE) {
-                       rte_log_set_history(0);
-                       RTE_LOG(CRIT, MEMPOOL,
-                               "obj=%p, mempool=%p, cookie=%" PRIx64 "\n",
-                               obj, (const void *) mp, cookie);
-                       rte_panic("MEMPOOL: bad trailer cookie\n");
-               }
-       }
-}
-#ifndef __INTEL_COMPILER
-#pragma GCC diagnostic error "-Wcast-qual"
-#endif
+#define __mempool_check_cookies(mp, obj_table_const, n, free) \
+       rte_mempool_check_cookies(mp, obj_table_const, n, free)
 #else
 #define __mempool_check_cookies(mp, obj_table_const, n, free) do {} while(0)
 #endif /* RTE_LIBRTE_MEMPOOL_DEBUG */
 
 /**
- * A mempool object iterator callback function.
- */
-typedef void (*rte_mempool_obj_iter_t)(void * /*obj_iter_arg*/,
-       void * /*obj_start*/,
-       void * /*obj_end*/,
-       uint32_t /*obj_index */);
-
-/**
- * Call a function for each mempool object in a memory chunk
- *
- * Iterate across objects of the given size and alignment in the
- * provided chunk of memory. The given memory buffer can consist of
- * disjointed physical pages.
- *
- * For each object, call the provided callback (if any). This function
- * is used to populate a mempool, or walk through all the elements of a
- * mempool, or estimate how many elements of the given size could be
- * created in the given memory buffer.
- *
- * @param vaddr
- *   Virtual address of the memory buffer.
- * @param elt_num
- *   Maximum number of objects to iterate through.
- * @param elt_sz
- *   Size of each object.
- * @param align
- *   Alignment of each object.
- * @param paddr
- *   Array of physical addresses of the pages that comprises given memory
- *   buffer.
- * @param pg_num
- *   Number of elements in the paddr array.
- * @param pg_shift
- *   LOG2 of the physical pages size.
- * @param obj_iter
- *   Object iterator callback function (could be NULL).
- * @param obj_iter_arg
- *   User defined parameter for the object iterator callback function.
+ * An object callback function for mempool.
  *
- * @return
- *   Number of objects iterated through.
+ * Used by rte_mempool_create() and rte_mempool_obj_iter().
  */
-uint32_t rte_mempool_obj_iter(void *vaddr,
-       uint32_t elt_num, size_t elt_sz, size_t align,
-       const phys_addr_t paddr[], uint32_t pg_num, uint32_t pg_shift,
-       rte_mempool_obj_iter_t obj_iter, void *obj_iter_arg);
+typedef void (rte_mempool_obj_cb_t)(struct rte_mempool *mp,
+               void *opaque, void *obj, unsigned obj_idx);
+typedef rte_mempool_obj_cb_t rte_mempool_obj_ctor_t; /* compat */
 
 /**
- * An object constructor callback function for mempool.
+ * A memory callback function for mempool.
  *
- * Arguments are the mempool, the opaque pointer given by the user in
- * rte_mempool_create(), the pointer to the element and the index of
- * the element in the pool.
+ * Used by rte_mempool_mem_iter().
  */
-typedef void (rte_mempool_obj_ctor_t)(struct rte_mempool *, void *,
-                                     void *, unsigned);
+typedef void (rte_mempool_mem_cb_t)(struct rte_mempool *mp,
+               void *opaque, struct rte_mempool_memhdr *memhdr,
+               unsigned mem_idx);
 
 /**
  * A mempool constructor callback function.
@@ -541,7 +434,7 @@ struct rte_mempool *
 rte_mempool_create(const char *name, unsigned n, unsigned elt_size,
                   unsigned cache_size, unsigned private_data_size,
                   rte_mempool_ctor_t *mp_init, void *mp_init_arg,
-                  rte_mempool_obj_ctor_t *obj_init, void *obj_init_arg,
+                  rte_mempool_obj_cb_t *obj_init, void *obj_init_arg,
                   int socket_id, unsigned flags);
 
 /**
@@ -607,7 +500,7 @@ struct rte_mempool *
 rte_mempool_xmem_create(const char *name, unsigned n, unsigned elt_size,
                unsigned cache_size, unsigned private_data_size,
                rte_mempool_ctor_t *mp_init, void *mp_init_arg,
-               rte_mempool_obj_ctor_t *obj_init, void *obj_init_arg,
+               rte_mempool_obj_cb_t *obj_init, void *obj_init_arg,
                int socket_id, unsigned flags, void *vaddr,
                const phys_addr_t paddr[], uint32_t pg_num, uint32_t pg_shift);
 
@@ -696,10 +589,46 @@ struct rte_mempool *
 rte_dom0_mempool_create(const char *name, unsigned n, unsigned elt_size,
                unsigned cache_size, unsigned private_data_size,
                rte_mempool_ctor_t *mp_init, void *mp_init_arg,
-               rte_mempool_obj_ctor_t *obj_init, void *obj_init_arg,
+               rte_mempool_obj_cb_t *obj_init, void *obj_init_arg,
                int socket_id, unsigned flags);
 
 
+/**
+ * Call a function for each mempool element
+ *
+ * Iterate across all objects attached to a rte_mempool and call the
+ * callback function on it.
+ *
+ * @param mp
+ *   A pointer to an initialized mempool.
+ * @param obj_cb
+ *   A function pointer that is called for each object.
+ * @param obj_cb_arg
+ *   An opaque pointer passed to the callback function.
+ * @return
+ *   Number of objects iterated.
+ */
+uint32_t rte_mempool_obj_iter(struct rte_mempool *mp,
+       rte_mempool_obj_cb_t *obj_cb, void *obj_cb_arg);
+
+/**
+ * Call a function for each mempool memory chunk
+ *
+ * Iterate across all memory chunks attached to a rte_mempool and call
+ * the callback function on it.
+ *
+ * @param mp
+ *   A pointer to an initialized mempool.
+ * @param mem_cb
+ *   A function pointer that is called for each memory chunk.
+ * @param mem_cb_arg
+ *   An opaque pointer passed to the callback function.
+ * @return
+ *   Number of memory chunks iterated.
+ */
+uint32_t rte_mempool_mem_iter(struct rte_mempool *mp,
+       rte_mempool_mem_cb_t *mem_cb, void *mem_cb_arg);
+
 /**
  * Dump the status of the mempool to the console.
  *
@@ -708,7 +637,7 @@ rte_dom0_mempool_create(const char *name, unsigned n, unsigned elt_size,
  * @param mp
  *   A pointer to the mempool structure.
  */
-void rte_mempool_dump(FILE *f, const struct rte_mempool *mp);
+void rte_mempool_dump(FILE *f, struct rte_mempool *mp);
 
 /**
  * @internal Put several objects back in the mempool; used internally.
@@ -1219,21 +1148,12 @@ rte_mempool_empty(const struct rte_mempool *mp)
  *   The physical address of the elt element.
  */
 static inline phys_addr_t
-rte_mempool_virt2phy(const struct rte_mempool *mp, const void *elt)
+rte_mempool_virt2phy(__rte_unused const struct rte_mempool *mp, const void *elt)
 {
-       if (rte_eal_has_hugepages()) {
-               uintptr_t off;
-
-               off = (const char *)elt - (const char *)mp->elt_va_start;
-               return mp->elt_pa[off >> mp->pg_shift] + (off & mp->pg_mask);
-       } else {
-               /*
-                * If huge pages are disabled, we cannot assume the
-                * memory region to be physically contiguous.
-                * Lookup for each element.
-                */
-               return rte_mem_virt2phy(elt);
-       }
+       const struct rte_mempool_objhdr *hdr;
+       hdr = (const struct rte_mempool_objhdr *)RTE_PTR_SUB(elt,
+               sizeof(*hdr));
+       return hdr->physaddr;
 }
 
 /**
@@ -1246,7 +1166,7 @@ rte_mempool_virt2phy(const struct rte_mempool *mp, const void *elt)
  * @param mp
  *   A pointer to the mempool structure.
  */
-void rte_mempool_audit(const struct rte_mempool *mp);
+void rte_mempool_audit(struct rte_mempool *mp);
 
 /**
  * Return a pointer to the private data in an mempool structure.
@@ -1259,7 +1179,7 @@ void rte_mempool_audit(const struct rte_mempool *mp);
 static inline void *rte_mempool_get_priv(struct rte_mempool *mp)
 {
        return (char *)mp +
-               MEMPOOL_HEADER_SIZE(mp, mp->pg_num, mp->cache_size);
+               MEMPOOL_HEADER_SIZE(mp, mp->cache_size);
 }
 
 /**
@@ -1321,7 +1241,7 @@ uint32_t rte_mempool_calc_obj_size(uint32_t elt_size, uint32_t flags,
  *   The size of each element, including header and trailer, as returned
  *   by rte_mempool_calc_obj_size().
  * @param pg_shift
- *   LOG2 of the physical pages size.
+ *   LOG2 of the physical pages size. If set to 0, ignore page boundaries.
  * @return
  *   Required memory size aligned at page boundary.
  */
@@ -1367,7 +1287,7 @@ ssize_t rte_mempool_xmem_usage(void *vaddr, uint32_t elt_num,
  * @param arg
  *   Argument passed to iterator
  */
-void rte_mempool_walk(void (*func)(const struct rte_mempool *, void *arg),
+void rte_mempool_walk(void (*func)(struct rte_mempool *, void *arg),
                      void *arg);
 
 #ifdef __cplusplus