memory: malloc now supports multi process
[dpdk.git] / lib / librte_malloc / malloc_heap.c
1 /*-
2  *   BSD LICENSE
3  * 
4  *   Copyright(c) 2010-2012 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  * 
7  *   Redistribution and use in source and binary forms, with or without 
8  *   modification, are permitted provided that the following conditions 
9  *   are met:
10  * 
11  *     * Redistributions of source code must retain the above copyright 
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright 
14  *       notice, this list of conditions and the following disclaimer in 
15  *       the documentation and/or other materials provided with the 
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its 
18  *       contributors may be used to endorse or promote products derived 
19  *       from this software without specific prior written permission.
20  * 
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS 
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT 
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR 
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT 
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, 
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT 
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, 
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY 
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT 
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE 
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  * 
33  */
34 #include <stdint.h>
35 #include <stddef.h>
36 #include <stdlib.h>
37 #include <stdio.h>
38 #include <stdarg.h>
39 #include <errno.h>
40 #include <sys/queue.h>
41
42 #include <rte_memory.h>
43 #include <rte_memzone.h>
44 #include <rte_tailq.h>
45 #include <rte_eal.h>
46 #include <rte_eal_memconfig.h>
47 #include <rte_launch.h>
48 #include <rte_per_lcore.h>
49 #include <rte_lcore.h>
50 #include <rte_common.h>
51 #include <rte_string_fns.h>
52 #include <rte_spinlock.h>
53 #include <rte_memcpy.h>
54 #include <rte_atomic.h>
55
56 #include "malloc_elem.h"
57 #include "malloc_heap.h"
58
59 /* since the memzone size starts with a digit, it will appear unquoted in
60  * rte_config.h, so quote it so it can be passed to rte_str_to_size */
61 #define MALLOC_MEMZONE_SIZE RTE_STR(RTE_MALLOC_MEMZONE_SIZE)
62
63 /*
64  * returns the configuration setting for the memzone size as a size_t value
65  */
66 static inline size_t
67 get_malloc_memzone_size(void)
68 {
69         return rte_str_to_size(MALLOC_MEMZONE_SIZE);
70 }
71
72 /*
73  * reserve an extra memory zone and make it available for use by a particular
74  * heap. This reserves the zone and sets a dummy malloc_elem header at the end
75  * to prevent overflow. The rest of the zone is added to free list as a single
76  * large free block
77  */
78 static int
79 malloc_heap_add_memzone(struct malloc_heap *heap, size_t size, unsigned align)
80 {
81         const unsigned mz_flags = 0;
82         const size_t min_size = get_malloc_memzone_size();
83         /* ensure the data we want to allocate will fit in the memzone */
84         size_t mz_size = size + align + MALLOC_ELEM_OVERHEAD * 2;
85         if (mz_size < min_size)
86                 mz_size = min_size;
87
88         char mz_name[RTE_MEMZONE_NAMESIZE];
89         rte_snprintf(mz_name, sizeof(mz_name), "MALLOC_S%u_HEAP_%u",
90                         heap->numa_socket, heap->mz_count++);
91         const struct rte_memzone *mz = rte_memzone_reserve(mz_name, mz_size,
92                         heap->numa_socket, mz_flags);
93         if (mz == NULL)
94                 return -1;
95
96         /* allocate the memory block headers, one at end, one at start */
97         struct malloc_elem *start_elem = (struct malloc_elem *)mz->addr;
98         struct malloc_elem *end_elem = RTE_PTR_ADD(mz->addr,
99                         mz_size - MALLOC_ELEM_OVERHEAD);
100         end_elem = RTE_PTR_ALIGN_FLOOR(end_elem, CACHE_LINE_SIZE);
101
102         const unsigned elem_size = (uintptr_t)end_elem - (uintptr_t)start_elem;
103         malloc_elem_init(start_elem, heap, elem_size);
104         malloc_elem_mkend(end_elem, start_elem);
105
106         start_elem->next_free = heap->free_head;
107         heap->free_head = start_elem;
108         return 0;
109 }
110
111 /*
112  * initialise a malloc heap object. The heap is locked with a private
113  * lock while being initialised. This function should only be called the
114  * first time a thread calls malloc - if even then, as heaps are per-socket
115  * not per-thread.
116  */
117 static void
118 malloc_heap_init(struct malloc_heap *heap)
119 {
120         struct rte_mem_config *mcfg = rte_eal_get_configuration()->mem_config;
121
122         rte_eal_mcfg_wait_complete(mcfg);
123         while (heap->initialised != INITIALISED) {
124                 if (rte_atomic32_cmpset(
125                                 (volatile uint32_t*)&heap->initialised,
126                                 NOT_INITIALISED, INITIALISING)) {
127
128                         heap->free_head = NULL;
129                         heap->mz_count = 0;
130                         /*
131                          * Find NUMA socket of heap that is being initialised, so that
132                          * malloc_heaps[n].numa_socket == n
133                          */
134                         heap->numa_socket = heap - mcfg->malloc_heaps;
135                         rte_spinlock_init(&heap->lock);
136                         heap->initialised = INITIALISED;
137                 }
138         }
139 }
140
141 /*
142  * Iterates through the freelist for a heap to find a free element
143  * which can store data of the required size and with the requested alignment.
144  * Returns null on failure, or pointer to element on success, with the pointer
145  * to the previous element in the list, if any, being returned in a parameter
146  * (to make removing the element from the free list faster).
147  */
148 static struct malloc_elem *
149 find_suitable_element(struct malloc_heap *heap, size_t size,
150                 unsigned align, struct malloc_elem **prev)
151 {
152         struct malloc_elem *elem = heap->free_head;
153         *prev = NULL;
154         while(elem){
155                 if (malloc_elem_can_hold(elem, size, align))
156                         break;
157                 *prev = elem;
158                 elem = elem->next_free;
159         }
160         return elem;
161 }
162
163 /*
164  * Main function called by malloc to allocate a block of memory from the
165  * heap. It locks the free list, scans it, and adds a new memzone if the
166  * scan fails. Once the new memzone is added, it re-scans and should return
167  * the new element after releasing the lock.
168  */
169 void *
170 malloc_heap_alloc(struct malloc_heap *heap,
171                 const char *type __attribute__((unused)), size_t size, unsigned align)
172 {
173         if (!heap->initialised)
174                 malloc_heap_init(heap);
175
176         size = CACHE_LINE_ROUNDUP(size);
177         align = CACHE_LINE_ROUNDUP(align);
178         rte_spinlock_lock(&heap->lock);
179
180         struct malloc_elem *prev, *elem = find_suitable_element(heap,
181                         size, align, &prev);
182         if (elem == NULL){
183                 malloc_heap_add_memzone(heap, size, align);
184                 elem = find_suitable_element(heap, size, align, &prev);
185         }
186         if (elem != NULL)
187                 elem = malloc_elem_alloc(elem, size, align, prev);
188         rte_spinlock_unlock(&heap->lock);
189         return elem == NULL ? NULL : (void *)(&elem[1]);
190 }