ring: create common structure for prod and cons metadata
[dpdk.git] / lib / librte_ring / rte_ring.c
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2015 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 /*
35  * Derived from FreeBSD's bufring.c
36  *
37  **************************************************************************
38  *
39  * Copyright (c) 2007,2008 Kip Macy kmacy@freebsd.org
40  * All rights reserved.
41  *
42  * Redistribution and use in source and binary forms, with or without
43  * modification, are permitted provided that the following conditions are met:
44  *
45  * 1. Redistributions of source code must retain the above copyright notice,
46  *    this list of conditions and the following disclaimer.
47  *
48  * 2. The name of Kip Macy nor the names of other
49  *    contributors may be used to endorse or promote products derived from
50  *    this software without specific prior written permission.
51  *
52  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
53  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
54  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
55  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
56  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
57  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
58  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
59  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
60  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
61  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
62  * POSSIBILITY OF SUCH DAMAGE.
63  *
64  ***************************************************************************/
65
66 #include <stdio.h>
67 #include <stdarg.h>
68 #include <string.h>
69 #include <stdint.h>
70 #include <inttypes.h>
71 #include <errno.h>
72 #include <sys/queue.h>
73
74 #include <rte_common.h>
75 #include <rte_log.h>
76 #include <rte_memory.h>
77 #include <rte_memzone.h>
78 #include <rte_malloc.h>
79 #include <rte_launch.h>
80 #include <rte_eal.h>
81 #include <rte_eal_memconfig.h>
82 #include <rte_atomic.h>
83 #include <rte_per_lcore.h>
84 #include <rte_lcore.h>
85 #include <rte_branch_prediction.h>
86 #include <rte_errno.h>
87 #include <rte_string_fns.h>
88 #include <rte_spinlock.h>
89
90 #include "rte_ring.h"
91
92 TAILQ_HEAD(rte_ring_list, rte_tailq_entry);
93
94 static struct rte_tailq_elem rte_ring_tailq = {
95         .name = RTE_TAILQ_RING_NAME,
96 };
97 EAL_REGISTER_TAILQ(rte_ring_tailq)
98
99 /* true if x is a power of 2 */
100 #define POWEROF2(x) ((((x)-1) & (x)) == 0)
101
102 /* return the size of memory occupied by a ring */
103 ssize_t
104 rte_ring_get_memsize(unsigned count)
105 {
106         ssize_t sz;
107
108         /* count must be a power of 2 */
109         if ((!POWEROF2(count)) || (count > RTE_RING_SZ_MASK )) {
110                 RTE_LOG(ERR, RING,
111                         "Requested size is invalid, must be power of 2, and "
112                         "do not exceed the size limit %u\n", RTE_RING_SZ_MASK);
113                 return -EINVAL;
114         }
115
116         sz = sizeof(struct rte_ring) + count * sizeof(void *);
117         sz = RTE_ALIGN(sz, RTE_CACHE_LINE_SIZE);
118         return sz;
119 }
120
121 int
122 rte_ring_init(struct rte_ring *r, const char *name, unsigned count,
123         unsigned flags)
124 {
125         int ret;
126
127         /* compilation-time checks */
128         RTE_BUILD_BUG_ON((sizeof(struct rte_ring) &
129                           RTE_CACHE_LINE_MASK) != 0);
130         RTE_BUILD_BUG_ON((offsetof(struct rte_ring, cons) &
131                           RTE_CACHE_LINE_MASK) != 0);
132         RTE_BUILD_BUG_ON((offsetof(struct rte_ring, prod) &
133                           RTE_CACHE_LINE_MASK) != 0);
134 #ifdef RTE_LIBRTE_RING_DEBUG
135         RTE_BUILD_BUG_ON((sizeof(struct rte_ring_debug_stats) &
136                           RTE_CACHE_LINE_MASK) != 0);
137         RTE_BUILD_BUG_ON((offsetof(struct rte_ring, stats) &
138                           RTE_CACHE_LINE_MASK) != 0);
139 #endif
140
141         /* init the ring structure */
142         memset(r, 0, sizeof(*r));
143         ret = snprintf(r->name, sizeof(r->name), "%s", name);
144         if (ret < 0 || ret >= (int)sizeof(r->name))
145                 return -ENAMETOOLONG;
146         r->flags = flags;
147         r->prod.watermark = count;
148         r->prod.single = !!(flags & RING_F_SP_ENQ);
149         r->cons.single = !!(flags & RING_F_SC_DEQ);
150         r->prod.size = r->cons.size = count;
151         r->prod.mask = r->cons.mask = count-1;
152         r->prod.head = r->cons.head = 0;
153         r->prod.tail = r->cons.tail = 0;
154
155         return 0;
156 }
157
158 /* create the ring */
159 struct rte_ring *
160 rte_ring_create(const char *name, unsigned count, int socket_id,
161                 unsigned flags)
162 {
163         char mz_name[RTE_MEMZONE_NAMESIZE];
164         struct rte_ring *r;
165         struct rte_tailq_entry *te;
166         const struct rte_memzone *mz;
167         ssize_t ring_size;
168         int mz_flags = 0;
169         struct rte_ring_list* ring_list = NULL;
170         int ret;
171
172         ring_list = RTE_TAILQ_CAST(rte_ring_tailq.head, rte_ring_list);
173
174         ring_size = rte_ring_get_memsize(count);
175         if (ring_size < 0) {
176                 rte_errno = ring_size;
177                 return NULL;
178         }
179
180         ret = snprintf(mz_name, sizeof(mz_name), "%s%s",
181                 RTE_RING_MZ_PREFIX, name);
182         if (ret < 0 || ret >= (int)sizeof(mz_name)) {
183                 rte_errno = ENAMETOOLONG;
184                 return NULL;
185         }
186
187         te = rte_zmalloc("RING_TAILQ_ENTRY", sizeof(*te), 0);
188         if (te == NULL) {
189                 RTE_LOG(ERR, RING, "Cannot reserve memory for tailq\n");
190                 rte_errno = ENOMEM;
191                 return NULL;
192         }
193
194         rte_rwlock_write_lock(RTE_EAL_TAILQ_RWLOCK);
195
196         /* reserve a memory zone for this ring. If we can't get rte_config or
197          * we are secondary process, the memzone_reserve function will set
198          * rte_errno for us appropriately - hence no check in this this function */
199         mz = rte_memzone_reserve(mz_name, ring_size, socket_id, mz_flags);
200         if (mz != NULL) {
201                 r = mz->addr;
202                 /* no need to check return value here, we already checked the
203                  * arguments above */
204                 rte_ring_init(r, name, count, flags);
205
206                 te->data = (void *) r;
207                 r->memzone = mz;
208
209                 TAILQ_INSERT_TAIL(ring_list, te, next);
210         } else {
211                 r = NULL;
212                 RTE_LOG(ERR, RING, "Cannot reserve memory\n");
213                 rte_free(te);
214         }
215         rte_rwlock_write_unlock(RTE_EAL_TAILQ_RWLOCK);
216
217         return r;
218 }
219
220 /* free the ring */
221 void
222 rte_ring_free(struct rte_ring *r)
223 {
224         struct rte_ring_list *ring_list = NULL;
225         struct rte_tailq_entry *te;
226
227         if (r == NULL)
228                 return;
229
230         /*
231          * Ring was not created with rte_ring_create,
232          * therefore, there is no memzone to free.
233          */
234         if (r->memzone == NULL) {
235                 RTE_LOG(ERR, RING, "Cannot free ring (not created with rte_ring_create()");
236                 return;
237         }
238
239         if (rte_memzone_free(r->memzone) != 0) {
240                 RTE_LOG(ERR, RING, "Cannot free memory\n");
241                 return;
242         }
243
244         ring_list = RTE_TAILQ_CAST(rte_ring_tailq.head, rte_ring_list);
245         rte_rwlock_write_lock(RTE_EAL_TAILQ_RWLOCK);
246
247         /* find out tailq entry */
248         TAILQ_FOREACH(te, ring_list, next) {
249                 if (te->data == (void *) r)
250                         break;
251         }
252
253         if (te == NULL) {
254                 rte_rwlock_write_unlock(RTE_EAL_TAILQ_RWLOCK);
255                 return;
256         }
257
258         TAILQ_REMOVE(ring_list, te, next);
259
260         rte_rwlock_write_unlock(RTE_EAL_TAILQ_RWLOCK);
261
262         rte_free(te);
263 }
264
265 /*
266  * change the high water mark. If *count* is 0, water marking is
267  * disabled
268  */
269 int
270 rte_ring_set_water_mark(struct rte_ring *r, unsigned count)
271 {
272         if (count >= r->prod.size)
273                 return -EINVAL;
274
275         /* if count is 0, disable the watermarking */
276         if (count == 0)
277                 count = r->prod.size;
278
279         r->prod.watermark = count;
280         return 0;
281 }
282
283 /* dump the status of the ring on the console */
284 void
285 rte_ring_dump(FILE *f, const struct rte_ring *r)
286 {
287 #ifdef RTE_LIBRTE_RING_DEBUG
288         struct rte_ring_debug_stats sum;
289         unsigned lcore_id;
290 #endif
291
292         fprintf(f, "ring <%s>@%p\n", r->name, r);
293         fprintf(f, "  flags=%x\n", r->flags);
294         fprintf(f, "  size=%"PRIu32"\n", r->prod.size);
295         fprintf(f, "  ct=%"PRIu32"\n", r->cons.tail);
296         fprintf(f, "  ch=%"PRIu32"\n", r->cons.head);
297         fprintf(f, "  pt=%"PRIu32"\n", r->prod.tail);
298         fprintf(f, "  ph=%"PRIu32"\n", r->prod.head);
299         fprintf(f, "  used=%u\n", rte_ring_count(r));
300         fprintf(f, "  avail=%u\n", rte_ring_free_count(r));
301         if (r->prod.watermark == r->prod.size)
302                 fprintf(f, "  watermark=0\n");
303         else
304                 fprintf(f, "  watermark=%"PRIu32"\n", r->prod.watermark);
305
306         /* sum and dump statistics */
307 #ifdef RTE_LIBRTE_RING_DEBUG
308         memset(&sum, 0, sizeof(sum));
309         for (lcore_id = 0; lcore_id < RTE_MAX_LCORE; lcore_id++) {
310                 sum.enq_success_bulk += r->stats[lcore_id].enq_success_bulk;
311                 sum.enq_success_objs += r->stats[lcore_id].enq_success_objs;
312                 sum.enq_quota_bulk += r->stats[lcore_id].enq_quota_bulk;
313                 sum.enq_quota_objs += r->stats[lcore_id].enq_quota_objs;
314                 sum.enq_fail_bulk += r->stats[lcore_id].enq_fail_bulk;
315                 sum.enq_fail_objs += r->stats[lcore_id].enq_fail_objs;
316                 sum.deq_success_bulk += r->stats[lcore_id].deq_success_bulk;
317                 sum.deq_success_objs += r->stats[lcore_id].deq_success_objs;
318                 sum.deq_fail_bulk += r->stats[lcore_id].deq_fail_bulk;
319                 sum.deq_fail_objs += r->stats[lcore_id].deq_fail_objs;
320         }
321         fprintf(f, "  size=%"PRIu32"\n", r->prod.size);
322         fprintf(f, "  enq_success_bulk=%"PRIu64"\n", sum.enq_success_bulk);
323         fprintf(f, "  enq_success_objs=%"PRIu64"\n", sum.enq_success_objs);
324         fprintf(f, "  enq_quota_bulk=%"PRIu64"\n", sum.enq_quota_bulk);
325         fprintf(f, "  enq_quota_objs=%"PRIu64"\n", sum.enq_quota_objs);
326         fprintf(f, "  enq_fail_bulk=%"PRIu64"\n", sum.enq_fail_bulk);
327         fprintf(f, "  enq_fail_objs=%"PRIu64"\n", sum.enq_fail_objs);
328         fprintf(f, "  deq_success_bulk=%"PRIu64"\n", sum.deq_success_bulk);
329         fprintf(f, "  deq_success_objs=%"PRIu64"\n", sum.deq_success_objs);
330         fprintf(f, "  deq_fail_bulk=%"PRIu64"\n", sum.deq_fail_bulk);
331         fprintf(f, "  deq_fail_objs=%"PRIu64"\n", sum.deq_fail_objs);
332 #else
333         fprintf(f, "  no statistics available\n");
334 #endif
335 }
336
337 /* dump the status of all rings on the console */
338 void
339 rte_ring_list_dump(FILE *f)
340 {
341         const struct rte_tailq_entry *te;
342         struct rte_ring_list *ring_list;
343
344         ring_list = RTE_TAILQ_CAST(rte_ring_tailq.head, rte_ring_list);
345
346         rte_rwlock_read_lock(RTE_EAL_TAILQ_RWLOCK);
347
348         TAILQ_FOREACH(te, ring_list, next) {
349                 rte_ring_dump(f, (struct rte_ring *) te->data);
350         }
351
352         rte_rwlock_read_unlock(RTE_EAL_TAILQ_RWLOCK);
353 }
354
355 /* search a ring from its name */
356 struct rte_ring *
357 rte_ring_lookup(const char *name)
358 {
359         struct rte_tailq_entry *te;
360         struct rte_ring *r = NULL;
361         struct rte_ring_list *ring_list;
362
363         ring_list = RTE_TAILQ_CAST(rte_ring_tailq.head, rte_ring_list);
364
365         rte_rwlock_read_lock(RTE_EAL_TAILQ_RWLOCK);
366
367         TAILQ_FOREACH(te, ring_list, next) {
368                 r = (struct rte_ring *) te->data;
369                 if (strncmp(name, r->name, RTE_RING_NAMESIZE) == 0)
370                         break;
371         }
372
373         rte_rwlock_read_unlock(RTE_EAL_TAILQ_RWLOCK);
374
375         if (te == NULL) {
376                 rte_errno = ENOENT;
377                 return NULL;
378         }
379
380         return r;
381 }