45ee065073f059b70be83e1b2876485898cc3aaf
[dpdk.git] / lib / librte_acl / acl_bld.c
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33
34 #include <rte_acl.h>
35 #include "tb_mem.h"
36 #include "acl.h"
37
38 #define ACL_POOL_ALIGN          8
39 #define ACL_POOL_ALLOC_MIN      0x800000
40
41 /* number of pointers per alloc */
42 #define ACL_PTR_ALLOC   32
43
44 /* macros for dividing rule sets heuristics */
45 #define NODE_MAX        0x4000
46 #define NODE_MIN        0x800
47
48 /* TALLY are statistics per field */
49 enum {
50         TALLY_0 = 0,        /* number of rules that are 0% or more wild. */
51         TALLY_25,           /* number of rules that are 25% or more wild. */
52         TALLY_50,
53         TALLY_75,
54         TALLY_100,
55         TALLY_DEACTIVATED, /* deactivated fields (100% wild in all rules). */
56         TALLY_DEPTH,
57         /* number of rules that are 100% wild for this field and higher. */
58         TALLY_NUM
59 };
60
61 static const uint32_t wild_limits[TALLY_DEACTIVATED] = {0, 25, 50, 75, 100};
62
63 enum {
64         ACL_INTERSECT_NONE = 0,
65         ACL_INTERSECT_A = 1,    /* set A is a superset of A and B intersect */
66         ACL_INTERSECT_B = 2,    /* set B is a superset of A and B intersect */
67         ACL_INTERSECT = 4,      /* sets A and B intersect */
68 };
69
70 enum {
71         ACL_PRIORITY_EQUAL = 0,
72         ACL_PRIORITY_NODE_A = 1,
73         ACL_PRIORITY_NODE_B = 2,
74         ACL_PRIORITY_MIXED = 3
75 };
76
77
78 struct acl_mem_block {
79         uint32_t block_size;
80         void     *mem_ptr;
81 };
82
83 #define MEM_BLOCK_NUM   16
84
85 /* Single ACL rule, build representation.*/
86 struct rte_acl_build_rule {
87         struct rte_acl_build_rule   *next;
88         struct rte_acl_config       *config;
89         /**< configuration for each field in the rule. */
90         const struct rte_acl_rule   *f;
91         uint32_t                    *wildness;
92 };
93
94 /* Context for build phase */
95 struct acl_build_context {
96         const struct rte_acl_ctx *acx;
97         struct rte_acl_build_rule *build_rules;
98         struct rte_acl_config     cfg;
99         int32_t                   node_max;
100         uint32_t                  node;
101         uint32_t                  num_nodes;
102         uint32_t                  category_mask;
103         uint32_t                  num_rules;
104         uint32_t                  node_id;
105         uint32_t                  src_mask;
106         uint32_t                  num_build_rules;
107         uint32_t                  num_tries;
108         struct tb_mem_pool        pool;
109         struct rte_acl_trie       tries[RTE_ACL_MAX_TRIES];
110         struct rte_acl_bld_trie   bld_tries[RTE_ACL_MAX_TRIES];
111         uint32_t            data_indexes[RTE_ACL_MAX_TRIES][RTE_ACL_MAX_FIELDS];
112
113         /* memory free lists for nodes and blocks used for node ptrs */
114         struct acl_mem_block      blocks[MEM_BLOCK_NUM];
115         struct rte_acl_node       *node_free_list;
116 };
117
118 static int acl_merge_trie(struct acl_build_context *context,
119         struct rte_acl_node *node_a, struct rte_acl_node *node_b,
120         uint32_t level, struct rte_acl_node **node_c);
121
122 static int acl_merge(struct acl_build_context *context,
123         struct rte_acl_node *node_a, struct rte_acl_node *node_b,
124         int move, int a_subset, int level);
125
126 static void
127 acl_deref_ptr(struct acl_build_context *context,
128         struct rte_acl_node *node, int index);
129
130 static void *
131 acl_build_alloc(struct acl_build_context *context, size_t n, size_t s)
132 {
133         uint32_t m;
134         void *p;
135         size_t alloc_size = n * s;
136
137         /*
138          * look for memory in free lists
139          */
140         for (m = 0; m < RTE_DIM(context->blocks); m++) {
141                 if (context->blocks[m].block_size ==
142                    alloc_size && context->blocks[m].mem_ptr != NULL) {
143                         p = context->blocks[m].mem_ptr;
144                         context->blocks[m].mem_ptr = *((void **)p);
145                         memset(p, 0, alloc_size);
146                         return p;
147                 }
148         }
149
150         /*
151          * return allocation from memory pool
152          */
153         p = tb_alloc(&context->pool, alloc_size);
154         return p;
155 }
156
157 /*
158  * Free memory blocks (kept in context for reuse).
159  */
160 static void
161 acl_build_free(struct acl_build_context *context, size_t s, void *p)
162 {
163         uint32_t n;
164
165         for (n = 0; n < RTE_DIM(context->blocks); n++) {
166                 if (context->blocks[n].block_size == s) {
167                         *((void **)p) = context->blocks[n].mem_ptr;
168                         context->blocks[n].mem_ptr = p;
169                         return;
170                 }
171         }
172         for (n = 0; n < RTE_DIM(context->blocks); n++) {
173                 if (context->blocks[n].block_size == 0) {
174                         context->blocks[n].block_size = s;
175                         *((void **)p) = NULL;
176                         context->blocks[n].mem_ptr = p;
177                         return;
178                 }
179         }
180 }
181
182 /*
183  * Allocate and initialize a new node.
184  */
185 static struct rte_acl_node *
186 acl_alloc_node(struct acl_build_context *context, int level)
187 {
188         struct rte_acl_node *node;
189
190         if (context->node_free_list != NULL) {
191                 node = context->node_free_list;
192                 context->node_free_list = node->next;
193                 memset(node, 0, sizeof(struct rte_acl_node));
194         } else {
195                 node = acl_build_alloc(context, sizeof(struct rte_acl_node), 1);
196         }
197
198         if (node != NULL) {
199                 node->num_ptrs = 0;
200                 node->level = level;
201                 node->node_type = RTE_ACL_NODE_UNDEFINED;
202                 node->node_index = RTE_ACL_NODE_UNDEFINED;
203                 context->num_nodes++;
204                 node->id = context->node_id++;
205         }
206         return node;
207 }
208
209 /*
210  * Dereference all nodes to which this node points
211  */
212 static void
213 acl_free_node(struct acl_build_context *context,
214         struct rte_acl_node *node)
215 {
216         uint32_t n;
217
218         if (node->prev != NULL)
219                 node->prev->next = NULL;
220         for (n = 0; n < node->num_ptrs; n++)
221                 acl_deref_ptr(context, node, n);
222
223         /* free mrt if this is a match node */
224         if (node->mrt != NULL) {
225                 acl_build_free(context, sizeof(struct rte_acl_match_results),
226                         node->mrt);
227                 node->mrt = NULL;
228         }
229
230         /* free transitions to other nodes */
231         if (node->ptrs != NULL) {
232                 acl_build_free(context,
233                         node->max_ptrs * sizeof(struct rte_acl_ptr_set),
234                         node->ptrs);
235                 node->ptrs = NULL;
236         }
237
238         /* put it on the free list */
239         context->num_nodes--;
240         node->next = context->node_free_list;
241         context->node_free_list = node;
242 }
243
244
245 /*
246  * Include src bitset in dst bitset
247  */
248 static void
249 acl_include(struct rte_acl_bitset *dst, struct rte_acl_bitset *src, bits_t mask)
250 {
251         uint32_t n;
252
253         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++)
254                 dst->bits[n] = (dst->bits[n] & mask) | src->bits[n];
255 }
256
257 /*
258  * Set dst to bits of src1 that are not in src2
259  */
260 static int
261 acl_exclude(struct rte_acl_bitset *dst,
262         struct rte_acl_bitset *src1,
263         struct rte_acl_bitset *src2)
264 {
265         uint32_t n;
266         bits_t all_bits = 0;
267
268         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++) {
269                 dst->bits[n] = src1->bits[n] & ~src2->bits[n];
270                 all_bits |= dst->bits[n];
271         }
272         return all_bits != 0;
273 }
274
275 /*
276  * Add a pointer (ptr) to a node.
277  */
278 static int
279 acl_add_ptr(struct acl_build_context *context,
280         struct rte_acl_node *node,
281         struct rte_acl_node *ptr,
282         struct rte_acl_bitset *bits)
283 {
284         uint32_t n, num_ptrs;
285         struct rte_acl_ptr_set *ptrs = NULL;
286
287         /*
288          * If there's already a pointer to the same node, just add to the bitset
289          */
290         for (n = 0; n < node->num_ptrs; n++) {
291                 if (node->ptrs[n].ptr != NULL) {
292                         if (node->ptrs[n].ptr == ptr) {
293                                 acl_include(&node->ptrs[n].values, bits, -1);
294                                 acl_include(&node->values, bits, -1);
295                                 return 0;
296                         }
297                 }
298         }
299
300         /* if there's no room for another pointer, make room */
301         if (node->num_ptrs >= node->max_ptrs) {
302                 /* add room for more pointers */
303                 num_ptrs = node->max_ptrs + ACL_PTR_ALLOC;
304                 ptrs = acl_build_alloc(context, num_ptrs, sizeof(*ptrs));
305
306                 /* copy current points to new memory allocation */
307                 if (node->ptrs != NULL) {
308                         memcpy(ptrs, node->ptrs,
309                                 node->num_ptrs * sizeof(*ptrs));
310                         acl_build_free(context, node->max_ptrs * sizeof(*ptrs),
311                                 node->ptrs);
312                 }
313                 node->ptrs = ptrs;
314                 node->max_ptrs = num_ptrs;
315         }
316
317         /* Find available ptr and add a new pointer to this node */
318         for (n = node->min_add; n < node->max_ptrs; n++) {
319                 if (node->ptrs[n].ptr == NULL) {
320                         node->ptrs[n].ptr = ptr;
321                         acl_include(&node->ptrs[n].values, bits, 0);
322                         acl_include(&node->values, bits, -1);
323                         if (ptr != NULL)
324                                 ptr->ref_count++;
325                         if (node->num_ptrs <= n)
326                                 node->num_ptrs = n + 1;
327                         return 0;
328                 }
329         }
330
331         return 0;
332 }
333
334 /*
335  * Add a pointer for a range of values
336  */
337 static int
338 acl_add_ptr_range(struct acl_build_context *context,
339         struct rte_acl_node *root,
340         struct rte_acl_node *node,
341         uint8_t low,
342         uint8_t high)
343 {
344         uint32_t n;
345         struct rte_acl_bitset bitset;
346
347         /* clear the bitset values */
348         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++)
349                 bitset.bits[n] = 0;
350
351         /* for each bit in range, add bit to set */
352         for (n = 0; n < UINT8_MAX + 1; n++)
353                 if (n >= low && n <= high)
354                         bitset.bits[n / (sizeof(bits_t) * 8)] |=
355                                 1 << (n % (sizeof(bits_t) * 8));
356
357         return acl_add_ptr(context, root, node, &bitset);
358 }
359
360 /*
361  * Generate a bitset from a byte value and mask.
362  */
363 static int
364 acl_gen_mask(struct rte_acl_bitset *bitset, uint32_t value, uint32_t mask)
365 {
366         int range = 0;
367         uint32_t n;
368
369         /* clear the bitset values */
370         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++)
371                 bitset->bits[n] = 0;
372
373         /* for each bit in value/mask, add bit to set */
374         for (n = 0; n < UINT8_MAX + 1; n++) {
375                 if ((n & mask) == value) {
376                         range++;
377                         bitset->bits[n / (sizeof(bits_t) * 8)] |=
378                                 1 << (n % (sizeof(bits_t) * 8));
379                 }
380         }
381         return range;
382 }
383
384 /*
385  * Determine how A and B intersect.
386  * Determine if A and/or B are supersets of the intersection.
387  */
388 static int
389 acl_intersect_type(const struct rte_acl_bitset *a_bits,
390         const struct rte_acl_bitset *b_bits,
391         struct rte_acl_bitset *intersect)
392 {
393         uint32_t n;
394         bits_t intersect_bits = 0;
395         bits_t a_superset = 0;
396         bits_t b_superset = 0;
397
398         /*
399          * calculate and store intersection and check if A and/or B have
400          * bits outside the intersection (superset)
401          */
402         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++) {
403                 intersect->bits[n] = a_bits->bits[n] & b_bits->bits[n];
404                 a_superset |= a_bits->bits[n] ^ intersect->bits[n];
405                 b_superset |= b_bits->bits[n] ^ intersect->bits[n];
406                 intersect_bits |= intersect->bits[n];
407         }
408
409         n = (intersect_bits == 0 ? ACL_INTERSECT_NONE : ACL_INTERSECT) |
410                 (b_superset == 0 ? 0 : ACL_INTERSECT_B) |
411                 (a_superset == 0 ? 0 : ACL_INTERSECT_A);
412
413         return n;
414 }
415
416 /*
417  * Check if all bits in the bitset are on
418  */
419 static int
420 acl_full(struct rte_acl_node *node)
421 {
422         uint32_t n;
423         bits_t all_bits = -1;
424
425         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++)
426                 all_bits &= node->values.bits[n];
427         return all_bits == -1;
428 }
429
430 /*
431  * Check if all bits in the bitset are off
432  */
433 static int
434 acl_empty(struct rte_acl_node *node)
435 {
436         uint32_t n;
437
438         if (node->ref_count == 0) {
439                 for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++) {
440                         if (0 != node->values.bits[n])
441                                 return 0;
442                 }
443                 return 1;
444         } else {
445                 return 0;
446         }
447 }
448
449 /*
450  * Compute intersection of A and B
451  * return 1 if there is an intersection else 0.
452  */
453 static int
454 acl_intersect(struct rte_acl_bitset *a_bits,
455         struct rte_acl_bitset *b_bits,
456         struct rte_acl_bitset *intersect)
457 {
458         uint32_t n;
459         bits_t all_bits = 0;
460
461         for (n = 0; n < RTE_ACL_BIT_SET_SIZE; n++) {
462                 intersect->bits[n] = a_bits->bits[n] & b_bits->bits[n];
463                 all_bits |= intersect->bits[n];
464         }
465         return all_bits != 0;
466 }
467
468 /*
469  * Duplicate a node
470  */
471 static struct rte_acl_node *
472 acl_dup_node(struct acl_build_context *context, struct rte_acl_node *node)
473 {
474         uint32_t n;
475         struct rte_acl_node *next;
476
477         next = acl_alloc_node(context, node->level);
478
479         /* allocate the pointers */
480         if (node->num_ptrs > 0) {
481                 next->ptrs = acl_build_alloc(context,
482                         node->max_ptrs,
483                         sizeof(struct rte_acl_ptr_set));
484                 next->max_ptrs = node->max_ptrs;
485         }
486
487         /* copy over the pointers */
488         for (n = 0; n < node->num_ptrs; n++) {
489                 if (node->ptrs[n].ptr != NULL) {
490                         next->ptrs[n].ptr = node->ptrs[n].ptr;
491                         next->ptrs[n].ptr->ref_count++;
492                         acl_include(&next->ptrs[n].values,
493                                 &node->ptrs[n].values, -1);
494                 }
495         }
496
497         next->num_ptrs = node->num_ptrs;
498
499         /* copy over node's match results */
500         if (node->match_flag == 0)
501                 next->match_flag = 0;
502         else {
503                 next->match_flag = -1;
504                 next->mrt = acl_build_alloc(context, 1, sizeof(*next->mrt));
505                 memcpy(next->mrt, node->mrt, sizeof(*next->mrt));
506         }
507
508         /* copy over node's bitset */
509         acl_include(&next->values, &node->values, -1);
510
511         node->next = next;
512         next->prev = node;
513
514         return next;
515 }
516
517 /*
518  * Dereference a pointer from a node
519  */
520 static void
521 acl_deref_ptr(struct acl_build_context *context,
522         struct rte_acl_node *node, int index)
523 {
524         struct rte_acl_node *ref_node;
525
526         /* De-reference the node at the specified pointer */
527         if (node != NULL && node->ptrs[index].ptr != NULL) {
528                 ref_node = node->ptrs[index].ptr;
529                 ref_node->ref_count--;
530                 if (ref_node->ref_count == 0)
531                         acl_free_node(context, ref_node);
532         }
533 }
534
535 /*
536  * Exclude bitset from a node pointer
537  * returns  0 if poiter was deref'd
538  *          1 otherwise.
539  */
540 static int
541 acl_exclude_ptr(struct acl_build_context *context,
542         struct rte_acl_node *node,
543         int index,
544         struct rte_acl_bitset *b_bits)
545 {
546         int retval = 1;
547
548         /*
549          * remove bitset from node pointer and deref
550          * if the bitset becomes empty.
551          */
552         if (!acl_exclude(&node->ptrs[index].values,
553                         &node->ptrs[index].values,
554                         b_bits)) {
555                 acl_deref_ptr(context, node, index);
556                 node->ptrs[index].ptr = NULL;
557                 retval = 0;
558         }
559
560         /* exclude bits from the composite bits for the node */
561         acl_exclude(&node->values, &node->values, b_bits);
562         return retval;
563 }
564
565 /*
566  * Remove a bitset from src ptr and move remaining ptr to dst
567  */
568 static int
569 acl_move_ptr(struct acl_build_context *context,
570         struct rte_acl_node *dst,
571         struct rte_acl_node *src,
572         int index,
573         struct rte_acl_bitset *b_bits)
574 {
575         int rc;
576
577         if (b_bits != NULL)
578                 if (!acl_exclude_ptr(context, src, index, b_bits))
579                         return 0;
580
581         /* add src pointer to dst node */
582         rc = acl_add_ptr(context, dst, src->ptrs[index].ptr,
583                         &src->ptrs[index].values);
584         if (rc < 0)
585                 return rc;
586
587         /* remove ptr from src */
588         acl_exclude_ptr(context, src, index, &src->ptrs[index].values);
589         return 1;
590 }
591
592 /*
593  * acl_exclude rte_acl_bitset from src and copy remaining pointer to dst
594  */
595 static int
596 acl_copy_ptr(struct acl_build_context *context,
597         struct rte_acl_node *dst,
598         struct rte_acl_node *src,
599         int index,
600         struct rte_acl_bitset *b_bits)
601 {
602         int rc;
603         struct rte_acl_bitset bits;
604
605         if (b_bits != NULL)
606                 if (!acl_exclude(&bits, &src->ptrs[index].values, b_bits))
607                         return 0;
608
609         rc = acl_add_ptr(context, dst, src->ptrs[index].ptr, &bits);
610         if (rc < 0)
611                 return rc;
612         return 1;
613 }
614
615 /*
616  * Fill in gaps in ptrs list with the ptr at the end of the list
617  */
618 static void
619 acl_compact_node_ptrs(struct rte_acl_node *node_a)
620 {
621         uint32_t n;
622         int min_add = node_a->min_add;
623
624         while (node_a->num_ptrs > 0  &&
625                         node_a->ptrs[node_a->num_ptrs - 1].ptr == NULL)
626                 node_a->num_ptrs--;
627
628         for (n = min_add; n + 1 < node_a->num_ptrs; n++) {
629
630                 /* if this entry is empty */
631                 if (node_a->ptrs[n].ptr == NULL) {
632
633                         /* move the last pointer to this entry */
634                         acl_include(&node_a->ptrs[n].values,
635                                 &node_a->ptrs[node_a->num_ptrs - 1].values,
636                                 0);
637                         node_a->ptrs[n].ptr =
638                                 node_a->ptrs[node_a->num_ptrs - 1].ptr;
639
640                         /*
641                          * mark the end as empty and adjust the number
642                          * of used pointer enum_tries
643                          */
644                         node_a->ptrs[node_a->num_ptrs - 1].ptr = NULL;
645                         while (node_a->num_ptrs > 0  &&
646                                 node_a->ptrs[node_a->num_ptrs - 1].ptr == NULL)
647                                 node_a->num_ptrs--;
648                 }
649         }
650 }
651
652 /*
653  * acl_merge helper routine.
654  */
655 static int
656 acl_merge_intersect(struct acl_build_context *context,
657         struct rte_acl_node *node_a, uint32_t idx_a,
658         struct rte_acl_node *node_b, uint32_t idx_b,
659         int next_move, int level,
660         struct rte_acl_bitset *intersect_ptr)
661 {
662         struct rte_acl_node *node_c;
663
664         /* Duplicate A for intersection */
665         node_c = acl_dup_node(context, node_a->ptrs[idx_a].ptr);
666
667         /* Remove intersection from A */
668         acl_exclude_ptr(context, node_a, idx_a, intersect_ptr);
669
670         /*
671          * Added link from A to C for all transitions
672          * in the intersection
673          */
674         if (acl_add_ptr(context, node_a, node_c, intersect_ptr) < 0)
675                 return -1;
676
677         /* merge B->node into C */
678         return acl_merge(context, node_c, node_b->ptrs[idx_b].ptr, next_move,
679                 0, level + 1);
680 }
681
682
683 /*
684  * Merge the children of nodes A and B together.
685  *
686  * if match node
687  *      For each category
688  *              node A result = highest priority result
689  * if any pointers in A intersect with any in B
690  *      For each intersection
691  *              C = copy of node that A points to
692  *              remove intersection from A pointer
693  *              add a pointer to A that points to C for the intersection
694  *              Merge C and node that B points to
695  * Compact the pointers in A and B
696  * if move flag
697  *      If B has only one reference
698  *              Move B pointers to A
699  *      else
700  *              Copy B pointers to A
701  */
702 static int
703 acl_merge(struct acl_build_context *context,
704         struct rte_acl_node *node_a, struct rte_acl_node *node_b,
705         int move, int a_subset, int level)
706 {
707         uint32_t n, m, ptrs_a, ptrs_b;
708         uint32_t min_add_a, min_add_b;
709         int intersect_type;
710         int node_intersect_type;
711         int b_full, next_move, rc;
712         struct rte_acl_bitset intersect_values;
713         struct rte_acl_bitset intersect_ptr;
714
715         min_add_a = 0;
716         min_add_b = 0;
717         intersect_type = 0;
718         node_intersect_type = 0;
719
720         if (level == 0)
721                 a_subset = 1;
722
723         /*
724          *  Resolve match priorities
725          */
726         if (node_a->match_flag != 0 || node_b->match_flag != 0) {
727
728                 if (node_a->match_flag == 0 || node_b->match_flag == 0)
729                         RTE_LOG(ERR, ACL, "Not both matches\n");
730
731                 if (node_b->match_flag < node_a->match_flag)
732                         RTE_LOG(ERR, ACL, "Not same match\n");
733
734                 for (n = 0; n < context->cfg.num_categories; n++) {
735                         if (node_a->mrt->priority[n] <
736                                         node_b->mrt->priority[n]) {
737                                 node_a->mrt->priority[n] =
738                                         node_b->mrt->priority[n];
739                                 node_a->mrt->results[n] =
740                                         node_b->mrt->results[n];
741                         }
742                 }
743         }
744
745         /*
746          * If the two node transitions intersect then merge the transitions.
747          * Check intersection for entire node (all pointers)
748          */
749         node_intersect_type = acl_intersect_type(&node_a->values,
750                 &node_b->values,
751                 &intersect_values);
752
753         if (node_intersect_type & ACL_INTERSECT) {
754
755                 b_full = acl_full(node_b);
756
757                 min_add_b = node_b->min_add;
758                 node_b->min_add = node_b->num_ptrs;
759                 ptrs_b = node_b->num_ptrs;
760
761                 min_add_a = node_a->min_add;
762                 node_a->min_add = node_a->num_ptrs;
763                 ptrs_a = node_a->num_ptrs;
764
765                 for (n = 0; n < ptrs_a; n++) {
766                         for (m = 0; m < ptrs_b; m++) {
767
768                                 if (node_a->ptrs[n].ptr == NULL ||
769                                                 node_b->ptrs[m].ptr == NULL ||
770                                                 node_a->ptrs[n].ptr ==
771                                                 node_b->ptrs[m].ptr)
772                                                 continue;
773
774                                 intersect_type = acl_intersect_type(
775                                         &node_a->ptrs[n].values,
776                                         &node_b->ptrs[m].values,
777                                         &intersect_ptr);
778
779                                 /* If this node is not a 'match' node */
780                                 if ((intersect_type & ACL_INTERSECT) &&
781                                         (context->cfg.num_categories != 1 ||
782                                         !(node_a->ptrs[n].ptr->match_flag))) {
783
784                                         /*
785                                          * next merge is a 'move' pointer,
786                                          * if this one is and B is a
787                                          * subset of the intersection.
788                                          */
789                                         next_move = move &&
790                                                 (intersect_type &
791                                                 ACL_INTERSECT_B) == 0;
792
793                                         if (a_subset && b_full) {
794                                                 rc = acl_merge(context,
795                                                         node_a->ptrs[n].ptr,
796                                                         node_b->ptrs[m].ptr,
797                                                         next_move,
798                                                         1, level + 1);
799                                                 if (rc != 0)
800                                                         return rc;
801                                         } else {
802                                                 rc = acl_merge_intersect(
803                                                         context, node_a, n,
804                                                         node_b, m, next_move,
805                                                         level, &intersect_ptr);
806                                                 if (rc != 0)
807                                                         return rc;
808                                         }
809                                 }
810                         }
811                 }
812         }
813
814         /* Compact pointers */
815         node_a->min_add = min_add_a;
816         acl_compact_node_ptrs(node_a);
817         node_b->min_add = min_add_b;
818         acl_compact_node_ptrs(node_b);
819
820         /*
821          *  Either COPY or MOVE pointers from B to A
822          */
823         acl_intersect(&node_a->values, &node_b->values, &intersect_values);
824
825         if (move && node_b->ref_count == 1) {
826                 for (m = 0; m < node_b->num_ptrs; m++) {
827                         if (node_b->ptrs[m].ptr != NULL &&
828                                         acl_move_ptr(context, node_a, node_b, m,
829                                         &intersect_values) < 0)
830                                 return -1;
831                 }
832         } else {
833                 for (m = 0; m < node_b->num_ptrs; m++) {
834                         if (node_b->ptrs[m].ptr != NULL &&
835                                         acl_copy_ptr(context, node_a, node_b, m,
836                                         &intersect_values) < 0)
837                                 return -1;
838                 }
839         }
840
841         /*
842          *  Free node if its empty (no longer used)
843          */
844         if (acl_empty(node_b))
845                 acl_free_node(context, node_b);
846         return 0;
847 }
848
849 static int
850 acl_resolve_leaf(struct acl_build_context *context,
851         struct rte_acl_node *node_a,
852         struct rte_acl_node *node_b,
853         struct rte_acl_node **node_c)
854 {
855         uint32_t n;
856         int combined_priority = ACL_PRIORITY_EQUAL;
857
858         for (n = 0; n < context->cfg.num_categories; n++) {
859                 if (node_a->mrt->priority[n] != node_b->mrt->priority[n]) {
860                         combined_priority |= (node_a->mrt->priority[n] >
861                                 node_b->mrt->priority[n]) ?
862                                 ACL_PRIORITY_NODE_A : ACL_PRIORITY_NODE_B;
863                 }
864         }
865
866         /*
867          * if node a is higher or equal priority for all categories,
868          * then return node_a.
869          */
870         if (combined_priority == ACL_PRIORITY_NODE_A ||
871                         combined_priority == ACL_PRIORITY_EQUAL) {
872                 *node_c = node_a;
873                 return 0;
874         }
875
876         /*
877          * if node b is higher or equal priority for all categories,
878          * then return node_b.
879          */
880         if (combined_priority == ACL_PRIORITY_NODE_B) {
881                 *node_c = node_b;
882                 return 0;
883         }
884
885         /*
886          * mixed priorities - create a new node with the highest priority
887          * for each category.
888          */
889
890         /* force new duplication. */
891         node_a->next = NULL;
892
893         *node_c = acl_dup_node(context, node_a);
894         for (n = 0; n < context->cfg.num_categories; n++) {
895                 if ((*node_c)->mrt->priority[n] < node_b->mrt->priority[n]) {
896                         (*node_c)->mrt->priority[n] = node_b->mrt->priority[n];
897                         (*node_c)->mrt->results[n] = node_b->mrt->results[n];
898                 }
899         }
900         return 0;
901 }
902
903 /*
904  * Merge nodes A and B together,
905  *   returns a node that is the path for the intersection
906  *
907  * If match node (leaf on trie)
908  *      For each category
909  *              return node = highest priority result
910  *
911  * Create C as a duplicate of A to point to child intersections
912  * If any pointers in C intersect with any in B
913  *      For each intersection
914  *              merge children
915  *              remove intersection from C pointer
916  *              add a pointer from C to child intersection node
917  * Compact the pointers in A and B
918  * Copy any B pointers that are outside of the intersection to C
919  * If C has no references to the B trie
920  *   free C and return A
921  * Else If C has no references to the A trie
922  *   free C and return B
923  * Else
924  *   return C
925  */
926 static int
927 acl_merge_trie(struct acl_build_context *context,
928         struct rte_acl_node *node_a, struct rte_acl_node *node_b,
929         uint32_t level, struct rte_acl_node **return_c)
930 {
931         uint32_t n, m, ptrs_c, ptrs_b;
932         uint32_t min_add_c, min_add_b;
933         int node_intersect_type;
934         struct rte_acl_bitset node_intersect;
935         struct rte_acl_node *node_c;
936         struct rte_acl_node *node_a_next;
937         int node_b_refs;
938         int node_a_refs;
939
940         node_c = node_a;
941         node_a_next = node_a->next;
942         min_add_c = 0;
943         min_add_b = 0;
944         node_a_refs = node_a->num_ptrs;
945         node_b_refs = 0;
946         node_intersect_type = 0;
947
948         /* Resolve leaf nodes (matches) */
949         if (node_a->match_flag != 0) {
950                 acl_resolve_leaf(context, node_a, node_b, return_c);
951                 return 0;
952         }
953
954         /*
955          * Create node C as a copy of node A, and do: C = merge(A,B);
956          * If node A can be used instead (A==C), then later we'll
957          * destroy C and return A.
958          */
959         if (level > 0)
960                 node_c = acl_dup_node(context, node_a);
961
962         /*
963          * If the two node transitions intersect then merge the transitions.
964          * Check intersection for entire node (all pointers)
965          */
966         node_intersect_type = acl_intersect_type(&node_c->values,
967                 &node_b->values,
968                 &node_intersect);
969
970         if (node_intersect_type & ACL_INTERSECT) {
971
972                 min_add_b = node_b->min_add;
973                 node_b->min_add = node_b->num_ptrs;
974                 ptrs_b = node_b->num_ptrs;
975
976                 min_add_c = node_c->min_add;
977                 node_c->min_add = node_c->num_ptrs;
978                 ptrs_c = node_c->num_ptrs;
979
980                 for (n = 0; n < ptrs_c; n++) {
981                         if (node_c->ptrs[n].ptr == NULL) {
982                                 node_a_refs--;
983                                 continue;
984                         }
985                         node_c->ptrs[n].ptr->next = NULL;
986                         for (m = 0; m < ptrs_b; m++) {
987
988                                 struct rte_acl_bitset child_intersect;
989                                 int child_intersect_type;
990                                 struct rte_acl_node *child_node_c = NULL;
991
992                                 if (node_b->ptrs[m].ptr == NULL ||
993                                                 node_c->ptrs[n].ptr ==
994                                                 node_b->ptrs[m].ptr)
995                                                 continue;
996
997                                 child_intersect_type = acl_intersect_type(
998                                         &node_c->ptrs[n].values,
999                                         &node_b->ptrs[m].values,
1000                                         &child_intersect);
1001
1002                                 if ((child_intersect_type & ACL_INTERSECT) !=
1003                                                 0) {
1004                                         if (acl_merge_trie(context,
1005                                                         node_c->ptrs[n].ptr,
1006                                                         node_b->ptrs[m].ptr,
1007                                                         level + 1,
1008                                                         &child_node_c))
1009                                                 return 1;
1010
1011                                         if (child_node_c != NULL &&
1012                                                         child_node_c !=
1013                                                         node_c->ptrs[n].ptr) {
1014
1015                                                 node_b_refs++;
1016
1017                                                 /*
1018                                                  * Added link from C to
1019                                                  * child_C for all transitions
1020                                                  * in the intersection.
1021                                                  */
1022                                                 acl_add_ptr(context, node_c,
1023                                                         child_node_c,
1024                                                         &child_intersect);
1025
1026                                                 /*
1027                                                  * inc refs if pointer is not
1028                                                  * to node b.
1029                                                  */
1030                                                 node_a_refs += (child_node_c !=
1031                                                         node_b->ptrs[m].ptr);
1032
1033                                                 /*
1034                                                  * Remove intersection from C
1035                                                  * pointer.
1036                                                  */
1037                                                 if (!acl_exclude(
1038                                                         &node_c->ptrs[n].values,
1039                                                         &node_c->ptrs[n].values,
1040                                                         &child_intersect)) {
1041                                                         acl_deref_ptr(context,
1042                                                                 node_c, n);
1043                                                         node_c->ptrs[n].ptr =
1044                                                                 NULL;
1045                                                         node_a_refs--;
1046                                                 }
1047                                         }
1048                                 }
1049                         }
1050                 }
1051
1052                 /* Compact pointers */
1053                 node_c->min_add = min_add_c;
1054                 acl_compact_node_ptrs(node_c);
1055                 node_b->min_add = min_add_b;
1056                 acl_compact_node_ptrs(node_b);
1057         }
1058
1059         /*
1060          *  Copy pointers outside of the intersection from B to C
1061          */
1062         if ((node_intersect_type & ACL_INTERSECT_B) != 0) {
1063                 node_b_refs++;
1064                 for (m = 0; m < node_b->num_ptrs; m++)
1065                         if (node_b->ptrs[m].ptr != NULL)
1066                                 acl_copy_ptr(context, node_c,
1067                                         node_b, m, &node_intersect);
1068         }
1069
1070         /*
1071          * Free node C if top of trie is contained in A or B
1072          *  if node C is a duplicate of node A &&
1073          *     node C was not an existing duplicate
1074          */
1075         if (node_c != node_a && node_c != node_a_next) {
1076
1077                 /*
1078                  * if the intersection has no references to the
1079                  * B side, then it is contained in A
1080                  */
1081                 if (node_b_refs == 0) {
1082                         acl_free_node(context, node_c);
1083                         node_c = node_a;
1084                 } else {
1085                         /*
1086                          * if the intersection has no references to the
1087                          * A side, then it is contained in B.
1088                          */
1089                         if (node_a_refs == 0) {
1090                                 acl_free_node(context, node_c);
1091                                 node_c = node_b;
1092                         }
1093                 }
1094         }
1095
1096         if (return_c != NULL)
1097                 *return_c = node_c;
1098
1099         if (level == 0)
1100                 acl_free_node(context, node_b);
1101
1102         return 0;
1103 }
1104
1105 /*
1106  * Reset current runtime fields before next build:
1107  *  - free allocated RT memory.
1108  *  - reset all RT related fields to zero.
1109  */
1110 static void
1111 acl_build_reset(struct rte_acl_ctx *ctx)
1112 {
1113         rte_free(ctx->mem);
1114         memset(&ctx->num_categories, 0,
1115                 sizeof(*ctx) - offsetof(struct rte_acl_ctx, num_categories));
1116 }
1117
1118 static void
1119 acl_gen_range(struct acl_build_context *context,
1120         const uint8_t *hi, const uint8_t *lo, int size, int level,
1121         struct rte_acl_node *root, struct rte_acl_node *end)
1122 {
1123         struct rte_acl_node *node, *prev;
1124         uint32_t n;
1125
1126         prev = root;
1127         for (n = size - 1; n > 0; n--) {
1128                 node = acl_alloc_node(context, level++);
1129                 acl_add_ptr_range(context, prev, node, lo[n], hi[n]);
1130                 prev = node;
1131         }
1132         acl_add_ptr_range(context, prev, end, lo[0], hi[0]);
1133 }
1134
1135 static struct rte_acl_node *
1136 acl_gen_range_trie(struct acl_build_context *context,
1137         const void *min, const void *max,
1138         int size, int level, struct rte_acl_node **pend)
1139 {
1140         int32_t n;
1141         struct rte_acl_node *root;
1142         const uint8_t *lo = (const uint8_t *)min;
1143         const uint8_t *hi = (const uint8_t *)max;
1144
1145         *pend = acl_alloc_node(context, level+size);
1146         root = acl_alloc_node(context, level++);
1147
1148         if (lo[size - 1] == hi[size - 1]) {
1149                 acl_gen_range(context, hi, lo, size, level, root, *pend);
1150         } else {
1151                 uint8_t limit_lo[64];
1152                 uint8_t limit_hi[64];
1153                 uint8_t hi_ff = UINT8_MAX;
1154                 uint8_t lo_00 = 0;
1155
1156                 memset(limit_lo, 0, RTE_DIM(limit_lo));
1157                 memset(limit_hi, UINT8_MAX, RTE_DIM(limit_hi));
1158
1159                 for (n = size - 2; n >= 0; n--) {
1160                         hi_ff = (uint8_t)(hi_ff & hi[n]);
1161                         lo_00 = (uint8_t)(lo_00 | lo[n]);
1162                 }
1163
1164                 if (hi_ff != UINT8_MAX) {
1165                         limit_lo[size - 1] = hi[size - 1];
1166                         acl_gen_range(context, hi, limit_lo, size, level,
1167                                 root, *pend);
1168                 }
1169
1170                 if (lo_00 != 0) {
1171                         limit_hi[size - 1] = lo[size - 1];
1172                         acl_gen_range(context, limit_hi, lo, size, level,
1173                                 root, *pend);
1174                 }
1175
1176                 if (hi[size - 1] - lo[size - 1] > 1 ||
1177                                 lo_00 == 0 ||
1178                                 hi_ff == UINT8_MAX) {
1179                         limit_lo[size-1] = (uint8_t)(lo[size-1] + (lo_00 != 0));
1180                         limit_hi[size-1] = (uint8_t)(hi[size-1] -
1181                                 (hi_ff != UINT8_MAX));
1182                         acl_gen_range(context, limit_hi, limit_lo, size,
1183                                 level, root, *pend);
1184                 }
1185         }
1186         return root;
1187 }
1188
1189 static struct rte_acl_node *
1190 acl_gen_mask_trie(struct acl_build_context *context,
1191         const void *value, const void *mask,
1192         int size, int level, struct rte_acl_node **pend)
1193 {
1194         int32_t n;
1195         struct rte_acl_node *root;
1196         struct rte_acl_node *node, *prev;
1197         struct rte_acl_bitset bits;
1198         const uint8_t *val = (const uint8_t *)value;
1199         const uint8_t *msk = (const uint8_t *)mask;
1200
1201         root = acl_alloc_node(context, level++);
1202         prev = root;
1203
1204         for (n = size - 1; n >= 0; n--) {
1205                 node = acl_alloc_node(context, level++);
1206                 acl_gen_mask(&bits, val[n] & msk[n], msk[n]);
1207                 acl_add_ptr(context, prev, node, &bits);
1208                 prev = node;
1209         }
1210
1211         *pend = prev;
1212         return root;
1213 }
1214
1215 static struct rte_acl_node *
1216 build_trie(struct acl_build_context *context, struct rte_acl_build_rule *head,
1217         struct rte_acl_build_rule **last, uint32_t *count)
1218 {
1219         uint32_t n, m;
1220         int field_index, node_count;
1221         struct rte_acl_node *trie;
1222         struct rte_acl_build_rule *prev, *rule;
1223         struct rte_acl_node *end, *merge, *root, *end_prev;
1224         const struct rte_acl_field *fld;
1225
1226         prev = head;
1227         rule = head;
1228         *last = prev;
1229
1230         trie = acl_alloc_node(context, 0);
1231
1232         while (rule != NULL) {
1233
1234                 root = acl_alloc_node(context, 0);
1235
1236                 root->ref_count = 1;
1237                 end = root;
1238
1239                 for (n = 0; n < rule->config->num_fields; n++) {
1240
1241                         field_index = rule->config->defs[n].field_index;
1242                         fld = rule->f->field + field_index;
1243                         end_prev = end;
1244
1245                         /* build a mini-trie for this field */
1246                         switch (rule->config->defs[n].type) {
1247
1248                         case RTE_ACL_FIELD_TYPE_BITMASK:
1249                                 merge = acl_gen_mask_trie(context,
1250                                         &fld->value,
1251                                         &fld->mask_range,
1252                                         rule->config->defs[n].size,
1253                                         end->level + 1,
1254                                         &end);
1255                                 break;
1256
1257                         case RTE_ACL_FIELD_TYPE_MASK:
1258                         {
1259                                 /*
1260                                  * set msb for the size of the field and
1261                                  * all higher bits.
1262                                  */
1263                                 uint64_t mask;
1264
1265                                 if (fld->mask_range.u32 == 0) {
1266                                         mask = 0;
1267
1268                                 /*
1269                                  * arithmetic right shift for the length of
1270                                  * the mask less the msb.
1271                                  */
1272                                 } else {
1273                                         mask = -1 <<
1274                                                 (rule->config->defs[n].size *
1275                                                 CHAR_BIT - fld->mask_range.u32);
1276                                 }
1277
1278                                 /* gen a mini-trie for this field */
1279                                 merge = acl_gen_mask_trie(context,
1280                                         &fld->value,
1281                                         (char *)&mask,
1282                                         rule->config->defs[n].size,
1283                                         end->level + 1,
1284                                         &end);
1285                         }
1286                         break;
1287
1288                         case RTE_ACL_FIELD_TYPE_RANGE:
1289                                 merge = acl_gen_range_trie(context,
1290                                         &rule->f->field[field_index].value,
1291                                         &rule->f->field[field_index].mask_range,
1292                                         rule->config->defs[n].size,
1293                                         end->level + 1,
1294                                         &end);
1295                                 break;
1296
1297                         default:
1298                                 RTE_LOG(ERR, ACL,
1299                                         "Error in rule[%u] type - %hhu\n",
1300                                         rule->f->data.userdata,
1301                                         rule->config->defs[n].type);
1302                                 return NULL;
1303                         }
1304
1305                         /* merge this field on to the end of the rule */
1306                         if (acl_merge_trie(context, end_prev, merge, 0,
1307                                         NULL) != 0) {
1308                                 return NULL;
1309                         }
1310                 }
1311
1312                 end->match_flag = ++context->num_build_rules;
1313
1314                 /*
1315                  * Setup the results for this rule.
1316                  * The result and priority of each category.
1317                  */
1318                 if (end->mrt == NULL)
1319                         end->mrt = acl_build_alloc(context, 1,
1320                                 sizeof(*end->mrt));
1321
1322                 for (m = context->cfg.num_categories; 0 != m--; ) {
1323                         if (rule->f->data.category_mask & (1 << m)) {
1324                                 end->mrt->results[m] = rule->f->data.userdata;
1325                                 end->mrt->priority[m] = rule->f->data.priority;
1326                         } else {
1327                                 end->mrt->results[m] = 0;
1328                                 end->mrt->priority[m] = 0;
1329                         }
1330                 }
1331
1332                 node_count = context->num_nodes;
1333                 (*count)++;
1334
1335                 /* merge this rule into the trie */
1336                 if (acl_merge_trie(context, trie, root, 0, NULL))
1337                         return NULL;
1338
1339                 node_count = context->num_nodes - node_count;
1340                 if (node_count > context->node_max) {
1341                         *last = prev;
1342                         return trie;
1343                 }
1344
1345                 prev = rule;
1346                 rule = rule->next;
1347         }
1348
1349         *last = NULL;
1350         return trie;
1351 }
1352
1353 static void
1354 acl_calc_wildness(struct rte_acl_build_rule *head,
1355         const struct rte_acl_config *config)
1356 {
1357         uint32_t n;
1358         struct rte_acl_build_rule *rule;
1359
1360         for (rule = head; rule != NULL; rule = rule->next) {
1361
1362                 for (n = 0; n < config->num_fields; n++) {
1363
1364                         double wild = 0;
1365                         uint32_t bit_len = CHAR_BIT * config->defs[n].size;
1366                         uint64_t msk_val = RTE_LEN2MASK(bit_len,
1367                                 typeof(msk_val));
1368                         double size = bit_len;
1369                         int field_index = config->defs[n].field_index;
1370                         const struct rte_acl_field *fld = rule->f->field +
1371                                 field_index;
1372
1373                         switch (rule->config->defs[n].type) {
1374                         case RTE_ACL_FIELD_TYPE_BITMASK:
1375                                 wild = (size - __builtin_popcountll(
1376                                         fld->mask_range.u64 & msk_val)) /
1377                                         size;
1378                                 break;
1379
1380                         case RTE_ACL_FIELD_TYPE_MASK:
1381                                 wild = (size - fld->mask_range.u32) / size;
1382                                 break;
1383
1384                         case RTE_ACL_FIELD_TYPE_RANGE:
1385                                 wild = (fld->mask_range.u64 & msk_val) -
1386                                         (fld->value.u64 & msk_val);
1387                                 wild = wild / msk_val;
1388                                 break;
1389                         }
1390
1391                         rule->wildness[field_index] = (uint32_t)(wild * 100);
1392                 }
1393         }
1394 }
1395
1396 static void
1397 acl_rule_stats(struct rte_acl_build_rule *head, struct rte_acl_config *config)
1398 {
1399         struct rte_acl_build_rule *rule;
1400         uint32_t n, m, fields_deactivated = 0;
1401         uint32_t start = 0, deactivate = 0;
1402         int tally[RTE_ACL_MAX_LEVELS][TALLY_NUM];
1403
1404         memset(tally, 0, sizeof(tally));
1405
1406         for (rule = head; rule != NULL; rule = rule->next) {
1407
1408                 for (n = 0; n < config->num_fields; n++) {
1409                         uint32_t field_index = config->defs[n].field_index;
1410
1411                         tally[n][TALLY_0]++;
1412                         for (m = 1; m < RTE_DIM(wild_limits); m++) {
1413                                 if (rule->wildness[field_index] >=
1414                                                 wild_limits[m])
1415                                         tally[n][m]++;
1416                         }
1417                 }
1418
1419                 for (n = config->num_fields - 1; n > 0; n--) {
1420                         uint32_t field_index = config->defs[n].field_index;
1421
1422                         if (rule->wildness[field_index] == 100)
1423                                 tally[n][TALLY_DEPTH]++;
1424                         else
1425                                 break;
1426                 }
1427         }
1428
1429         /*
1430          * Look for any field that is always wild and drop it from the config
1431          * Only deactivate if all fields for a given input loop are deactivated.
1432          */
1433         for (n = 1; n < config->num_fields; n++) {
1434                 if (config->defs[n].input_index !=
1435                                 config->defs[n - 1].input_index) {
1436                         for (m = start; m < n; m++)
1437                                 tally[m][TALLY_DEACTIVATED] = deactivate;
1438                         fields_deactivated += deactivate;
1439                         start = n;
1440                         deactivate = 1;
1441                 }
1442
1443                 /* if the field is not always completely wild */
1444                 if (tally[n][TALLY_100] != tally[n][TALLY_0])
1445                         deactivate = 0;
1446         }
1447
1448         for (m = start; m < n; m++)
1449                 tally[m][TALLY_DEACTIVATED] = deactivate;
1450
1451         fields_deactivated += deactivate;
1452
1453         /* remove deactivated fields */
1454         if (fields_deactivated) {
1455                 uint32_t k, l = 0;
1456
1457                 for (k = 0; k < config->num_fields; k++) {
1458                         if (tally[k][TALLY_DEACTIVATED] == 0) {
1459                                 memmove(&tally[l][0], &tally[k][0],
1460                                         TALLY_NUM * sizeof(tally[0][0]));
1461                                 memmove(&config->defs[l++],
1462                                         &config->defs[k],
1463                                         sizeof(struct rte_acl_field_def));
1464                         }
1465                 }
1466                 config->num_fields = l;
1467         }
1468 }
1469
1470 static int
1471 rule_cmp_wildness(struct rte_acl_build_rule *r1, struct rte_acl_build_rule *r2)
1472 {
1473         uint32_t n;
1474
1475         for (n = 1; n < r1->config->num_fields; n++) {
1476                 int field_index = r1->config->defs[n].field_index;
1477
1478                 if (r1->wildness[field_index] != r2->wildness[field_index])
1479                         return (r1->wildness[field_index] -
1480                                 r2->wildness[field_index]);
1481         }
1482         return 0;
1483 }
1484
1485 /*
1486  * Sort list of rules based on the rules wildness.
1487  */
1488 static struct rte_acl_build_rule *
1489 sort_rules(struct rte_acl_build_rule *head)
1490 {
1491         struct rte_acl_build_rule *new_head;
1492         struct rte_acl_build_rule *l, *r, **p;
1493
1494         new_head = NULL;
1495         while (head != NULL) {
1496
1497                 /* remove element from the head of the old list. */
1498                 r = head;
1499                 head = r->next;
1500                 r->next = NULL;
1501
1502                 /* walk through new sorted list to find a proper place. */
1503                 for (p = &new_head;
1504                                 (l = *p) != NULL &&
1505                                 rule_cmp_wildness(l, r) >= 0;
1506                                 p = &l->next)
1507                         ;
1508
1509                 /* insert element into the new sorted list. */
1510                 r->next = *p;
1511                 *p = r;
1512         }
1513
1514         return new_head;
1515 }
1516
1517 static uint32_t
1518 acl_build_index(const struct rte_acl_config *config, uint32_t *data_index)
1519 {
1520         uint32_t n, m;
1521         int32_t last_header;
1522
1523         m = 0;
1524         last_header = -1;
1525
1526         for (n = 0; n < config->num_fields; n++) {
1527                 if (last_header != config->defs[n].input_index) {
1528                         last_header = config->defs[n].input_index;
1529                         data_index[m++] = config->defs[n].offset;
1530                 }
1531         }
1532
1533         return m;
1534 }
1535
1536 static struct rte_acl_build_rule *
1537 build_one_trie(struct acl_build_context *context,
1538         struct rte_acl_build_rule *rule_sets[RTE_ACL_MAX_TRIES],
1539         uint32_t n)
1540 {
1541         struct rte_acl_build_rule *last;
1542         struct rte_acl_config *config;
1543
1544         config = rule_sets[n]->config;
1545
1546         acl_rule_stats(rule_sets[n], config);
1547         rule_sets[n] = sort_rules(rule_sets[n]);
1548
1549         context->tries[n].type = RTE_ACL_FULL_TRIE;
1550         context->tries[n].count = 0;
1551
1552         context->tries[n].num_data_indexes = acl_build_index(config,
1553                 context->data_indexes[n]);
1554         context->tries[n].data_index = context->data_indexes[n];
1555
1556         context->bld_tries[n].trie = build_trie(context, rule_sets[n],
1557                 &last, &context->tries[n].count);
1558
1559         return last;
1560 }
1561
1562 static int
1563 acl_build_tries(struct acl_build_context *context,
1564         struct rte_acl_build_rule *head)
1565 {
1566         uint32_t n, num_tries;
1567         struct rte_acl_config *config;
1568         struct rte_acl_build_rule *last;
1569         struct rte_acl_build_rule *rule_sets[RTE_ACL_MAX_TRIES];
1570
1571         config = head->config;
1572         rule_sets[0] = head;
1573
1574         /* initialize tries */
1575         for (n = 0; n < RTE_DIM(context->tries); n++) {
1576                 context->tries[n].type = RTE_ACL_UNUSED_TRIE;
1577                 context->bld_tries[n].trie = NULL;
1578                 context->tries[n].count = 0;
1579         }
1580
1581         context->tries[0].type = RTE_ACL_FULL_TRIE;
1582
1583         /* calc wildness of each field of each rule */
1584         acl_calc_wildness(head, config);
1585
1586         for (n = 0;; n = num_tries) {
1587
1588                 num_tries = n + 1;
1589
1590                 last = build_one_trie(context, rule_sets, n);
1591                 if (context->bld_tries[n].trie == NULL) {
1592                         RTE_LOG(ERR, ACL, "Build of %u-th trie failed\n", n);
1593                         return -ENOMEM;
1594                 }
1595
1596                 /* Build of the last trie completed. */
1597                 if (last == NULL)
1598                         break;
1599
1600                 if (num_tries == RTE_DIM(context->tries)) {
1601                         RTE_LOG(ERR, ACL,
1602                                 "Exceeded max number of tries: %u\n",
1603                                 num_tries);
1604                         return -ENOMEM;
1605                 }
1606
1607                 /* Trie is getting too big, split remaining rule set. */
1608                 rule_sets[num_tries] = last->next;
1609                 last->next = NULL;
1610                 acl_free_node(context, context->bld_tries[n].trie);
1611
1612                 /* Create a new copy of config for remaining rules. */
1613                 config = acl_build_alloc(context, 1, sizeof(*config));
1614                 memcpy(config, rule_sets[n]->config, sizeof(*config));
1615
1616                 /* Make remaining rules use new config. */
1617                 for (head = rule_sets[num_tries]; head != NULL;
1618                                 head = head->next)
1619                         head->config = config;
1620
1621                 /* Rebuild the trie for the reduced rule-set. */
1622                 last = build_one_trie(context, rule_sets, n);
1623                 if (context->bld_tries[n].trie == NULL || last != NULL) {
1624                         RTE_LOG(ERR, ACL, "Build of %u-th trie failed\n", n);
1625                         return -ENOMEM;
1626                 }
1627
1628         }
1629
1630         context->num_tries = num_tries;
1631         return 0;
1632 }
1633
1634 static void
1635 acl_build_log(const struct acl_build_context *ctx)
1636 {
1637         uint32_t n;
1638
1639         RTE_LOG(DEBUG, ACL, "Build phase for ACL \"%s\":\n"
1640                 "node limit for tree split: %u\n"
1641                 "nodes created: %u\n"
1642                 "memory consumed: %zu\n",
1643                 ctx->acx->name,
1644                 ctx->node_max,
1645                 ctx->num_nodes,
1646                 ctx->pool.alloc);
1647
1648         for (n = 0; n < RTE_DIM(ctx->tries); n++) {
1649                 if (ctx->tries[n].count != 0)
1650                         RTE_LOG(DEBUG, ACL,
1651                                 "trie %u: number of rules: %u, indexes: %u\n",
1652                                 n, ctx->tries[n].count,
1653                                 ctx->tries[n].num_data_indexes);
1654         }
1655 }
1656
1657 static int
1658 acl_build_rules(struct acl_build_context *bcx)
1659 {
1660         struct rte_acl_build_rule *br, *head;
1661         const struct rte_acl_rule *rule;
1662         uint32_t *wp;
1663         uint32_t fn, i, n, num;
1664         size_t ofs, sz;
1665
1666         fn = bcx->cfg.num_fields;
1667         n = bcx->acx->num_rules;
1668         ofs = n * sizeof(*br);
1669         sz = ofs + n * fn * sizeof(*wp);
1670
1671         br = tb_alloc(&bcx->pool, sz);
1672
1673         wp = (uint32_t *)((uintptr_t)br + ofs);
1674         num = 0;
1675         head = NULL;
1676
1677         for (i = 0; i != n; i++) {
1678                 rule = (const struct rte_acl_rule *)
1679                         ((uintptr_t)bcx->acx->rules + bcx->acx->rule_sz * i);
1680                 if ((rule->data.category_mask & bcx->category_mask) != 0) {
1681                         br[num].next = head;
1682                         br[num].config = &bcx->cfg;
1683                         br[num].f = rule;
1684                         br[num].wildness = wp;
1685                         wp += fn;
1686                         head = br + num;
1687                         num++;
1688                 }
1689         }
1690
1691         bcx->num_rules = num;
1692         bcx->build_rules = head;
1693
1694         return 0;
1695 }
1696
1697 /*
1698  * Copy data_indexes for each trie into RT location.
1699  */
1700 static void
1701 acl_set_data_indexes(struct rte_acl_ctx *ctx)
1702 {
1703         uint32_t i, n, ofs;
1704
1705         ofs = 0;
1706         for (i = 0; i != ctx->num_tries; i++) {
1707                 n = ctx->trie[i].num_data_indexes;
1708                 memcpy(ctx->data_indexes + ofs, ctx->trie[i].data_index,
1709                         n * sizeof(ctx->data_indexes[0]));
1710                 ctx->trie[i].data_index = ctx->data_indexes + ofs;
1711                 ofs += RTE_ACL_MAX_FIELDS;
1712         }
1713 }
1714
1715 /*
1716  * Internal routine, performs 'build' phase of trie generation:
1717  * - setups build context.
1718  * - analizes given set of rules.
1719  * - builds internal tree(s).
1720  */
1721 static int
1722 acl_bld(struct acl_build_context *bcx, struct rte_acl_ctx *ctx,
1723         const struct rte_acl_config *cfg, uint32_t node_max)
1724 {
1725         int32_t rc;
1726
1727         /* setup build context. */
1728         memset(bcx, 0, sizeof(*bcx));
1729         bcx->acx = ctx;
1730         bcx->pool.alignment = ACL_POOL_ALIGN;
1731         bcx->pool.min_alloc = ACL_POOL_ALLOC_MIN;
1732         bcx->cfg = *cfg;
1733         bcx->category_mask = RTE_LEN2MASK(bcx->cfg.num_categories,
1734                 typeof(bcx->category_mask));
1735         bcx->node_max = node_max;
1736
1737         rc = sigsetjmp(bcx->pool.fail, 0);
1738
1739         /* build phase runs out of memory. */
1740         if (rc != 0) {
1741                 RTE_LOG(ERR, ACL,
1742                         "ACL context: %s, %s() failed with error code: %d\n",
1743                         bcx->acx->name, __func__, rc);
1744                 return rc;
1745         }
1746
1747         /* Create a build rules copy. */
1748         rc = acl_build_rules(bcx);
1749         if (rc != 0)
1750                 return rc;
1751
1752         /* No rules to build for that context+config */
1753         if (bcx->build_rules == NULL) {
1754                 rc = -EINVAL;
1755         } else {
1756                 /* build internal trie representation. */
1757                 rc = acl_build_tries(bcx, bcx->build_rules);
1758         }
1759         return rc;
1760 }
1761
1762 /*
1763  * Check that parameters for acl_build() are valid.
1764  */
1765 static int
1766 acl_check_bld_param(struct rte_acl_ctx *ctx, const struct rte_acl_config *cfg)
1767 {
1768         static const size_t field_sizes[] = {
1769                 sizeof(uint8_t), sizeof(uint16_t),
1770                 sizeof(uint32_t), sizeof(uint64_t),
1771         };
1772
1773         uint32_t i, j;
1774
1775         if (ctx == NULL || cfg == NULL || cfg->num_categories == 0 ||
1776                         cfg->num_categories > RTE_ACL_MAX_CATEGORIES ||
1777                         cfg->num_fields == 0 ||
1778                         cfg->num_fields > RTE_ACL_MAX_FIELDS)
1779                 return -EINVAL;
1780
1781         for (i = 0; i != cfg->num_fields; i++) {
1782                 if (cfg->defs[i].type > RTE_ACL_FIELD_TYPE_BITMASK) {
1783                         RTE_LOG(ERR, ACL,
1784                         "ACL context: %s, invalid type: %hhu for %u-th field\n",
1785                         ctx->name, cfg->defs[i].type, i);
1786                         return -EINVAL;
1787                 }
1788                 for (j = 0;
1789                                 j != RTE_DIM(field_sizes) &&
1790                                 cfg->defs[i].size != field_sizes[j];
1791                                 j++)
1792                         ;
1793
1794                 if (j == RTE_DIM(field_sizes)) {
1795                         RTE_LOG(ERR, ACL,
1796                         "ACL context: %s, invalid size: %hhu for %u-th field\n",
1797                         ctx->name, cfg->defs[i].size, i);
1798                         return -EINVAL;
1799                 }
1800         }
1801
1802         return 0;
1803 }
1804
1805 int
1806 rte_acl_build(struct rte_acl_ctx *ctx, const struct rte_acl_config *cfg)
1807 {
1808         int32_t rc;
1809         uint32_t n;
1810         size_t max_size;
1811         struct acl_build_context bcx;
1812
1813         rc = acl_check_bld_param(ctx, cfg);
1814         if (rc != 0)
1815                 return rc;
1816
1817         acl_build_reset(ctx);
1818
1819         if (cfg->max_size == 0) {
1820                 n = NODE_MIN;
1821                 max_size = SIZE_MAX;
1822         } else {
1823                 n = NODE_MAX;
1824                 max_size = cfg->max_size;
1825         }
1826
1827         for (rc = -ERANGE; n >= NODE_MIN && rc == -ERANGE; n /= 2) {
1828
1829                 /* perform build phase. */
1830                 rc = acl_bld(&bcx, ctx, cfg, n);
1831
1832                 if (rc == 0) {
1833                         /* allocate and fill run-time  structures. */
1834                         rc = rte_acl_gen(ctx, bcx.tries, bcx.bld_tries,
1835                                 bcx.num_tries, bcx.cfg.num_categories,
1836                                 RTE_ACL_MAX_FIELDS * RTE_DIM(bcx.tries) *
1837                                 sizeof(ctx->data_indexes[0]), max_size);
1838                         if (rc == 0) {
1839                                 /* set data indexes. */
1840                                 acl_set_data_indexes(ctx);
1841
1842                                 /* copy in build config. */
1843                                 ctx->config = *cfg;
1844                         }
1845                 }
1846
1847                 acl_build_log(&bcx);
1848
1849                 /* cleanup after build. */
1850                 tb_free_pool(&bcx.pool);
1851         }
1852
1853         return rc;
1854 }