doc: move FAQ
[dpdk.git] / lib / librte_port / rte_port_ras.c
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
5  *   All rights reserved.
6  *
7  *   Redistribution and use in source and binary forms, with or without
8  *   modification, are permitted provided that the following conditions
9  *   are met:
10  *
11  *     * Redistributions of source code must retain the above copyright
12  *       notice, this list of conditions and the following disclaimer.
13  *     * Redistributions in binary form must reproduce the above copyright
14  *       notice, this list of conditions and the following disclaimer in
15  *       the documentation and/or other materials provided with the
16  *       distribution.
17  *     * Neither the name of Intel Corporation nor the names of its
18  *       contributors may be used to endorse or promote products derived
19  *       from this software without specific prior written permission.
20  *
21  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32  */
33 #include <string.h>
34
35 #include <rte_ether.h>
36 #include <rte_ip_frag.h>
37 #include <rte_cycles.h>
38 #include <rte_log.h>
39
40 #include "rte_port_ras.h"
41
42 #ifndef RTE_PORT_RAS_N_BUCKETS
43 #define RTE_PORT_RAS_N_BUCKETS                                 4094
44 #endif
45
46 #ifndef RTE_PORT_RAS_N_ENTRIES_PER_BUCKET
47 #define RTE_PORT_RAS_N_ENTRIES_PER_BUCKET                      8
48 #endif
49
50 #ifndef RTE_PORT_RAS_N_ENTRIES
51 #define RTE_PORT_RAS_N_ENTRIES (RTE_PORT_RAS_N_BUCKETS * RTE_PORT_RAS_N_ENTRIES_PER_BUCKET)
52 #endif
53
54 #ifdef RTE_PORT_STATS_COLLECT
55
56 #define RTE_PORT_RING_WRITER_RAS_STATS_PKTS_IN_ADD(port, val) \
57         port->stats.n_pkts_in += val
58 #define RTE_PORT_RING_WRITER_RAS_STATS_PKTS_DROP_ADD(port, val) \
59         port->stats.n_pkts_drop += val
60
61 #else
62
63 #define RTE_PORT_RING_WRITER_RAS_STATS_PKTS_IN_ADD(port, val)
64 #define RTE_PORT_RING_WRITER_RAS_STATS_PKTS_DROP_ADD(port, val)
65
66 #endif
67
68 struct rte_port_ring_writer_ras;
69
70 typedef void (*ras_op)(
71                 struct rte_port_ring_writer_ras *p,
72                 struct rte_mbuf *pkt);
73
74 static void
75 process_ipv4(struct rte_port_ring_writer_ras *p, struct rte_mbuf *pkt);
76 static void
77 process_ipv6(struct rte_port_ring_writer_ras *p, struct rte_mbuf *pkt);
78
79 struct rte_port_ring_writer_ras {
80         struct rte_port_out_stats stats;
81
82         struct rte_mbuf *tx_buf[RTE_PORT_IN_BURST_SIZE_MAX];
83         struct rte_ring *ring;
84         uint32_t tx_burst_sz;
85         uint32_t tx_buf_count;
86         struct rte_ip_frag_tbl *frag_tbl;
87         struct rte_ip_frag_death_row death_row;
88
89         ras_op f_ras;
90 };
91
92 static void *
93 rte_port_ring_writer_ras_create(void *params, int socket_id, int is_ipv4)
94 {
95         struct rte_port_ring_writer_ras_params *conf =
96                         (struct rte_port_ring_writer_ras_params *) params;
97         struct rte_port_ring_writer_ras *port;
98         uint64_t frag_cycles;
99
100         /* Check input parameters */
101         if (conf == NULL) {
102                 RTE_LOG(ERR, PORT, "%s: Parameter conf is NULL\n", __func__);
103                 return NULL;
104         }
105         if (conf->ring == NULL) {
106                 RTE_LOG(ERR, PORT, "%s: Parameter ring is NULL\n", __func__);
107                 return NULL;
108         }
109         if ((conf->tx_burst_sz == 0) ||
110             (conf->tx_burst_sz > RTE_PORT_IN_BURST_SIZE_MAX)) {
111                 RTE_LOG(ERR, PORT, "%s: Parameter tx_burst_sz is invalid\n",
112                         __func__);
113                 return NULL;
114         }
115
116         /* Memory allocation */
117         port = rte_zmalloc_socket("PORT", sizeof(*port),
118                         RTE_CACHE_LINE_SIZE, socket_id);
119         if (port == NULL) {
120                 RTE_LOG(ERR, PORT, "%s: Failed to allocate socket\n", __func__);
121                 return NULL;
122         }
123
124         /* Create fragmentation table */
125         frag_cycles = (rte_get_tsc_hz() + MS_PER_S - 1) / MS_PER_S * MS_PER_S;
126         frag_cycles *= 100;
127
128         port->frag_tbl = rte_ip_frag_table_create(
129                 RTE_PORT_RAS_N_BUCKETS,
130                 RTE_PORT_RAS_N_ENTRIES_PER_BUCKET,
131                 RTE_PORT_RAS_N_ENTRIES,
132                 frag_cycles,
133                 socket_id);
134
135         if (port->frag_tbl == NULL) {
136                 RTE_LOG(ERR, PORT, "%s: rte_ip_frag_table_create failed\n",
137                         __func__);
138                 rte_free(port);
139                 return NULL;
140         }
141
142         /* Initialization */
143         port->ring = conf->ring;
144         port->tx_burst_sz = conf->tx_burst_sz;
145         port->tx_buf_count = 0;
146
147         port->f_ras = (is_ipv4 == 0) ? process_ipv4 : process_ipv6;
148
149         return port;
150 }
151
152 static void *
153 rte_port_ring_writer_ipv4_ras_create(void *params, int socket_id)
154 {
155         return rte_port_ring_writer_ras_create(params, socket_id, 1);
156 }
157
158 static void *
159 rte_port_ring_writer_ipv6_ras_create(void *params, int socket_id)
160 {
161         return rte_port_ring_writer_ras_create(params, socket_id, 0);
162 }
163
164 static inline void
165 send_burst(struct rte_port_ring_writer_ras *p)
166 {
167         uint32_t nb_tx;
168
169         nb_tx = rte_ring_sp_enqueue_burst(p->ring, (void **)p->tx_buf,
170                         p->tx_buf_count);
171
172         RTE_PORT_RING_WRITER_RAS_STATS_PKTS_DROP_ADD(p, p->tx_buf_count - nb_tx);
173         for ( ; nb_tx < p->tx_buf_count; nb_tx++)
174                 rte_pktmbuf_free(p->tx_buf[nb_tx]);
175
176         p->tx_buf_count = 0;
177 }
178
179 static void
180 process_ipv4(struct rte_port_ring_writer_ras *p, struct rte_mbuf *pkt)
181 {
182         /* Assume there is no ethernet header */
183         struct ipv4_hdr *pkt_hdr = rte_pktmbuf_mtod(pkt, struct ipv4_hdr *);
184
185         /* Get "Do not fragment" flag and fragment offset */
186         uint16_t frag_field = rte_be_to_cpu_16(pkt_hdr->fragment_offset);
187         uint16_t frag_offset = (uint16_t)(frag_field & IPV4_HDR_OFFSET_MASK);
188         uint16_t frag_flag = (uint16_t)(frag_field & IPV4_HDR_MF_FLAG);
189
190         /* If it is a fragmented packet, then try to reassemble */
191         if ((frag_flag == 0) && (frag_offset == 0))
192                 p->tx_buf[p->tx_buf_count++] = pkt;
193         else {
194                 struct rte_mbuf *mo;
195                 struct rte_ip_frag_tbl *tbl = p->frag_tbl;
196                 struct rte_ip_frag_death_row *dr = &p->death_row;
197
198                 /* Process this fragment */
199                 mo = rte_ipv4_frag_reassemble_packet(tbl, dr, pkt, rte_rdtsc(),
200                                 pkt_hdr);
201                 if (mo != NULL)
202                         p->tx_buf[p->tx_buf_count++] = mo;
203
204                 rte_ip_frag_free_death_row(&p->death_row, 3);
205         }
206 }
207
208 static void
209 process_ipv6(struct rte_port_ring_writer_ras *p, struct rte_mbuf *pkt)
210 {
211         /* Assume there is no ethernet header */
212         struct ipv6_hdr *pkt_hdr = rte_pktmbuf_mtod(pkt, struct ipv6_hdr *);
213
214         struct ipv6_extension_fragment *frag_hdr;
215         frag_hdr = rte_ipv6_frag_get_ipv6_fragment_header(pkt_hdr);
216         uint16_t frag_offset = frag_hdr->frag_offset;
217         uint16_t frag_flag = frag_hdr->more_frags;
218
219         /* If it is a fragmented packet, then try to reassemble */
220         if ((frag_flag == 0) && (frag_offset == 0))
221                 p->tx_buf[p->tx_buf_count++] = pkt;
222         else {
223                 struct rte_mbuf *mo;
224                 struct rte_ip_frag_tbl *tbl = p->frag_tbl;
225                 struct rte_ip_frag_death_row *dr = &p->death_row;
226
227                 /* Process this fragment */
228                 mo = rte_ipv6_frag_reassemble_packet(tbl, dr, pkt, rte_rdtsc(), pkt_hdr,
229                                 frag_hdr);
230                 if (mo != NULL)
231                         p->tx_buf[p->tx_buf_count++] = mo;
232
233                 rte_ip_frag_free_death_row(&p->death_row, 3);
234         }
235 }
236
237 static int
238 rte_port_ring_writer_ras_tx(void *port, struct rte_mbuf *pkt)
239 {
240         struct rte_port_ring_writer_ras *p =
241                         (struct rte_port_ring_writer_ras *) port;
242
243         RTE_PORT_RING_WRITER_RAS_STATS_PKTS_IN_ADD(p, 1);
244         p->f_ras(p, pkt);
245         if (p->tx_buf_count >= p->tx_burst_sz)
246                 send_burst(p);
247
248         return 0;
249 }
250
251 static int
252 rte_port_ring_writer_ras_tx_bulk(void *port,
253                 struct rte_mbuf **pkts,
254                 uint64_t pkts_mask)
255 {
256         struct rte_port_ring_writer_ras *p =
257                         (struct rte_port_ring_writer_ras *) port;
258
259         if ((pkts_mask & (pkts_mask + 1)) == 0) {
260                 uint64_t n_pkts = __builtin_popcountll(pkts_mask);
261                 uint32_t i;
262
263                 for (i = 0; i < n_pkts; i++) {
264                         struct rte_mbuf *pkt = pkts[i];
265
266                         RTE_PORT_RING_WRITER_RAS_STATS_PKTS_IN_ADD(p, 1);
267                         p->f_ras(p, pkt);
268                         if (p->tx_buf_count >= p->tx_burst_sz)
269                                 send_burst(p);
270                 }
271         } else {
272                 for ( ; pkts_mask; ) {
273                         uint32_t pkt_index = __builtin_ctzll(pkts_mask);
274                         uint64_t pkt_mask = 1LLU << pkt_index;
275                         struct rte_mbuf *pkt = pkts[pkt_index];
276
277                         RTE_PORT_RING_WRITER_RAS_STATS_PKTS_IN_ADD(p, 1);
278                         p->f_ras(p, pkt);
279                         if (p->tx_buf_count >= p->tx_burst_sz)
280                                 send_burst(p);
281
282                         pkts_mask &= ~pkt_mask;
283                 }
284         }
285
286         return 0;
287 }
288
289 static int
290 rte_port_ring_writer_ras_flush(void *port)
291 {
292         struct rte_port_ring_writer_ras *p =
293                         (struct rte_port_ring_writer_ras *) port;
294
295         if (p->tx_buf_count > 0)
296                 send_burst(p);
297
298         return 0;
299 }
300
301 static int
302 rte_port_ring_writer_ras_free(void *port)
303 {
304         struct rte_port_ring_writer_ras *p =
305                         (struct rte_port_ring_writer_ras *) port;
306
307         if (port == NULL) {
308                 RTE_LOG(ERR, PORT, "%s: Parameter port is NULL\n", __func__);
309                 return -1;
310         }
311
312         rte_port_ring_writer_ras_flush(port);
313         rte_ip_frag_table_destroy(p->frag_tbl);
314         rte_free(port);
315
316         return 0;
317 }
318
319 static int
320 rte_port_ras_writer_stats_read(void *port,
321                 struct rte_port_out_stats *stats, int clear)
322 {
323         struct rte_port_ring_writer_ras *p =
324                 (struct rte_port_ring_writer_ras *) port;
325
326         if (stats != NULL)
327                 memcpy(stats, &p->stats, sizeof(p->stats));
328
329         if (clear)
330                 memset(&p->stats, 0, sizeof(p->stats));
331
332         return 0;
333 }
334
335 /*
336  * Summary of port operations
337  */
338 struct rte_port_out_ops rte_port_ring_writer_ipv4_ras_ops = {
339         .f_create = rte_port_ring_writer_ipv4_ras_create,
340         .f_free = rte_port_ring_writer_ras_free,
341         .f_tx = rte_port_ring_writer_ras_tx,
342         .f_tx_bulk = rte_port_ring_writer_ras_tx_bulk,
343         .f_flush = rte_port_ring_writer_ras_flush,
344         .f_stats = rte_port_ras_writer_stats_read,
345 };
346
347 struct rte_port_out_ops rte_port_ring_writer_ipv6_ras_ops = {
348         .f_create = rte_port_ring_writer_ipv6_ras_create,
349         .f_free = rte_port_ring_writer_ras_free,
350         .f_tx = rte_port_ring_writer_ras_tx,
351         .f_tx_bulk = rte_port_ring_writer_ras_tx_bulk,
352         .f_flush = rte_port_ring_writer_ras_flush,
353         .f_stats = rte_port_ras_writer_stats_read,
354 };