net/cnxk: add multi-segment Tx for CN10K
[dpdk.git] / drivers / net / cnxk / cn10k_tx.h
1 /* SPDX-License-Identifier: BSD-3-Clause
2  * Copyright(C) 2021 Marvell.
3  */
4 #ifndef __CN10K_TX_H__
5 #define __CN10K_TX_H__
6
7 #define NIX_TX_OFFLOAD_NONE           (0)
8 #define NIX_TX_OFFLOAD_L3_L4_CSUM_F   BIT(0)
9 #define NIX_TX_OFFLOAD_OL3_OL4_CSUM_F BIT(1)
10 #define NIX_TX_OFFLOAD_VLAN_QINQ_F    BIT(2)
11 #define NIX_TX_OFFLOAD_MBUF_NOFF_F    BIT(3)
12 #define NIX_TX_OFFLOAD_TSO_F          BIT(4)
13
14 /* Flags to control xmit_prepare function.
15  * Defining it from backwards to denote its been
16  * not used as offload flags to pick function
17  */
18 #define NIX_TX_MULTI_SEG_F BIT(15)
19
20 #define NIX_TX_NEED_SEND_HDR_W1                                                \
21         (NIX_TX_OFFLOAD_L3_L4_CSUM_F | NIX_TX_OFFLOAD_OL3_OL4_CSUM_F |         \
22          NIX_TX_OFFLOAD_VLAN_QINQ_F | NIX_TX_OFFLOAD_TSO_F)
23
24 #define NIX_TX_NEED_EXT_HDR                                                    \
25         (NIX_TX_OFFLOAD_VLAN_QINQ_F | NIX_TX_OFFLOAD_TSO_F)
26
27 #define NIX_XMIT_FC_OR_RETURN(txq, pkts)                                       \
28         do {                                                                   \
29                 /* Cached value is low, Update the fc_cache_pkts */            \
30                 if (unlikely((txq)->fc_cache_pkts < (pkts))) {                 \
31                         /* Multiply with sqe_per_sqb to express in pkts */     \
32                         (txq)->fc_cache_pkts =                                 \
33                                 ((txq)->nb_sqb_bufs_adj - *(txq)->fc_mem)      \
34                                 << (txq)->sqes_per_sqb_log2;                   \
35                         /* Check it again for the room */                      \
36                         if (unlikely((txq)->fc_cache_pkts < (pkts)))           \
37                                 return 0;                                      \
38                 }                                                              \
39         } while (0)
40
41 /* Function to determine no of tx subdesc required in case ext
42  * sub desc is enabled.
43  */
44 static __rte_always_inline int
45 cn10k_nix_tx_ext_subs(const uint16_t flags)
46 {
47         return (flags &
48                 (NIX_TX_OFFLOAD_VLAN_QINQ_F | NIX_TX_OFFLOAD_TSO_F)) ? 1 : 0;
49 }
50
51 static __rte_always_inline uint64_t
52 cn10k_nix_tx_steor_data(const uint16_t flags)
53 {
54         const uint64_t dw_m1 = cn10k_nix_tx_ext_subs(flags) + 1;
55         uint64_t data;
56
57         /* This will be moved to addr area */
58         data = dw_m1;
59         /* 15 vector sizes for single seg */
60         data |= dw_m1 << 19;
61         data |= dw_m1 << 22;
62         data |= dw_m1 << 25;
63         data |= dw_m1 << 28;
64         data |= dw_m1 << 31;
65         data |= dw_m1 << 34;
66         data |= dw_m1 << 37;
67         data |= dw_m1 << 40;
68         data |= dw_m1 << 43;
69         data |= dw_m1 << 46;
70         data |= dw_m1 << 49;
71         data |= dw_m1 << 52;
72         data |= dw_m1 << 55;
73         data |= dw_m1 << 58;
74         data |= dw_m1 << 61;
75
76         return data;
77 }
78
79 static __rte_always_inline void
80 cn10k_nix_tx_skeleton(const struct cn10k_eth_txq *txq, uint64_t *cmd,
81                       const uint16_t flags)
82 {
83         /* Send hdr */
84         cmd[0] = txq->send_hdr_w0;
85         cmd[1] = 0;
86         cmd += 2;
87
88         /* Send ext if present */
89         if (flags & NIX_TX_NEED_EXT_HDR) {
90                 *(__uint128_t *)cmd = *(const __uint128_t *)txq->cmd;
91                 cmd += 2;
92         }
93
94         /* Send sg */
95         cmd[0] = txq->sg_w0;
96         cmd[1] = 0;
97 }
98
99 static __rte_always_inline void
100 cn10k_nix_xmit_prepare_tso(struct rte_mbuf *m, const uint64_t flags)
101 {
102         uint64_t mask, ol_flags = m->ol_flags;
103
104         if (flags & NIX_TX_OFFLOAD_TSO_F && (ol_flags & PKT_TX_TCP_SEG)) {
105                 uintptr_t mdata = rte_pktmbuf_mtod(m, uintptr_t);
106                 uint16_t *iplen, *oiplen, *oudplen;
107                 uint16_t lso_sb, paylen;
108
109                 mask = -!!(ol_flags & (PKT_TX_OUTER_IPV4 | PKT_TX_OUTER_IPV6));
110                 lso_sb = (mask & (m->outer_l2_len + m->outer_l3_len)) +
111                          m->l2_len + m->l3_len + m->l4_len;
112
113                 /* Reduce payload len from base headers */
114                 paylen = m->pkt_len - lso_sb;
115
116                 /* Get iplen position assuming no tunnel hdr */
117                 iplen = (uint16_t *)(mdata + m->l2_len +
118                                      (2 << !!(ol_flags & PKT_TX_IPV6)));
119                 /* Handle tunnel tso */
120                 if ((flags & NIX_TX_OFFLOAD_OL3_OL4_CSUM_F) &&
121                     (ol_flags & PKT_TX_TUNNEL_MASK)) {
122                         const uint8_t is_udp_tun =
123                                 (CNXK_NIX_UDP_TUN_BITMASK >>
124                                  ((ol_flags & PKT_TX_TUNNEL_MASK) >> 45)) &
125                                 0x1;
126
127                         oiplen = (uint16_t *)(mdata + m->outer_l2_len +
128                                               (2 << !!(ol_flags &
129                                                        PKT_TX_OUTER_IPV6)));
130                         *oiplen = rte_cpu_to_be_16(rte_be_to_cpu_16(*oiplen) -
131                                                    paylen);
132
133                         /* Update format for UDP tunneled packet */
134                         if (is_udp_tun) {
135                                 oudplen = (uint16_t *)(mdata + m->outer_l2_len +
136                                                        m->outer_l3_len + 4);
137                                 *oudplen = rte_cpu_to_be_16(
138                                         rte_be_to_cpu_16(*oudplen) - paylen);
139                         }
140
141                         /* Update iplen position to inner ip hdr */
142                         iplen = (uint16_t *)(mdata + lso_sb - m->l3_len -
143                                              m->l4_len +
144                                              (2 << !!(ol_flags & PKT_TX_IPV6)));
145                 }
146
147                 *iplen = rte_cpu_to_be_16(rte_be_to_cpu_16(*iplen) - paylen);
148         }
149 }
150
151 static __rte_always_inline void
152 cn10k_nix_xmit_prepare(struct rte_mbuf *m, uint64_t *cmd, uintptr_t lmt_addr,
153                        const uint16_t flags, const uint64_t lso_tun_fmt)
154 {
155         struct nix_send_ext_s *send_hdr_ext;
156         struct nix_send_hdr_s *send_hdr;
157         uint64_t ol_flags = 0, mask;
158         union nix_send_hdr_w1_u w1;
159         union nix_send_sg_s *sg;
160
161         send_hdr = (struct nix_send_hdr_s *)cmd;
162         if (flags & NIX_TX_NEED_EXT_HDR) {
163                 send_hdr_ext = (struct nix_send_ext_s *)(cmd + 2);
164                 sg = (union nix_send_sg_s *)(cmd + 4);
165                 /* Clear previous markings */
166                 send_hdr_ext->w0.lso = 0;
167                 send_hdr_ext->w1.u = 0;
168         } else {
169                 sg = (union nix_send_sg_s *)(cmd + 2);
170         }
171
172         if (flags & NIX_TX_NEED_SEND_HDR_W1) {
173                 ol_flags = m->ol_flags;
174                 w1.u = 0;
175         }
176
177         if (!(flags & NIX_TX_MULTI_SEG_F)) {
178                 send_hdr->w0.total = m->data_len;
179                 send_hdr->w0.aura =
180                         roc_npa_aura_handle_to_aura(m->pool->pool_id);
181         }
182
183         /*
184          * L3type:  2 => IPV4
185          *          3 => IPV4 with csum
186          *          4 => IPV6
187          * L3type and L3ptr needs to be set for either
188          * L3 csum or L4 csum or LSO
189          *
190          */
191
192         if ((flags & NIX_TX_OFFLOAD_OL3_OL4_CSUM_F) &&
193             (flags & NIX_TX_OFFLOAD_L3_L4_CSUM_F)) {
194                 const uint8_t csum = !!(ol_flags & PKT_TX_OUTER_UDP_CKSUM);
195                 const uint8_t ol3type =
196                         ((!!(ol_flags & PKT_TX_OUTER_IPV4)) << 1) +
197                         ((!!(ol_flags & PKT_TX_OUTER_IPV6)) << 2) +
198                         !!(ol_flags & PKT_TX_OUTER_IP_CKSUM);
199
200                 /* Outer L3 */
201                 w1.ol3type = ol3type;
202                 mask = 0xffffull << ((!!ol3type) << 4);
203                 w1.ol3ptr = ~mask & m->outer_l2_len;
204                 w1.ol4ptr = ~mask & (w1.ol3ptr + m->outer_l3_len);
205
206                 /* Outer L4 */
207                 w1.ol4type = csum + (csum << 1);
208
209                 /* Inner L3 */
210                 w1.il3type = ((!!(ol_flags & PKT_TX_IPV4)) << 1) +
211                              ((!!(ol_flags & PKT_TX_IPV6)) << 2);
212                 w1.il3ptr = w1.ol4ptr + m->l2_len;
213                 w1.il4ptr = w1.il3ptr + m->l3_len;
214                 /* Increment it by 1 if it is IPV4 as 3 is with csum */
215                 w1.il3type = w1.il3type + !!(ol_flags & PKT_TX_IP_CKSUM);
216
217                 /* Inner L4 */
218                 w1.il4type = (ol_flags & PKT_TX_L4_MASK) >> 52;
219
220                 /* In case of no tunnel header use only
221                  * shift IL3/IL4 fields a bit to use
222                  * OL3/OL4 for header checksum
223                  */
224                 mask = !ol3type;
225                 w1.u = ((w1.u & 0xFFFFFFFF00000000) >> (mask << 3)) |
226                        ((w1.u & 0X00000000FFFFFFFF) >> (mask << 4));
227
228         } else if (flags & NIX_TX_OFFLOAD_OL3_OL4_CSUM_F) {
229                 const uint8_t csum = !!(ol_flags & PKT_TX_OUTER_UDP_CKSUM);
230                 const uint8_t outer_l2_len = m->outer_l2_len;
231
232                 /* Outer L3 */
233                 w1.ol3ptr = outer_l2_len;
234                 w1.ol4ptr = outer_l2_len + m->outer_l3_len;
235                 /* Increment it by 1 if it is IPV4 as 3 is with csum */
236                 w1.ol3type = ((!!(ol_flags & PKT_TX_OUTER_IPV4)) << 1) +
237                              ((!!(ol_flags & PKT_TX_OUTER_IPV6)) << 2) +
238                              !!(ol_flags & PKT_TX_OUTER_IP_CKSUM);
239
240                 /* Outer L4 */
241                 w1.ol4type = csum + (csum << 1);
242
243         } else if (flags & NIX_TX_OFFLOAD_L3_L4_CSUM_F) {
244                 const uint8_t l2_len = m->l2_len;
245
246                 /* Always use OLXPTR and OLXTYPE when only
247                  * when one header is present
248                  */
249
250                 /* Inner L3 */
251                 w1.ol3ptr = l2_len;
252                 w1.ol4ptr = l2_len + m->l3_len;
253                 /* Increment it by 1 if it is IPV4 as 3 is with csum */
254                 w1.ol3type = ((!!(ol_flags & PKT_TX_IPV4)) << 1) +
255                              ((!!(ol_flags & PKT_TX_IPV6)) << 2) +
256                              !!(ol_flags & PKT_TX_IP_CKSUM);
257
258                 /* Inner L4 */
259                 w1.ol4type = (ol_flags & PKT_TX_L4_MASK) >> 52;
260         }
261
262         if (flags & NIX_TX_NEED_EXT_HDR && flags & NIX_TX_OFFLOAD_VLAN_QINQ_F) {
263                 send_hdr_ext->w1.vlan1_ins_ena = !!(ol_flags & PKT_TX_VLAN);
264                 /* HW will update ptr after vlan0 update */
265                 send_hdr_ext->w1.vlan1_ins_ptr = 12;
266                 send_hdr_ext->w1.vlan1_ins_tci = m->vlan_tci;
267
268                 send_hdr_ext->w1.vlan0_ins_ena = !!(ol_flags & PKT_TX_QINQ);
269                 /* 2B before end of l2 header */
270                 send_hdr_ext->w1.vlan0_ins_ptr = 12;
271                 send_hdr_ext->w1.vlan0_ins_tci = m->vlan_tci_outer;
272         }
273
274         if (flags & NIX_TX_OFFLOAD_TSO_F && (ol_flags & PKT_TX_TCP_SEG)) {
275                 uint16_t lso_sb;
276                 uint64_t mask;
277
278                 mask = -(!w1.il3type);
279                 lso_sb = (mask & w1.ol4ptr) + (~mask & w1.il4ptr) + m->l4_len;
280
281                 send_hdr_ext->w0.lso_sb = lso_sb;
282                 send_hdr_ext->w0.lso = 1;
283                 send_hdr_ext->w0.lso_mps = m->tso_segsz;
284                 send_hdr_ext->w0.lso_format =
285                         NIX_LSO_FORMAT_IDX_TSOV4 + !!(ol_flags & PKT_TX_IPV6);
286                 w1.ol4type = NIX_SENDL4TYPE_TCP_CKSUM;
287
288                 /* Handle tunnel tso */
289                 if ((flags & NIX_TX_OFFLOAD_OL3_OL4_CSUM_F) &&
290                     (ol_flags & PKT_TX_TUNNEL_MASK)) {
291                         const uint8_t is_udp_tun =
292                                 (CNXK_NIX_UDP_TUN_BITMASK >>
293                                  ((ol_flags & PKT_TX_TUNNEL_MASK) >> 45)) &
294                                 0x1;
295                         uint8_t shift = is_udp_tun ? 32 : 0;
296
297                         shift += (!!(ol_flags & PKT_TX_OUTER_IPV6) << 4);
298                         shift += (!!(ol_flags & PKT_TX_IPV6) << 3);
299
300                         w1.il4type = NIX_SENDL4TYPE_TCP_CKSUM;
301                         w1.ol4type = is_udp_tun ? NIX_SENDL4TYPE_UDP_CKSUM : 0;
302                         /* Update format for UDP tunneled packet */
303                         send_hdr_ext->w0.lso_format = (lso_tun_fmt >> shift);
304                 }
305         }
306
307         if (flags & NIX_TX_NEED_SEND_HDR_W1)
308                 send_hdr->w1.u = w1.u;
309
310         if (!(flags & NIX_TX_MULTI_SEG_F)) {
311                 sg->seg1_size = m->data_len;
312                 *(rte_iova_t *)(sg + 1) = rte_mbuf_data_iova(m);
313
314                 if (flags & NIX_TX_OFFLOAD_MBUF_NOFF_F) {
315                         /* DF bit = 1 if refcount of current mbuf or parent mbuf
316                          *              is greater than 1
317                          * DF bit = 0 otherwise
318                          */
319                         send_hdr->w0.df = cnxk_nix_prefree_seg(m);
320                 }
321                 /* Mark mempool object as "put" since it is freed by NIX */
322                 if (!send_hdr->w0.df)
323                         __mempool_check_cookies(m->pool, (void **)&m, 1, 0);
324         }
325
326         /* With minimal offloads, 'cmd' being local could be optimized out to
327          * registers. In other cases, 'cmd' will be in stack. Intent is
328          * 'cmd' stores content from txq->cmd which is copied only once.
329          */
330         *((struct nix_send_hdr_s *)lmt_addr) = *send_hdr;
331         lmt_addr += 16;
332         if (flags & NIX_TX_NEED_EXT_HDR) {
333                 *((struct nix_send_ext_s *)lmt_addr) = *send_hdr_ext;
334                 lmt_addr += 16;
335         }
336         /* In case of multi-seg, sg template is stored here */
337         *((union nix_send_sg_s *)lmt_addr) = *sg;
338         *(rte_iova_t *)(lmt_addr + 8) = *(rte_iova_t *)(sg + 1);
339 }
340
341 static __rte_always_inline uint16_t
342 cn10k_nix_prepare_mseg(struct rte_mbuf *m, uint64_t *cmd, const uint16_t flags)
343 {
344         struct nix_send_hdr_s *send_hdr;
345         union nix_send_sg_s *sg;
346         struct rte_mbuf *m_next;
347         uint64_t *slist, sg_u;
348         uint64_t nb_segs;
349         uint64_t segdw;
350         uint8_t off, i;
351
352         send_hdr = (struct nix_send_hdr_s *)cmd;
353         send_hdr->w0.total = m->pkt_len;
354         send_hdr->w0.aura = roc_npa_aura_handle_to_aura(m->pool->pool_id);
355
356         if (flags & NIX_TX_NEED_EXT_HDR)
357                 off = 2;
358         else
359                 off = 0;
360
361         sg = (union nix_send_sg_s *)&cmd[2 + off];
362         /* Clear sg->u header before use */
363         sg->u &= 0xFC00000000000000;
364         sg_u = sg->u;
365         slist = &cmd[3 + off];
366
367         i = 0;
368         nb_segs = m->nb_segs;
369
370         /* Fill mbuf segments */
371         do {
372                 m_next = m->next;
373                 sg_u = sg_u | ((uint64_t)m->data_len << (i << 4));
374                 *slist = rte_mbuf_data_iova(m);
375                 /* Set invert df if buffer is not to be freed by H/W */
376                 if (flags & NIX_TX_OFFLOAD_MBUF_NOFF_F)
377                         sg_u |= (cnxk_nix_prefree_seg(m) << (i + 55));
378                         /* Mark mempool object as "put" since it is freed by NIX
379                          */
380 #ifdef RTE_LIBRTE_MEMPOOL_DEBUG
381                 if (!(sg_u & (1ULL << (i + 55))))
382                         __mempool_check_cookies(m->pool, (void **)&m, 1, 0);
383 #endif
384                 slist++;
385                 i++;
386                 nb_segs--;
387                 if (i > 2 && nb_segs) {
388                         i = 0;
389                         /* Next SG subdesc */
390                         *(uint64_t *)slist = sg_u & 0xFC00000000000000;
391                         sg->u = sg_u;
392                         sg->segs = 3;
393                         sg = (union nix_send_sg_s *)slist;
394                         sg_u = sg->u;
395                         slist++;
396                 }
397                 m = m_next;
398         } while (nb_segs);
399
400         sg->u = sg_u;
401         sg->segs = i;
402         segdw = (uint64_t *)slist - (uint64_t *)&cmd[2 + off];
403         /* Roundup extra dwords to multiple of 2 */
404         segdw = (segdw >> 1) + (segdw & 0x1);
405         /* Default dwords */
406         segdw += (off >> 1) + 1;
407         send_hdr->w0.sizem1 = segdw - 1;
408
409         return segdw;
410 }
411
412 static __rte_always_inline uint16_t
413 cn10k_nix_xmit_pkts(void *tx_queue, struct rte_mbuf **tx_pkts, uint16_t pkts,
414                     uint64_t *cmd, const uint16_t flags)
415 {
416         struct cn10k_eth_txq *txq = tx_queue;
417         const rte_iova_t io_addr = txq->io_addr;
418         uintptr_t pa, lmt_addr = txq->lmt_base;
419         uint16_t lmt_id, burst, left, i;
420         uint64_t lso_tun_fmt;
421         uint64_t data;
422
423         NIX_XMIT_FC_OR_RETURN(txq, pkts);
424
425         /* Get cmd skeleton */
426         cn10k_nix_tx_skeleton(txq, cmd, flags);
427
428         /* Reduce the cached count */
429         txq->fc_cache_pkts -= pkts;
430
431         if (flags & NIX_TX_OFFLOAD_TSO_F)
432                 lso_tun_fmt = txq->lso_tun_fmt;
433
434         /* Get LMT base address and LMT ID as lcore id */
435         ROC_LMT_BASE_ID_GET(lmt_addr, lmt_id);
436         left = pkts;
437 again:
438         burst = left > 32 ? 32 : left;
439         for (i = 0; i < burst; i++) {
440                 /* Perform header writes for TSO, barrier at
441                  * lmt steorl will suffice.
442                  */
443                 if (flags & NIX_TX_OFFLOAD_TSO_F)
444                         cn10k_nix_xmit_prepare_tso(tx_pkts[i], flags);
445
446                 cn10k_nix_xmit_prepare(tx_pkts[i], cmd, lmt_addr, flags,
447                                        lso_tun_fmt);
448                 lmt_addr += (1ULL << ROC_LMT_LINE_SIZE_LOG2);
449         }
450
451         /* Trigger LMTST */
452         if (burst > 16) {
453                 data = cn10k_nix_tx_steor_data(flags);
454                 pa = io_addr | (data & 0x7) << 4;
455                 data &= ~0x7ULL;
456                 data |= (15ULL << 12);
457                 data |= (uint64_t)lmt_id;
458
459                 /* STEOR0 */
460                 roc_lmt_submit_steorl(data, pa);
461
462                 data = cn10k_nix_tx_steor_data(flags);
463                 pa = io_addr | (data & 0x7) << 4;
464                 data &= ~0x7ULL;
465                 data |= ((uint64_t)(burst - 17)) << 12;
466                 data |= (uint64_t)(lmt_id + 16);
467
468                 /* STEOR1 */
469                 roc_lmt_submit_steorl(data, pa);
470         } else if (burst) {
471                 data = cn10k_nix_tx_steor_data(flags);
472                 pa = io_addr | (data & 0x7) << 4;
473                 data &= ~0x7ULL;
474                 data |= ((uint64_t)(burst - 1)) << 12;
475                 data |= lmt_id;
476
477                 /* STEOR0 */
478                 roc_lmt_submit_steorl(data, pa);
479         }
480
481         left -= burst;
482         rte_io_wmb();
483         if (left) {
484                 /* Start processing another burst */
485                 tx_pkts += burst;
486                 /* Reset lmt base addr */
487                 lmt_addr -= (1ULL << ROC_LMT_LINE_SIZE_LOG2);
488                 lmt_addr &= (~(BIT_ULL(ROC_LMT_BASE_PER_CORE_LOG2) - 1));
489                 goto again;
490         }
491
492         return pkts;
493 }
494
495 static __rte_always_inline uint16_t
496 cn10k_nix_xmit_pkts_mseg(void *tx_queue, struct rte_mbuf **tx_pkts,
497                          uint16_t pkts, uint64_t *cmd, const uint16_t flags)
498 {
499         struct cn10k_eth_txq *txq = tx_queue;
500         uintptr_t pa0, pa1, lmt_addr = txq->lmt_base;
501         const rte_iova_t io_addr = txq->io_addr;
502         uint16_t segdw, lmt_id, burst, left, i;
503         uint64_t data0, data1;
504         uint64_t lso_tun_fmt;
505         __uint128_t data128;
506         uint16_t shft;
507
508         NIX_XMIT_FC_OR_RETURN(txq, pkts);
509
510         cn10k_nix_tx_skeleton(txq, cmd, flags);
511
512         /* Reduce the cached count */
513         txq->fc_cache_pkts -= pkts;
514
515         if (flags & NIX_TX_OFFLOAD_TSO_F)
516                 lso_tun_fmt = txq->lso_tun_fmt;
517
518         /* Get LMT base address and LMT ID as lcore id */
519         ROC_LMT_BASE_ID_GET(lmt_addr, lmt_id);
520         left = pkts;
521 again:
522         burst = left > 32 ? 32 : left;
523         shft = 16;
524         data128 = 0;
525         for (i = 0; i < burst; i++) {
526                 /* Perform header writes for TSO, barrier at
527                  * lmt steorl will suffice.
528                  */
529                 if (flags & NIX_TX_OFFLOAD_TSO_F)
530                         cn10k_nix_xmit_prepare_tso(tx_pkts[i], flags);
531
532                 cn10k_nix_xmit_prepare(tx_pkts[i], cmd, lmt_addr, flags,
533                                        lso_tun_fmt);
534                 /* Store sg list directly on lmt line */
535                 segdw = cn10k_nix_prepare_mseg(tx_pkts[i], (uint64_t *)lmt_addr,
536                                                flags);
537                 lmt_addr += (1ULL << ROC_LMT_LINE_SIZE_LOG2);
538                 data128 |= (((__uint128_t)(segdw - 1)) << shft);
539                 shft += 3;
540         }
541
542         data0 = (uint64_t)data128;
543         data1 = (uint64_t)(data128 >> 64);
544         /* Make data0 similar to data1 */
545         data0 >>= 16;
546         /* Trigger LMTST */
547         if (burst > 16) {
548                 pa0 = io_addr | (data0 & 0x7) << 4;
549                 data0 &= ~0x7ULL;
550                 /* Move lmtst1..15 sz to bits 63:19 */
551                 data0 <<= 16;
552                 data0 |= (15ULL << 12);
553                 data0 |= (uint64_t)lmt_id;
554
555                 /* STEOR0 */
556                 roc_lmt_submit_steorl(data0, pa0);
557
558                 pa1 = io_addr | (data1 & 0x7) << 4;
559                 data1 &= ~0x7ULL;
560                 data1 <<= 16;
561                 data1 |= ((uint64_t)(burst - 17)) << 12;
562                 data1 |= (uint64_t)(lmt_id + 16);
563
564                 /* STEOR1 */
565                 roc_lmt_submit_steorl(data1, pa1);
566         } else if (burst) {
567                 pa0 = io_addr | (data0 & 0x7) << 4;
568                 data0 &= ~0x7ULL;
569                 /* Move lmtst1..15 sz to bits 63:19 */
570                 data0 <<= 16;
571                 data0 |= ((burst - 1) << 12);
572                 data0 |= (uint64_t)lmt_id;
573
574                 /* STEOR0 */
575                 roc_lmt_submit_steorl(data0, pa0);
576         }
577
578         left -= burst;
579         rte_io_wmb();
580         if (left) {
581                 /* Start processing another burst */
582                 tx_pkts += burst;
583                 /* Reset lmt base addr */
584                 lmt_addr -= (1ULL << ROC_LMT_LINE_SIZE_LOG2);
585                 lmt_addr &= (~(BIT_ULL(ROC_LMT_BASE_PER_CORE_LOG2) - 1));
586                 goto again;
587         }
588
589         return pkts;
590 }
591
592 #define L3L4CSUM_F   NIX_TX_OFFLOAD_L3_L4_CSUM_F
593 #define OL3OL4CSUM_F NIX_TX_OFFLOAD_OL3_OL4_CSUM_F
594 #define VLAN_F       NIX_TX_OFFLOAD_VLAN_QINQ_F
595 #define NOFF_F       NIX_TX_OFFLOAD_MBUF_NOFF_F
596 #define TSO_F        NIX_TX_OFFLOAD_TSO_F
597
598 /* [TSO] [NOFF] [VLAN] [OL3OL4CSUM] [L3L4CSUM] */
599 #define NIX_TX_FASTPATH_MODES                                           \
600 T(no_offload,                           0, 0, 0, 0, 0,  4,              \
601                 NIX_TX_OFFLOAD_NONE)                                    \
602 T(l3l4csum,                             0, 0, 0, 0, 1,  4,              \
603                 L3L4CSUM_F)                                             \
604 T(ol3ol4csum,                           0, 0, 0, 1, 0,  4,              \
605                 OL3OL4CSUM_F)                                           \
606 T(ol3ol4csum_l3l4csum,                  0, 0, 0, 1, 1,  4,              \
607                 OL3OL4CSUM_F | L3L4CSUM_F)                              \
608 T(vlan,                                 0, 0, 1, 0, 0,  6,              \
609                 VLAN_F)                                                 \
610 T(vlan_l3l4csum,                        0, 0, 1, 0, 1,  6,              \
611                 VLAN_F | L3L4CSUM_F)                                    \
612 T(vlan_ol3ol4csum,                      0, 0, 1, 1, 0,  6,              \
613                 VLAN_F | OL3OL4CSUM_F)                                  \
614 T(vlan_ol3ol4csum_l3l4csum,             0, 0, 1, 1, 1,  6,              \
615                 VLAN_F | OL3OL4CSUM_F | L3L4CSUM_F)                     \
616 T(noff,                                 0, 1, 0, 0, 0,  4,              \
617                 NOFF_F)                                                 \
618 T(noff_l3l4csum,                        0, 1, 0, 0, 1,  4,              \
619                 NOFF_F | L3L4CSUM_F)                                    \
620 T(noff_ol3ol4csum,                      0, 1, 0, 1, 0,  4,              \
621                 NOFF_F | OL3OL4CSUM_F)                                  \
622 T(noff_ol3ol4csum_l3l4csum,             0, 1, 0, 1, 1,  4,              \
623                 NOFF_F | OL3OL4CSUM_F | L3L4CSUM_F)                     \
624 T(noff_vlan,                            0, 1, 1, 0, 0,  6,              \
625                 NOFF_F | VLAN_F)                                        \
626 T(noff_vlan_l3l4csum,                   0, 1, 1, 0, 1,  6,              \
627                 NOFF_F | VLAN_F | L3L4CSUM_F)                           \
628 T(noff_vlan_ol3ol4csum,                 0, 1, 1, 1, 0,  6,              \
629                 NOFF_F | VLAN_F | OL3OL4CSUM_F)                         \
630 T(noff_vlan_ol3ol4csum_l3l4csum,        0, 1, 1, 1, 1,  6,              \
631                 NOFF_F | VLAN_F | OL3OL4CSUM_F | L3L4CSUM_F)            \
632 T(tso,                                  1, 0, 0, 0, 0,  6,              \
633                 TSO_F)                                                  \
634 T(tso_l3l4csum,                         1, 0, 0, 0, 1,  6,              \
635                 TSO_F | L3L4CSUM_F)                                     \
636 T(tso_ol3ol4csum,                       1, 0, 0, 1, 0,  6,              \
637                 TSO_F | OL3OL4CSUM_F)                                   \
638 T(tso_ol3ol4csum_l3l4csum,              1, 0, 0, 1, 1,  6,              \
639                 TSO_F | OL3OL4CSUM_F | L3L4CSUM_F)                      \
640 T(tso_vlan,                             1, 0, 1, 0, 0,  6,              \
641                 TSO_F | VLAN_F)                                         \
642 T(tso_vlan_l3l4csum,                    1, 0, 1, 0, 1,  6,              \
643                 TSO_F | VLAN_F | L3L4CSUM_F)                            \
644 T(tso_vlan_ol3ol4csum,                  1, 0, 1, 1, 0,  6,              \
645                 TSO_F | VLAN_F | OL3OL4CSUM_F)                          \
646 T(tso_vlan_ol3ol4csum_l3l4csum,         1, 0, 1, 1, 1,  6,              \
647                 TSO_F | VLAN_F | OL3OL4CSUM_F | L3L4CSUM_F)             \
648 T(tso_noff,                             1, 1, 0, 0, 0,  6,              \
649                 TSO_F | NOFF_F)                                         \
650 T(tso_noff_l3l4csum,                    1, 1, 0, 0, 1,  6,              \
651                 TSO_F | NOFF_F | L3L4CSUM_F)                            \
652 T(tso_noff_ol3ol4csum,                  1, 1, 0, 1, 0,  6,              \
653                 TSO_F | NOFF_F | OL3OL4CSUM_F)                          \
654 T(tso_noff_ol3ol4csum_l3l4csum,         1, 1, 0, 1, 1,  6,              \
655                 TSO_F | NOFF_F | OL3OL4CSUM_F | L3L4CSUM_F)             \
656 T(tso_noff_vlan,                        1, 1, 1, 0, 0,  6,              \
657                 TSO_F | NOFF_F | VLAN_F)                                \
658 T(tso_noff_vlan_l3l4csum,               1, 1, 1, 0, 1,  6,              \
659                 TSO_F | NOFF_F | VLAN_F | L3L4CSUM_F)                   \
660 T(tso_noff_vlan_ol3ol4csum,             1, 1, 1, 1, 0,  6,              \
661                 TSO_F | NOFF_F | VLAN_F | OL3OL4CSUM_F)                 \
662 T(tso_noff_vlan_ol3ol4csum_l3l4csum,    1, 1, 1, 1, 1,  6,              \
663                 TSO_F | NOFF_F | VLAN_F | OL3OL4CSUM_F | L3L4CSUM_F)
664
665 #define T(name, f4, f3, f2, f1, f0, sz, flags)                                 \
666         uint16_t __rte_noinline __rte_hot cn10k_nix_xmit_pkts_##name(          \
667                 void *tx_queue, struct rte_mbuf **tx_pkts, uint16_t pkts);     \
668                                                                                \
669         uint16_t __rte_noinline __rte_hot cn10k_nix_xmit_pkts_mseg_##name(     \
670                 void *tx_queue, struct rte_mbuf **tx_pkts, uint16_t pkts);
671
672 NIX_TX_FASTPATH_MODES
673 #undef T
674
675 #endif /* __CN10K_TX_H__ */