net/mlx5: create advanced RxQ table via DevX
[dpdk.git] / drivers / net / mlx5 / mlx5.h
index aa88464..8aa5240 100644 (file)
@@ -152,15 +152,37 @@ struct mlx5_stats_ctrl {
        uint64_t imissed_base;
 };
 
-/* devx counter object */
-struct mlx5_devx_counter_set {
-       struct mlx5dv_devx_obj *obj;
-       int id; /* Flow counter ID */
+/* devX creation object */
+struct mlx5_devx_obj {
+       struct mlx5dv_devx_obj *obj; /* The DV object. */
+       int id; /* The object ID. */
 };
 
+struct mlx5_devx_mkey_attr {
+       uint64_t addr;
+       uint64_t size;
+       uint32_t umem_id;
+       uint32_t pd;
+};
+
+/* HCA supports this number of time periods for LRO. */
+#define MLX5_LRO_NUM_SUPP_PERIODS 4
+
 /* HCA attributes. */
 struct mlx5_hca_attr {
        uint32_t eswitch_manager:1;
+       uint32_t flow_counters_dump:1;
+       uint8_t flow_counter_bulk_alloc_bitmap;
+       uint32_t eth_net_offloads:1;
+       uint32_t eth_virt:1;
+       uint32_t wqe_vlan_insert:1;
+       uint32_t wqe_inline_mode:2;
+       uint32_t vport_inline_mode:3;
+       uint32_t lro_cap:1;
+       uint32_t tunnel_lro_gre:1;
+       uint32_t tunnel_lro_vxlan:1;
+       uint32_t lro_max_msg_sz_mode:2;
+       uint32_t lro_timer_supported_periods[MLX5_LRO_NUM_SUPP_PERIODS];
 };
 
 /* Flow list . */
@@ -169,6 +191,21 @@ TAILQ_HEAD(mlx5_flows, rte_flow);
 /* Default PMD specific parameter value. */
 #define MLX5_ARG_UNSET (-1)
 
+#define MLX5_LRO_SUPPORTED(dev) \
+       (((struct mlx5_priv *)((dev)->data->dev_private))->config.lro.supported)
+
+#define MLX5_LRO_ENABLED(dev) \
+       ((dev)->data->dev_conf.rxmode.offloads & DEV_RX_OFFLOAD_TCP_LRO)
+
+#define MLX5_FLOW_IPV4_LRO     (1 << 0)
+#define MLX5_FLOW_IPV6_LRO     (1 << 1)
+
+/* LRO configurations structure. */
+struct mlx5_lro_config {
+       uint32_t supported:1; /* Whether LRO is supported. */
+       uint32_t timeout; /* User configuration. */
+};
+
 /*
  * Device configuration structure.
  *
@@ -180,6 +217,7 @@ TAILQ_HEAD(mlx5_flows, rte_flow);
 struct mlx5_dev_config {
        unsigned int hw_csum:1; /* Checksum offload is supported. */
        unsigned int hw_vlan_strip:1; /* VLAN stripping is supported. */
+       unsigned int hw_vlan_insert:1; /* VLAN insertion in WQE is supported. */
        unsigned int hw_fcs_strip:1; /* FCS stripping is supported. */
        unsigned int hw_padding:1; /* End alignment padding is supported. */
        unsigned int vf:1; /* This is a VF. */
@@ -189,9 +227,7 @@ struct mlx5_dev_config {
        unsigned int cqe_comp:1; /* CQE compression is enabled. */
        unsigned int cqe_pad:1; /* CQE padding is enabled. */
        unsigned int tso:1; /* Whether TSO is supported. */
-       unsigned int tx_vec_en:1; /* Tx vector is enabled. */
        unsigned int rx_vec_en:1; /* Rx vector is enabled. */
-       unsigned int mpw_hdr_dseg:1; /* Enable DSEGs in the title WQEBB. */
        unsigned int mr_ext_memseg_en:1;
        /* Whether memseg should be extended for MR creation. */
        unsigned int l3_vxlan_en:1; /* Enable L3 VXLAN flow creation. */
@@ -200,6 +236,7 @@ struct mlx5_dev_config {
        unsigned int dv_flow_en:1; /* Enable DV flow. */
        unsigned int swp:1; /* Tx generic tunnel checksum and TSO offload. */
        unsigned int devx:1; /* Whether devx interface is available or not. */
+       unsigned int dest_tir:1; /* Whether advanced DR API is available. */
        struct {
                unsigned int enabled:1; /* Whether MPRQ is enabled. */
                unsigned int stride_num_n; /* Number of strides. */
@@ -215,15 +252,107 @@ struct mlx5_dev_config {
        unsigned int tso_max_payload_sz; /* Maximum TCP payload for TSO. */
        unsigned int ind_table_max_size; /* Maximum indirection table size. */
        unsigned int max_dump_files_num; /* Maximum dump files per queue. */
-       int txq_inline; /* Maximum packet size for inlining. */
        int txqs_inline; /* Queue number threshold for inlining. */
-       int txqs_vec; /* Queue number threshold for vectorized Tx. */
-       int inline_max_packet_sz; /* Max packet size for inlining. */
+       int txq_inline_min; /* Minimal amount of data bytes to inline. */
+       int txq_inline_max; /* Max packet size for inlining with SEND. */
+       int txq_inline_mpw; /* Max packet size for inlining with eMPW. */
        struct mlx5_hca_attr hca_attr; /* HCA attributes. */
+       struct mlx5_lro_config lro; /* LRO configuration. */
+};
+
+struct mlx5_devx_wq_attr {
+       uint32_t wq_type:4;
+       uint32_t wq_signature:1;
+       uint32_t end_padding_mode:2;
+       uint32_t cd_slave:1;
+       uint32_t hds_skip_first_sge:1;
+       uint32_t log2_hds_buf_size:3;
+       uint32_t page_offset:5;
+       uint32_t lwm:16;
+       uint32_t pd:24;
+       uint32_t uar_page:24;
+       uint64_t dbr_addr;
+       uint32_t hw_counter;
+       uint32_t sw_counter;
+       uint32_t log_wq_stride:4;
+       uint32_t log_wq_pg_sz:5;
+       uint32_t log_wq_sz:5;
+       uint32_t dbr_umem_valid:1;
+       uint32_t wq_umem_valid:1;
+       uint32_t log_hairpin_num_packets:5;
+       uint32_t log_hairpin_data_sz:5;
+       uint32_t single_wqe_log_num_of_strides:4;
+       uint32_t two_byte_shift_en:1;
+       uint32_t single_stride_log_num_of_bytes:3;
+       uint32_t dbr_umem_id;
+       uint32_t wq_umem_id;
+       uint64_t wq_umem_offset;
+};
+
+/* Create RQ attributes structure, used by create RQ operation. */
+struct mlx5_devx_create_rq_attr {
+       uint32_t rlky:1;
+       uint32_t delay_drop_en:1;
+       uint32_t scatter_fcs:1;
+       uint32_t vsd:1;
+       uint32_t mem_rq_type:4;
+       uint32_t state:4;
+       uint32_t flush_in_error_en:1;
+       uint32_t hairpin:1;
+       uint32_t user_index:24;
+       uint32_t cqn:24;
+       uint32_t counter_set_id:8;
+       uint32_t rmpn:24;
+       struct mlx5_devx_wq_attr wq_attr;
+};
+
+/* Modify RQ attributes structure, used by modify RQ operation. */
+struct mlx5_devx_modify_rq_attr {
+       uint32_t rqn:24;
+       uint32_t rq_state:4; /* Current RQ state. */
+       uint32_t state:4; /* Required RQ state. */
+       uint32_t scatter_fcs:1;
+       uint32_t vsd:1;
+       uint32_t counter_set_id:8;
+       uint32_t hairpin_peer_sq:24;
+       uint32_t hairpin_peer_vhca:16;
+       uint64_t modify_bitmask;
+       uint32_t lwm:16; /* Contained WQ lwm. */
+};
+
+struct mlx5_rx_hash_field_select {
+       uint32_t l3_prot_type:1;
+       uint32_t l4_prot_type:1;
+       uint32_t selected_fields:30;
+};
+
+/* TIR attributes structure, used by TIR operations. */
+struct mlx5_devx_tir_attr {
+       uint32_t disp_type:4;
+       uint32_t lro_timeout_period_usecs:16;
+       uint32_t lro_enable_mask:4;
+       uint32_t lro_max_msg_sz:8;
+       uint32_t inline_rqn:24;
+       uint32_t rx_hash_symmetric:1;
+       uint32_t tunneled_offload_en:1;
+       uint32_t indirect_table:24;
+       uint32_t rx_hash_fn:4;
+       uint32_t self_lb_block:2;
+       uint32_t transport_domain:24;
+       uint32_t rx_hash_toeplitz_key[10];
+       struct mlx5_rx_hash_field_select rx_hash_field_selector_outer;
+       struct mlx5_rx_hash_field_select rx_hash_field_selector_inner;
+};
+
+/* RQT attributes structure, used by RQT operations. */
+struct mlx5_devx_rqt_attr {
+       uint32_t rqt_max_size:16;
+       uint32_t rqt_actual_size:16;
+       uint32_t rq_list[];
 };
 
 /**
- * Type of objet being allocated.
+ * Type of object being allocated.
  */
 enum mlx5_verbs_alloc_type {
        MLX5_VERBS_ALLOC_TYPE_NONE,
@@ -248,7 +377,104 @@ struct mlx5_drop {
        struct mlx5_rxq_ibv *rxq; /* Verbs Rx queue. */
 };
 
-struct mlx5_flow_tcf_context;
+#define MLX5_COUNTERS_PER_POOL 512
+#define MLX5_MAX_PENDING_QUERIES 4
+
+struct mlx5_flow_counter_pool;
+
+struct flow_counter_stats {
+       uint64_t hits;
+       uint64_t bytes;
+};
+
+/* Counters information. */
+struct mlx5_flow_counter {
+       TAILQ_ENTRY(mlx5_flow_counter) next;
+       /**< Pointer to the next flow counter structure. */
+       uint32_t shared:1; /**< Share counter ID with other flow rules. */
+       uint32_t batch: 1;
+       /**< Whether the counter was allocated by batch command. */
+       uint32_t ref_cnt:30; /**< Reference counter. */
+       uint32_t id; /**< Counter ID. */
+       union {  /**< Holds the counters for the rule. */
+#if defined(HAVE_IBV_DEVICE_COUNTERS_SET_V42)
+               struct ibv_counter_set *cs;
+#elif defined(HAVE_IBV_DEVICE_COUNTERS_SET_V45)
+               struct ibv_counters *cs;
+#endif
+               struct mlx5_devx_obj *dcs; /**< Counter Devx object. */
+               struct mlx5_flow_counter_pool *pool; /**< The counter pool. */
+       };
+       union {
+               uint64_t hits; /**< Reset value of hits packets. */
+               int64_t query_gen; /**< Generation of the last release. */
+       };
+       uint64_t bytes; /**< Reset value of bytes. */
+       void *action; /**< Pointer to the dv action. */
+};
+
+TAILQ_HEAD(mlx5_counters, mlx5_flow_counter);
+
+/* Counter pool structure - query is in pool resolution. */
+struct mlx5_flow_counter_pool {
+       TAILQ_ENTRY(mlx5_flow_counter_pool) next;
+       struct mlx5_counters counters; /* Free counter list. */
+       union {
+               struct mlx5_devx_obj *min_dcs;
+               rte_atomic64_t a64_dcs;
+       };
+       /* The devx object of the minimum counter ID. */
+       rte_atomic64_t query_gen;
+       uint32_t n_counters: 16; /* Number of devx allocated counters. */
+       rte_spinlock_t sl; /* The pool lock. */
+       struct mlx5_counter_stats_raw *raw;
+       struct mlx5_counter_stats_raw *raw_hw; /* The raw on HW working. */
+       struct mlx5_flow_counter counters_raw[]; /* The pool counters memory. */
+};
+
+struct mlx5_counter_stats_raw;
+
+/* Memory management structure for group of counter statistics raws. */
+struct mlx5_counter_stats_mem_mng {
+       LIST_ENTRY(mlx5_counter_stats_mem_mng) next;
+       struct mlx5_counter_stats_raw *raws;
+       struct mlx5_devx_obj *dm;
+       struct mlx5dv_devx_umem *umem;
+};
+
+/* Raw memory structure for the counter statistics values of a pool. */
+struct mlx5_counter_stats_raw {
+       LIST_ENTRY(mlx5_counter_stats_raw) next;
+       int min_dcs_id;
+       struct mlx5_counter_stats_mem_mng *mem_mng;
+       volatile struct flow_counter_stats *data;
+};
+
+TAILQ_HEAD(mlx5_counter_pools, mlx5_flow_counter_pool);
+
+/* Container structure for counter pools. */
+struct mlx5_pools_container {
+       rte_atomic16_t n_valid; /* Number of valid pools. */
+       uint16_t n; /* Number of pools. */
+       struct mlx5_counter_pools pool_list; /* Counter pool list. */
+       struct mlx5_flow_counter_pool **pools; /* Counter pool array. */
+       struct mlx5_counter_stats_mem_mng *init_mem_mng;
+       /* Hold the memory management for the next allocated pools raws. */
+};
+
+/* Counter global management structure. */
+struct mlx5_flow_counter_mng {
+       uint8_t mhi[2]; /* master \ host container index. */
+       struct mlx5_pools_container ccont[2 * 2];
+       /* 2 containers for single and for batch for double-buffer. */
+       struct mlx5_counters flow_counters; /* Legacy flow counter list. */
+       uint8_t pending_queries;
+       uint8_t batch;
+       uint16_t pool_index;
+       uint8_t query_thread_on;
+       LIST_HEAD(mem_mngs, mlx5_counter_stats_mem_mng) mem_mngs;
+       LIST_HEAD(stat_raws, mlx5_counter_stats_raw) free_stat_raws;
+};
 
 /* Per port data of shared IB device. */
 struct mlx5_ibv_shared_port {
@@ -283,6 +509,7 @@ struct mlx5_ibv_shared {
        uint32_t max_port; /* Maximal IB device port index. */
        struct ibv_context *ctx; /* Verbs/DV context. */
        struct ibv_pd *pd; /* Protection Domain. */
+       uint32_t tdn; /* Transport Domain number. */
        char ibdev_name[IBV_SYSFS_NAME_MAX]; /* IB device name. */
        char ibdev_path[IBV_SYSFS_PATH_MAX]; /* IB device path for secondary */
        struct ibv_device_attr_ex device_attr; /* Device properties. */
@@ -316,10 +543,13 @@ struct mlx5_ibv_shared {
        LIST_HEAD(jump, mlx5_flow_dv_jump_tbl_resource) jump_tbl;
        LIST_HEAD(port_id_action_list, mlx5_flow_dv_port_id_action_resource)
                port_id_action_list; /* List of port ID actions. */
+       struct mlx5_flow_counter_mng cmng; /* Counters management structure. */
        /* Shared interrupt handler section. */
        pthread_mutex_t intr_mutex; /* Interrupt config mutex. */
        uint32_t intr_cnt; /* Interrupt handler reference counter. */
        struct rte_intr_handle intr_handle; /* Interrupt handler for device. */
+       struct rte_intr_handle intr_handle_devx; /* DEVX interrupt handler. */
+       struct mlx5dv_devx_cmd_comp *devx_comp; /* DEVX async comp obj. */
        struct mlx5_ibv_shared_port port[]; /* per device port data array. */
 };
 
@@ -349,9 +579,11 @@ struct mlx5_priv {
        unsigned int representor:1; /* Device is a port representor. */
        unsigned int master:1; /* Device is a E-Switch master. */
        unsigned int dr_shared:1; /* DV/DR data is shared. */
+       unsigned int counter_fallback:1; /* Use counter fallback management. */
        uint16_t domain_id; /* Switch domain identifier. */
        uint16_t vport_id; /* Associated VF vport index (if any). */
        int32_t representor_id; /* Port representor identifier. */
+       unsigned int if_index; /* Associated kernel network device index. */
        /* RX/TX queues. */
        unsigned int rxqs_n; /* RX queues array size. */
        unsigned int txqs_n; /* TX queues array size. */
@@ -364,8 +596,6 @@ struct mlx5_priv {
        struct mlx5_drop drop_queue; /* Flow drop queues. */
        struct mlx5_flows flows; /* RTE Flow rules. */
        struct mlx5_flows ctrl_flows; /* Control flow rules. */
-       LIST_HEAD(counters, mlx5_flow_counter) flow_counters;
-       /* Flow counters. */
        LIST_HEAD(rxq, mlx5_rxq_ctrl) rxqsctrl; /* DPDK Rx queues. */
        LIST_HEAD(rxqibv, mlx5_rxq_ibv) rxqsibv; /* Verbs Rx queues. */
        LIST_HEAD(hrxq, mlx5_hrxq) hrxqs; /* Verbs Hash Rx queues. */
@@ -393,7 +623,6 @@ struct mlx5_priv {
        rte_spinlock_t uar_lock[MLX5_UAR_PAGE_NUM_MAX];
        /* UAR same-page access control required in 32bit implementations. */
 #endif
-       struct mlx5_flow_tcf_context *tcf_context; /* TC flower context. */
 };
 
 #define PORT_ID(priv) ((priv)->dev_data->port_id)
@@ -407,15 +636,9 @@ int mlx5_proc_priv_init(struct rte_eth_dev *dev);
 /* mlx5_ethdev.c */
 
 int mlx5_get_ifname(const struct rte_eth_dev *dev, char (*ifname)[IF_NAMESIZE]);
-int mlx5_get_ifname_base(const struct rte_eth_dev *base,
-                        const struct rte_eth_dev *dev,
-                        char (*ifname)[IF_NAMESIZE]);
 int mlx5_get_master_ifname(const char *ibdev_path, char (*ifname)[IF_NAMESIZE]);
 unsigned int mlx5_ifindex(const struct rte_eth_dev *dev);
 int mlx5_ifreq(const struct rte_eth_dev *dev, int req, struct ifreq *ifr);
-int mlx5_ifreq_base(const struct rte_eth_dev *base,
-                   const struct rte_eth_dev *dev,
-                   int req, struct ifreq *ifr);
 int mlx5_get_mtu(struct rte_eth_dev *dev, uint16_t *mtu);
 int mlx5_set_flags(struct rte_eth_dev *dev, unsigned int keep,
                   unsigned int flags);
@@ -435,6 +658,7 @@ int mlx5_ibv_device_to_pci_addr(const struct ibv_device *device,
                                struct rte_pci_addr *pci_addr);
 void mlx5_dev_link_status_handler(void *arg);
 void mlx5_dev_interrupt_handler(void *arg);
+void mlx5_dev_interrupt_handler_devx(void *arg);
 void mlx5_dev_interrupt_handler_uninstall(struct rte_eth_dev *dev);
 void mlx5_dev_interrupt_handler_install(struct rte_eth_dev *dev);
 int mlx5_set_link_down(struct rte_eth_dev *dev);
@@ -556,6 +780,10 @@ int mlx5_ctrl_flow(struct rte_eth_dev *dev,
                   struct rte_flow_item_eth *eth_mask);
 int mlx5_flow_create_drop_queue(struct rte_eth_dev *dev);
 void mlx5_flow_delete_drop_queue(struct rte_eth_dev *dev);
+void mlx5_flow_async_pool_query_handle(struct mlx5_ibv_shared *sh,
+                                      uint64_t async_id, int status);
+void mlx5_set_query_alarm(struct mlx5_ibv_shared *sh);
+void mlx5_flow_query_alarm(void *arg);
 
 /* mlx5_mp.c */
 void mlx5_mp_req_start_rxtx(struct rte_eth_dev *dev);
@@ -587,12 +815,30 @@ int mlx5_nl_switch_info(int nl, unsigned int ifindex,
 
 /* mlx5_devx_cmds.c */
 
-int mlx5_devx_cmd_flow_counter_alloc(struct ibv_context *ctx,
-                                    struct mlx5_devx_counter_set *dcx);
-int mlx5_devx_cmd_flow_counter_free(struct mlx5dv_devx_obj *obj);
-int mlx5_devx_cmd_flow_counter_query(struct mlx5_devx_counter_set *dcx,
-                                    int clear,
-                                    uint64_t *pkts, uint64_t *bytes);
+struct mlx5_devx_obj *mlx5_devx_cmd_flow_counter_alloc(struct ibv_context *ctx,
+                                                      uint32_t bulk_sz);
+int mlx5_devx_cmd_destroy(struct mlx5_devx_obj *obj);
+int mlx5_devx_cmd_flow_counter_query(struct mlx5_devx_obj *dcs,
+                                    int clear, uint32_t n_counters,
+                                    uint64_t *pkts, uint64_t *bytes,
+                                    uint32_t mkey, void *addr,
+                                    struct mlx5dv_devx_cmd_comp *cmd_comp,
+                                    uint64_t async_id);
 int mlx5_devx_cmd_query_hca_attr(struct ibv_context *ctx,
                                 struct mlx5_hca_attr *attr);
+struct mlx5_devx_obj *mlx5_devx_cmd_mkey_create(struct ibv_context *ctx,
+                                            struct mlx5_devx_mkey_attr *attr);
+int mlx5_devx_get_out_command_status(void *out);
+int mlx5_devx_cmd_qp_query_tis_td(struct ibv_qp *qp, uint32_t tis_num,
+                                 uint32_t *tis_td);
+struct mlx5_devx_obj *mlx5_devx_cmd_create_rq(struct ibv_context *ctx,
+                               struct mlx5_devx_create_rq_attr *rq_attr,
+                               int socket);
+int mlx5_devx_cmd_modify_rq(struct mlx5_devx_obj *rq,
+                           struct mlx5_devx_modify_rq_attr *rq_attr);
+struct mlx5_devx_obj *mlx5_devx_cmd_create_tir(struct ibv_context *ctx,
+                                       struct mlx5_devx_tir_attr *tir_attr);
+struct mlx5_devx_obj *mlx5_devx_cmd_create_rqt(struct ibv_context *ctx,
+                                       struct mlx5_devx_rqt_attr *rqt_attr);
+
 #endif /* RTE_PMD_MLX5_H_ */