pci: get IOMMU class on Linux
[dpdk.git] / lib / librte_eal / common / include / rte_pci.h
1 /*-
2  *   BSD LICENSE
3  *
4  *   Copyright(c) 2010-2015 Intel Corporation. All rights reserved.
5  *   Copyright 2013-2014 6WIND S.A.
6  *   All rights reserved.
7  *
8  *   Redistribution and use in source and binary forms, with or without
9  *   modification, are permitted provided that the following conditions
10  *   are met:
11  *
12  *     * Redistributions of source code must retain the above copyright
13  *       notice, this list of conditions and the following disclaimer.
14  *     * Redistributions in binary form must reproduce the above copyright
15  *       notice, this list of conditions and the following disclaimer in
16  *       the documentation and/or other materials provided with the
17  *       distribution.
18  *     * Neither the name of Intel Corporation nor the names of its
19  *       contributors may be used to endorse or promote products derived
20  *       from this software without specific prior written permission.
21  *
22  *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
23  *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
24  *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
25  *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
26  *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
27  *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
28  *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
29  *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
30  *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
31  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
32  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
33  */
34
35 #ifndef _RTE_PCI_H_
36 #define _RTE_PCI_H_
37
38 /**
39  * @file
40  *
41  * RTE PCI Interface
42  */
43
44 #ifdef __cplusplus
45 extern "C" {
46 #endif
47
48 #include <stdio.h>
49 #include <stdlib.h>
50 #include <limits.h>
51 #include <errno.h>
52 #include <sys/queue.h>
53 #include <stdint.h>
54 #include <inttypes.h>
55
56 #include <rte_debug.h>
57 #include <rte_interrupts.h>
58 #include <rte_dev.h>
59 #include <rte_bus.h>
60
61 /** Pathname of PCI devices directory. */
62 const char *pci_get_sysfs_path(void);
63
64 /** Formatting string for PCI device identifier: Ex: 0000:00:01.0 */
65 #define PCI_PRI_FMT "%.4" PRIx16 ":%.2" PRIx8 ":%.2" PRIx8 ".%" PRIx8
66 #define PCI_PRI_STR_SIZE sizeof("XXXXXXXX:XX:XX.X")
67
68 /** Short formatting string, without domain, for PCI device: Ex: 00:01.0 */
69 #define PCI_SHORT_PRI_FMT "%.2" PRIx8 ":%.2" PRIx8 ".%" PRIx8
70
71 /** Nb. of values in PCI device identifier format string. */
72 #define PCI_FMT_NVAL 4
73
74 /** Nb. of values in PCI resource format. */
75 #define PCI_RESOURCE_FMT_NVAL 3
76
77 /** Maximum number of PCI resources. */
78 #define PCI_MAX_RESOURCE 6
79
80 /* Forward declarations */
81 struct rte_pci_device;
82 struct rte_pci_driver;
83
84 /** List of PCI devices */
85 TAILQ_HEAD(rte_pci_device_list, rte_pci_device);
86 /** List of PCI drivers */
87 TAILQ_HEAD(rte_pci_driver_list, rte_pci_driver);
88
89 /* PCI Bus iterators */
90 #define FOREACH_DEVICE_ON_PCIBUS(p)     \
91                 TAILQ_FOREACH(p, &(rte_pci_bus.device_list), next)
92
93 #define FOREACH_DRIVER_ON_PCIBUS(p)     \
94                 TAILQ_FOREACH(p, &(rte_pci_bus.driver_list), next)
95
96 /**
97  * A structure describing an ID for a PCI driver. Each driver provides a
98  * table of these IDs for each device that it supports.
99  */
100 struct rte_pci_id {
101         uint32_t class_id;            /**< Class ID (class, subclass, pi) or RTE_CLASS_ANY_ID. */
102         uint16_t vendor_id;           /**< Vendor ID or PCI_ANY_ID. */
103         uint16_t device_id;           /**< Device ID or PCI_ANY_ID. */
104         uint16_t subsystem_vendor_id; /**< Subsystem vendor ID or PCI_ANY_ID. */
105         uint16_t subsystem_device_id; /**< Subsystem device ID or PCI_ANY_ID. */
106 };
107
108 /**
109  * A structure describing the location of a PCI device.
110  */
111 struct rte_pci_addr {
112         uint32_t domain;                /**< Device domain */
113         uint8_t bus;                    /**< Device bus */
114         uint8_t devid;                  /**< Device ID */
115         uint8_t function;               /**< Device function. */
116 };
117
118 struct rte_devargs;
119
120 /**
121  * A structure describing a PCI device.
122  */
123 struct rte_pci_device {
124         TAILQ_ENTRY(rte_pci_device) next;       /**< Next probed PCI device. */
125         struct rte_device device;               /**< Inherit core device */
126         struct rte_pci_addr addr;               /**< PCI location. */
127         struct rte_pci_id id;                   /**< PCI ID. */
128         struct rte_mem_resource mem_resource[PCI_MAX_RESOURCE];
129                                                 /**< PCI Memory Resource */
130         struct rte_intr_handle intr_handle;     /**< Interrupt handle */
131         struct rte_pci_driver *driver;          /**< Associated driver */
132         uint16_t max_vfs;                       /**< sriov enable if not zero */
133         enum rte_kernel_driver kdrv;            /**< Kernel driver passthrough */
134         char name[PCI_PRI_STR_SIZE+1];          /**< PCI location (ASCII) */
135 };
136
137 /**
138  * @internal
139  * Helper macro for drivers that need to convert to struct rte_pci_device.
140  */
141 #define RTE_DEV_TO_PCI(ptr) container_of(ptr, struct rte_pci_device, device)
142
143 /** Any PCI device identifier (vendor, device, ...) */
144 #define PCI_ANY_ID (0xffff)
145 #define RTE_CLASS_ANY_ID (0xffffff)
146
147 #ifdef __cplusplus
148 /** C++ macro used to help building up tables of device IDs */
149 #define RTE_PCI_DEVICE(vend, dev) \
150         RTE_CLASS_ANY_ID,         \
151         (vend),                   \
152         (dev),                    \
153         PCI_ANY_ID,               \
154         PCI_ANY_ID
155 #else
156 /** Macro used to help building up tables of device IDs */
157 #define RTE_PCI_DEVICE(vend, dev)          \
158         .class_id = RTE_CLASS_ANY_ID,      \
159         .vendor_id = (vend),               \
160         .device_id = (dev),                \
161         .subsystem_vendor_id = PCI_ANY_ID, \
162         .subsystem_device_id = PCI_ANY_ID
163 #endif
164
165 /**
166  * Initialisation function for the driver called during PCI probing.
167  */
168 typedef int (pci_probe_t)(struct rte_pci_driver *, struct rte_pci_device *);
169
170 /**
171  * Uninitialisation function for the driver called during hotplugging.
172  */
173 typedef int (pci_remove_t)(struct rte_pci_device *);
174
175 /**
176  * A structure describing a PCI driver.
177  */
178 struct rte_pci_driver {
179         TAILQ_ENTRY(rte_pci_driver) next;       /**< Next in list. */
180         struct rte_driver driver;               /**< Inherit core driver. */
181         struct rte_pci_bus *bus;                /**< PCI bus reference. */
182         pci_probe_t *probe;                     /**< Device Probe function. */
183         pci_remove_t *remove;                   /**< Device Remove function. */
184         const struct rte_pci_id *id_table;      /**< ID table, NULL terminated. */
185         uint32_t drv_flags;                     /**< Flags contolling handling of device. */
186 };
187
188 /**
189  * Structure describing the PCI bus
190  */
191 struct rte_pci_bus {
192         struct rte_bus bus;               /**< Inherit the generic class */
193         struct rte_pci_device_list device_list;  /**< List of PCI devices */
194         struct rte_pci_driver_list driver_list;  /**< List of PCI drivers */
195 };
196
197 /** Device needs PCI BAR mapping (done with either IGB_UIO or VFIO) */
198 #define RTE_PCI_DRV_NEED_MAPPING 0x0001
199 /** Device driver supports link state interrupt */
200 #define RTE_PCI_DRV_INTR_LSC    0x0008
201 /** Device driver supports device removal interrupt */
202 #define RTE_PCI_DRV_INTR_RMV 0x0010
203 /** Device driver needs to keep mapped resources if unsupported dev detected */
204 #define RTE_PCI_DRV_KEEP_MAPPED_RES 0x0020
205 /** Device driver supports IOVA as VA */
206 #define RTE_PCI_DRV_IOVA_AS_VA 0X0040
207
208 /**
209  * A structure describing a PCI mapping.
210  */
211 struct pci_map {
212         void *addr;
213         char *path;
214         uint64_t offset;
215         uint64_t size;
216         uint64_t phaddr;
217 };
218
219 /**
220  * A structure describing a mapped PCI resource.
221  * For multi-process we need to reproduce all PCI mappings in secondary
222  * processes, so save them in a tailq.
223  */
224 struct mapped_pci_resource {
225         TAILQ_ENTRY(mapped_pci_resource) next;
226
227         struct rte_pci_addr pci_addr;
228         char path[PATH_MAX];
229         int nb_maps;
230         struct pci_map maps[PCI_MAX_RESOURCE];
231 };
232
233 /** mapped pci device list */
234 TAILQ_HEAD(mapped_pci_res_list, mapped_pci_resource);
235
236 /**< Internal use only - Macro used by pci addr parsing functions **/
237 #define GET_PCIADDR_FIELD(in, fd, lim, dlm)                   \
238 do {                                                               \
239         unsigned long val;                                      \
240         char *end;                                              \
241         errno = 0;                                              \
242         val = strtoul((in), &end, 16);                          \
243         if (errno != 0 || end[0] != (dlm) || val > (lim))       \
244                 return -EINVAL;                                 \
245         (fd) = (typeof (fd))val;                                \
246         (in) = end + 1;                                         \
247 } while(0)
248
249 /**
250  * Utility function to produce a PCI Bus-Device-Function value
251  * given a string representation. Assumes that the BDF is provided without
252  * a domain prefix (i.e. domain returned is always 0)
253  *
254  * @param input
255  *      The input string to be parsed. Should have the format XX:XX.X
256  * @param dev_addr
257  *      The PCI Bus-Device-Function address to be returned. Domain will always be
258  *      returned as 0
259  * @return
260  *  0 on success, negative on error.
261  */
262 static inline int
263 eal_parse_pci_BDF(const char *input, struct rte_pci_addr *dev_addr)
264 {
265         dev_addr->domain = 0;
266         GET_PCIADDR_FIELD(input, dev_addr->bus, UINT8_MAX, ':');
267         GET_PCIADDR_FIELD(input, dev_addr->devid, UINT8_MAX, '.');
268         GET_PCIADDR_FIELD(input, dev_addr->function, UINT8_MAX, 0);
269         return 0;
270 }
271
272 /**
273  * Utility function to produce a PCI Bus-Device-Function value
274  * given a string representation. Assumes that the BDF is provided including
275  * a domain prefix.
276  *
277  * @param input
278  *      The input string to be parsed. Should have the format XXXX:XX:XX.X
279  * @param dev_addr
280  *      The PCI Bus-Device-Function address to be returned
281  * @return
282  *  0 on success, negative on error.
283  */
284 static inline int
285 eal_parse_pci_DomBDF(const char *input, struct rte_pci_addr *dev_addr)
286 {
287         GET_PCIADDR_FIELD(input, dev_addr->domain, UINT16_MAX, ':');
288         GET_PCIADDR_FIELD(input, dev_addr->bus, UINT8_MAX, ':');
289         GET_PCIADDR_FIELD(input, dev_addr->devid, UINT8_MAX, '.');
290         GET_PCIADDR_FIELD(input, dev_addr->function, UINT8_MAX, 0);
291         return 0;
292 }
293 #undef GET_PCIADDR_FIELD
294
295 /**
296  * Utility function to write a pci device name, this device name can later be
297  * used to retrieve the corresponding rte_pci_addr using eal_parse_pci_*
298  * BDF helpers.
299  *
300  * @param addr
301  *      The PCI Bus-Device-Function address
302  * @param output
303  *      The output buffer string
304  * @param size
305  *      The output buffer size
306  */
307 static inline void
308 rte_pci_device_name(const struct rte_pci_addr *addr,
309                 char *output, size_t size)
310 {
311         RTE_VERIFY(size >= PCI_PRI_STR_SIZE);
312         RTE_VERIFY(snprintf(output, size, PCI_PRI_FMT,
313                             addr->domain, addr->bus,
314                             addr->devid, addr->function) >= 0);
315 }
316
317 /* Compare two PCI device addresses. */
318 /**
319  * Utility function to compare two PCI device addresses.
320  *
321  * @param addr
322  *      The PCI Bus-Device-Function address to compare
323  * @param addr2
324  *      The PCI Bus-Device-Function address to compare
325  * @return
326  *      0 on equal PCI address.
327  *      Positive on addr is greater than addr2.
328  *      Negative on addr is less than addr2, or error.
329  */
330 static inline int
331 rte_eal_compare_pci_addr(const struct rte_pci_addr *addr,
332                          const struct rte_pci_addr *addr2)
333 {
334         uint64_t dev_addr, dev_addr2;
335
336         if ((addr == NULL) || (addr2 == NULL))
337                 return -1;
338
339         dev_addr = ((uint64_t)addr->domain << 24) |
340                 (addr->bus << 16) | (addr->devid << 8) | addr->function;
341         dev_addr2 = ((uint64_t)addr2->domain << 24) |
342                 (addr2->bus << 16) | (addr2->devid << 8) | addr2->function;
343
344         if (dev_addr > dev_addr2)
345                 return 1;
346         else if (dev_addr < dev_addr2)
347                 return -1;
348         else
349                 return 0;
350 }
351
352 /**
353  * Scan the content of the PCI bus, and the devices in the devices
354  * list
355  *
356  * @return
357  *  0 on success, negative on error
358  */
359 int rte_pci_scan(void);
360
361 /**
362  * Probe the PCI bus
363  *
364  * @return
365  *   - 0 on success.
366  *   - !0 on error.
367  */
368 int
369 rte_pci_probe(void);
370
371 /*
372  * Match the PCI Driver and Device using the ID Table
373  *
374  * @param pci_drv
375  *      PCI driver from which ID table would be extracted
376  * @param pci_dev
377  *      PCI device to match against the driver
378  * @return
379  *      1 for successful match
380  *      0 for unsuccessful match
381  */
382 int
383 rte_pci_match(const struct rte_pci_driver *pci_drv,
384               const struct rte_pci_device *pci_dev);
385
386
387 /**
388  * Get iommu class of PCI devices on the bus.
389  * And return their preferred iova mapping mode.
390  *
391  * @return
392  *   - enum rte_iova_mode.
393  */
394 enum rte_iova_mode
395 rte_pci_get_iommu_class(void);
396
397 /**
398  * Map the PCI device resources in user space virtual memory address
399  *
400  * Note that driver should not call this function when flag
401  * RTE_PCI_DRV_NEED_MAPPING is set, as EAL will do that for
402  * you when it's on.
403  *
404  * @param dev
405  *   A pointer to a rte_pci_device structure describing the device
406  *   to use
407  *
408  * @return
409  *   0 on success, negative on error and positive if no driver
410  *   is found for the device.
411  */
412 int rte_pci_map_device(struct rte_pci_device *dev);
413
414 /**
415  * Unmap this device
416  *
417  * @param dev
418  *   A pointer to a rte_pci_device structure describing the device
419  *   to use
420  */
421 void rte_pci_unmap_device(struct rte_pci_device *dev);
422
423 /**
424  * @internal
425  * Map a particular resource from a file.
426  *
427  * @param requested_addr
428  *      The starting address for the new mapping range.
429  * @param fd
430  *      The file descriptor.
431  * @param offset
432  *      The offset for the mapping range.
433  * @param size
434  *      The size for the mapping range.
435  * @param additional_flags
436  *      The additional flags for the mapping range.
437  * @return
438  *   - On success, the function returns a pointer to the mapped area.
439  *   - On error, the value MAP_FAILED is returned.
440  */
441 void *pci_map_resource(void *requested_addr, int fd, off_t offset,
442                 size_t size, int additional_flags);
443
444 /**
445  * @internal
446  * Unmap a particular resource.
447  *
448  * @param requested_addr
449  *      The address for the unmapping range.
450  * @param size
451  *      The size for the unmapping range.
452  */
453 void pci_unmap_resource(void *requested_addr, size_t size);
454
455 /**
456  * Probe the single PCI device.
457  *
458  * Scan the content of the PCI bus, and find the pci device specified by pci
459  * address, then call the probe() function for registered driver that has a
460  * matching entry in its id_table for discovered device.
461  *
462  * @param addr
463  *      The PCI Bus-Device-Function address to probe.
464  * @return
465  *   - 0 on success.
466  *   - Negative on error.
467  */
468 int rte_pci_probe_one(const struct rte_pci_addr *addr);
469
470 /**
471  * Close the single PCI device.
472  *
473  * Scan the content of the PCI bus, and find the pci device specified by pci
474  * address, then call the remove() function for registered driver that has a
475  * matching entry in its id_table for discovered device.
476  *
477  * @param addr
478  *      The PCI Bus-Device-Function address to close.
479  * @return
480  *   - 0 on success.
481  *   - Negative on error.
482  */
483 int rte_pci_detach(const struct rte_pci_addr *addr);
484
485 /**
486  * Dump the content of the PCI bus.
487  *
488  * @param f
489  *   A pointer to a file for output
490  */
491 void rte_pci_dump(FILE *f);
492
493 /**
494  * Register a PCI driver.
495  *
496  * @param driver
497  *   A pointer to a rte_pci_driver structure describing the driver
498  *   to be registered.
499  */
500 void rte_pci_register(struct rte_pci_driver *driver);
501
502 /** Helper for PCI device registration from driver (eth, crypto) instance */
503 #define RTE_PMD_REGISTER_PCI(nm, pci_drv) \
504 RTE_INIT(pciinitfn_ ##nm); \
505 static void pciinitfn_ ##nm(void) \
506 {\
507         (pci_drv).driver.name = RTE_STR(nm);\
508         rte_pci_register(&pci_drv); \
509 } \
510 RTE_PMD_EXPORT_NAME(nm, __COUNTER__)
511
512 /**
513  * Unregister a PCI driver.
514  *
515  * @param driver
516  *   A pointer to a rte_pci_driver structure describing the driver
517  *   to be unregistered.
518  */
519 void rte_pci_unregister(struct rte_pci_driver *driver);
520
521 /**
522  * Read PCI config space.
523  *
524  * @param device
525  *   A pointer to a rte_pci_device structure describing the device
526  *   to use
527  * @param buf
528  *   A data buffer where the bytes should be read into
529  * @param len
530  *   The length of the data buffer.
531  * @param offset
532  *   The offset into PCI config space
533  */
534 int rte_pci_read_config(const struct rte_pci_device *device,
535                 void *buf, size_t len, off_t offset);
536
537 /**
538  * Write PCI config space.
539  *
540  * @param device
541  *   A pointer to a rte_pci_device structure describing the device
542  *   to use
543  * @param buf
544  *   A data buffer containing the bytes should be written
545  * @param len
546  *   The length of the data buffer.
547  * @param offset
548  *   The offset into PCI config space
549  */
550 int rte_pci_write_config(const struct rte_pci_device *device,
551                 const void *buf, size_t len, off_t offset);
552
553 /**
554  * A structure used to access io resources for a pci device.
555  * rte_pci_ioport is arch, os, driver specific, and should not be used outside
556  * of pci ioport api.
557  */
558 struct rte_pci_ioport {
559         struct rte_pci_device *dev;
560         uint64_t base;
561         uint64_t len; /* only filled for memory mapped ports */
562 };
563
564 /**
565  * Initialize a rte_pci_ioport object for a pci device io resource.
566  *
567  * This object is then used to gain access to those io resources (see below).
568  *
569  * @param dev
570  *   A pointer to a rte_pci_device structure describing the device
571  *   to use.
572  * @param bar
573  *   Index of the io pci resource we want to access.
574  * @param p
575  *   The rte_pci_ioport object to be initialized.
576  * @return
577  *  0 on success, negative on error.
578  */
579 int rte_pci_ioport_map(struct rte_pci_device *dev, int bar,
580                 struct rte_pci_ioport *p);
581
582 /**
583  * Release any resources used in a rte_pci_ioport object.
584  *
585  * @param p
586  *   The rte_pci_ioport object to be uninitialized.
587  * @return
588  *  0 on success, negative on error.
589  */
590 int rte_pci_ioport_unmap(struct rte_pci_ioport *p);
591
592 /**
593  * Read from a io pci resource.
594  *
595  * @param p
596  *   The rte_pci_ioport object from which we want to read.
597  * @param data
598  *   A data buffer where the bytes should be read into
599  * @param len
600  *   The length of the data buffer.
601  * @param offset
602  *   The offset into the pci io resource.
603  */
604 void rte_pci_ioport_read(struct rte_pci_ioport *p,
605                 void *data, size_t len, off_t offset);
606
607 /**
608  * Write to a io pci resource.
609  *
610  * @param p
611  *   The rte_pci_ioport object to which we want to write.
612  * @param data
613  *   A data buffer where the bytes should be read into
614  * @param len
615  *   The length of the data buffer.
616  * @param offset
617  *   The offset into the pci io resource.
618  */
619 void rte_pci_ioport_write(struct rte_pci_ioport *p,
620                 const void *data, size_t len, off_t offset);
621
622 #ifdef __cplusplus
623 }
624 #endif
625
626 #endif /* _RTE_PCI_H_ */