bus/fslmc: do not needlessly check for IOVA mode
[dpdk.git] / drivers / bus / fslmc / fslmc_vfio.c
1 /* SPDX-License-Identifier: BSD-3-Clause
2  *
3  *   Copyright (c) 2015-2016 Freescale Semiconductor, Inc. All rights reserved.
4  *   Copyright 2016 NXP
5  *
6  */
7
8 #include <unistd.h>
9 #include <stdio.h>
10 #include <sys/types.h>
11 #include <string.h>
12 #include <stdlib.h>
13 #include <fcntl.h>
14 #include <errno.h>
15 #include <sys/ioctl.h>
16 #include <sys/stat.h>
17 #include <sys/mman.h>
18 #include <sys/vfs.h>
19 #include <libgen.h>
20 #include <dirent.h>
21 #include <sys/eventfd.h>
22
23 #include <eal_filesystem.h>
24 #include <rte_mbuf.h>
25 #include <rte_ethdev_driver.h>
26 #include <rte_malloc.h>
27 #include <rte_memcpy.h>
28 #include <rte_string_fns.h>
29 #include <rte_cycles.h>
30 #include <rte_kvargs.h>
31 #include <rte_dev.h>
32 #include <rte_bus.h>
33
34 #include "rte_fslmc.h"
35 #include "fslmc_vfio.h"
36 #include "fslmc_logs.h"
37 #include <mc/fsl_dpmng.h>
38
39 #include "portal/dpaa2_hw_pvt.h"
40 #include "portal/dpaa2_hw_dpio.h"
41
42 /** Pathname of FSL-MC devices directory. */
43 #define SYSFS_FSL_MC_DEVICES "/sys/bus/fsl-mc/devices"
44
45 #define FSLMC_CONTAINER_MAX_LEN 8 /**< Of the format dprc.XX */
46
47 /* Number of VFIO containers & groups with in */
48 static struct fslmc_vfio_group vfio_group;
49 static struct fslmc_vfio_container vfio_container;
50 static int container_device_fd;
51 static char *g_container;
52 static uint32_t *msi_intr_vaddr;
53 void *(*rte_mcp_ptr_list);
54 static int is_dma_done;
55
56 static struct rte_dpaa2_object_list dpaa2_obj_list =
57         TAILQ_HEAD_INITIALIZER(dpaa2_obj_list);
58
59 /*register a fslmc bus based dpaa2 driver */
60 void
61 rte_fslmc_object_register(struct rte_dpaa2_object *object)
62 {
63         RTE_VERIFY(object);
64
65         TAILQ_INSERT_TAIL(&dpaa2_obj_list, object, next);
66 }
67
68 int
69 fslmc_get_container_group(int *groupid)
70 {
71         int ret;
72         char *container;
73
74         if (!g_container) {
75                 container = getenv("DPRC");
76                 if (container == NULL) {
77                         DPAA2_BUS_INFO("DPAA2: DPRC not available");
78                         return -EINVAL;
79                 }
80
81                 if (strlen(container) >= FSLMC_CONTAINER_MAX_LEN) {
82                         DPAA2_BUS_ERR("Invalid container name: %s", container);
83                         return -1;
84                 }
85
86                 g_container = strdup(container);
87                 if (!g_container) {
88                         DPAA2_BUS_ERR("Mem alloc failure; Container name");
89                         return -ENOMEM;
90                 }
91         }
92
93         /* get group number */
94         ret = vfio_get_group_no(SYSFS_FSL_MC_DEVICES, g_container, groupid);
95         if (ret <= 0) {
96                 DPAA2_BUS_ERR("Unable to find %s IOMMU group", g_container);
97                 return -1;
98         }
99
100         DPAA2_BUS_DEBUG("Container: %s has VFIO iommu group id = %d",
101                         g_container, *groupid);
102
103         return 0;
104 }
105
106 static int
107 vfio_connect_container(void)
108 {
109         int fd, ret;
110
111         if (vfio_container.used) {
112                 DPAA2_BUS_DEBUG("No container available");
113                 return -1;
114         }
115
116         /* Try connecting to vfio container if already created */
117         if (!ioctl(vfio_group.fd, VFIO_GROUP_SET_CONTAINER,
118                 &vfio_container.fd)) {
119                 DPAA2_BUS_DEBUG(
120                     "Container pre-exists with FD[0x%x] for this group",
121                     vfio_container.fd);
122                 vfio_group.container = &vfio_container;
123                 return 0;
124         }
125
126         /* Opens main vfio file descriptor which represents the "container" */
127         fd = vfio_get_container_fd();
128         if (fd < 0) {
129                 DPAA2_BUS_ERR("Failed to open VFIO container");
130                 return -errno;
131         }
132
133         /* Check whether support for SMMU type IOMMU present or not */
134         if (ioctl(fd, VFIO_CHECK_EXTENSION, VFIO_TYPE1_IOMMU)) {
135                 /* Connect group to container */
136                 ret = ioctl(vfio_group.fd, VFIO_GROUP_SET_CONTAINER, &fd);
137                 if (ret) {
138                         DPAA2_BUS_ERR("Failed to setup group container");
139                         close(fd);
140                         return -errno;
141                 }
142
143                 ret = ioctl(fd, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU);
144                 if (ret) {
145                         DPAA2_BUS_ERR("Failed to setup VFIO iommu");
146                         close(fd);
147                         return -errno;
148                 }
149         } else {
150                 DPAA2_BUS_ERR("No supported IOMMU available");
151                 close(fd);
152                 return -EINVAL;
153         }
154
155         vfio_container.used = 1;
156         vfio_container.fd = fd;
157         vfio_container.group = &vfio_group;
158         vfio_group.container = &vfio_container;
159
160         return 0;
161 }
162
163 static int vfio_map_irq_region(struct fslmc_vfio_group *group)
164 {
165         int ret;
166         unsigned long *vaddr = NULL;
167         struct vfio_iommu_type1_dma_map map = {
168                 .argsz = sizeof(map),
169                 .flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE,
170                 .vaddr = 0x6030000,
171                 .iova = 0x6030000,
172                 .size = 0x1000,
173         };
174
175         vaddr = (unsigned long *)mmap(NULL, 0x1000, PROT_WRITE |
176                 PROT_READ, MAP_SHARED, container_device_fd, 0x6030000);
177         if (vaddr == MAP_FAILED) {
178                 DPAA2_BUS_ERR("Unable to map region (errno = %d)", errno);
179                 return -errno;
180         }
181
182         msi_intr_vaddr = (uint32_t *)((char *)(vaddr) + 64);
183         map.vaddr = (unsigned long)vaddr;
184         ret = ioctl(group->container->fd, VFIO_IOMMU_MAP_DMA, &map);
185         if (ret == 0)
186                 return 0;
187
188         DPAA2_BUS_ERR("Unable to map DMA address (errno = %d)", errno);
189         return -errno;
190 }
191
192 int rte_fslmc_vfio_dmamap(void)
193 {
194         int ret;
195         struct fslmc_vfio_group *group;
196         struct vfio_iommu_type1_dma_map dma_map = {
197                 .argsz = sizeof(struct vfio_iommu_type1_dma_map),
198                 .flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE,
199         };
200
201         int i;
202         const struct rte_memseg *memseg;
203
204         if (is_dma_done)
205                 return 0;
206
207         memseg = rte_eal_get_physmem_layout();
208         if (memseg == NULL) {
209                 DPAA2_BUS_ERR("Cannot get physical layout");
210                 return -ENODEV;
211         }
212
213         for (i = 0; i < RTE_MAX_MEMSEG; i++) {
214                 if (memseg[i].addr == NULL && memseg[i].len == 0) {
215                         DPAA2_BUS_DEBUG("Total %d segments found", i);
216                         break;
217                 }
218
219                 dma_map.size = memseg[i].len;
220                 dma_map.vaddr = memseg[i].addr_64;
221 #ifdef RTE_LIBRTE_DPAA2_USE_PHYS_IOVA
222                 dma_map.iova = memseg[i].iova;
223 #else
224                 dma_map.iova = dma_map.vaddr;
225 #endif
226
227                 /* SET DMA MAP for IOMMU */
228                 group = &vfio_group;
229
230                 if (!group->container) {
231                         DPAA2_BUS_ERR("Container is not connected");
232                         return -1;
233                 }
234
235                 DPAA2_BUS_DEBUG("-->Initial SHM Virtual ADDR %llX",
236                                 dma_map.vaddr);
237                 DPAA2_BUS_DEBUG("-----> DMA size 0x%llX", dma_map.size);
238                 ret = ioctl(group->container->fd, VFIO_IOMMU_MAP_DMA,
239                             &dma_map);
240                 if (ret) {
241                         DPAA2_BUS_ERR("Unable to map DMA address (errno = %d)",
242                                       errno);
243                         return ret;
244                 }
245         }
246
247         /* Verifying that at least single segment is available */
248         if (i <= 0) {
249                 DPAA2_BUS_ERR("No Segments found for VFIO Mapping");
250                 return -1;
251         }
252
253         /* TODO - This is a W.A. as VFIO currently does not add the mapping of
254          * the interrupt region to SMMU. This should be removed once the
255          * support is added in the Kernel.
256          */
257         vfio_map_irq_region(group);
258
259         is_dma_done = 1;
260
261         return 0;
262 }
263
264 static int64_t vfio_map_mcp_obj(struct fslmc_vfio_group *group, char *mcp_obj)
265 {
266         intptr_t v_addr = (intptr_t)MAP_FAILED;
267         int32_t ret, mc_fd;
268
269         struct vfio_device_info d_info = { .argsz = sizeof(d_info) };
270         struct vfio_region_info reg_info = { .argsz = sizeof(reg_info) };
271
272         /* getting the mcp object's fd*/
273         mc_fd = ioctl(group->fd, VFIO_GROUP_GET_DEVICE_FD, mcp_obj);
274         if (mc_fd < 0) {
275                 DPAA2_BUS_ERR("Error in VFIO get dev %s fd from group %d",
276                               mcp_obj, group->fd);
277                 return v_addr;
278         }
279
280         /* getting device info*/
281         ret = ioctl(mc_fd, VFIO_DEVICE_GET_INFO, &d_info);
282         if (ret < 0) {
283                 DPAA2_BUS_ERR("Error in VFIO getting DEVICE_INFO");
284                 goto MC_FAILURE;
285         }
286
287         /* getting device region info*/
288         ret = ioctl(mc_fd, VFIO_DEVICE_GET_REGION_INFO, &reg_info);
289         if (ret < 0) {
290                 DPAA2_BUS_ERR("Error in VFIO getting REGION_INFO");
291                 goto MC_FAILURE;
292         }
293
294         DPAA2_BUS_DEBUG("Region offset = %llx  , region size = %llx",
295                         reg_info.offset, reg_info.size);
296
297         v_addr = (size_t)mmap(NULL, reg_info.size,
298                 PROT_WRITE | PROT_READ, MAP_SHARED,
299                 mc_fd, reg_info.offset);
300
301 MC_FAILURE:
302         close(mc_fd);
303
304         return v_addr;
305 }
306
307 #define IRQ_SET_BUF_LEN  (sizeof(struct vfio_irq_set) + sizeof(int))
308
309 int rte_dpaa2_intr_enable(struct rte_intr_handle *intr_handle, int index)
310 {
311         int len, ret;
312         char irq_set_buf[IRQ_SET_BUF_LEN];
313         struct vfio_irq_set *irq_set;
314         int *fd_ptr;
315
316         len = sizeof(irq_set_buf);
317
318         irq_set = (struct vfio_irq_set *)irq_set_buf;
319         irq_set->argsz = len;
320         irq_set->count = 1;
321         irq_set->flags =
322                 VFIO_IRQ_SET_DATA_EVENTFD | VFIO_IRQ_SET_ACTION_TRIGGER;
323         irq_set->index = index;
324         irq_set->start = 0;
325         fd_ptr = (int *)&irq_set->data;
326         *fd_ptr = intr_handle->fd;
327
328         ret = ioctl(intr_handle->vfio_dev_fd, VFIO_DEVICE_SET_IRQS, irq_set);
329         if (ret) {
330                 DPAA2_BUS_ERR("Error:dpaa2 SET IRQs fd=%d, err = %d(%s)",
331                               intr_handle->fd, errno, strerror(errno));
332                 return ret;
333         }
334
335         return ret;
336 }
337
338 int rte_dpaa2_intr_disable(struct rte_intr_handle *intr_handle, int index)
339 {
340         struct vfio_irq_set *irq_set;
341         char irq_set_buf[IRQ_SET_BUF_LEN];
342         int len, ret;
343
344         len = sizeof(struct vfio_irq_set);
345
346         irq_set = (struct vfio_irq_set *)irq_set_buf;
347         irq_set->argsz = len;
348         irq_set->flags = VFIO_IRQ_SET_DATA_NONE | VFIO_IRQ_SET_ACTION_TRIGGER;
349         irq_set->index = index;
350         irq_set->start = 0;
351         irq_set->count = 0;
352
353         ret = ioctl(intr_handle->vfio_dev_fd, VFIO_DEVICE_SET_IRQS, irq_set);
354         if (ret)
355                 DPAA2_BUS_ERR(
356                         "Error disabling dpaa2 interrupts for fd %d",
357                         intr_handle->fd);
358
359         return ret;
360 }
361
362 /* set up interrupt support (but not enable interrupts) */
363 int
364 rte_dpaa2_vfio_setup_intr(struct rte_intr_handle *intr_handle,
365                           int vfio_dev_fd,
366                           int num_irqs)
367 {
368         int i, ret;
369
370         /* start from MSI-X interrupt type */
371         for (i = 0; i < num_irqs; i++) {
372                 struct vfio_irq_info irq_info = { .argsz = sizeof(irq_info) };
373                 int fd = -1;
374
375                 irq_info.index = i;
376
377                 ret = ioctl(vfio_dev_fd, VFIO_DEVICE_GET_IRQ_INFO, &irq_info);
378                 if (ret < 0) {
379                         DPAA2_BUS_ERR("Cannot get IRQ(%d) info, error %i (%s)",
380                                       i, errno, strerror(errno));
381                         return -1;
382                 }
383
384                 /* if this vector cannot be used with eventfd,
385                  * fail if we explicitly
386                  * specified interrupt type, otherwise continue
387                  */
388                 if ((irq_info.flags & VFIO_IRQ_INFO_EVENTFD) == 0)
389                         continue;
390
391                 /* set up an eventfd for interrupts */
392                 fd = eventfd(0, EFD_NONBLOCK | EFD_CLOEXEC);
393                 if (fd < 0) {
394                         DPAA2_BUS_ERR("Cannot set up eventfd, error %i (%s)",
395                                       errno, strerror(errno));
396                         return -1;
397                 }
398
399                 intr_handle->fd = fd;
400                 intr_handle->type = RTE_INTR_HANDLE_VFIO_MSI;
401                 intr_handle->vfio_dev_fd = vfio_dev_fd;
402
403                 return 0;
404         }
405
406         /* if we're here, we haven't found a suitable interrupt vector */
407         return -1;
408 }
409
410 /*
411  * fslmc_process_iodevices for processing only IO (ETH, CRYPTO, and possibly
412  * EVENT) devices.
413  */
414 static int
415 fslmc_process_iodevices(struct rte_dpaa2_device *dev)
416 {
417         int dev_fd;
418         struct vfio_device_info device_info = { .argsz = sizeof(device_info) };
419         struct rte_dpaa2_object *object = NULL;
420
421         dev_fd = ioctl(vfio_group.fd, VFIO_GROUP_GET_DEVICE_FD,
422                        dev->device.name);
423         if (dev_fd <= 0) {
424                 DPAA2_BUS_ERR("Unable to obtain device FD for device:%s",
425                               dev->device.name);
426                 return -1;
427         }
428
429         if (ioctl(dev_fd, VFIO_DEVICE_GET_INFO, &device_info)) {
430                 DPAA2_BUS_ERR("Unable to obtain information for device:%s",
431                               dev->device.name);
432                 return -1;
433         }
434
435         switch (dev->dev_type) {
436         case DPAA2_ETH:
437                 rte_dpaa2_vfio_setup_intr(&dev->intr_handle, dev_fd,
438                                           device_info.num_irqs);
439                 break;
440         case DPAA2_CON:
441         case DPAA2_IO:
442         case DPAA2_CI:
443         case DPAA2_BPOOL:
444                 TAILQ_FOREACH(object, &dpaa2_obj_list, next) {
445                         if (dev->dev_type == object->dev_type)
446                                 object->create(dev_fd, &device_info,
447                                                dev->object_id);
448                         else
449                                 continue;
450                 }
451                 break;
452         default:
453                 break;
454         }
455
456         DPAA2_BUS_DEBUG("Device (%s) abstracted from VFIO",
457                         dev->device.name);
458         return 0;
459 }
460
461 static int
462 fslmc_process_mcp(struct rte_dpaa2_device *dev)
463 {
464         intptr_t v_addr;
465         char *dev_name;
466         struct fsl_mc_io dpmng  = {0};
467         struct mc_version mc_ver_info = {0};
468
469         rte_mcp_ptr_list = malloc(sizeof(void *) * 1);
470         if (!rte_mcp_ptr_list) {
471                 DPAA2_BUS_ERR("Unable to allocate MC portal memory");
472                 return -ENOMEM;
473         }
474
475         dev_name = strdup(dev->device.name);
476         if (!dev_name) {
477                 DPAA2_BUS_ERR("Unable to allocate MC device name memory");
478                 free(rte_mcp_ptr_list);
479                 rte_mcp_ptr_list = NULL;
480                 return -ENOMEM;
481         }
482
483         v_addr = vfio_map_mcp_obj(&vfio_group, dev_name);
484         if (v_addr == (intptr_t)MAP_FAILED) {
485                 DPAA2_BUS_ERR("Error mapping region (errno = %d)", errno);
486                 free(rte_mcp_ptr_list);
487                 rte_mcp_ptr_list = NULL;
488                 return -1;
489         }
490
491         /* check the MC version compatibility */
492         dpmng.regs = (void *)v_addr;
493         if (mc_get_version(&dpmng, CMD_PRI_LOW, &mc_ver_info)) {
494                 DPAA2_BUS_ERR("Unable to obtain MC version");
495                 return -1;
496         }
497
498         if ((mc_ver_info.major != MC_VER_MAJOR) ||
499             (mc_ver_info.minor < MC_VER_MINOR)) {
500                 DPAA2_BUS_ERR("DPAA2 MC version not compatible!"
501                               " Expected %d.%d.x, Detected %d.%d.%d",
502                               MC_VER_MAJOR, MC_VER_MINOR,
503                               mc_ver_info.major, mc_ver_info.minor,
504                               mc_ver_info.revision);
505                 free(rte_mcp_ptr_list);
506                 rte_mcp_ptr_list = NULL;
507                 return -1;
508         }
509         rte_mcp_ptr_list[0] = (void *)v_addr;
510
511         return 0;
512 }
513
514 int
515 fslmc_vfio_process_group(void)
516 {
517         int ret;
518         int found_mportal = 0;
519         struct rte_dpaa2_device *dev, *dev_temp;
520
521         /* Search the MCP as that should be initialized first. */
522         TAILQ_FOREACH_SAFE(dev, &rte_fslmc_bus.device_list, next, dev_temp) {
523                 if (dev->dev_type == DPAA2_MPORTAL) {
524                         ret = fslmc_process_mcp(dev);
525                         if (ret) {
526                                 DPAA2_BUS_ERR("Unable to map MC Portal");
527                                 return -1;
528                         }
529                         if (!found_mportal)
530                                 found_mportal = 1;
531
532                         TAILQ_REMOVE(&rte_fslmc_bus.device_list, dev, next);
533                         free(dev);
534                         dev = NULL;
535                         /* Ideally there is only a single dpmcp, but in case
536                          * multiple exists, looping on remaining devices.
537                          */
538                 }
539         }
540
541         /* Cannot continue if there is not even a single mportal */
542         if (!found_mportal) {
543                 DPAA2_BUS_ERR("No MC Portal device found. Not continuing");
544                 return -1;
545         }
546
547         TAILQ_FOREACH_SAFE(dev, &rte_fslmc_bus.device_list, next, dev_temp) {
548                 if (!dev)
549                         break;
550
551                 switch (dev->dev_type) {
552                 case DPAA2_ETH:
553                 case DPAA2_CRYPTO:
554                         ret = fslmc_process_iodevices(dev);
555                         if (ret) {
556                                 DPAA2_BUS_DEBUG("Dev (%s) init failed",
557                                                 dev->device.name);
558                                 return ret;
559                         }
560                         break;
561                 case DPAA2_CON:
562                 case DPAA2_IO:
563                 case DPAA2_CI:
564                 case DPAA2_BPOOL:
565                         /* Call the object creation routine and remove the
566                          * device entry from device list
567                          */
568                         ret = fslmc_process_iodevices(dev);
569                         if (ret) {
570                                 DPAA2_BUS_DEBUG("Dev (%s) init failed",
571                                                 dev->device.name);
572                                 return -1;
573                         }
574
575                         /* This device is not required to be in the DPDK
576                          * exposed device list.
577                          */
578                         TAILQ_REMOVE(&rte_fslmc_bus.device_list, dev, next);
579                         free(dev);
580                         dev = NULL;
581                         break;
582                 case DPAA2_UNKNOWN:
583                 default:
584                         /* Unknown - ignore */
585                         DPAA2_BUS_DEBUG("Found unknown device (%s)",
586                                         dev->device.name);
587                         TAILQ_REMOVE(&rte_fslmc_bus.device_list, dev, next);
588                         free(dev);
589                         dev = NULL;
590                 }
591         }
592
593         return 0;
594 }
595
596 int
597 fslmc_vfio_setup_group(void)
598 {
599         int groupid;
600         int ret;
601         struct vfio_group_status status = { .argsz = sizeof(status) };
602
603         /* if already done once */
604         if (container_device_fd)
605                 return 0;
606
607         ret = fslmc_get_container_group(&groupid);
608         if (ret)
609                 return ret;
610
611         /* In case this group was already opened, continue without any
612          * processing.
613          */
614         if (vfio_group.groupid == groupid) {
615                 DPAA2_BUS_ERR("groupid already exists %d", groupid);
616                 return 0;
617         }
618
619         /* Get the actual group fd */
620         ret = vfio_get_group_fd(groupid);
621         if (ret < 0)
622                 return ret;
623         vfio_group.fd = ret;
624
625         /* Check group viability */
626         ret = ioctl(vfio_group.fd, VFIO_GROUP_GET_STATUS, &status);
627         if (ret) {
628                 DPAA2_BUS_ERR("VFIO error getting group status");
629                 close(vfio_group.fd);
630                 rte_vfio_clear_group(vfio_group.fd);
631                 return ret;
632         }
633
634         if (!(status.flags & VFIO_GROUP_FLAGS_VIABLE)) {
635                 DPAA2_BUS_ERR("VFIO group not viable");
636                 close(vfio_group.fd);
637                 rte_vfio_clear_group(vfio_group.fd);
638                 return -EPERM;
639         }
640         /* Since Group is VIABLE, Store the groupid */
641         vfio_group.groupid = groupid;
642
643         /* check if group does not have a container yet */
644         if (!(status.flags & VFIO_GROUP_FLAGS_CONTAINER_SET)) {
645                 /* Now connect this IOMMU group to given container */
646                 ret = vfio_connect_container();
647                 if (ret) {
648                         DPAA2_BUS_ERR(
649                                 "Error connecting container with groupid %d",
650                                 groupid);
651                         close(vfio_group.fd);
652                         rte_vfio_clear_group(vfio_group.fd);
653                         return ret;
654                 }
655         }
656
657         /* Get Device information */
658         ret = ioctl(vfio_group.fd, VFIO_GROUP_GET_DEVICE_FD, g_container);
659         if (ret < 0) {
660                 DPAA2_BUS_ERR("Error getting device %s fd from group %d",
661                               g_container, vfio_group.groupid);
662                 close(vfio_group.fd);
663                 rte_vfio_clear_group(vfio_group.fd);
664                 return ret;
665         }
666         container_device_fd = ret;
667         DPAA2_BUS_DEBUG("VFIO Container FD is [0x%X]",
668                         container_device_fd);
669
670         return 0;
671 }