62499de05c97bea7d5965af1c4599b5cb5b5cf7f
[dpdk.git] / drivers / bus / fslmc / fslmc_vfio.c
1 /* SPDX-License-Identifier: BSD-3-Clause
2  *
3  *   Copyright (c) 2015-2016 Freescale Semiconductor, Inc. All rights reserved.
4  *   Copyright 2016 NXP
5  *
6  */
7
8 #include <unistd.h>
9 #include <stdio.h>
10 #include <sys/types.h>
11 #include <string.h>
12 #include <stdlib.h>
13 #include <fcntl.h>
14 #include <errno.h>
15 #include <sys/ioctl.h>
16 #include <sys/stat.h>
17 #include <sys/mman.h>
18 #include <sys/vfs.h>
19 #include <libgen.h>
20 #include <dirent.h>
21 #include <sys/eventfd.h>
22
23 #include <eal_filesystem.h>
24 #include <rte_mbuf.h>
25 #include <rte_ethdev_driver.h>
26 #include <rte_malloc.h>
27 #include <rte_memcpy.h>
28 #include <rte_string_fns.h>
29 #include <rte_cycles.h>
30 #include <rte_kvargs.h>
31 #include <rte_dev.h>
32 #include <rte_bus.h>
33
34 #include "rte_fslmc.h"
35 #include "fslmc_vfio.h"
36 #include "fslmc_logs.h"
37 #include <mc/fsl_dpmng.h>
38
39 #include "portal/dpaa2_hw_pvt.h"
40 #include "portal/dpaa2_hw_dpio.h"
41
42 /** Pathname of FSL-MC devices directory. */
43 #define SYSFS_FSL_MC_DEVICES "/sys/bus/fsl-mc/devices"
44
45 #define FSLMC_CONTAINER_MAX_LEN 8 /**< Of the format dprc.XX */
46
47 /* Number of VFIO containers & groups with in */
48 static struct fslmc_vfio_group vfio_group;
49 static struct fslmc_vfio_container vfio_container;
50 static int container_device_fd;
51 static char *g_container;
52 static uint32_t *msi_intr_vaddr;
53 void *(*rte_mcp_ptr_list);
54 static int is_dma_done;
55
56 static struct rte_dpaa2_object_list dpaa2_obj_list =
57         TAILQ_HEAD_INITIALIZER(dpaa2_obj_list);
58
59 /*register a fslmc bus based dpaa2 driver */
60 void
61 rte_fslmc_object_register(struct rte_dpaa2_object *object)
62 {
63         RTE_VERIFY(object);
64
65         TAILQ_INSERT_TAIL(&dpaa2_obj_list, object, next);
66 }
67
68 int
69 fslmc_get_container_group(int *groupid)
70 {
71         int ret;
72         char *container;
73
74         if (!g_container) {
75                 container = getenv("DPRC");
76                 if (container == NULL) {
77                         DPAA2_BUS_INFO("DPAA2: DPRC not available");
78                         return -EINVAL;
79                 }
80
81                 if (strlen(container) >= FSLMC_CONTAINER_MAX_LEN) {
82                         DPAA2_BUS_ERR("Invalid container name: %s", container);
83                         return -1;
84                 }
85
86                 g_container = strdup(container);
87                 if (!g_container) {
88                         DPAA2_BUS_ERR("Mem alloc failure; Container name");
89                         return -ENOMEM;
90                 }
91         }
92
93         /* get group number */
94         ret = vfio_get_group_no(SYSFS_FSL_MC_DEVICES, g_container, groupid);
95         if (ret <= 0) {
96                 DPAA2_BUS_ERR("Unable to find %s IOMMU group", g_container);
97                 return -1;
98         }
99
100         DPAA2_BUS_DEBUG("Container: %s has VFIO iommu group id = %d",
101                         g_container, *groupid);
102
103         return 0;
104 }
105
106 static int
107 vfio_connect_container(void)
108 {
109         int fd, ret;
110
111         if (vfio_container.used) {
112                 DPAA2_BUS_DEBUG("No container available");
113                 return -1;
114         }
115
116         /* Try connecting to vfio container if already created */
117         if (!ioctl(vfio_group.fd, VFIO_GROUP_SET_CONTAINER,
118                 &vfio_container.fd)) {
119                 DPAA2_BUS_DEBUG(
120                     "Container pre-exists with FD[0x%x] for this group",
121                     vfio_container.fd);
122                 vfio_group.container = &vfio_container;
123                 return 0;
124         }
125
126         /* Opens main vfio file descriptor which represents the "container" */
127         fd = vfio_get_container_fd();
128         if (fd < 0) {
129                 DPAA2_BUS_ERR("Failed to open VFIO container");
130                 return -errno;
131         }
132
133         /* Check whether support for SMMU type IOMMU present or not */
134         if (ioctl(fd, VFIO_CHECK_EXTENSION, VFIO_TYPE1_IOMMU)) {
135                 /* Connect group to container */
136                 ret = ioctl(vfio_group.fd, VFIO_GROUP_SET_CONTAINER, &fd);
137                 if (ret) {
138                         DPAA2_BUS_ERR("Failed to setup group container");
139                         close(fd);
140                         return -errno;
141                 }
142
143                 ret = ioctl(fd, VFIO_SET_IOMMU, VFIO_TYPE1_IOMMU);
144                 if (ret) {
145                         DPAA2_BUS_ERR("Failed to setup VFIO iommu");
146                         close(fd);
147                         return -errno;
148                 }
149         } else {
150                 DPAA2_BUS_ERR("No supported IOMMU available");
151                 close(fd);
152                 return -EINVAL;
153         }
154
155         vfio_container.used = 1;
156         vfio_container.fd = fd;
157         vfio_container.group = &vfio_group;
158         vfio_group.container = &vfio_container;
159
160         return 0;
161 }
162
163 static int vfio_map_irq_region(struct fslmc_vfio_group *group)
164 {
165         int ret;
166         unsigned long *vaddr = NULL;
167         struct vfio_iommu_type1_dma_map map = {
168                 .argsz = sizeof(map),
169                 .flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE,
170                 .vaddr = 0x6030000,
171                 .iova = 0x6030000,
172                 .size = 0x1000,
173         };
174
175         vaddr = (unsigned long *)mmap(NULL, 0x1000, PROT_WRITE |
176                 PROT_READ, MAP_SHARED, container_device_fd, 0x6030000);
177         if (vaddr == MAP_FAILED) {
178                 DPAA2_BUS_ERR("Unable to map region (errno = %d)", errno);
179                 return -errno;
180         }
181
182         msi_intr_vaddr = (uint32_t *)((char *)(vaddr) + 64);
183         map.vaddr = (unsigned long)vaddr;
184         ret = ioctl(group->container->fd, VFIO_IOMMU_MAP_DMA, &map);
185         if (ret == 0)
186                 return 0;
187
188         DPAA2_BUS_ERR("Unable to map DMA address (errno = %d)", errno);
189         return -errno;
190 }
191
192 int rte_fslmc_vfio_dmamap(void)
193 {
194         int ret;
195         struct fslmc_vfio_group *group;
196         struct vfio_iommu_type1_dma_map dma_map = {
197                 .argsz = sizeof(struct vfio_iommu_type1_dma_map),
198                 .flags = VFIO_DMA_MAP_FLAG_READ | VFIO_DMA_MAP_FLAG_WRITE,
199         };
200
201         int i;
202         const struct rte_memseg *memseg;
203
204         if (is_dma_done)
205                 return 0;
206
207         memseg = rte_eal_get_physmem_layout();
208         if (memseg == NULL) {
209                 DPAA2_BUS_ERR("Cannot get physical layout");
210                 return -ENODEV;
211         }
212
213         for (i = 0; i < RTE_MAX_MEMSEG; i++) {
214                 if (memseg[i].addr == NULL && memseg[i].len == 0) {
215                         DPAA2_BUS_DEBUG("Total %d segments found", i);
216                         break;
217                 }
218
219                 dma_map.size = memseg[i].len;
220                 dma_map.vaddr = memseg[i].addr_64;
221 #ifdef RTE_LIBRTE_DPAA2_USE_PHYS_IOVA
222                 if (rte_eal_iova_mode() == RTE_IOVA_VA)
223                         dma_map.iova = dma_map.vaddr;
224                 else
225                         dma_map.iova = memseg[i].iova;
226 #else
227                 dma_map.iova = dma_map.vaddr;
228 #endif
229
230                 /* SET DMA MAP for IOMMU */
231                 group = &vfio_group;
232
233                 if (!group->container) {
234                         DPAA2_BUS_ERR("Container is not connected");
235                         return -1;
236                 }
237
238                 DPAA2_BUS_DEBUG("-->Initial SHM Virtual ADDR %llX",
239                                 dma_map.vaddr);
240                 DPAA2_BUS_DEBUG("-----> DMA size 0x%llX", dma_map.size);
241                 ret = ioctl(group->container->fd, VFIO_IOMMU_MAP_DMA,
242                             &dma_map);
243                 if (ret) {
244                         DPAA2_BUS_ERR("Unable to map DMA address (errno = %d)",
245                                       errno);
246                         return ret;
247                 }
248         }
249
250         /* Verifying that at least single segment is available */
251         if (i <= 0) {
252                 DPAA2_BUS_ERR("No Segments found for VFIO Mapping");
253                 return -1;
254         }
255
256         /* TODO - This is a W.A. as VFIO currently does not add the mapping of
257          * the interrupt region to SMMU. This should be removed once the
258          * support is added in the Kernel.
259          */
260         vfio_map_irq_region(group);
261
262         is_dma_done = 1;
263
264         return 0;
265 }
266
267 static int64_t vfio_map_mcp_obj(struct fslmc_vfio_group *group, char *mcp_obj)
268 {
269         intptr_t v_addr = (intptr_t)MAP_FAILED;
270         int32_t ret, mc_fd;
271
272         struct vfio_device_info d_info = { .argsz = sizeof(d_info) };
273         struct vfio_region_info reg_info = { .argsz = sizeof(reg_info) };
274
275         /* getting the mcp object's fd*/
276         mc_fd = ioctl(group->fd, VFIO_GROUP_GET_DEVICE_FD, mcp_obj);
277         if (mc_fd < 0) {
278                 DPAA2_BUS_ERR("Error in VFIO get dev %s fd from group %d",
279                               mcp_obj, group->fd);
280                 return v_addr;
281         }
282
283         /* getting device info*/
284         ret = ioctl(mc_fd, VFIO_DEVICE_GET_INFO, &d_info);
285         if (ret < 0) {
286                 DPAA2_BUS_ERR("Error in VFIO getting DEVICE_INFO");
287                 goto MC_FAILURE;
288         }
289
290         /* getting device region info*/
291         ret = ioctl(mc_fd, VFIO_DEVICE_GET_REGION_INFO, &reg_info);
292         if (ret < 0) {
293                 DPAA2_BUS_ERR("Error in VFIO getting REGION_INFO");
294                 goto MC_FAILURE;
295         }
296
297         DPAA2_BUS_DEBUG("Region offset = %llx  , region size = %llx",
298                         reg_info.offset, reg_info.size);
299
300         v_addr = (size_t)mmap(NULL, reg_info.size,
301                 PROT_WRITE | PROT_READ, MAP_SHARED,
302                 mc_fd, reg_info.offset);
303
304 MC_FAILURE:
305         close(mc_fd);
306
307         return v_addr;
308 }
309
310 #define IRQ_SET_BUF_LEN  (sizeof(struct vfio_irq_set) + sizeof(int))
311
312 int rte_dpaa2_intr_enable(struct rte_intr_handle *intr_handle, int index)
313 {
314         int len, ret;
315         char irq_set_buf[IRQ_SET_BUF_LEN];
316         struct vfio_irq_set *irq_set;
317         int *fd_ptr;
318
319         len = sizeof(irq_set_buf);
320
321         irq_set = (struct vfio_irq_set *)irq_set_buf;
322         irq_set->argsz = len;
323         irq_set->count = 1;
324         irq_set->flags =
325                 VFIO_IRQ_SET_DATA_EVENTFD | VFIO_IRQ_SET_ACTION_TRIGGER;
326         irq_set->index = index;
327         irq_set->start = 0;
328         fd_ptr = (int *)&irq_set->data;
329         *fd_ptr = intr_handle->fd;
330
331         ret = ioctl(intr_handle->vfio_dev_fd, VFIO_DEVICE_SET_IRQS, irq_set);
332         if (ret) {
333                 DPAA2_BUS_ERR("Error:dpaa2 SET IRQs fd=%d, err = %d(%s)",
334                               intr_handle->fd, errno, strerror(errno));
335                 return ret;
336         }
337
338         return ret;
339 }
340
341 int rte_dpaa2_intr_disable(struct rte_intr_handle *intr_handle, int index)
342 {
343         struct vfio_irq_set *irq_set;
344         char irq_set_buf[IRQ_SET_BUF_LEN];
345         int len, ret;
346
347         len = sizeof(struct vfio_irq_set);
348
349         irq_set = (struct vfio_irq_set *)irq_set_buf;
350         irq_set->argsz = len;
351         irq_set->flags = VFIO_IRQ_SET_DATA_NONE | VFIO_IRQ_SET_ACTION_TRIGGER;
352         irq_set->index = index;
353         irq_set->start = 0;
354         irq_set->count = 0;
355
356         ret = ioctl(intr_handle->vfio_dev_fd, VFIO_DEVICE_SET_IRQS, irq_set);
357         if (ret)
358                 DPAA2_BUS_ERR(
359                         "Error disabling dpaa2 interrupts for fd %d",
360                         intr_handle->fd);
361
362         return ret;
363 }
364
365 /* set up interrupt support (but not enable interrupts) */
366 int
367 rte_dpaa2_vfio_setup_intr(struct rte_intr_handle *intr_handle,
368                           int vfio_dev_fd,
369                           int num_irqs)
370 {
371         int i, ret;
372
373         /* start from MSI-X interrupt type */
374         for (i = 0; i < num_irqs; i++) {
375                 struct vfio_irq_info irq_info = { .argsz = sizeof(irq_info) };
376                 int fd = -1;
377
378                 irq_info.index = i;
379
380                 ret = ioctl(vfio_dev_fd, VFIO_DEVICE_GET_IRQ_INFO, &irq_info);
381                 if (ret < 0) {
382                         DPAA2_BUS_ERR("Cannot get IRQ(%d) info, error %i (%s)",
383                                       i, errno, strerror(errno));
384                         return -1;
385                 }
386
387                 /* if this vector cannot be used with eventfd,
388                  * fail if we explicitly
389                  * specified interrupt type, otherwise continue
390                  */
391                 if ((irq_info.flags & VFIO_IRQ_INFO_EVENTFD) == 0)
392                         continue;
393
394                 /* set up an eventfd for interrupts */
395                 fd = eventfd(0, EFD_NONBLOCK | EFD_CLOEXEC);
396                 if (fd < 0) {
397                         DPAA2_BUS_ERR("Cannot set up eventfd, error %i (%s)",
398                                       errno, strerror(errno));
399                         return -1;
400                 }
401
402                 intr_handle->fd = fd;
403                 intr_handle->type = RTE_INTR_HANDLE_VFIO_MSI;
404                 intr_handle->vfio_dev_fd = vfio_dev_fd;
405
406                 return 0;
407         }
408
409         /* if we're here, we haven't found a suitable interrupt vector */
410         return -1;
411 }
412
413 /*
414  * fslmc_process_iodevices for processing only IO (ETH, CRYPTO, and possibly
415  * EVENT) devices.
416  */
417 static int
418 fslmc_process_iodevices(struct rte_dpaa2_device *dev)
419 {
420         int dev_fd;
421         struct vfio_device_info device_info = { .argsz = sizeof(device_info) };
422         struct rte_dpaa2_object *object = NULL;
423
424         dev_fd = ioctl(vfio_group.fd, VFIO_GROUP_GET_DEVICE_FD,
425                        dev->device.name);
426         if (dev_fd <= 0) {
427                 DPAA2_BUS_ERR("Unable to obtain device FD for device:%s",
428                               dev->device.name);
429                 return -1;
430         }
431
432         if (ioctl(dev_fd, VFIO_DEVICE_GET_INFO, &device_info)) {
433                 DPAA2_BUS_ERR("Unable to obtain information for device:%s",
434                               dev->device.name);
435                 return -1;
436         }
437
438         switch (dev->dev_type) {
439         case DPAA2_ETH:
440                 rte_dpaa2_vfio_setup_intr(&dev->intr_handle, dev_fd,
441                                           device_info.num_irqs);
442                 break;
443         case DPAA2_CON:
444         case DPAA2_IO:
445         case DPAA2_CI:
446         case DPAA2_BPOOL:
447                 TAILQ_FOREACH(object, &dpaa2_obj_list, next) {
448                         if (dev->dev_type == object->dev_type)
449                                 object->create(dev_fd, &device_info,
450                                                dev->object_id);
451                         else
452                                 continue;
453                 }
454                 break;
455         default:
456                 break;
457         }
458
459         DPAA2_BUS_DEBUG("Device (%s) abstracted from VFIO",
460                         dev->device.name);
461         return 0;
462 }
463
464 static int
465 fslmc_process_mcp(struct rte_dpaa2_device *dev)
466 {
467         intptr_t v_addr;
468         char *dev_name;
469         struct fsl_mc_io dpmng  = {0};
470         struct mc_version mc_ver_info = {0};
471
472         rte_mcp_ptr_list = malloc(sizeof(void *) * 1);
473         if (!rte_mcp_ptr_list) {
474                 DPAA2_BUS_ERR("Unable to allocate MC portal memory");
475                 return -ENOMEM;
476         }
477
478         dev_name = strdup(dev->device.name);
479         if (!dev_name) {
480                 DPAA2_BUS_ERR("Unable to allocate MC device name memory");
481                 free(rte_mcp_ptr_list);
482                 rte_mcp_ptr_list = NULL;
483                 return -ENOMEM;
484         }
485
486         v_addr = vfio_map_mcp_obj(&vfio_group, dev_name);
487         if (v_addr == (intptr_t)MAP_FAILED) {
488                 DPAA2_BUS_ERR("Error mapping region (errno = %d)", errno);
489                 free(rte_mcp_ptr_list);
490                 rte_mcp_ptr_list = NULL;
491                 return -1;
492         }
493
494         /* check the MC version compatibility */
495         dpmng.regs = (void *)v_addr;
496         if (mc_get_version(&dpmng, CMD_PRI_LOW, &mc_ver_info)) {
497                 DPAA2_BUS_ERR("Unable to obtain MC version");
498                 return -1;
499         }
500
501         if ((mc_ver_info.major != MC_VER_MAJOR) ||
502             (mc_ver_info.minor < MC_VER_MINOR)) {
503                 DPAA2_BUS_ERR("DPAA2 MC version not compatible!"
504                               " Expected %d.%d.x, Detected %d.%d.%d",
505                               MC_VER_MAJOR, MC_VER_MINOR,
506                               mc_ver_info.major, mc_ver_info.minor,
507                               mc_ver_info.revision);
508                 free(rte_mcp_ptr_list);
509                 rte_mcp_ptr_list = NULL;
510                 return -1;
511         }
512         rte_mcp_ptr_list[0] = (void *)v_addr;
513
514         return 0;
515 }
516
517 int
518 fslmc_vfio_process_group(void)
519 {
520         int ret;
521         int found_mportal = 0;
522         struct rte_dpaa2_device *dev, *dev_temp;
523
524         /* Search the MCP as that should be initialized first. */
525         TAILQ_FOREACH_SAFE(dev, &rte_fslmc_bus.device_list, next, dev_temp) {
526                 if (dev->dev_type == DPAA2_MPORTAL) {
527                         ret = fslmc_process_mcp(dev);
528                         if (ret) {
529                                 DPAA2_BUS_ERR("Unable to map MC Portal");
530                                 return -1;
531                         }
532                         if (!found_mportal)
533                                 found_mportal = 1;
534
535                         TAILQ_REMOVE(&rte_fslmc_bus.device_list, dev, next);
536                         free(dev);
537                         dev = NULL;
538                         /* Ideally there is only a single dpmcp, but in case
539                          * multiple exists, looping on remaining devices.
540                          */
541                 }
542         }
543
544         /* Cannot continue if there is not even a single mportal */
545         if (!found_mportal) {
546                 DPAA2_BUS_ERR("No MC Portal device found. Not continuing");
547                 return -1;
548         }
549
550         TAILQ_FOREACH_SAFE(dev, &rte_fslmc_bus.device_list, next, dev_temp) {
551                 if (!dev)
552                         break;
553
554                 switch (dev->dev_type) {
555                 case DPAA2_ETH:
556                 case DPAA2_CRYPTO:
557                         ret = fslmc_process_iodevices(dev);
558                         if (ret) {
559                                 DPAA2_BUS_DEBUG("Dev (%s) init failed",
560                                                 dev->device.name);
561                                 return ret;
562                         }
563                         break;
564                 case DPAA2_CON:
565                 case DPAA2_IO:
566                 case DPAA2_CI:
567                 case DPAA2_BPOOL:
568                         /* Call the object creation routine and remove the
569                          * device entry from device list
570                          */
571                         ret = fslmc_process_iodevices(dev);
572                         if (ret) {
573                                 DPAA2_BUS_DEBUG("Dev (%s) init failed",
574                                                 dev->device.name);
575                                 return -1;
576                         }
577
578                         /* This device is not required to be in the DPDK
579                          * exposed device list.
580                          */
581                         TAILQ_REMOVE(&rte_fslmc_bus.device_list, dev, next);
582                         free(dev);
583                         dev = NULL;
584                         break;
585                 case DPAA2_UNKNOWN:
586                 default:
587                         /* Unknown - ignore */
588                         DPAA2_BUS_DEBUG("Found unknown device (%s)",
589                                         dev->device.name);
590                         TAILQ_REMOVE(&rte_fslmc_bus.device_list, dev, next);
591                         free(dev);
592                         dev = NULL;
593                 }
594         }
595
596         return 0;
597 }
598
599 int
600 fslmc_vfio_setup_group(void)
601 {
602         int groupid;
603         int ret;
604         struct vfio_group_status status = { .argsz = sizeof(status) };
605
606         /* if already done once */
607         if (container_device_fd)
608                 return 0;
609
610         ret = fslmc_get_container_group(&groupid);
611         if (ret)
612                 return ret;
613
614         /* In case this group was already opened, continue without any
615          * processing.
616          */
617         if (vfio_group.groupid == groupid) {
618                 DPAA2_BUS_ERR("groupid already exists %d", groupid);
619                 return 0;
620         }
621
622         /* Get the actual group fd */
623         ret = vfio_get_group_fd(groupid);
624         if (ret < 0)
625                 return ret;
626         vfio_group.fd = ret;
627
628         /* Check group viability */
629         ret = ioctl(vfio_group.fd, VFIO_GROUP_GET_STATUS, &status);
630         if (ret) {
631                 DPAA2_BUS_ERR("VFIO error getting group status");
632                 close(vfio_group.fd);
633                 rte_vfio_clear_group(vfio_group.fd);
634                 return ret;
635         }
636
637         if (!(status.flags & VFIO_GROUP_FLAGS_VIABLE)) {
638                 DPAA2_BUS_ERR("VFIO group not viable");
639                 close(vfio_group.fd);
640                 rte_vfio_clear_group(vfio_group.fd);
641                 return -EPERM;
642         }
643         /* Since Group is VIABLE, Store the groupid */
644         vfio_group.groupid = groupid;
645
646         /* check if group does not have a container yet */
647         if (!(status.flags & VFIO_GROUP_FLAGS_CONTAINER_SET)) {
648                 /* Now connect this IOMMU group to given container */
649                 ret = vfio_connect_container();
650                 if (ret) {
651                         DPAA2_BUS_ERR(
652                                 "Error connecting container with groupid %d",
653                                 groupid);
654                         close(vfio_group.fd);
655                         rte_vfio_clear_group(vfio_group.fd);
656                         return ret;
657                 }
658         }
659
660         /* Get Device information */
661         ret = ioctl(vfio_group.fd, VFIO_GROUP_GET_DEVICE_FD, g_container);
662         if (ret < 0) {
663                 DPAA2_BUS_ERR("Error getting device %s fd from group %d",
664                               g_container, vfio_group.groupid);
665                 close(vfio_group.fd);
666                 rte_vfio_clear_group(vfio_group.fd);
667                 return ret;
668         }
669         container_device_fd = ret;
670         DPAA2_BUS_DEBUG("VFIO Container FD is [0x%X]",
671                         container_device_fd);
672
673         return 0;
674 }