eal: split CPU flags operations to architecture specific
authorChao Zhu <bjzhuc@cn.ibm.com>
Tue, 28 Oct 2014 12:50:55 +0000 (13:50 +0100)
committerThomas Monjalon <thomas.monjalon@6wind.com>
Wed, 5 Nov 2014 21:20:12 +0000 (22:20 +0100)
This patch splits CPU flags related operations from DPDK and push them
to architecture specific arch directories, so that other processor
architecture can implement its own CPU flag functions to support DPDK.

Signed-off-by: Chao Zhu <bjzhuc@cn.ibm.com>
Signed-off-by: David Marchand <david.marchand@6wind.com>
Acked-by: Thomas Monjalon <thomas.monjalon@6wind.com>
lib/librte_eal/common/Makefile
lib/librte_eal/common/eal_common_cpuflags.c
lib/librte_eal/common/include/arch/i686/rte_cpuflags.h [new file with mode: 0644]
lib/librte_eal/common/include/arch/x86_64/rte_cpuflags.h [new file with mode: 0644]
lib/librte_eal/common/include/generic/rte_cpuflags.h [new file with mode: 0644]
lib/librte_eal/common/include/rte_cpuflags.h [deleted file]

index f9f98dc..ddf8b48 100644 (file)
@@ -36,7 +36,7 @@ INC += rte_debug.h rte_eal.h rte_errno.h rte_launch.h rte_lcore.h
 INC += rte_log.h rte_memory.h rte_memzone.h rte_pci.h
 INC += rte_pci_dev_ids.h rte_per_lcore.h rte_random.h
 INC += rte_rwlock.h rte_tailq.h rte_interrupts.h rte_alarm.h
-INC += rte_string_fns.h rte_cpuflags.h rte_version.h rte_tailq_elem.h
+INC += rte_string_fns.h rte_version.h rte_tailq_elem.h
 INC += rte_eal_memconfig.h rte_malloc_heap.h
 INC += rte_hexdump.h rte_devargs.h rte_dev.h
 INC += rte_common_vect.h
@@ -47,7 +47,7 @@ INC += rte_warnings.h
 endif
 
 GENERIC_INC := rte_atomic.h rte_byteorder.h rte_cycles.h rte_prefetch.h
-GENERIC_INC += rte_spinlock.h rte_memcpy.h
+GENERIC_INC += rte_spinlock.h rte_memcpy.h rte_cpuflags.h
 ARCH_INC := $(GENERIC_INC)
 
 SYMLINK-$(CONFIG_RTE_LIBRTE_EAL)-include := $(addprefix include/,$(INC))
index 9e79179..6fd360c 100644 (file)
  *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
  *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  */
-#include <stdlib.h>
-#include <stdio.h>
-#include <errno.h>
-#include <stdint.h>
 #include <rte_cpuflags.h>
 
 /*
 #endif
 #endif
 
-/**
- * Enumeration of CPU registers
- */
-enum cpu_register_t {
-       REG_EAX = 0,
-       REG_EBX,
-       REG_ECX,
-       REG_EDX,
-};
-
-typedef uint32_t cpuid_registers_t[4];
-
-#define CPU_FLAG_NAME_MAX_LEN 64
-
-/**
- * Struct to hold a processor feature entry
- */
-struct feature_entry {
-       uint32_t leaf;                          /**< cpuid leaf */
-       uint32_t subleaf;                       /**< cpuid subleaf */
-       uint32_t reg;                           /**< cpuid register */
-       uint32_t bit;                           /**< cpuid register bit */
-       char name[CPU_FLAG_NAME_MAX_LEN];       /**< String for printing */
-};
-
-#define FEAT_DEF(name, leaf, subleaf, reg, bit) \
-       [RTE_CPUFLAG_##name] = {leaf, subleaf, reg, bit, #name },
-
-/**
- * An array that holds feature entries
- */
-static const struct feature_entry cpu_feature_table[] = {
-       FEAT_DEF(SSE3, 0x00000001, 0, REG_ECX,  0)
-       FEAT_DEF(PCLMULQDQ, 0x00000001, 0, REG_ECX,  1)
-       FEAT_DEF(DTES64, 0x00000001, 0, REG_ECX,  2)
-       FEAT_DEF(MONITOR, 0x00000001, 0, REG_ECX,  3)
-       FEAT_DEF(DS_CPL, 0x00000001, 0, REG_ECX,  4)
-       FEAT_DEF(VMX, 0x00000001, 0, REG_ECX,  5)
-       FEAT_DEF(SMX, 0x00000001, 0, REG_ECX,  6)
-       FEAT_DEF(EIST, 0x00000001, 0, REG_ECX,  7)
-       FEAT_DEF(TM2, 0x00000001, 0, REG_ECX,  8)
-       FEAT_DEF(SSSE3, 0x00000001, 0, REG_ECX,  9)
-       FEAT_DEF(CNXT_ID, 0x00000001, 0, REG_ECX, 10)
-       FEAT_DEF(FMA, 0x00000001, 0, REG_ECX, 12)
-       FEAT_DEF(CMPXCHG16B, 0x00000001, 0, REG_ECX, 13)
-       FEAT_DEF(XTPR, 0x00000001, 0, REG_ECX, 14)
-       FEAT_DEF(PDCM, 0x00000001, 0, REG_ECX, 15)
-       FEAT_DEF(PCID, 0x00000001, 0, REG_ECX, 17)
-       FEAT_DEF(DCA, 0x00000001, 0, REG_ECX, 18)
-       FEAT_DEF(SSE4_1, 0x00000001, 0, REG_ECX, 19)
-       FEAT_DEF(SSE4_2, 0x00000001, 0, REG_ECX, 20)
-       FEAT_DEF(X2APIC, 0x00000001, 0, REG_ECX, 21)
-       FEAT_DEF(MOVBE, 0x00000001, 0, REG_ECX, 22)
-       FEAT_DEF(POPCNT, 0x00000001, 0, REG_ECX, 23)
-       FEAT_DEF(TSC_DEADLINE, 0x00000001, 0, REG_ECX, 24)
-       FEAT_DEF(AES, 0x00000001, 0, REG_ECX, 25)
-       FEAT_DEF(XSAVE, 0x00000001, 0, REG_ECX, 26)
-       FEAT_DEF(OSXSAVE, 0x00000001, 0, REG_ECX, 27)
-       FEAT_DEF(AVX, 0x00000001, 0, REG_ECX, 28)
-       FEAT_DEF(F16C, 0x00000001, 0, REG_ECX, 29)
-       FEAT_DEF(RDRAND, 0x00000001, 0, REG_ECX, 30)
-
-       FEAT_DEF(FPU, 0x00000001, 0, REG_EDX,  0)
-       FEAT_DEF(VME, 0x00000001, 0, REG_EDX,  1)
-       FEAT_DEF(DE, 0x00000001, 0, REG_EDX,  2)
-       FEAT_DEF(PSE, 0x00000001, 0, REG_EDX,  3)
-       FEAT_DEF(TSC, 0x00000001, 0, REG_EDX,  4)
-       FEAT_DEF(MSR, 0x00000001, 0, REG_EDX,  5)
-       FEAT_DEF(PAE, 0x00000001, 0, REG_EDX,  6)
-       FEAT_DEF(MCE, 0x00000001, 0, REG_EDX,  7)
-       FEAT_DEF(CX8, 0x00000001, 0, REG_EDX,  8)
-       FEAT_DEF(APIC, 0x00000001, 0, REG_EDX,  9)
-       FEAT_DEF(SEP, 0x00000001, 0, REG_EDX, 11)
-       FEAT_DEF(MTRR, 0x00000001, 0, REG_EDX, 12)
-       FEAT_DEF(PGE, 0x00000001, 0, REG_EDX, 13)
-       FEAT_DEF(MCA, 0x00000001, 0, REG_EDX, 14)
-       FEAT_DEF(CMOV, 0x00000001, 0, REG_EDX, 15)
-       FEAT_DEF(PAT, 0x00000001, 0, REG_EDX, 16)
-       FEAT_DEF(PSE36, 0x00000001, 0, REG_EDX, 17)
-       FEAT_DEF(PSN, 0x00000001, 0, REG_EDX, 18)
-       FEAT_DEF(CLFSH, 0x00000001, 0, REG_EDX, 19)
-       FEAT_DEF(DS, 0x00000001, 0, REG_EDX, 21)
-       FEAT_DEF(ACPI, 0x00000001, 0, REG_EDX, 22)
-       FEAT_DEF(MMX, 0x00000001, 0, REG_EDX, 23)
-       FEAT_DEF(FXSR, 0x00000001, 0, REG_EDX, 24)
-       FEAT_DEF(SSE, 0x00000001, 0, REG_EDX, 25)
-       FEAT_DEF(SSE2, 0x00000001, 0, REG_EDX, 26)
-       FEAT_DEF(SS, 0x00000001, 0, REG_EDX, 27)
-       FEAT_DEF(HTT, 0x00000001, 0, REG_EDX, 28)
-       FEAT_DEF(TM, 0x00000001, 0, REG_EDX, 29)
-       FEAT_DEF(PBE, 0x00000001, 0, REG_EDX, 31)
-
-       FEAT_DEF(DIGTEMP, 0x00000006, 0, REG_EAX,  0)
-       FEAT_DEF(TRBOBST, 0x00000006, 0, REG_EAX,  1)
-       FEAT_DEF(ARAT, 0x00000006, 0, REG_EAX,  2)
-       FEAT_DEF(PLN, 0x00000006, 0, REG_EAX,  4)
-       FEAT_DEF(ECMD, 0x00000006, 0, REG_EAX,  5)
-       FEAT_DEF(PTM, 0x00000006, 0, REG_EAX,  6)
-
-       FEAT_DEF(MPERF_APERF_MSR, 0x00000006, 0, REG_ECX,  0)
-       FEAT_DEF(ACNT2, 0x00000006, 0, REG_ECX,  1)
-       FEAT_DEF(ENERGY_EFF, 0x00000006, 0, REG_ECX,  3)
-
-       FEAT_DEF(FSGSBASE, 0x00000007, 0, REG_EBX,  0)
-       FEAT_DEF(BMI1, 0x00000007, 0, REG_EBX,  2)
-       FEAT_DEF(HLE, 0x00000007, 0, REG_EBX,  4)
-       FEAT_DEF(AVX2, 0x00000007, 0, REG_EBX,  5)
-       FEAT_DEF(SMEP, 0x00000007, 0, REG_EBX,  6)
-       FEAT_DEF(BMI2, 0x00000007, 0, REG_EBX,  7)
-       FEAT_DEF(ERMS, 0x00000007, 0, REG_EBX,  8)
-       FEAT_DEF(INVPCID, 0x00000007, 0, REG_EBX, 10)
-       FEAT_DEF(RTM, 0x00000007, 0, REG_EBX, 11)
-
-       FEAT_DEF(LAHF_SAHF, 0x80000001, 0, REG_ECX,  0)
-       FEAT_DEF(LZCNT, 0x80000001, 0, REG_ECX,  4)
-
-       FEAT_DEF(SYSCALL, 0x80000001, 0, REG_EDX, 11)
-       FEAT_DEF(XD, 0x80000001, 0, REG_EDX, 20)
-       FEAT_DEF(1GB_PG, 0x80000001, 0, REG_EDX, 26)
-       FEAT_DEF(RDTSCP, 0x80000001, 0, REG_EDX, 27)
-       FEAT_DEF(EM64T, 0x80000001, 0, REG_EDX, 29)
-
-       FEAT_DEF(INVTSC, 0x80000007, 0, REG_EDX,  8)
-};
-
-/*
- * Execute CPUID instruction and get contents of a specific register
- *
- * This function, when compiled with GCC, will generate architecture-neutral
- * code, as per GCC manual.
- */
-static inline void
-rte_cpu_get_features(uint32_t leaf, uint32_t subleaf, cpuid_registers_t out)
-{
-#if defined(__i386__) && defined(__PIC__)
-    /* %ebx is a forbidden register if we compile with -fPIC or -fPIE */
-    asm volatile("movl %%ebx,%0 ; cpuid ; xchgl %%ebx,%0"
-                : "=r" (out[REG_EBX]),
-                  "=a" (out[REG_EAX]),
-                  "=c" (out[REG_ECX]),
-                  "=d" (out[REG_EDX])
-                : "a" (leaf), "c" (subleaf));
-#else
-
-    asm volatile("cpuid"
-                : "=a" (out[REG_EAX]),
-                  "=b" (out[REG_EBX]),
-                  "=c" (out[REG_ECX]),
-                  "=d" (out[REG_EDX])
-                : "a" (leaf), "c" (subleaf));
-
-#endif
-}
-
-/*
- * Checks if a particular flag is available on current machine.
- */
-int
-rte_cpu_get_flag_enabled(enum rte_cpu_flag_t feature)
-{
-       const struct feature_entry *feat;
-       cpuid_registers_t regs;
-
-
-       if (feature >= RTE_CPUFLAG_NUMFLAGS)
-               /* Flag does not match anything in the feature tables */
-               return -ENOENT;
-
-       feat = &cpu_feature_table[feature];
-
-       if (!feat->leaf)
-               /* This entry in the table wasn't filled out! */
-               return -EFAULT;
-
-       rte_cpu_get_features(feat->leaf & 0xffff0000, 0, regs);
-       if (((regs[REG_EAX] ^ feat->leaf) & 0xffff0000) ||
-             regs[REG_EAX] < feat->leaf)
-               return 0;
-
-       /* get the cpuid leaf containing the desired feature */
-       rte_cpu_get_features(feat->leaf, feat->subleaf, regs);
-
-       /* check if the feature is enabled */
-       return (regs[feat->reg] >> feat->bit) & 1;
-}
-
 /**
  * Checks if the machine is adequate for running the binary. If it is not, the
  * program exits with status 1.
diff --git a/lib/librte_eal/common/include/arch/i686/rte_cpuflags.h b/lib/librte_eal/common/include/arch/i686/rte_cpuflags.h
new file mode 100644 (file)
index 0000000..fd27e8f
--- /dev/null
@@ -0,0 +1,310 @@
+/*-
+ *   BSD LICENSE
+ *
+ *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
+ *   All rights reserved.
+ *
+ *   Redistribution and use in source and binary forms, with or without
+ *   modification, are permitted provided that the following conditions
+ *   are met:
+ *
+ *     * Redistributions of source code must retain the above copyright
+ *       notice, this list of conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright
+ *       notice, this list of conditions and the following disclaimer in
+ *       the documentation and/or other materials provided with the
+ *       distribution.
+ *     * Neither the name of Intel Corporation nor the names of its
+ *       contributors may be used to endorse or promote products derived
+ *       from this software without specific prior written permission.
+ *
+ *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+ *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+ *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
+ *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
+ *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
+ *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
+ *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
+ *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
+ *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
+ *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ */
+
+#ifndef _RTE_CPUFLAGS_I686_H_
+#define _RTE_CPUFLAGS_I686_H_
+
+#ifdef __cplusplus
+extern "C" {
+#endif
+
+#include <stdlib.h>
+#include <stdio.h>
+#include <errno.h>
+#include <stdint.h>
+
+#include "generic/rte_cpuflags.h"
+
+enum rte_cpu_flag_t {
+       /* (EAX 01h) ECX features*/
+       RTE_CPUFLAG_SSE3 = 0,               /**< SSE3 */
+       RTE_CPUFLAG_PCLMULQDQ,              /**< PCLMULQDQ */
+       RTE_CPUFLAG_DTES64,                 /**< DTES64 */
+       RTE_CPUFLAG_MONITOR,                /**< MONITOR */
+       RTE_CPUFLAG_DS_CPL,                 /**< DS_CPL */
+       RTE_CPUFLAG_VMX,                    /**< VMX */
+       RTE_CPUFLAG_SMX,                    /**< SMX */
+       RTE_CPUFLAG_EIST,                   /**< EIST */
+       RTE_CPUFLAG_TM2,                    /**< TM2 */
+       RTE_CPUFLAG_SSSE3,                  /**< SSSE3 */
+       RTE_CPUFLAG_CNXT_ID,                /**< CNXT_ID */
+       RTE_CPUFLAG_FMA,                    /**< FMA */
+       RTE_CPUFLAG_CMPXCHG16B,             /**< CMPXCHG16B */
+       RTE_CPUFLAG_XTPR,                   /**< XTPR */
+       RTE_CPUFLAG_PDCM,                   /**< PDCM */
+       RTE_CPUFLAG_PCID,                   /**< PCID */
+       RTE_CPUFLAG_DCA,                    /**< DCA */
+       RTE_CPUFLAG_SSE4_1,                 /**< SSE4_1 */
+       RTE_CPUFLAG_SSE4_2,                 /**< SSE4_2 */
+       RTE_CPUFLAG_X2APIC,                 /**< X2APIC */
+       RTE_CPUFLAG_MOVBE,                  /**< MOVBE */
+       RTE_CPUFLAG_POPCNT,                 /**< POPCNT */
+       RTE_CPUFLAG_TSC_DEADLINE,           /**< TSC_DEADLINE */
+       RTE_CPUFLAG_AES,                    /**< AES */
+       RTE_CPUFLAG_XSAVE,                  /**< XSAVE */
+       RTE_CPUFLAG_OSXSAVE,                /**< OSXSAVE */
+       RTE_CPUFLAG_AVX,                    /**< AVX */
+       RTE_CPUFLAG_F16C,                   /**< F16C */
+       RTE_CPUFLAG_RDRAND,                 /**< RDRAND */
+
+       /* (EAX 01h) EDX features */
+       RTE_CPUFLAG_FPU,                    /**< FPU */
+       RTE_CPUFLAG_VME,                    /**< VME */
+       RTE_CPUFLAG_DE,                     /**< DE */
+       RTE_CPUFLAG_PSE,                    /**< PSE */
+       RTE_CPUFLAG_TSC,                    /**< TSC */
+       RTE_CPUFLAG_MSR,                    /**< MSR */
+       RTE_CPUFLAG_PAE,                    /**< PAE */
+       RTE_CPUFLAG_MCE,                    /**< MCE */
+       RTE_CPUFLAG_CX8,                    /**< CX8 */
+       RTE_CPUFLAG_APIC,                   /**< APIC */
+       RTE_CPUFLAG_SEP,                    /**< SEP */
+       RTE_CPUFLAG_MTRR,                   /**< MTRR */
+       RTE_CPUFLAG_PGE,                    /**< PGE */
+       RTE_CPUFLAG_MCA,                    /**< MCA */
+       RTE_CPUFLAG_CMOV,                   /**< CMOV */
+       RTE_CPUFLAG_PAT,                    /**< PAT */
+       RTE_CPUFLAG_PSE36,                  /**< PSE36 */
+       RTE_CPUFLAG_PSN,                    /**< PSN */
+       RTE_CPUFLAG_CLFSH,                  /**< CLFSH */
+       RTE_CPUFLAG_DS,                     /**< DS */
+       RTE_CPUFLAG_ACPI,                   /**< ACPI */
+       RTE_CPUFLAG_MMX,                    /**< MMX */
+       RTE_CPUFLAG_FXSR,                   /**< FXSR */
+       RTE_CPUFLAG_SSE,                    /**< SSE */
+       RTE_CPUFLAG_SSE2,                   /**< SSE2 */
+       RTE_CPUFLAG_SS,                     /**< SS */
+       RTE_CPUFLAG_HTT,                    /**< HTT */
+       RTE_CPUFLAG_TM,                     /**< TM */
+       RTE_CPUFLAG_PBE,                    /**< PBE */
+
+       /* (EAX 06h) EAX features */
+       RTE_CPUFLAG_DIGTEMP,                /**< DIGTEMP */
+       RTE_CPUFLAG_TRBOBST,                /**< TRBOBST */
+       RTE_CPUFLAG_ARAT,                   /**< ARAT */
+       RTE_CPUFLAG_PLN,                    /**< PLN */
+       RTE_CPUFLAG_ECMD,                   /**< ECMD */
+       RTE_CPUFLAG_PTM,                    /**< PTM */
+
+       /* (EAX 06h) ECX features */
+       RTE_CPUFLAG_MPERF_APERF_MSR,        /**< MPERF_APERF_MSR */
+       RTE_CPUFLAG_ACNT2,                  /**< ACNT2 */
+       RTE_CPUFLAG_ENERGY_EFF,             /**< ENERGY_EFF */
+
+       /* (EAX 07h, ECX 0h) EBX features */
+       RTE_CPUFLAG_FSGSBASE,               /**< FSGSBASE */
+       RTE_CPUFLAG_BMI1,                   /**< BMI1 */
+       RTE_CPUFLAG_HLE,                    /**< Hardware Lock elision */
+       RTE_CPUFLAG_AVX2,                   /**< AVX2 */
+       RTE_CPUFLAG_SMEP,                   /**< SMEP */
+       RTE_CPUFLAG_BMI2,                   /**< BMI2 */
+       RTE_CPUFLAG_ERMS,                   /**< ERMS */
+       RTE_CPUFLAG_INVPCID,                /**< INVPCID */
+       RTE_CPUFLAG_RTM,                    /**< Transactional memory */
+
+       /* (EAX 80000001h) ECX features */
+       RTE_CPUFLAG_LAHF_SAHF,              /**< LAHF_SAHF */
+       RTE_CPUFLAG_LZCNT,                  /**< LZCNT */
+
+       /* (EAX 80000001h) EDX features */
+       RTE_CPUFLAG_SYSCALL,                /**< SYSCALL */
+       RTE_CPUFLAG_XD,                     /**< XD */
+       RTE_CPUFLAG_1GB_PG,                 /**< 1GB_PG */
+       RTE_CPUFLAG_RDTSCP,                 /**< RDTSCP */
+       RTE_CPUFLAG_EM64T,                  /**< EM64T */
+
+       /* (EAX 80000007h) EDX features */
+       RTE_CPUFLAG_INVTSC,                 /**< INVTSC */
+
+       /* The last item */
+       RTE_CPUFLAG_NUMFLAGS,               /**< This should always be the last! */
+};
+
+enum cpu_register_t {
+       REG_EAX = 0,
+       REG_EBX,
+       REG_ECX,
+       REG_EDX,
+};
+
+static const struct feature_entry cpu_feature_table[] = {
+       FEAT_DEF(SSE3, 0x00000001, 0, REG_ECX,  0)
+       FEAT_DEF(PCLMULQDQ, 0x00000001, 0, REG_ECX,  1)
+       FEAT_DEF(DTES64, 0x00000001, 0, REG_ECX,  2)
+       FEAT_DEF(MONITOR, 0x00000001, 0, REG_ECX,  3)
+       FEAT_DEF(DS_CPL, 0x00000001, 0, REG_ECX,  4)
+       FEAT_DEF(VMX, 0x00000001, 0, REG_ECX,  5)
+       FEAT_DEF(SMX, 0x00000001, 0, REG_ECX,  6)
+       FEAT_DEF(EIST, 0x00000001, 0, REG_ECX,  7)
+       FEAT_DEF(TM2, 0x00000001, 0, REG_ECX,  8)
+       FEAT_DEF(SSSE3, 0x00000001, 0, REG_ECX,  9)
+       FEAT_DEF(CNXT_ID, 0x00000001, 0, REG_ECX, 10)
+       FEAT_DEF(FMA, 0x00000001, 0, REG_ECX, 12)
+       FEAT_DEF(CMPXCHG16B, 0x00000001, 0, REG_ECX, 13)
+       FEAT_DEF(XTPR, 0x00000001, 0, REG_ECX, 14)
+       FEAT_DEF(PDCM, 0x00000001, 0, REG_ECX, 15)
+       FEAT_DEF(PCID, 0x00000001, 0, REG_ECX, 17)
+       FEAT_DEF(DCA, 0x00000001, 0, REG_ECX, 18)
+       FEAT_DEF(SSE4_1, 0x00000001, 0, REG_ECX, 19)
+       FEAT_DEF(SSE4_2, 0x00000001, 0, REG_ECX, 20)
+       FEAT_DEF(X2APIC, 0x00000001, 0, REG_ECX, 21)
+       FEAT_DEF(MOVBE, 0x00000001, 0, REG_ECX, 22)
+       FEAT_DEF(POPCNT, 0x00000001, 0, REG_ECX, 23)
+       FEAT_DEF(TSC_DEADLINE, 0x00000001, 0, REG_ECX, 24)
+       FEAT_DEF(AES, 0x00000001, 0, REG_ECX, 25)
+       FEAT_DEF(XSAVE, 0x00000001, 0, REG_ECX, 26)
+       FEAT_DEF(OSXSAVE, 0x00000001, 0, REG_ECX, 27)
+       FEAT_DEF(AVX, 0x00000001, 0, REG_ECX, 28)
+       FEAT_DEF(F16C, 0x00000001, 0, REG_ECX, 29)
+       FEAT_DEF(RDRAND, 0x00000001, 0, REG_ECX, 30)
+
+       FEAT_DEF(FPU, 0x00000001, 0, REG_EDX,  0)
+       FEAT_DEF(VME, 0x00000001, 0, REG_EDX,  1)
+       FEAT_DEF(DE, 0x00000001, 0, REG_EDX,  2)
+       FEAT_DEF(PSE, 0x00000001, 0, REG_EDX,  3)
+       FEAT_DEF(TSC, 0x00000001, 0, REG_EDX,  4)
+       FEAT_DEF(MSR, 0x00000001, 0, REG_EDX,  5)
+       FEAT_DEF(PAE, 0x00000001, 0, REG_EDX,  6)
+       FEAT_DEF(MCE, 0x00000001, 0, REG_EDX,  7)
+       FEAT_DEF(CX8, 0x00000001, 0, REG_EDX,  8)
+       FEAT_DEF(APIC, 0x00000001, 0, REG_EDX,  9)
+       FEAT_DEF(SEP, 0x00000001, 0, REG_EDX, 11)
+       FEAT_DEF(MTRR, 0x00000001, 0, REG_EDX, 12)
+       FEAT_DEF(PGE, 0x00000001, 0, REG_EDX, 13)
+       FEAT_DEF(MCA, 0x00000001, 0, REG_EDX, 14)
+       FEAT_DEF(CMOV, 0x00000001, 0, REG_EDX, 15)
+       FEAT_DEF(PAT, 0x00000001, 0, REG_EDX, 16)
+       FEAT_DEF(PSE36, 0x00000001, 0, REG_EDX, 17)
+       FEAT_DEF(PSN, 0x00000001, 0, REG_EDX, 18)
+       FEAT_DEF(CLFSH, 0x00000001, 0, REG_EDX, 19)
+       FEAT_DEF(DS, 0x00000001, 0, REG_EDX, 21)
+       FEAT_DEF(ACPI, 0x00000001, 0, REG_EDX, 22)
+       FEAT_DEF(MMX, 0x00000001, 0, REG_EDX, 23)
+       FEAT_DEF(FXSR, 0x00000001, 0, REG_EDX, 24)
+       FEAT_DEF(SSE, 0x00000001, 0, REG_EDX, 25)
+       FEAT_DEF(SSE2, 0x00000001, 0, REG_EDX, 26)
+       FEAT_DEF(SS, 0x00000001, 0, REG_EDX, 27)
+       FEAT_DEF(HTT, 0x00000001, 0, REG_EDX, 28)
+       FEAT_DEF(TM, 0x00000001, 0, REG_EDX, 29)
+       FEAT_DEF(PBE, 0x00000001, 0, REG_EDX, 31)
+
+       FEAT_DEF(DIGTEMP, 0x00000006, 0, REG_EAX,  0)
+       FEAT_DEF(TRBOBST, 0x00000006, 0, REG_EAX,  1)
+       FEAT_DEF(ARAT, 0x00000006, 0, REG_EAX,  2)
+       FEAT_DEF(PLN, 0x00000006, 0, REG_EAX,  4)
+       FEAT_DEF(ECMD, 0x00000006, 0, REG_EAX,  5)
+       FEAT_DEF(PTM, 0x00000006, 0, REG_EAX,  6)
+
+       FEAT_DEF(MPERF_APERF_MSR, 0x00000006, 0, REG_ECX,  0)
+       FEAT_DEF(ACNT2, 0x00000006, 0, REG_ECX,  1)
+       FEAT_DEF(ENERGY_EFF, 0x00000006, 0, REG_ECX,  3)
+
+       FEAT_DEF(FSGSBASE, 0x00000007, 0, REG_EBX,  0)
+       FEAT_DEF(BMI1, 0x00000007, 0, REG_EBX,  2)
+       FEAT_DEF(HLE, 0x00000007, 0, REG_EBX,  4)
+       FEAT_DEF(AVX2, 0x00000007, 0, REG_EBX,  5)
+       FEAT_DEF(SMEP, 0x00000007, 0, REG_EBX,  6)
+       FEAT_DEF(BMI2, 0x00000007, 0, REG_EBX,  7)
+       FEAT_DEF(ERMS, 0x00000007, 0, REG_EBX,  8)
+       FEAT_DEF(INVPCID, 0x00000007, 0, REG_EBX, 10)
+       FEAT_DEF(RTM, 0x00000007, 0, REG_EBX, 11)
+
+       FEAT_DEF(LAHF_SAHF, 0x80000001, 0, REG_ECX,  0)
+       FEAT_DEF(LZCNT, 0x80000001, 0, REG_ECX,  4)
+
+       FEAT_DEF(SYSCALL, 0x80000001, 0, REG_EDX, 11)
+       FEAT_DEF(XD, 0x80000001, 0, REG_EDX, 20)
+       FEAT_DEF(1GB_PG, 0x80000001, 0, REG_EDX, 26)
+       FEAT_DEF(RDTSCP, 0x80000001, 0, REG_EDX, 27)
+       FEAT_DEF(EM64T, 0x80000001, 0, REG_EDX, 29)
+
+       FEAT_DEF(INVTSC, 0x80000007, 0, REG_EDX,  8)
+};
+
+static inline void
+rte_cpu_get_features(uint32_t leaf, uint32_t subleaf, cpuid_registers_t out)
+{
+#if defined(__i386__) && defined(__PIC__)
+    /* %ebx is a forbidden register if we compile with -fPIC or -fPIE */
+    asm volatile("movl %%ebx,%0 ; cpuid ; xchgl %%ebx,%0"
+                : "=r" (out[REG_EBX]),
+                  "=a" (out[REG_EAX]),
+                  "=c" (out[REG_ECX]),
+                  "=d" (out[REG_EDX])
+                : "a" (leaf), "c" (subleaf));
+#else
+
+    asm volatile("cpuid"
+                : "=a" (out[REG_EAX]),
+                  "=b" (out[REG_EBX]),
+                  "=c" (out[REG_ECX]),
+                  "=d" (out[REG_EDX])
+                : "a" (leaf), "c" (subleaf));
+
+#endif
+}
+
+static inline int
+rte_cpu_get_flag_enabled(enum rte_cpu_flag_t feature)
+{
+       const struct feature_entry *feat;
+       cpuid_registers_t regs;
+
+
+       if (feature >= RTE_CPUFLAG_NUMFLAGS)
+               /* Flag does not match anything in the feature tables */
+               return -ENOENT;
+
+       feat = &cpu_feature_table[feature];
+
+       if (!feat->leaf)
+               /* This entry in the table wasn't filled out! */
+               return -EFAULT;
+
+       rte_cpu_get_features(feat->leaf & 0xffff0000, 0, regs);
+       if (((regs[REG_EAX] ^ feat->leaf) & 0xffff0000) ||
+             regs[REG_EAX] < feat->leaf)
+               return 0;
+
+       /* get the cpuid leaf containing the desired feature */
+       rte_cpu_get_features(feat->leaf, feat->subleaf, regs);
+
+       /* check if the feature is enabled */
+       return (regs[feat->reg] >> feat->bit) & 1;
+}
+
+#ifdef __cplusplus
+}
+#endif
+
+#endif /* _RTE_CPUFLAGS_I686_H_ */
diff --git a/lib/librte_eal/common/include/arch/x86_64/rte_cpuflags.h b/lib/librte_eal/common/include/arch/x86_64/rte_cpuflags.h
new file mode 100644 (file)
index 0000000..a58dd7b
--- /dev/null
@@ -0,0 +1,310 @@
+/*-
+ *   BSD LICENSE
+ *
+ *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
+ *   All rights reserved.
+ *
+ *   Redistribution and use in source and binary forms, with or without
+ *   modification, are permitted provided that the following conditions
+ *   are met:
+ *
+ *     * Redistributions of source code must retain the above copyright
+ *       notice, this list of conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright
+ *       notice, this list of conditions and the following disclaimer in
+ *       the documentation and/or other materials provided with the
+ *       distribution.
+ *     * Neither the name of Intel Corporation nor the names of its
+ *       contributors may be used to endorse or promote products derived
+ *       from this software without specific prior written permission.
+ *
+ *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+ *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+ *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
+ *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
+ *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
+ *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
+ *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
+ *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
+ *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
+ *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ */
+
+#ifndef _RTE_CPUFLAGS_X86_64_H_
+#define _RTE_CPUFLAGS_X86_64_H_
+
+#ifdef __cplusplus
+extern "C" {
+#endif
+
+#include <stdlib.h>
+#include <stdio.h>
+#include <errno.h>
+#include <stdint.h>
+
+#include "generic/rte_cpuflags.h"
+
+enum rte_cpu_flag_t {
+       /* (EAX 01h) ECX features*/
+       RTE_CPUFLAG_SSE3 = 0,               /**< SSE3 */
+       RTE_CPUFLAG_PCLMULQDQ,              /**< PCLMULQDQ */
+       RTE_CPUFLAG_DTES64,                 /**< DTES64 */
+       RTE_CPUFLAG_MONITOR,                /**< MONITOR */
+       RTE_CPUFLAG_DS_CPL,                 /**< DS_CPL */
+       RTE_CPUFLAG_VMX,                    /**< VMX */
+       RTE_CPUFLAG_SMX,                    /**< SMX */
+       RTE_CPUFLAG_EIST,                   /**< EIST */
+       RTE_CPUFLAG_TM2,                    /**< TM2 */
+       RTE_CPUFLAG_SSSE3,                  /**< SSSE3 */
+       RTE_CPUFLAG_CNXT_ID,                /**< CNXT_ID */
+       RTE_CPUFLAG_FMA,                    /**< FMA */
+       RTE_CPUFLAG_CMPXCHG16B,             /**< CMPXCHG16B */
+       RTE_CPUFLAG_XTPR,                   /**< XTPR */
+       RTE_CPUFLAG_PDCM,                   /**< PDCM */
+       RTE_CPUFLAG_PCID,                   /**< PCID */
+       RTE_CPUFLAG_DCA,                    /**< DCA */
+       RTE_CPUFLAG_SSE4_1,                 /**< SSE4_1 */
+       RTE_CPUFLAG_SSE4_2,                 /**< SSE4_2 */
+       RTE_CPUFLAG_X2APIC,                 /**< X2APIC */
+       RTE_CPUFLAG_MOVBE,                  /**< MOVBE */
+       RTE_CPUFLAG_POPCNT,                 /**< POPCNT */
+       RTE_CPUFLAG_TSC_DEADLINE,           /**< TSC_DEADLINE */
+       RTE_CPUFLAG_AES,                    /**< AES */
+       RTE_CPUFLAG_XSAVE,                  /**< XSAVE */
+       RTE_CPUFLAG_OSXSAVE,                /**< OSXSAVE */
+       RTE_CPUFLAG_AVX,                    /**< AVX */
+       RTE_CPUFLAG_F16C,                   /**< F16C */
+       RTE_CPUFLAG_RDRAND,                 /**< RDRAND */
+
+       /* (EAX 01h) EDX features */
+       RTE_CPUFLAG_FPU,                    /**< FPU */
+       RTE_CPUFLAG_VME,                    /**< VME */
+       RTE_CPUFLAG_DE,                     /**< DE */
+       RTE_CPUFLAG_PSE,                    /**< PSE */
+       RTE_CPUFLAG_TSC,                    /**< TSC */
+       RTE_CPUFLAG_MSR,                    /**< MSR */
+       RTE_CPUFLAG_PAE,                    /**< PAE */
+       RTE_CPUFLAG_MCE,                    /**< MCE */
+       RTE_CPUFLAG_CX8,                    /**< CX8 */
+       RTE_CPUFLAG_APIC,                   /**< APIC */
+       RTE_CPUFLAG_SEP,                    /**< SEP */
+       RTE_CPUFLAG_MTRR,                   /**< MTRR */
+       RTE_CPUFLAG_PGE,                    /**< PGE */
+       RTE_CPUFLAG_MCA,                    /**< MCA */
+       RTE_CPUFLAG_CMOV,                   /**< CMOV */
+       RTE_CPUFLAG_PAT,                    /**< PAT */
+       RTE_CPUFLAG_PSE36,                  /**< PSE36 */
+       RTE_CPUFLAG_PSN,                    /**< PSN */
+       RTE_CPUFLAG_CLFSH,                  /**< CLFSH */
+       RTE_CPUFLAG_DS,                     /**< DS */
+       RTE_CPUFLAG_ACPI,                   /**< ACPI */
+       RTE_CPUFLAG_MMX,                    /**< MMX */
+       RTE_CPUFLAG_FXSR,                   /**< FXSR */
+       RTE_CPUFLAG_SSE,                    /**< SSE */
+       RTE_CPUFLAG_SSE2,                   /**< SSE2 */
+       RTE_CPUFLAG_SS,                     /**< SS */
+       RTE_CPUFLAG_HTT,                    /**< HTT */
+       RTE_CPUFLAG_TM,                     /**< TM */
+       RTE_CPUFLAG_PBE,                    /**< PBE */
+
+       /* (EAX 06h) EAX features */
+       RTE_CPUFLAG_DIGTEMP,                /**< DIGTEMP */
+       RTE_CPUFLAG_TRBOBST,                /**< TRBOBST */
+       RTE_CPUFLAG_ARAT,                   /**< ARAT */
+       RTE_CPUFLAG_PLN,                    /**< PLN */
+       RTE_CPUFLAG_ECMD,                   /**< ECMD */
+       RTE_CPUFLAG_PTM,                    /**< PTM */
+
+       /* (EAX 06h) ECX features */
+       RTE_CPUFLAG_MPERF_APERF_MSR,        /**< MPERF_APERF_MSR */
+       RTE_CPUFLAG_ACNT2,                  /**< ACNT2 */
+       RTE_CPUFLAG_ENERGY_EFF,             /**< ENERGY_EFF */
+
+       /* (EAX 07h, ECX 0h) EBX features */
+       RTE_CPUFLAG_FSGSBASE,               /**< FSGSBASE */
+       RTE_CPUFLAG_BMI1,                   /**< BMI1 */
+       RTE_CPUFLAG_HLE,                    /**< Hardware Lock elision */
+       RTE_CPUFLAG_AVX2,                   /**< AVX2 */
+       RTE_CPUFLAG_SMEP,                   /**< SMEP */
+       RTE_CPUFLAG_BMI2,                   /**< BMI2 */
+       RTE_CPUFLAG_ERMS,                   /**< ERMS */
+       RTE_CPUFLAG_INVPCID,                /**< INVPCID */
+       RTE_CPUFLAG_RTM,                    /**< Transactional memory */
+
+       /* (EAX 80000001h) ECX features */
+       RTE_CPUFLAG_LAHF_SAHF,              /**< LAHF_SAHF */
+       RTE_CPUFLAG_LZCNT,                  /**< LZCNT */
+
+       /* (EAX 80000001h) EDX features */
+       RTE_CPUFLAG_SYSCALL,                /**< SYSCALL */
+       RTE_CPUFLAG_XD,                     /**< XD */
+       RTE_CPUFLAG_1GB_PG,                 /**< 1GB_PG */
+       RTE_CPUFLAG_RDTSCP,                 /**< RDTSCP */
+       RTE_CPUFLAG_EM64T,                  /**< EM64T */
+
+       /* (EAX 80000007h) EDX features */
+       RTE_CPUFLAG_INVTSC,                 /**< INVTSC */
+
+       /* The last item */
+       RTE_CPUFLAG_NUMFLAGS,               /**< This should always be the last! */
+};
+
+enum cpu_register_t {
+       REG_EAX = 0,
+       REG_EBX,
+       REG_ECX,
+       REG_EDX,
+};
+
+static const struct feature_entry cpu_feature_table[] = {
+       FEAT_DEF(SSE3, 0x00000001, 0, REG_ECX,  0)
+       FEAT_DEF(PCLMULQDQ, 0x00000001, 0, REG_ECX,  1)
+       FEAT_DEF(DTES64, 0x00000001, 0, REG_ECX,  2)
+       FEAT_DEF(MONITOR, 0x00000001, 0, REG_ECX,  3)
+       FEAT_DEF(DS_CPL, 0x00000001, 0, REG_ECX,  4)
+       FEAT_DEF(VMX, 0x00000001, 0, REG_ECX,  5)
+       FEAT_DEF(SMX, 0x00000001, 0, REG_ECX,  6)
+       FEAT_DEF(EIST, 0x00000001, 0, REG_ECX,  7)
+       FEAT_DEF(TM2, 0x00000001, 0, REG_ECX,  8)
+       FEAT_DEF(SSSE3, 0x00000001, 0, REG_ECX,  9)
+       FEAT_DEF(CNXT_ID, 0x00000001, 0, REG_ECX, 10)
+       FEAT_DEF(FMA, 0x00000001, 0, REG_ECX, 12)
+       FEAT_DEF(CMPXCHG16B, 0x00000001, 0, REG_ECX, 13)
+       FEAT_DEF(XTPR, 0x00000001, 0, REG_ECX, 14)
+       FEAT_DEF(PDCM, 0x00000001, 0, REG_ECX, 15)
+       FEAT_DEF(PCID, 0x00000001, 0, REG_ECX, 17)
+       FEAT_DEF(DCA, 0x00000001, 0, REG_ECX, 18)
+       FEAT_DEF(SSE4_1, 0x00000001, 0, REG_ECX, 19)
+       FEAT_DEF(SSE4_2, 0x00000001, 0, REG_ECX, 20)
+       FEAT_DEF(X2APIC, 0x00000001, 0, REG_ECX, 21)
+       FEAT_DEF(MOVBE, 0x00000001, 0, REG_ECX, 22)
+       FEAT_DEF(POPCNT, 0x00000001, 0, REG_ECX, 23)
+       FEAT_DEF(TSC_DEADLINE, 0x00000001, 0, REG_ECX, 24)
+       FEAT_DEF(AES, 0x00000001, 0, REG_ECX, 25)
+       FEAT_DEF(XSAVE, 0x00000001, 0, REG_ECX, 26)
+       FEAT_DEF(OSXSAVE, 0x00000001, 0, REG_ECX, 27)
+       FEAT_DEF(AVX, 0x00000001, 0, REG_ECX, 28)
+       FEAT_DEF(F16C, 0x00000001, 0, REG_ECX, 29)
+       FEAT_DEF(RDRAND, 0x00000001, 0, REG_ECX, 30)
+
+       FEAT_DEF(FPU, 0x00000001, 0, REG_EDX,  0)
+       FEAT_DEF(VME, 0x00000001, 0, REG_EDX,  1)
+       FEAT_DEF(DE, 0x00000001, 0, REG_EDX,  2)
+       FEAT_DEF(PSE, 0x00000001, 0, REG_EDX,  3)
+       FEAT_DEF(TSC, 0x00000001, 0, REG_EDX,  4)
+       FEAT_DEF(MSR, 0x00000001, 0, REG_EDX,  5)
+       FEAT_DEF(PAE, 0x00000001, 0, REG_EDX,  6)
+       FEAT_DEF(MCE, 0x00000001, 0, REG_EDX,  7)
+       FEAT_DEF(CX8, 0x00000001, 0, REG_EDX,  8)
+       FEAT_DEF(APIC, 0x00000001, 0, REG_EDX,  9)
+       FEAT_DEF(SEP, 0x00000001, 0, REG_EDX, 11)
+       FEAT_DEF(MTRR, 0x00000001, 0, REG_EDX, 12)
+       FEAT_DEF(PGE, 0x00000001, 0, REG_EDX, 13)
+       FEAT_DEF(MCA, 0x00000001, 0, REG_EDX, 14)
+       FEAT_DEF(CMOV, 0x00000001, 0, REG_EDX, 15)
+       FEAT_DEF(PAT, 0x00000001, 0, REG_EDX, 16)
+       FEAT_DEF(PSE36, 0x00000001, 0, REG_EDX, 17)
+       FEAT_DEF(PSN, 0x00000001, 0, REG_EDX, 18)
+       FEAT_DEF(CLFSH, 0x00000001, 0, REG_EDX, 19)
+       FEAT_DEF(DS, 0x00000001, 0, REG_EDX, 21)
+       FEAT_DEF(ACPI, 0x00000001, 0, REG_EDX, 22)
+       FEAT_DEF(MMX, 0x00000001, 0, REG_EDX, 23)
+       FEAT_DEF(FXSR, 0x00000001, 0, REG_EDX, 24)
+       FEAT_DEF(SSE, 0x00000001, 0, REG_EDX, 25)
+       FEAT_DEF(SSE2, 0x00000001, 0, REG_EDX, 26)
+       FEAT_DEF(SS, 0x00000001, 0, REG_EDX, 27)
+       FEAT_DEF(HTT, 0x00000001, 0, REG_EDX, 28)
+       FEAT_DEF(TM, 0x00000001, 0, REG_EDX, 29)
+       FEAT_DEF(PBE, 0x00000001, 0, REG_EDX, 31)
+
+       FEAT_DEF(DIGTEMP, 0x00000006, 0, REG_EAX,  0)
+       FEAT_DEF(TRBOBST, 0x00000006, 0, REG_EAX,  1)
+       FEAT_DEF(ARAT, 0x00000006, 0, REG_EAX,  2)
+       FEAT_DEF(PLN, 0x00000006, 0, REG_EAX,  4)
+       FEAT_DEF(ECMD, 0x00000006, 0, REG_EAX,  5)
+       FEAT_DEF(PTM, 0x00000006, 0, REG_EAX,  6)
+
+       FEAT_DEF(MPERF_APERF_MSR, 0x00000006, 0, REG_ECX,  0)
+       FEAT_DEF(ACNT2, 0x00000006, 0, REG_ECX,  1)
+       FEAT_DEF(ENERGY_EFF, 0x00000006, 0, REG_ECX,  3)
+
+       FEAT_DEF(FSGSBASE, 0x00000007, 0, REG_EBX,  0)
+       FEAT_DEF(BMI1, 0x00000007, 0, REG_EBX,  2)
+       FEAT_DEF(HLE, 0x00000007, 0, REG_EBX,  4)
+       FEAT_DEF(AVX2, 0x00000007, 0, REG_EBX,  5)
+       FEAT_DEF(SMEP, 0x00000007, 0, REG_EBX,  6)
+       FEAT_DEF(BMI2, 0x00000007, 0, REG_EBX,  7)
+       FEAT_DEF(ERMS, 0x00000007, 0, REG_EBX,  8)
+       FEAT_DEF(INVPCID, 0x00000007, 0, REG_EBX, 10)
+       FEAT_DEF(RTM, 0x00000007, 0, REG_EBX, 11)
+
+       FEAT_DEF(LAHF_SAHF, 0x80000001, 0, REG_ECX,  0)
+       FEAT_DEF(LZCNT, 0x80000001, 0, REG_ECX,  4)
+
+       FEAT_DEF(SYSCALL, 0x80000001, 0, REG_EDX, 11)
+       FEAT_DEF(XD, 0x80000001, 0, REG_EDX, 20)
+       FEAT_DEF(1GB_PG, 0x80000001, 0, REG_EDX, 26)
+       FEAT_DEF(RDTSCP, 0x80000001, 0, REG_EDX, 27)
+       FEAT_DEF(EM64T, 0x80000001, 0, REG_EDX, 29)
+
+       FEAT_DEF(INVTSC, 0x80000007, 0, REG_EDX,  8)
+};
+
+static inline void
+rte_cpu_get_features(uint32_t leaf, uint32_t subleaf, cpuid_registers_t out)
+{
+#if defined(__i386__) && defined(__PIC__)
+    /* %ebx is a forbidden register if we compile with -fPIC or -fPIE */
+    asm volatile("movl %%ebx,%0 ; cpuid ; xchgl %%ebx,%0"
+                : "=r" (out[REG_EBX]),
+                  "=a" (out[REG_EAX]),
+                  "=c" (out[REG_ECX]),
+                  "=d" (out[REG_EDX])
+                : "a" (leaf), "c" (subleaf));
+#else
+
+    asm volatile("cpuid"
+                : "=a" (out[REG_EAX]),
+                  "=b" (out[REG_EBX]),
+                  "=c" (out[REG_ECX]),
+                  "=d" (out[REG_EDX])
+                : "a" (leaf), "c" (subleaf));
+
+#endif
+}
+
+static inline int
+rte_cpu_get_flag_enabled(enum rte_cpu_flag_t feature)
+{
+       const struct feature_entry *feat;
+       cpuid_registers_t regs;
+
+
+       if (feature >= RTE_CPUFLAG_NUMFLAGS)
+               /* Flag does not match anything in the feature tables */
+               return -ENOENT;
+
+       feat = &cpu_feature_table[feature];
+
+       if (!feat->leaf)
+               /* This entry in the table wasn't filled out! */
+               return -EFAULT;
+
+       rte_cpu_get_features(feat->leaf & 0xffff0000, 0, regs);
+       if (((regs[REG_EAX] ^ feat->leaf) & 0xffff0000) ||
+             regs[REG_EAX] < feat->leaf)
+               return 0;
+
+       /* get the cpuid leaf containing the desired feature */
+       rte_cpu_get_features(feat->leaf, feat->subleaf, regs);
+
+       /* check if the feature is enabled */
+       return (regs[feat->reg] >> feat->bit) & 1;
+}
+
+#ifdef __cplusplus
+}
+#endif
+
+#endif /* _RTE_CPUFLAGS_X86_64_H_ */
diff --git a/lib/librte_eal/common/include/generic/rte_cpuflags.h b/lib/librte_eal/common/include/generic/rte_cpuflags.h
new file mode 100644 (file)
index 0000000..7f04838
--- /dev/null
@@ -0,0 +1,110 @@
+/*-
+ *   BSD LICENSE
+ *
+ *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
+ *   All rights reserved.
+ *
+ *   Redistribution and use in source and binary forms, with or without
+ *   modification, are permitted provided that the following conditions
+ *   are met:
+ *
+ *     * Redistributions of source code must retain the above copyright
+ *       notice, this list of conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright
+ *       notice, this list of conditions and the following disclaimer in
+ *       the documentation and/or other materials provided with the
+ *       distribution.
+ *     * Neither the name of Intel Corporation nor the names of its
+ *       contributors may be used to endorse or promote products derived
+ *       from this software without specific prior written permission.
+ *
+ *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+ *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+ *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
+ *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
+ *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
+ *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
+ *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
+ *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
+ *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
+ *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ */
+
+#ifndef _RTE_CPUFLAGS_H_
+#define _RTE_CPUFLAGS_H_
+
+/**
+ * @file
+ * Architecture specific API to determine available CPU features at runtime.
+ */
+
+#include <stdlib.h>
+#include <stdio.h>
+#include <errno.h>
+#include <stdint.h>
+
+/**
+ * Enumeration of all CPU features supported
+ */
+enum rte_cpu_flag_t;
+
+/**
+ * Enumeration of CPU registers
+ */
+enum cpu_register_t;
+
+typedef uint32_t cpuid_registers_t[4];
+
+#define CPU_FLAG_NAME_MAX_LEN 64
+
+/**
+ * Struct to hold a processor feature entry
+ */
+struct feature_entry {
+       uint32_t leaf;                          /**< cpuid leaf */
+       uint32_t subleaf;                       /**< cpuid subleaf */
+       uint32_t reg;                           /**< cpuid register */
+       uint32_t bit;                           /**< cpuid register bit */
+       char name[CPU_FLAG_NAME_MAX_LEN];       /**< String for printing */
+};
+
+#define FEAT_DEF(name, leaf, subleaf, reg, bit) \
+       [RTE_CPUFLAG_##name] = {leaf, subleaf, reg, bit, #name },
+
+/**
+ * An array that holds feature entries
+ */
+static const struct feature_entry cpu_feature_table[];
+
+/**
+ * Execute CPUID instruction and get contents of a specific register
+ *
+ * This function, when compiled with GCC, will generate architecture-neutral
+ * code, as per GCC manual.
+ */
+static inline void
+rte_cpu_get_features(uint32_t leaf, uint32_t subleaf, cpuid_registers_t out);
+
+/**
+ * Function for checking a CPU flag availability
+ *
+ * @param flag
+ *     CPU flag to query CPU for
+ * @return
+ *     1 if flag is available
+ *     0 if flag is not available
+ *     -ENOENT if flag is invalid
+ */
+static inline int
+rte_cpu_get_flag_enabled(enum rte_cpu_flag_t feature);
+
+/**
+ * This function checks that the currently used CPU supports the CPU features
+ * that were specified at compile time. It is called automatically within the
+ * EAL, so does not need to be used by applications.
+ */
+void
+rte_cpu_check_supported(void);
+
+#endif /* _RTE_CPUFLAGS_H_ */
diff --git a/lib/librte_eal/common/include/rte_cpuflags.h b/lib/librte_eal/common/include/rte_cpuflags.h
deleted file mode 100644 (file)
index 5fa96db..0000000
+++ /dev/null
@@ -1,182 +0,0 @@
-/*-
- *   BSD LICENSE
- *
- *   Copyright(c) 2010-2014 Intel Corporation. All rights reserved.
- *   All rights reserved.
- *
- *   Redistribution and use in source and binary forms, with or without
- *   modification, are permitted provided that the following conditions
- *   are met:
- *
- *     * Redistributions of source code must retain the above copyright
- *       notice, this list of conditions and the following disclaimer.
- *     * Redistributions in binary form must reproduce the above copyright
- *       notice, this list of conditions and the following disclaimer in
- *       the documentation and/or other materials provided with the
- *       distribution.
- *     * Neither the name of Intel Corporation nor the names of its
- *       contributors may be used to endorse or promote products derived
- *       from this software without specific prior written permission.
- *
- *   THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
- *   "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
- *   LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
- *   A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
- *   OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
- *   SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
- *   LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
- *   DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
- *   THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
- *   (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
- *   OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
- */
-
-#ifndef _RTE_CPUFLAGS_H_
-#define _RTE_CPUFLAGS_H_
-
-/**
- * @file
- * Simple API to determine available CPU features at runtime.
- */
-
-#ifdef __cplusplus
-extern "C" {
-#endif
-
-
-/**
- * Enumeration of all CPU features supported
- */
-enum rte_cpu_flag_t {
-       /* (EAX 01h) ECX features*/
-       RTE_CPUFLAG_SSE3 = 0,               /**< SSE3 */
-       RTE_CPUFLAG_PCLMULQDQ,              /**< PCLMULQDQ */
-       RTE_CPUFLAG_DTES64,                 /**< DTES64 */
-       RTE_CPUFLAG_MONITOR,                /**< MONITOR */
-       RTE_CPUFLAG_DS_CPL,                 /**< DS_CPL */
-       RTE_CPUFLAG_VMX,                    /**< VMX */
-       RTE_CPUFLAG_SMX,                    /**< SMX */
-       RTE_CPUFLAG_EIST,                   /**< EIST */
-       RTE_CPUFLAG_TM2,                    /**< TM2 */
-       RTE_CPUFLAG_SSSE3,                  /**< SSSE3 */
-       RTE_CPUFLAG_CNXT_ID,                /**< CNXT_ID */
-       RTE_CPUFLAG_FMA,                    /**< FMA */
-       RTE_CPUFLAG_CMPXCHG16B,             /**< CMPXCHG16B */
-       RTE_CPUFLAG_XTPR,                   /**< XTPR */
-       RTE_CPUFLAG_PDCM,                   /**< PDCM */
-       RTE_CPUFLAG_PCID,                   /**< PCID */
-       RTE_CPUFLAG_DCA,                    /**< DCA */
-       RTE_CPUFLAG_SSE4_1,                 /**< SSE4_1 */
-       RTE_CPUFLAG_SSE4_2,                 /**< SSE4_2 */
-       RTE_CPUFLAG_X2APIC,                 /**< X2APIC */
-       RTE_CPUFLAG_MOVBE,                  /**< MOVBE */
-       RTE_CPUFLAG_POPCNT,                 /**< POPCNT */
-       RTE_CPUFLAG_TSC_DEADLINE,           /**< TSC_DEADLINE */
-       RTE_CPUFLAG_AES,                    /**< AES */
-       RTE_CPUFLAG_XSAVE,                  /**< XSAVE */
-       RTE_CPUFLAG_OSXSAVE,                /**< OSXSAVE */
-       RTE_CPUFLAG_AVX,                    /**< AVX */
-       RTE_CPUFLAG_F16C,                   /**< F16C */
-       RTE_CPUFLAG_RDRAND,                 /**< RDRAND */
-
-       /* (EAX 01h) EDX features */
-       RTE_CPUFLAG_FPU,                    /**< FPU */
-       RTE_CPUFLAG_VME,                    /**< VME */
-       RTE_CPUFLAG_DE,                     /**< DE */
-       RTE_CPUFLAG_PSE,                    /**< PSE */
-       RTE_CPUFLAG_TSC,                    /**< TSC */
-       RTE_CPUFLAG_MSR,                    /**< MSR */
-       RTE_CPUFLAG_PAE,                    /**< PAE */
-       RTE_CPUFLAG_MCE,                    /**< MCE */
-       RTE_CPUFLAG_CX8,                    /**< CX8 */
-       RTE_CPUFLAG_APIC,                   /**< APIC */
-       RTE_CPUFLAG_SEP,                    /**< SEP */
-       RTE_CPUFLAG_MTRR,                   /**< MTRR */
-       RTE_CPUFLAG_PGE,                    /**< PGE */
-       RTE_CPUFLAG_MCA,                    /**< MCA */
-       RTE_CPUFLAG_CMOV,                   /**< CMOV */
-       RTE_CPUFLAG_PAT,                    /**< PAT */
-       RTE_CPUFLAG_PSE36,                  /**< PSE36 */
-       RTE_CPUFLAG_PSN,                    /**< PSN */
-       RTE_CPUFLAG_CLFSH,                  /**< CLFSH */
-       RTE_CPUFLAG_DS,                     /**< DS */
-       RTE_CPUFLAG_ACPI,                   /**< ACPI */
-       RTE_CPUFLAG_MMX,                    /**< MMX */
-       RTE_CPUFLAG_FXSR,                   /**< FXSR */
-       RTE_CPUFLAG_SSE,                    /**< SSE */
-       RTE_CPUFLAG_SSE2,                   /**< SSE2 */
-       RTE_CPUFLAG_SS,                     /**< SS */
-       RTE_CPUFLAG_HTT,                    /**< HTT */
-       RTE_CPUFLAG_TM,                     /**< TM */
-       RTE_CPUFLAG_PBE,                    /**< PBE */
-
-       /* (EAX 06h) EAX features */
-       RTE_CPUFLAG_DIGTEMP,                /**< DIGTEMP */
-       RTE_CPUFLAG_TRBOBST,                /**< TRBOBST */
-       RTE_CPUFLAG_ARAT,                   /**< ARAT */
-       RTE_CPUFLAG_PLN,                    /**< PLN */
-       RTE_CPUFLAG_ECMD,                   /**< ECMD */
-       RTE_CPUFLAG_PTM,                    /**< PTM */
-
-       /* (EAX 06h) ECX features */
-       RTE_CPUFLAG_MPERF_APERF_MSR,        /**< MPERF_APERF_MSR */
-       RTE_CPUFLAG_ACNT2,                  /**< ACNT2 */
-       RTE_CPUFLAG_ENERGY_EFF,             /**< ENERGY_EFF */
-
-       /* (EAX 07h, ECX 0h) EBX features */
-       RTE_CPUFLAG_FSGSBASE,               /**< FSGSBASE */
-       RTE_CPUFLAG_BMI1,                   /**< BMI1 */
-       RTE_CPUFLAG_HLE,                    /**< Hardware Lock elision */
-       RTE_CPUFLAG_AVX2,                   /**< AVX2 */
-       RTE_CPUFLAG_SMEP,                   /**< SMEP */
-       RTE_CPUFLAG_BMI2,                   /**< BMI2 */
-       RTE_CPUFLAG_ERMS,                   /**< ERMS */
-       RTE_CPUFLAG_INVPCID,                /**< INVPCID */
-       RTE_CPUFLAG_RTM,                    /**< Transactional memory */
-
-       /* (EAX 80000001h) ECX features */
-       RTE_CPUFLAG_LAHF_SAHF,              /**< LAHF_SAHF */
-       RTE_CPUFLAG_LZCNT,                  /**< LZCNT */
-
-       /* (EAX 80000001h) EDX features */
-       RTE_CPUFLAG_SYSCALL,                /**< SYSCALL */
-       RTE_CPUFLAG_XD,                     /**< XD */
-       RTE_CPUFLAG_1GB_PG,                 /**< 1GB_PG */
-       RTE_CPUFLAG_RDTSCP,                 /**< RDTSCP */
-       RTE_CPUFLAG_EM64T,                  /**< EM64T */
-
-       /* (EAX 80000007h) EDX features */
-       RTE_CPUFLAG_INVTSC,                 /**< INVTSC */
-
-       /* The last item */
-       RTE_CPUFLAG_NUMFLAGS,               /**< This should always be the last! */
-};
-
-
-/**
- * Function for checking a CPU flag availability
- *
- * @param flag
- *     CPU flag to query CPU for
- * @return
- *     1 if flag is available
- *     0 if flag is not available
- *     -ENOENT if flag is invalid
- */
-int
-rte_cpu_get_flag_enabled(enum rte_cpu_flag_t flag);
-
-/**
- * This function checks that the currently used CPU supports the CPU features
- * that were specified at compile time. It is called automatically within the
- * EAL, so does not need to be used by applications.
- */
-void
-rte_cpu_check_supported(void);
-
-#ifdef __cplusplus
-}
-#endif
-
-
-#endif /* _RTE_CPUFLAGS_H_ */