source: icGREP/icgrep-devel/icgrep/IR_Gen/idisa_target.cpp @ 6235

Last change on this file since 6235 was 6235, checked in by cameron, 9 months ago

BMI2_available() and checking for u32u8

File size: 3.6 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 */
5
6#include "idisa_target.h"
7#include <toolchain/toolchain.h>
8#include <IR_Gen/idisa_sse_builder.h>
9#include <IR_Gen/idisa_avx_builder.h>
10#include <IR_Gen/idisa_i64_builder.h>
11#include <IR_Gen/idisa_nvptx_builder.h>
12#include <llvm/IR/Module.h>
13#include <llvm/ADT/Triple.h>
14#include <llvm/Support/ErrorHandling.h>
15#include <llvm/Support/raw_ostream.h>
16#include <kernels/kernel_builder.h>
17
18using namespace kernel;
19using namespace llvm;
20
21struct Features {
22    bool hasAVX;
23    bool hasAVX2;
24    bool hasAVX512F;
25    Features() : hasAVX(0), hasAVX2(0), hasAVX512F(0) { }
26};
27
28Features getHostCPUFeatures() {
29    Features hostCPUFeatures;
30    StringMap<bool> features;
31    if (sys::getHostCPUFeatures(features)) {
32        hostCPUFeatures.hasAVX = features.lookup("avx");
33        hostCPUFeatures.hasAVX2 = features.lookup("avx2");
34        hostCPUFeatures.hasAVX512F = features.lookup("avx512f");
35    }
36    return hostCPUFeatures;
37}
38
39bool SSSE3_available() {
40    StringMap<bool> features;
41    if (sys::getHostCPUFeatures(features)) {
42        return features.lookup("ssse3");
43    }
44    return false;
45}
46
47bool BMI2_available() {
48    StringMap<bool> features;
49    if (sys::getHostCPUFeatures(features)) {
50        return features.lookup("bmi2");
51    }
52    return false;
53}
54
55bool AVX2_available() {
56    StringMap<bool> features;
57    if (sys::getHostCPUFeatures(features)) {
58        return features.lookup("avx2");
59    }
60    return false;
61}
62
63bool AVX512BW_available() {
64    StringMap<bool> features;
65    if (sys::getHostCPUFeatures(features)) {
66        return features.lookup("avx512bw");
67    }
68    return false;
69}
70
71namespace IDISA {
72
73KernelBuilder * GetIDISA_Builder(llvm::LLVMContext & C) {
74    const auto hostCPUFeatures = getHostCPUFeatures();
75    if (LLVM_LIKELY(codegen::BlockSize == 0)) {  // No BlockSize override: use processor SIMD width
76
77#if LLVM_VERSION_INTEGER >= LLVM_VERSION_CODE(3, 8, 0)
78        if (hostCPUFeatures.hasAVX512F) codegen::BlockSize = 512;
79        else
80#endif
81        if (hostCPUFeatures.hasAVX2) codegen::BlockSize = 256;
82        else codegen::BlockSize = 128;
83    }
84    else if (((codegen::BlockSize & (codegen::BlockSize - 1)) != 0) || (codegen::BlockSize < 64)) {
85        llvm::report_fatal_error("BlockSize must be a power of 2 and >=64");
86    }
87#if LLVM_VERSION_INTEGER >= LLVM_VERSION_CODE(3, 8, 0)
88    if (codegen::BlockSize >= 512) {
89        // AVX512BW builder can only be used for BlockSize multiples of 512
90        if (hostCPUFeatures.hasAVX512F) {
91            return new KernelBuilderImpl<IDISA_AVX512F_Builder>(C, codegen::BlockSize, codegen::LaneWidth);
92        }
93    }
94#endif
95    if (codegen::BlockSize >= 256) {
96        // AVX2 or AVX builders can only be used for BlockSize multiples of 256
97        if (hostCPUFeatures.hasAVX2) {
98            return new KernelBuilderImpl<IDISA_AVX2_Builder>(C, codegen::BlockSize, codegen::LaneWidth);
99        } else if (hostCPUFeatures.hasAVX) {
100            return new KernelBuilderImpl<IDISA_AVX_Builder>(C, codegen::BlockSize, codegen::LaneWidth);
101        }
102    } else if (codegen::BlockSize == 64) {
103        return new KernelBuilderImpl<IDISA_I64_Builder>(C, codegen::BlockSize, codegen::LaneWidth);
104    }
105    if (SSSE3_available()) return new KernelBuilderImpl<IDISA_SSSE3_Builder>(C, codegen::BlockSize, codegen::LaneWidth);
106    return new KernelBuilderImpl<IDISA_SSE2_Builder>(C, codegen::BlockSize, codegen::LaneWidth);
107}
108#ifdef CUDA_ENABLED
109KernelBuilder * GetIDISA_GPU_Builder(llvm::LLVMContext & C) {
110    return new KernelBuilderImpl<IDISA_NVPTX20_Builder>(C, 64 * 64, 64);
111}
112#endif
113}
Note: See TracBrowser for help on using the repository browser.