source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5364

Last change on this file since 5364 was 5364, checked in by cameron, 2 years ago

Consolidate pipeline compiler options in toolchain

File size: 29.4 KB
RevLine 
[4324]1/*
[4947]2 *  Copyright (c) 2016 International Characters.
[4324]3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
[5234]7#include "grep_engine.h"
[5267]8#include <llvm/IR/Module.h>
[4946]9#include <llvm/ExecutionEngine/MCJIT.h>
[5234]10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
[5238]14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
[4949]16#include <UCD/UnicodeNameData.h>
[5206]17#include <UCD/resolve_properties.h>
[5142]18#include <kernels/cc_kernel.h>
[5357]19#include <kernels/linebreak_kernel.h>
[5338]20#include <kernels/streams_merge.h>
[5343]21#include <kernels/match_count.h>
[5254]22#include <kernels/mmap_kernel.h>
[5234]23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
[5348]26#include <kernels/interface.h>
[5234]27#include <pablo/pablo_compiler.h>
[5087]28#include <pablo/pablo_kernel.h>
29#include <pablo/pablo_toolchain.h>
[5234]30#include <re/re_cc.h>
31#include <re/re_toolchain.h>
32#include <toolchain.h>
33#include <iostream>
[4324]34#include <sstream>
[5267]35#ifdef CUDA_ENABLED
[5238]36#include <IR_Gen/CudaDriver.h>
[5314]37#include "preprocess.cpp"
[5151]38#endif
[5236]39#include <util/aligned_allocator.h>
[5151]40
[5333]41
[5241]42using namespace parabix;
[5267]43using namespace llvm;
[5241]44
[5033]45static cl::OptionCategory bGrepOutputOptions("Output Options",
46                                             "These options control the output.");
[5176]47static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]48
[5176]49static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
50
[5033]51static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]52
[5033]53static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
54static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
55
56static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
57static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
58
[5045]59bool isUTF_16 = false;
[5151]60std::string IRFilename = "icgrep.ll";
61std::string PTXFilename = "icgrep.ptx";
[5033]62
[5241]63static re::CC * parsedCodePointSet = nullptr;
64static std::vector<std::string> parsedPropertyValues;
65
[5314]66#ifdef CUDA_ENABLED
67int blockNo = 0;
68size_t * startPoints = nullptr;
69size_t * accumBytes = nullptr;
70#endif
71
[5106]72void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
[5101]73    boost::filesystem::path file(fileName);
[4788]74    if (exists(file)) {
75        if (is_directory(file)) {
[4969]76            return;
[4788]77        }
78    } else {
[5176]79        if (!SilenceFileErrors) {
80            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
81            return;
82        }
[4788]83    }
84
[5037]85    const auto fileSize = file_size(file);
[5001]86    if (fileSize > 0) {
[4883]87        try {
[5101]88            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
[5037]89            char * fileBuffer = const_cast<char *>(source.data());
[5314]90           
[5151]91#ifdef CUDA_ENABLED 
92            if(codegen::NVPTX){
[5314]93                codegen::BlockSize = 128;
[5341]94                char * LineBreak;
95                if (posix_memalign((void**)&LineBreak, 32, fileSize)) {
96                    std::cerr << "Cannot allocate memory for linebreak.\n";
97                    exit(-1);
98                }
99                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize, LineBreak);
[5314]100
101                const unsigned numOfGroups = codegen::GroupNum;
102                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
103                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
104                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
105                    exit(-1);
106                }
107
108                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
[5151]109                if (CountOnly){
110                    exit(0);
111                }
112                else{
[5314]113                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
[5341]114                    mGrepFunction_CPU((char *)rslt, LineBreak, fileBuffer, intputSize, fileIdx);
[5151]115                    return;
116                }
117               
118            } 
119#endif
[5037]120            if (CountOnly) {
[5048]121                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
[5037]122            } else {
[5048]123                mGrepFunction(fileBuffer, fileSize, fileIdx);
[5037]124            }
125            source.close();
126        } catch (std::exception & e) {
[5176]127            if (!SilenceFileErrors) {
128                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
129                return;
130            }
[4883]131        }
[5037]132    } else {
[5151]133#ifdef CUDA_ENABLED
134        if (codegen::NVPTX){
135            std::cout << 0 << std::endl;
136            exit(0);
137        }
138#endif
[5048]139        if (CountOnly) {
[5106]140            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
[5037]141        } else {
[5048]142            mGrepFunction(nullptr, 0, fileIdx);
[5037]143        }
[5021]144    }
[4949]145}
146
[5314]147
[5151]148Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
149    Type * const int64ty = iBuilder->getInt64Ty();
[5314]150    Type * const size_ty = iBuilder->getSizeTy();
151    Type * const int32ty = iBuilder->getInt32Ty();
152    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
153    Type * const int64tyPtr = PointerType::get(int64ty, 1);
154    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
[5151]155    Type * const resultTy = iBuilder->getVoidTy();
[5314]156    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
[5151]157    kernelFunc->setCallingConv(CallingConv::C);
158    Function::arg_iterator args = kernelFunc->arg_begin();
159
160    Value * const inputPtr = &*(args++);
161    inputPtr->setName("inputPtr");
[5314]162    Value * const startPointsPtr = &*(args++);
163    startPointsPtr->setName("startPointsPtr");
164    Value * const bufferSizesPtr = &*(args++);
165    bufferSizesPtr->setName("bufferSizesPtr");
[5151]166    Value * const outputPtr = &*(args++);
167    outputPtr->setName("resultPtr");
168
169    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
170    iBuilder->SetInsertPoint(entryBlock);
171
172    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
[5314]173    Value * tid = iBuilder->CreateCall(tidFunc);
174    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
175    Value * bid = iBuilder->CreateCall(bidFunc);
[5151]176
[5314]177    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
178
[5151]179    Function * mainFunc = m->getFunction("Main");
[5314]180    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
[5200]181    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
[5314]182    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
183    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
184    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
[5200]185
[5361]186    if (CountOnly) {
[5314]187        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
188        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
[5151]189        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
190        iBuilder->CreateStore(result, outputThreadPtr);
[5361]191    } else {
[5348]192        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 1);
[5314]193        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
194        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
[5151]195        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
196    }   
197
198    iBuilder->CreateRetVoid();
199    return kernelFunc;
200}
201
[5206]202Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
[5151]203    Type * const size_ty = iBuilder->getSizeTy();
204    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
[5341]205    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 0);
206    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, rsltType, int8PtrTy, size_ty, size_ty, nullptr));
[5151]207    mainCPUFn->setCallingConv(CallingConv::C);
208    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
209    Function::arg_iterator args = mainCPUFn->arg_begin();
[5135]210   
[5151]211    Value * const rsltStream = &*(args++);
212    rsltStream->setName("rslt");
[5341]213    Value * const lbStream = &*(args++);
214    lbStream->setName("lb");
[5151]215    Value * const inputStream = &*(args++);
216    inputStream->setName("input");
217    Value * const fileSize = &*(args++);
218    fileSize->setName("fileSize");
219    Value * const fileIdx = &*(args++);
220    fileIdx->setName("fileIdx");
[4946]221
[5294]222    const unsigned segmentSize = codegen::SegmentSize;
[5348]223   
[5341]224    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1));
[5151]225    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
226
[5341]227    kernel::MMapSourceKernel mmapK1(iBuilder, segmentSize); 
[5348]228    mmapK1.setName("mmap1");
[5341]229    mmapK1.generateKernel({}, {&MatchResults});
230    mmapK1.setInitialArguments({fileSize});
[5294]231
[5341]232    ExternalFileBuffer LineBreak(iBuilder, iBuilder->getStreamSetTy(1, 1));
233    LineBreak.setStreamSetBuffer(lbStream, fileSize);
234   
235    kernel::MMapSourceKernel mmapK2(iBuilder, segmentSize); 
[5348]236    mmapK2.setName("mmap2");
[5341]237    mmapK2.generateKernel({}, {&LineBreak});
238    mmapK2.setInitialArguments({fileSize});
[5320]239
[5206]240    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
[5341]241    scanMatchK.generateKernel({&MatchResults, &LineBreak}, {});
[5348]242    scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
[5151]243   
[5364]244    generatePipeline(iBuilder, {&mmapK1, &mmapK2, &scanMatchK});
[5151]245    iBuilder->CreateRetVoid();
246
247    return mainCPUFn;
248}
249
[5338]250void GrepEngine::multiGrepCodeGen(std::string moduleName, std::vector<re::RE *> REs, bool CountOnly, bool UTF_16, GrepType grepType) {
251
252    isUTF_16 = UTF_16;
253    Module * M = new Module(moduleName + ":icgrep", getGlobalContext());; 
254    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);; 
255
256    const unsigned segmentSize = codegen::SegmentSize;
[5364]257    const unsigned bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
[5338]258    const unsigned encodingBits = UTF_16 ? 16 : 8;
259
260    mGrepType = grepType;
261
262    Type * const size_ty = iBuilder->getSizeTy();
263    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
264    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), 0);
265    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
266
267    Function * mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
268    mainFn->setCallingConv(CallingConv::C);
269    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
270    Function::arg_iterator args = mainFn->arg_begin();
271   
272    Value * inputStream = &*(args++);
273    inputStream->setName("input");
274    Value * fileSize = &*(args++);
275    fileSize->setName("fileSize");
276    Value * fileIdx = &*(args++);
277    fileIdx->setName("fileIdx");
278
279    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));   
280    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
281    ByteStream.setStreamSetBuffer(inputStream, fileSize);
282    BasisBits.allocateBuffer();
283   
284    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
285    mmapK.generateKernel({}, {&ByteStream});
286    mmapK.setInitialArguments({fileSize});
287
288    kernel::S2PKernel  s2pk(iBuilder);
289    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5357]290   
[5338]291    std::vector<pablo::PabloKernel *> icgrepKs;
292    std::vector<StreamSetBuffer *> MatchResultsBufs;
293
294    for(unsigned i=0; i<REs.size(); i++){   
[5357]295        pablo::PabloKernel * icgrepK = new pablo::PabloKernel(iBuilder, "icgrep"+std::to_string(i), {Binding{iBuilder->getStreamSetTy(8), "basis"}, Binding{iBuilder->getStreamSetTy(1, 1), "linebreak"}});
[5343]296        re::re2pablo_compiler(icgrepK, re::regular_expression_passes(REs[i]), false);
[5338]297        pablo_function_passes(icgrepK);
298        icgrepKs.push_back(icgrepK);
299        CircularBuffer * MatchResults = new CircularBuffer(iBuilder, iBuilder->getStreamSetTy(2, 1), segmentSize * bufferSegments);       
300        MatchResults->allocateBuffer();
301        MatchResultsBufs.push_back(MatchResults);
302    }   
303
[5339]304    std::vector<kernel::KernelBuilder *> KernelList;
[5338]305    KernelList.push_back(&mmapK);
[5343]306    KernelList.push_back(&s2pk);
[5338]307
308    CircularBuffer mergedResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
309    mergedResults.allocateBuffer();
310
311    kernel::StreamsMerge streamsMergeK(iBuilder, 1, REs.size());
312    streamsMergeK.generateKernel(MatchResultsBufs, {&mergedResults});
313
[5357]314    kernel::LineBreakKernelBuilder linebreakK(iBuilder, "lb", encodingBits);
315    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
316    LineBreakStream.allocateBuffer();
317    linebreakK.generateKernel({&BasisBits}, {&LineBreakStream});
318   
319    KernelList.push_back(&linebreakK);
[5338]320    for(unsigned i=0; i<REs.size(); i++){
[5357]321        icgrepKs[i]->generateKernel({&BasisBits, &LineBreakStream}, {MatchResultsBufs[i]});
[5338]322        KernelList.push_back(icgrepKs[i]);
323    }
324    KernelList.push_back(&streamsMergeK);
[5343]325
326    if (CountOnly) {
327        kernel::MatchCount matchCountK(iBuilder);
328        matchCountK.generateKernel({&mergedResults}, {}); 
329
330        KernelList.push_back(&matchCountK); 
331
[5364]332        generatePipeline(iBuilder, KernelList);
[5343]333        iBuilder->CreateRet(matchCountK.getScalarField(matchCountK.getInstance(), "matchedLineCount"));
334
[5361]335    } else {
[5343]336        kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
337        scanMatchK.generateKernel({&mergedResults, &LineBreakStream}, {});               
338        scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
339
340        KernelList.push_back(&scanMatchK);
341
[5364]342        generatePipeline(iBuilder, KernelList);
[5343]343       
344        iBuilder->CreateRetVoid();
345    }
[5338]346   
347    mEngine = JIT_to_ExecutionEngine(M);
348    ApplyObjectCache(mEngine);
349    icgrep_Linking(M, mEngine);
350
351#ifndef NDEBUG
352    verifyModule(*M, &dbgs());
353#endif
354
355    mEngine->finalizeObject();
356    delete iBuilder;
357   
[5343]358    if (CountOnly) {
359        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
360    } else {
361        mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
362    }
[5338]363
364}
365
[5206]366void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
[5151]367    isUTF_16 = UTF_16;
368    int addrSpace = 0;
369    bool CPU_Only = true;
[5200]370    Module * M = nullptr; 
371    IDISA::IDISA_Builder * iBuilder = nullptr; 
[5151]372
373#ifdef CUDA_ENABLED
374    setNVPTXOption(); 
[5202]375    if (codegen::NVPTX) {
376        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
[5151]377        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
378        M = gpuM;
379        iBuilder = GPUBuilder;
380        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
381        M->setTargetTriple("nvptx64-nvidia-cuda");
382        addrSpace = 1;
383        CPU_Only = false;
[5200]384        codegen::BlockSize = 64;
[5202]385    }
[5151]386#endif
387
[5310]388    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
[5202]389    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
[5200]390
[5204]391    if (CPU_Only) {
[5200]392        M = cpuM;
393        iBuilder = CPUBuilder;
394    }
395
[5273]396    // segment size made availabe for each call to the mmap source kernel
[5135]397    const unsigned segmentSize = codegen::SegmentSize;
[5364]398    const unsigned bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
[5246]399    const unsigned encodingBits = UTF_16 ? 16 : 8;
[5033]400
[5206]401    mGrepType = grepType;
[5135]402
[5204]403    Type * const size_ty = iBuilder->getSizeTy();
[5135]404    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
[5246]405    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
[5204]406    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
[5151]407
408    Function * mainFn = nullptr;
409    Value * inputStream = nullptr;
410    Value * fileSize = nullptr;
411    Value * fileIdx = nullptr;
412
413#ifdef CUDA_ENABLED   
414    Value * outputStream = nullptr;
[5348]415    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), addrSpace);
[5151]416    if (codegen::NVPTX){
417        if (CountOnly){
418            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
419            mainFn->setCallingConv(CallingConv::C);
420            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
421            Function::arg_iterator args = mainFn->arg_begin();
422           
423            inputStream = &*(args++);
424            inputStream->setName("input");
425            fileSize = &*(args++);
426            fileSize->setName("fileSize");
[5202]427        } else {
[5151]428            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
429            mainFn->setCallingConv(CallingConv::C);
430            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
431            Function::arg_iterator args = mainFn->arg_begin();
432           
433            inputStream = &*(args++);
434            inputStream->setName("input");
435            fileSize = &*(args++);
436            fileSize->setName("fileSize");
437            outputStream = &*(args++);
438            outputStream->setName("output");
439        }
440    } 
441#endif
[5353]442    if (CPU_Only) {
[5204]443        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
[5151]444        mainFn->setCallingConv(CallingConv::C);
445        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
446        Function::arg_iterator args = mainFn->arg_begin();
447       
448        inputStream = &*(args++);
449        inputStream->setName("input");
450        fileSize = &*(args++);
451        fileSize->setName("fileSize");
452        fileIdx = &*(args++);
453        fileIdx->setName("fileIdx");
454    }
[5135]455       
[5217]456    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
[5254]457   
[5273]458    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
[5254]459    mmapK.generateKernel({}, {&ByteStream});
460    mmapK.setInitialArguments({fileSize});
461   
[5310]462    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
[5135]463
[5230]464    kernel::S2PKernel  s2pk(iBuilder);
[5135]465    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5333]466   
[5357]467    kernel::LineBreakKernelBuilder linebreakK(iBuilder, "lb", encodingBits);
468    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
[5336]469
[5357]470    linebreakK.generateKernel({&BasisBits}, {&LineBreakStream});
[5333]471    LineBreakStream.allocateBuffer();
472
[5357]473    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}, Binding{iBuilder->getStreamSetTy(1, 1), "linebreak"}});
[5310]474    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
[5217]475    pablo_function_passes(&icgrepK);
[5135]476
[5142]477    ByteStream.setStreamSetBuffer(inputStream, fileSize);
[5135]478    BasisBits.allocateBuffer();
479
[5242]480    if (CountOnly) {
[5357]481        icgrepK.generateKernel({&BasisBits, &LineBreakStream}, {});
[5364]482        generatePipeline(iBuilder, {&mmapK, &s2pk, &linebreakK, &icgrepK});
[5310]483        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
[5202]484    } else {
[5151]485#ifdef CUDA_ENABLED
486        if (codegen::NVPTX){
[5348]487            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), addrSpace);
[5151]488            MatchResults.setStreamSetBuffer(outputStream, fileSize);
[5135]489
[5357]490            icgrepK.generateKernel({&BasisBits, &LineBreakStream},  {&MatchResults});
491            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &linebreakK, &icgrepK});
[5135]492
493        }
[5151]494#endif
[5202]495        if (CPU_Only) {
[5333]496            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
[5151]497            MatchResults.allocateBuffer();
498
[5357]499            icgrepK.generateKernel({&BasisBits, &LineBreakStream}, {&MatchResults});
[5151]500
[5206]501            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
[5333]502            scanMatchK.generateKernel({&MatchResults, &LineBreakStream}, {});               
[5220]503            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
[5336]504           
[5364]505            generatePipeline(iBuilder, {&mmapK, &s2pk, &linebreakK, &icgrepK, &scanMatchK});
[5135]506        }
507        iBuilder->CreateRetVoid();
508    }
[5151]509
510#ifdef CUDA_ENABLED
511    Function * mainCPUFn = nullptr;
512    if(codegen::NVPTX){
513        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
514        MDNode * Node = MDNode::get(M->getContext(),
515                                    {llvm::ValueAsMetadata::get(kernelFunction),
516                                     MDString::get(M->getContext(), "kernel"), 
517                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
518        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
519        NMD->addOperand(Node);
520   
521        Compile2PTX(M, IRFilename, PTXFilename);
[5206]522        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
[5151]523        if (CountOnly) return;
524    }
525#endif
[5310]526
527
[5151]528    mEngine = JIT_to_ExecutionEngine(cpuM);
[5135]529    ApplyObjectCache(mEngine);
[5151]530    icgrep_Linking(cpuM, mEngine);
[5135]531
532#ifndef NDEBUG
533    verifyModule(*M, &dbgs());
534#endif
535
536    mEngine->finalizeObject();
537    delete iBuilder;
538   
539    if (CountOnly) {
540        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
541    } else {
[5151]542#ifdef CUDA_ENABLED
543        if(codegen::NVPTX){
544            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
545        }
546#endif
547        if (CPU_Only) {
548            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
549        }
[5135]550    }
551
552}
553
[5241]554re::CC * GrepEngine::grepCodepoints() {
555    parsedCodePointSet = re::makeCC();
[4967]556    char * mFileBuffer = getUnicodeNameDataPtr();
[4969]557    size_t mFileSize = getUnicodeNameDataSize();
[5048]558    mGrepFunction(mFileBuffer, mFileSize, 0);
[5241]559    return parsedCodePointSet;
[4946]560}
[4968]561
[5206]562const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
[5245]563    enum { MaxSupportedVectorWidthInBytes = 32 };
564    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
[5241]565    parsedPropertyValues.clear();
[5236]566    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
[5241]567    const auto n = str.length();
[5245]568    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
569    // erroneously matching garbage data when loading the final partial block.
570    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
[5241]571    std::memcpy(aligned, str.data(), n);
[5245]572    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
[5241]573    mGrepFunction(aligned, n, 0);
[5236]574    alloc.deallocate(aligned, 0);
[5241]575    return parsedPropertyValues;
[5206]576}
577
[5033]578static int * total_count;
579static std::stringstream * resultStrs = nullptr;
580static std::vector<std::string> inputFiles;
581
582void initResult(std::vector<std::string> filenames){
583    const int n = filenames.size();
584    if (n > 1) {
585        ShowFileNames = true;
586    }
587    inputFiles = filenames;
588    resultStrs = new std::stringstream[n];
589    total_count = new int[n];
[5037]590    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]591        total_count[i] = 0;
592    }
593   
594}
595
596extern "C" {
[5106]597    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
[5329]598        assert (buffer);
[5314]599#ifdef CUDA_ENABLED
600    if (codegen::NVPTX){
601        while(line_start>startPoints[blockNo]) blockNo++;
602        line_start -= accumBytes[blockNo-1];
603        line_end -= accumBytes[blockNo-1];
604    }
605#endif
[5048]606        int index = isUTF_16 ? 2 : 1;
607        int idx = fileIdx;
608         
[5033]609        if (ShowFileNames) {
610            resultStrs[idx] << inputFiles[idx] << ':';
611        }
612        if (ShowLineNumbers) {
613            resultStrs[idx] << lineNum << ":";
614        }
615       
[5045]616        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
[5033]617            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
618            line_start++;
619        }
[5045]620        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
621            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
622            line_start += 2;
623        }
[5033]624        if (line_end == filesize) {
625            // The match position is at end-of-file.   We have a final unterminated line.
[5045]626            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]627            if (NormalizeLineBreaks) {
628                resultStrs[idx] << '\n';  // terminate it
629            }
630            return;
631        }
632        unsigned char end_byte = (unsigned char)buffer[line_end]; 
[5048]633        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
[5033]634        if (NormalizeLineBreaks) {
635            if (end_byte == 0x85) {
636                // Line terminated with NEL, on the second byte.  Back up 1.
637                line_end--;
638            } else if (end_byte > 0xD) {
639                // Line terminated with PS or LS, on the third byte.  Back up 2.
[5045]640                isUTF_16 ? line_end-- : line_end -= 2;
[5033]641            }
[5045]642            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]643            resultStrs[idx] << '\n';
[5245]644        } else {
[5045]645            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
[5033]646                // Check for line_end on first byte of CRLF;  note that we don't
647                // want to access past the end of buffer.
[5048]648                if (line_end + 1 < filesize) {
649                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
650                        // Found CRLF; preserve both bytes.
651                        line_end++;
652                    }
653                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
654                        // Found CRLF; preserve both bytes.
655                        line_end += 2;
656                    }
657                }
[5033]658            }
[5045]659            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
[5033]660        }
661    }
662}
663
[5106]664void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
[5176]665   
[5033]666    if(CountOnly){
667        if (!ShowFileNames) {
[5037]668            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]669                std::cout << total_CountOnly[i] << std::endl;
670            }
671        }
672        else {
[5037]673            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]674                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
675            };
676        }
677        return;
678    }
679   
[5037]680    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]681        std::cout << resultStrs[i].str();
682    }
683}
684
685extern "C" {
[5106]686    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5329]687        assert (buffer);
[5033]688        re::codepoint_t c = 0;
689        ssize_t line_pos = line_start;
690        while (isxdigit(buffer[line_pos])) {
691            if (isdigit(buffer[line_pos])) {
692                c = (c << 4) | (buffer[line_pos] - '0');
693            }
694            else {
695                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
696            }
697            line_pos++;
698        }
699        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
700        parsedCodePointSet->insert(c);
701    }
702}
703
[5206]704extern "C" {
705    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5241]706        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
[5206]707    }
708}
709
[5033]710void icgrep_Linking(Module * m, ExecutionEngine * e) {
711    Module::FunctionListType & fns = m->getFunctionList();
[5234]712    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
[5033]713        std::string fnName = it->getName().str();
714        if (fnName == "s2p_block") continue;
715        if (fnName == "process_block") continue;
716        if (fnName == "process_block_initialize_carries") continue;
717       
718        if (fnName == "wrapped_report_match") {
719            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
720        }
721        if (fnName == "insert_codepoints") {
722            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
723        }
[5206]724        if (fnName == "insert_property_values") {
725            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
726        }
[5033]727    }
728}
729
[5240]730GrepEngine::GrepEngine()
731: mGrepFunction(nullptr)
732, mGrepFunction_CountOnly(nullptr)
733, mGrepFunction_CPU(nullptr)
734, mGrepType(GrepType::Normal)
735, mEngine(nullptr) {
736
737}
738
739GrepEngine::~GrepEngine() {
740    delete mEngine;
741}
Note: See TracBrowser for help on using the repository browser.