source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5341

Last change on this file since 5341 was 5341, checked in by xuedongx, 2 years ago

LineBreak? Kernel for GPU.

File size: 30.5 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "grep_engine.h"
8#include <llvm/IR/Module.h>
9#include <llvm/ExecutionEngine/MCJIT.h>
10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
16#include <UCD/UnicodeNameData.h>
17#include <UCD/resolve_properties.h>
18#include <kernels/cc_kernel.h>
19#include <kernels/unicode_linebreak_kernel.h>
20#include <kernels/streams_merge.h>
21#include <kernels/pipeline.h>
22#include <kernels/mmap_kernel.h>
23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <pablo/pablo_compiler.h>
27#include <pablo/pablo_kernel.h>
28#include <pablo/pablo_toolchain.h>
29#include <re/re_cc.h>
30#include <re/re_toolchain.h>
31#include <toolchain.h>
32#include <iostream>
33#include <sstream>
34#ifdef CUDA_ENABLED
35#include <IR_Gen/CudaDriver.h>
36#include "preprocess.cpp"
37#endif
38#include <util/aligned_allocator.h>
39
40#define UNICODE_LINE_BREAK (!re::AlgorithmOptionIsSet(re::DisableUnicodeLineBreak))
41
42using namespace parabix;
43using namespace llvm;
44
45static cl::OptionCategory bGrepOutputOptions("Output Options",
46                                             "These options control the output.");
47static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
48
49static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
50
51static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
52
53static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
54static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
55
56static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
57static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
58
59static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
60
61static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
62
63bool isUTF_16 = false;
64std::string IRFilename = "icgrep.ll";
65std::string PTXFilename = "icgrep.ptx";
66
67static re::CC * parsedCodePointSet = nullptr;
68static std::vector<std::string> parsedPropertyValues;
69
70#ifdef CUDA_ENABLED
71int blockNo = 0;
72size_t * startPoints = nullptr;
73size_t * accumBytes = nullptr;
74#endif
75
76void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
77    boost::filesystem::path file(fileName);
78    if (exists(file)) {
79        if (is_directory(file)) {
80            return;
81        }
82    } else {
83        if (!SilenceFileErrors) {
84            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
85            return;
86        }
87    }
88
89    const auto fileSize = file_size(file);
90    if (fileSize > 0) {
91        try {
92            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
93            char * fileBuffer = const_cast<char *>(source.data());
94           
95#ifdef CUDA_ENABLED 
96            if(codegen::NVPTX){
97                codegen::BlockSize = 128;
98                char * LineBreak;
99                if (posix_memalign((void**)&LineBreak, 32, fileSize)) {
100                    std::cerr << "Cannot allocate memory for linebreak.\n";
101                    exit(-1);
102                }
103                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize, LineBreak);
104
105                const unsigned numOfGroups = codegen::GroupNum;
106                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
107                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
108                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
109                    exit(-1);
110                }
111
112                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
113                if (CountOnly){
114                    exit(0);
115                }
116                else{
117                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
118                    mGrepFunction_CPU((char *)rslt, LineBreak, fileBuffer, intputSize, fileIdx);
119                    return;
120                }
121               
122            } 
123#endif
124            if (CountOnly) {
125                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
126            } else {
127                mGrepFunction(fileBuffer, fileSize, fileIdx);
128            }
129            source.close();
130        } catch (std::exception & e) {
131            if (!SilenceFileErrors) {
132                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
133                return;
134            }
135        }
136    } else {
137#ifdef CUDA_ENABLED
138        if (codegen::NVPTX){
139            std::cout << 0 << std::endl;
140            exit(0);
141        }
142#endif
143        if (CountOnly) {
144            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
145        } else {
146            mGrepFunction(nullptr, 0, fileIdx);
147        }
148    }
149}
150
151
152Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
153    Type * const int64ty = iBuilder->getInt64Ty();
154    Type * const size_ty = iBuilder->getSizeTy();
155    Type * const int32ty = iBuilder->getInt32Ty();
156    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
157    Type * const int64tyPtr = PointerType::get(int64ty, 1);
158    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
159    Type * const resultTy = iBuilder->getVoidTy();
160    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
161    kernelFunc->setCallingConv(CallingConv::C);
162    Function::arg_iterator args = kernelFunc->arg_begin();
163
164    Value * const inputPtr = &*(args++);
165    inputPtr->setName("inputPtr");
166    Value * const startPointsPtr = &*(args++);
167    startPointsPtr->setName("startPointsPtr");
168    Value * const bufferSizesPtr = &*(args++);
169    bufferSizesPtr->setName("bufferSizesPtr");
170    Value * const outputPtr = &*(args++);
171    outputPtr->setName("resultPtr");
172
173    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
174    iBuilder->SetInsertPoint(entryBlock);
175
176    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
177    Value * tid = iBuilder->CreateCall(tidFunc);
178    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
179    Value * bid = iBuilder->CreateCall(bidFunc);
180
181    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
182
183    Function * mainFunc = m->getFunction("Main");
184    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
185    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
186    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
187    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
188    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
189
190    if (CountOnly){
191        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
192        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
193        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
194        iBuilder->CreateStore(result, outputThreadPtr);
195    }
196    else {
197        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
198        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
199        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
200        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
201    }   
202
203    iBuilder->CreateRetVoid();
204    return kernelFunc;
205}
206
207Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
208    Type * const size_ty = iBuilder->getSizeTy();
209    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
210    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 0);
211    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, rsltType, int8PtrTy, size_ty, size_ty, nullptr));
212    mainCPUFn->setCallingConv(CallingConv::C);
213    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
214    Function::arg_iterator args = mainCPUFn->arg_begin();
215   
216    Value * const rsltStream = &*(args++);
217    rsltStream->setName("rslt");
218    Value * const lbStream = &*(args++);
219    lbStream->setName("lb");
220    Value * const inputStream = &*(args++);
221    inputStream->setName("input");
222    Value * const fileSize = &*(args++);
223    fileSize->setName("fileSize");
224    Value * const fileIdx = &*(args++);
225    fileIdx->setName("fileIdx");
226
227    const unsigned segmentSize = codegen::SegmentSize;
228
229    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1));
230    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
231
232    kernel::MMapSourceKernel mmapK1(iBuilder, segmentSize); 
233    mmapK1.generateKernel({}, {&MatchResults});
234    mmapK1.setInitialArguments({fileSize});
235
236
237    ExternalFileBuffer LineBreak(iBuilder, iBuilder->getStreamSetTy(1, 1));
238    LineBreak.setStreamSetBuffer(lbStream, fileSize);
239   
240    kernel::MMapSourceKernel mmapK2(iBuilder, segmentSize); 
241    mmapK2.generateKernel({}, {&LineBreak});
242    mmapK2.setInitialArguments({fileSize});
243
244    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
245    scanMatchK.generateKernel({&MatchResults, &LineBreak}, {});
246           
247    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
248   
249    generatePipelineLoop(iBuilder, {&mmapK1, &mmapK2, &scanMatchK});
250    iBuilder->CreateRetVoid();
251
252    return mainCPUFn;
253}
254
255void GrepEngine::multiGrepCodeGen(std::string moduleName, std::vector<re::RE *> REs, bool CountOnly, bool UTF_16, GrepType grepType) {
256
257    isUTF_16 = UTF_16;
258    Module * M = new Module(moduleName + ":icgrep", getGlobalContext());; 
259    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);; 
260
261    const unsigned segmentSize = codegen::SegmentSize;
262    const unsigned bufferSegments = segmentPipelineParallel ? (codegen::BufferSegments * codegen::ThreadNum) : codegen::BufferSegments;
263    const unsigned encodingBits = UTF_16 ? 16 : 8;
264
265    mGrepType = grepType;
266
267    Type * const size_ty = iBuilder->getSizeTy();
268    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
269    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), 0);
270    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
271
272    Function * mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
273    mainFn->setCallingConv(CallingConv::C);
274    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
275    Function::arg_iterator args = mainFn->arg_begin();
276   
277    Value * inputStream = &*(args++);
278    inputStream->setName("input");
279    Value * fileSize = &*(args++);
280    fileSize->setName("fileSize");
281    Value * fileIdx = &*(args++);
282    fileIdx->setName("fileIdx");
283
284    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));   
285    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
286    ByteStream.setStreamSetBuffer(inputStream, fileSize);
287    BasisBits.allocateBuffer();
288   
289    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
290    mmapK.generateKernel({}, {&ByteStream});
291    mmapK.setInitialArguments({fileSize});
292
293    kernel::S2PKernel  s2pk(iBuilder);
294    s2pk.generateKernel({&ByteStream}, {&BasisBits});
295
296    std::vector<re::CC *> LF;
297    LF.push_back(re::makeCC(0x0A));
298   
299    kernel::UnicodeLineBreakKernelBuilder unicodelbK(iBuilder, "unicodelinebreak", encodingBits);
300    kernel::ParabixCharacterClassKernelBuilder linefeedK(iBuilder, "linefeed", LF, encodingBits);
301
302    pablo::PabloKernel *linebreakK = UNICODE_LINE_BREAK ? &cast<pablo::PabloKernel>(unicodelbK) :  &cast<pablo::PabloKernel>(linefeedK);
303    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
304    LineBreakStream.allocateBuffer();
305    linebreakK->generateKernel({&BasisBits}, {&LineBreakStream});
306
307    std::vector<pablo::PabloKernel *> icgrepKs;
308    std::vector<StreamSetBuffer *> MatchResultsBufs;
309
310    for(unsigned i=0; i<REs.size(); i++){   
311        pablo::PabloKernel * icgrepK = new pablo::PabloKernel(iBuilder, "icgrep"+std::to_string(i), {Binding{iBuilder->getStreamSetTy(8), "basis"}});
312        re::re2pablo_compiler(icgrepK, re::regular_expression_passes(REs[i]), CountOnly);
313        pablo_function_passes(icgrepK);
314        icgrepKs.push_back(icgrepK);
315        CircularBuffer * MatchResults = new CircularBuffer(iBuilder, iBuilder->getStreamSetTy(2, 1), segmentSize * bufferSegments);       
316        MatchResults->allocateBuffer();
317        MatchResultsBufs.push_back(MatchResults);
318    }   
319
320    std::vector<kernel::KernelBuilder *> KernelList;
321    KernelList.push_back(&mmapK);
322    KernelList.push_back(&s2pk);   
323    KernelList.push_back(linebreakK);
324
325    CircularBuffer mergedResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
326    mergedResults.allocateBuffer();
327
328    kernel::StreamsMerge streamsMergeK(iBuilder, 1, REs.size());
329    streamsMergeK.generateKernel(MatchResultsBufs, {&mergedResults});
330
331    kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
332    scanMatchK.generateKernel({&mergedResults, &LineBreakStream}, {});               
333    scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
334
335    for(unsigned i=0; i<REs.size(); i++){
336        icgrepKs[i]->generateKernel({&BasisBits}, {MatchResultsBufs[i]});
337        KernelList.push_back(icgrepKs[i]);
338    }
339    KernelList.push_back(&streamsMergeK);
340    KernelList.push_back(&scanMatchK);
341   
342    if (pipelineParallel){
343        generatePipelineParallel(iBuilder, KernelList);
344    } else if (segmentPipelineParallel){
345        generateSegmentParallelPipeline(iBuilder, KernelList);
346    }  else{
347        generatePipelineLoop(iBuilder, KernelList);
348    }
349   
350    iBuilder->CreateRetVoid();
351   
352    mEngine = JIT_to_ExecutionEngine(M);
353    ApplyObjectCache(mEngine);
354    icgrep_Linking(M, mEngine);
355
356#ifndef NDEBUG
357    verifyModule(*M, &dbgs());
358#endif
359
360    mEngine->finalizeObject();
361    delete iBuilder;
362   
363    mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
364
365}
366
367void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
368    isUTF_16 = UTF_16;
369    int addrSpace = 0;
370    bool CPU_Only = true;
371    Module * M = nullptr; 
372    IDISA::IDISA_Builder * iBuilder = nullptr; 
373
374#ifdef CUDA_ENABLED
375    setNVPTXOption(); 
376    if (codegen::NVPTX) {
377        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
378        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
379        M = gpuM;
380        iBuilder = GPUBuilder;
381        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
382        M->setTargetTriple("nvptx64-nvidia-cuda");
383        addrSpace = 1;
384        CPU_Only = false;
385        codegen::BlockSize = 64;
386    }
387#endif
388
389    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
390    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
391
392    if (CPU_Only) {
393        M = cpuM;
394        iBuilder = CPUBuilder;
395    }
396
397    // segment size made availabe for each call to the mmap source kernel
398    const unsigned segmentSize = codegen::SegmentSize;
399    const unsigned bufferSegments = segmentPipelineParallel ? (codegen::BufferSegments * codegen::ThreadNum) : codegen::BufferSegments;
400    const unsigned encodingBits = UTF_16 ? 16 : 8;
401
402    mGrepType = grepType;
403
404    Type * const size_ty = iBuilder->getSizeTy();
405    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
406    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
407    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
408
409    Function * mainFn = nullptr;
410    Value * inputStream = nullptr;
411    Value * fileSize = nullptr;
412    Value * fileIdx = nullptr;
413
414#ifdef CUDA_ENABLED   
415    Value * outputStream = nullptr;
416    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
417    if (codegen::NVPTX){
418        if (CountOnly){
419            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
420            mainFn->setCallingConv(CallingConv::C);
421            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
422            Function::arg_iterator args = mainFn->arg_begin();
423           
424            inputStream = &*(args++);
425            inputStream->setName("input");
426            fileSize = &*(args++);
427            fileSize->setName("fileSize");
428        } else {
429            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
430            mainFn->setCallingConv(CallingConv::C);
431            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
432            Function::arg_iterator args = mainFn->arg_begin();
433           
434            inputStream = &*(args++);
435            inputStream->setName("input");
436            fileSize = &*(args++);
437            fileSize->setName("fileSize");
438            outputStream = &*(args++);
439            outputStream->setName("output");
440        }
441    } 
442#endif
443    if (CPU_Only){
444        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
445        mainFn->setCallingConv(CallingConv::C);
446        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
447        Function::arg_iterator args = mainFn->arg_begin();
448       
449        inputStream = &*(args++);
450        inputStream->setName("input");
451        fileSize = &*(args++);
452        fileSize->setName("fileSize");
453        fileIdx = &*(args++);
454        fileIdx->setName("fileIdx");
455    }
456       
457    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
458   
459    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
460    mmapK.generateKernel({}, {&ByteStream});
461    mmapK.setInitialArguments({fileSize});
462   
463    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
464
465    kernel::S2PKernel  s2pk(iBuilder);
466    s2pk.generateKernel({&ByteStream}, {&BasisBits});
467   
468    std::vector<re::CC *> LF;
469    LF.push_back(re::makeCC(0x0A));
470   
471    kernel::UnicodeLineBreakKernelBuilder unicodelbK(iBuilder, "unicodelinebreak", encodingBits);
472    kernel::ParabixCharacterClassKernelBuilder linefeedK(iBuilder, "linefeed", LF, encodingBits);
473
474    pablo::PabloKernel *linebreakK = UNICODE_LINE_BREAK ? &cast<pablo::PabloKernel>(unicodelbK) :  &cast<pablo::PabloKernel>(linefeedK);
475    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
476    LineBreakStream.allocateBuffer();
477    linebreakK->generateKernel({&BasisBits}, {&LineBreakStream});
478
479    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}});
480    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
481    pablo_function_passes(&icgrepK);
482
483    ByteStream.setStreamSetBuffer(inputStream, fileSize);
484    BasisBits.allocateBuffer();
485
486    if (CountOnly) {
487        icgrepK.generateKernel({&BasisBits}, {});
488        if (pipelineParallel){
489            generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK});
490        } else if (segmentPipelineParallel){
491            generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK});
492        } else {
493            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
494        }
495        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
496    } else {
497#ifdef CUDA_ENABLED
498        if (codegen::NVPTX){
499            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1), addrSpace);
500            MatchResults.setStreamSetBuffer(outputStream, fileSize);
501
502            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
503            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
504
505        }
506#endif
507        if (CPU_Only) {
508            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
509            MatchResults.allocateBuffer();
510
511            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
512
513            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
514            scanMatchK.generateKernel({&MatchResults, &LineBreakStream}, {});               
515            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
516           
517            if (pipelineParallel){
518                generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
519            } else if (segmentPipelineParallel){
520                generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
521            }  else{
522                generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
523            }
524        }
525        iBuilder->CreateRetVoid();
526    }
527
528#ifdef CUDA_ENABLED
529    Function * mainCPUFn = nullptr;
530    if(codegen::NVPTX){
531        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
532        MDNode * Node = MDNode::get(M->getContext(),
533                                    {llvm::ValueAsMetadata::get(kernelFunction),
534                                     MDString::get(M->getContext(), "kernel"), 
535                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
536        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
537        NMD->addOperand(Node);
538   
539        Compile2PTX(M, IRFilename, PTXFilename);
540        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
541        if (CountOnly) return;
542    }
543#endif
544
545
546    mEngine = JIT_to_ExecutionEngine(cpuM);
547    ApplyObjectCache(mEngine);
548    icgrep_Linking(cpuM, mEngine);
549
550#ifndef NDEBUG
551    verifyModule(*M, &dbgs());
552#endif
553
554    mEngine->finalizeObject();
555    delete iBuilder;
556   
557    if (CountOnly) {
558        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
559    } else {
560#ifdef CUDA_ENABLED
561        if(codegen::NVPTX){
562            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
563        }
564#endif
565        if (CPU_Only) {
566            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
567        }
568    }
569
570}
571
572re::CC * GrepEngine::grepCodepoints() {
573    parsedCodePointSet = re::makeCC();
574    char * mFileBuffer = getUnicodeNameDataPtr();
575    size_t mFileSize = getUnicodeNameDataSize();
576    mGrepFunction(mFileBuffer, mFileSize, 0);
577    return parsedCodePointSet;
578}
579
580const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
581    enum { MaxSupportedVectorWidthInBytes = 32 };
582    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
583    parsedPropertyValues.clear();
584    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
585    const auto n = str.length();
586    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
587    // erroneously matching garbage data when loading the final partial block.
588    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
589    std::memcpy(aligned, str.data(), n);
590    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
591    mGrepFunction(aligned, n, 0);
592    alloc.deallocate(aligned, 0);
593    return parsedPropertyValues;
594}
595
596static int * total_count;
597static std::stringstream * resultStrs = nullptr;
598static std::vector<std::string> inputFiles;
599
600void initResult(std::vector<std::string> filenames){
601    const int n = filenames.size();
602    if (n > 1) {
603        ShowFileNames = true;
604    }
605    inputFiles = filenames;
606    resultStrs = new std::stringstream[n];
607    total_count = new int[n];
608    for (unsigned i = 0; i < inputFiles.size(); ++i){
609        total_count[i] = 0;
610    }
611   
612}
613
614extern "C" {
615    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
616        assert (buffer);
617#ifdef CUDA_ENABLED
618    if (codegen::NVPTX){
619        while(line_start>startPoints[blockNo]) blockNo++;
620        line_start -= accumBytes[blockNo-1];
621        line_end -= accumBytes[blockNo-1];
622    }
623#endif
624        int index = isUTF_16 ? 2 : 1;
625        int idx = fileIdx;
626         
627        if (ShowFileNames) {
628            resultStrs[idx] << inputFiles[idx] << ':';
629        }
630        if (ShowLineNumbers) {
631            resultStrs[idx] << lineNum << ":";
632        }
633       
634        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
635            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
636            line_start++;
637        }
638        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
639            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
640            line_start += 2;
641        }
642        if (line_end == filesize) {
643            // The match position is at end-of-file.   We have a final unterminated line.
644            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
645            if (NormalizeLineBreaks) {
646                resultStrs[idx] << '\n';  // terminate it
647            }
648            return;
649        }
650        unsigned char end_byte = (unsigned char)buffer[line_end]; 
651        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
652        if (NormalizeLineBreaks) {
653            if (end_byte == 0x85) {
654                // Line terminated with NEL, on the second byte.  Back up 1.
655                line_end--;
656            } else if (end_byte > 0xD) {
657                // Line terminated with PS or LS, on the third byte.  Back up 2.
658                isUTF_16 ? line_end-- : line_end -= 2;
659            }
660            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
661            resultStrs[idx] << '\n';
662        } else {
663            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
664                // Check for line_end on first byte of CRLF;  note that we don't
665                // want to access past the end of buffer.
666                if (line_end + 1 < filesize) {
667                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
668                        // Found CRLF; preserve both bytes.
669                        line_end++;
670                    }
671                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
672                        // Found CRLF; preserve both bytes.
673                        line_end += 2;
674                    }
675                }
676            }
677            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
678        }
679    }
680}
681
682void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
683   
684    if(CountOnly){
685        if (!ShowFileNames) {
686            for (unsigned i = 0; i < inputFiles.size(); ++i){
687                std::cout << total_CountOnly[i] << std::endl;
688            }
689        }
690        else {
691            for (unsigned i = 0; i < inputFiles.size(); ++i){
692                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
693            };
694        }
695        return;
696    }
697   
698    for (unsigned i = 0; i < inputFiles.size(); ++i){
699        std::cout << resultStrs[i].str();
700    }
701}
702
703extern "C" {
704    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
705        assert (buffer);
706        re::codepoint_t c = 0;
707        ssize_t line_pos = line_start;
708        while (isxdigit(buffer[line_pos])) {
709            if (isdigit(buffer[line_pos])) {
710                c = (c << 4) | (buffer[line_pos] - '0');
711            }
712            else {
713                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
714            }
715            line_pos++;
716        }
717        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
718        parsedCodePointSet->insert(c);
719    }
720}
721
722extern "C" {
723    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
724        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
725    }
726}
727
728void icgrep_Linking(Module * m, ExecutionEngine * e) {
729    Module::FunctionListType & fns = m->getFunctionList();
730    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
731        std::string fnName = it->getName().str();
732        if (fnName == "s2p_block") continue;
733        if (fnName == "process_block") continue;
734        if (fnName == "process_block_initialize_carries") continue;
735       
736        if (fnName == "wrapped_report_match") {
737            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
738        }
739        if (fnName == "insert_codepoints") {
740            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
741        }
742        if (fnName == "insert_property_values") {
743            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
744        }
745    }
746}
747
748GrepEngine::GrepEngine()
749: mGrepFunction(nullptr)
750, mGrepFunction_CountOnly(nullptr)
751, mGrepFunction_CPU(nullptr)
752, mGrepType(GrepType::Normal)
753, mEngine(nullptr) {
754
755}
756
757GrepEngine::~GrepEngine() {
758    delete mEngine;
759}
Note: See TracBrowser for help on using the repository browser.