source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5380

Last change on this file since 5380 was 5380, checked in by nmedfort, 2 years ago

Removed debug line

File size: 30.4 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "grep_engine.h"
8#include <llvm/IR/Module.h>
9#include <llvm/ExecutionEngine/MCJIT.h>
10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
16#include <UCD/UnicodeNameData.h>
17#include <UCD/resolve_properties.h>
18#include <kernels/cc_kernel.h>
19#include <kernels/linebreak_kernel.h>
20#include <kernels/streams_merge.h>
21#include <kernels/match_count.h>
22#include <kernels/mmap_kernel.h>
23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <kernels/stdin_kernel.h>
27#include <pablo/pablo_compiler.h>
28#include <pablo/pablo_kernel.h>
29#include <pablo/pablo_toolchain.h>
30#include <re/re_cc.h>
31#include <re/re_toolchain.h>
32#include <toolchain.h>
33#include <iostream>
34#include <sstream>
35#include <cc/multiplex_CCs.h>
36
37#include <llvm/Support/raw_ostream.h>
38
39#ifdef CUDA_ENABLED
40#include <IR_Gen/CudaDriver.h>
41#include "preprocess.cpp"
42#endif
43#include <util/aligned_allocator.h>
44
45using namespace parabix;
46using namespace llvm;
47
48static cl::OptionCategory bGrepOutputOptions("Output Options",
49                                             "These options control the output.");
50static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
51
52static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
53
54static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
55
56static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
57static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
58
59static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
60static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
61
62/// iNVESTIGATE: icgrep is reporting stdin is not empty even when nothing is being piped into it?
63static cl::opt<bool> UseStdIn("stdin", cl::desc("Read from standard input."), cl::cat(bGrepOutputOptions));
64
65bool isUTF_16 = false;
66std::string IRFilename = "icgrep.ll";
67std::string PTXFilename = "icgrep.ptx";
68
69static re::CC * parsedCodePointSet = nullptr;
70static std::vector<std::string> parsedPropertyValues;
71
72#ifdef CUDA_ENABLED
73int blockNo = 0;
74size_t * startPoints = nullptr;
75size_t * accumBytes = nullptr;
76#endif
77
78void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly) {
79    boost::filesystem::path file(fileName);
80    if (exists(file)) {
81        if (is_directory(file)) {
82            return;
83        }
84    } else {
85        if (!SilenceFileErrors) {
86            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
87            return;
88        }
89    }
90
91    const auto fileSize = file_size(file);
92    if (fileSize > 0) {
93        try {
94            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
95            char * fileBuffer = const_cast<char *>(source.data());
96           
97#ifdef CUDA_ENABLED 
98            if(codegen::NVPTX){
99                codegen::BlockSize = 128;
100                char * LineBreak;
101                if (posix_memalign((void**)&LineBreak, 32, fileSize)) {
102                    std::cerr << "Cannot allocate memory for linebreak.\n";
103                    exit(-1);
104                }
105                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize, LineBreak);
106
107                const unsigned numOfGroups = codegen::GroupNum;
108                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
109                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
110                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
111                    exit(-1);
112                }
113
114                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
115                if (CountOnly){
116                    exit(0);
117                }
118                else{
119                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
120                    mGrepFunction_CPU((char *)rslt, LineBreak, fileBuffer, intputSize, fileIdx);
121                    return;
122                }
123               
124            } 
125#endif
126            if (CountOnly) {
127                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
128            } else {
129                mGrepFunction(fileBuffer, fileSize, fileIdx);
130            }
131            source.close();
132        } catch (std::exception & e) {
133            if (!SilenceFileErrors) {
134                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
135                return;
136            }
137        }
138    } else {
139#ifdef CUDA_ENABLED
140        if (codegen::NVPTX){
141            std::cout << 0 << std::endl;
142            exit(0);
143        }
144#endif
145        if (CountOnly) {
146            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
147        } else {
148            mGrepFunction(nullptr, 0, fileIdx);
149        }
150    }
151}
152
153void GrepEngine::doGrep(const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly) {
154    if (CountOnly) {
155        total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
156    } else {
157        mGrepFunction(nullptr, 0, fileIdx);
158    }
159}
160
161Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
162    Type * const int64ty = iBuilder->getInt64Ty();
163    Type * const size_ty = iBuilder->getSizeTy();
164    Type * const int32ty = iBuilder->getInt32Ty();
165    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
166    Type * const int64tyPtr = PointerType::get(int64ty, 1);
167    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
168    Type * const resultTy = iBuilder->getVoidTy();
169    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
170    kernelFunc->setCallingConv(CallingConv::C);
171    Function::arg_iterator args = kernelFunc->arg_begin();
172
173    Value * const inputPtr = &*(args++);
174    inputPtr->setName("inputPtr");
175    Value * const startPointsPtr = &*(args++);
176    startPointsPtr->setName("startPointsPtr");
177    Value * const bufferSizesPtr = &*(args++);
178    bufferSizesPtr->setName("bufferSizesPtr");
179    Value * const outputPtr = &*(args++);
180    outputPtr->setName("resultPtr");
181
182    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
183    iBuilder->SetInsertPoint(entryBlock);
184
185    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
186    Value * tid = iBuilder->CreateCall(tidFunc);
187    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
188    Value * bid = iBuilder->CreateCall(bidFunc);
189
190    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
191
192    Function * mainFunc = m->getFunction("Main");
193    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
194    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
195    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
196    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
197    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
198
199    if (CountOnly) {
200        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
201        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
202        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
203        iBuilder->CreateStore(result, outputThreadPtr);
204    } else {
205        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 1);
206        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
207        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
208        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
209    }   
210
211    iBuilder->CreateRetVoid();
212    return kernelFunc;
213}
214
215Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
216    Type * const size_ty = iBuilder->getSizeTy();
217    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
218    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 0);
219    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, rsltType, int8PtrTy, size_ty, size_ty, nullptr));
220    mainCPUFn->setCallingConv(CallingConv::C);
221    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
222    Function::arg_iterator args = mainCPUFn->arg_begin();
223   
224    Value * const rsltStream = &*(args++);
225    rsltStream->setName("rslt");
226    Value * const lbStream = &*(args++);
227    lbStream->setName("lb");
228    Value * const inputStream = &*(args++);
229    inputStream->setName("input");
230    Value * const fileSize = &*(args++);
231    fileSize->setName("fileSize");
232    Value * const fileIdx = &*(args++);
233    fileIdx->setName("fileIdx");
234
235    const unsigned segmentSize = codegen::SegmentSize;
236   
237    ExternalFileBuffer InputStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
238    InputStream.setStreamSetBuffer(inputStream);
239
240    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1));
241    MatchResults.setStreamSetBuffer(rsltStream);
242
243    kernel::MMapSourceKernel mmapK1(iBuilder, segmentSize); 
244    mmapK1.setName("mmap1");
245    mmapK1.generateKernel({}, {&MatchResults});
246    mmapK1.setInitialArguments({fileSize});
247
248    ExternalFileBuffer LineBreak(iBuilder, iBuilder->getStreamSetTy(1, 1));
249    LineBreak.setStreamSetBuffer(lbStream);
250   
251    kernel::MMapSourceKernel mmapK2(iBuilder, segmentSize); 
252    mmapK2.setName("mmap2");
253    mmapK2.generateKernel({}, {&LineBreak});
254    mmapK2.setInitialArguments({fileSize});
255
256    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType, 8);
257    scanMatchK.generateKernel({&InputStream, &MatchResults, &LineBreak}, {});
258    scanMatchK.setInitialArguments({fileIdx});
259   
260    generatePipeline(iBuilder, {&mmapK1, &mmapK2, &scanMatchK});
261    iBuilder->CreateRetVoid();
262
263    return mainCPUFn;
264}
265
266void GrepEngine::multiGrepCodeGen(std::string moduleName, std::vector<re::RE *> REs, bool CountOnly, bool UTF_16, GrepType grepType) {
267
268    isUTF_16 = UTF_16;
269    Module * M = new Module(moduleName + ":icgrep", getGlobalContext());; 
270    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);; 
271
272    const unsigned segmentSize = codegen::SegmentSize;
273    const unsigned bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
274    const unsigned encodingBits = UTF_16 ? 16 : 8;
275
276    mGrepType = grepType;
277
278    Type * const sizeTy = iBuilder->getSizeTy();
279    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), 0);
280    Type * const resultTy = CountOnly ? sizeTy : iBuilder->getVoidTy();
281
282    Function * mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, sizeTy, sizeTy, nullptr));
283    mainFn->setCallingConv(CallingConv::C);
284    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
285    Function::arg_iterator args = mainFn->arg_begin();
286   
287    Value * inputStream = &*(args++);
288    inputStream->setName("input");
289    Value * fileSize = &*(args++);
290    fileSize->setName("fileSize");
291    Value * fileIdx = &*(args++);
292    fileIdx->setName("fileIdx");
293
294    StreamSetBuffer * byteStream = nullptr;
295    kernel::KernelBuilder * sourceK = nullptr;
296//    if (usingStdIn) {
297//        byteStream = new ExtensibleBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8));
298//        cast<ExtensibleBuffer>(byteStream)->allocateBuffer();
299//        sourceK = new kernel::StdInKernel(iBuilder, segmentSize);
300//        sourceK->generateKernel({}, {byteStream});
301//    } else {
302        byteStream = new ExternalFileBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8));
303        cast<ExternalFileBuffer>(byteStream)->setStreamSetBuffer(inputStream);
304        sourceK = new kernel::MMapSourceKernel(iBuilder, segmentSize);
305        sourceK->generateKernel({}, {byteStream});
306        sourceK->setInitialArguments({fileSize});
307//    }
308
309    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
310    BasisBits.allocateBuffer();
311
312    kernel::S2PKernel  s2pk(iBuilder);
313    s2pk.generateKernel({byteStream}, {&BasisBits});
314   
315    std::vector<pablo::PabloKernel *> icgrepKs;
316    std::vector<StreamSetBuffer *> MatchResultsBufs;
317
318    for(unsigned i=0; i<REs.size(); i++){   
319        pablo::PabloKernel * icgrepK = new pablo::PabloKernel(iBuilder, "icgrep"+std::to_string(i), {Binding{iBuilder->getStreamSetTy(8), "basis"}, Binding{iBuilder->getStreamSetTy(1, 1), "linebreak"}});
320        re::re2pablo_compiler(icgrepK, re::regular_expression_passes(REs[i]), false);
321        pablo_function_passes(icgrepK);
322        icgrepKs.push_back(icgrepK);
323        CircularBuffer * MatchResults = new CircularBuffer(iBuilder, iBuilder->getStreamSetTy(2, 1), segmentSize * bufferSegments);       
324        MatchResults->allocateBuffer();
325        MatchResultsBufs.push_back(MatchResults);
326    }   
327
328    std::vector<kernel::KernelBuilder *> KernelList;
329    KernelList.push_back(sourceK);
330    KernelList.push_back(&s2pk);
331
332    CircularBuffer mergedResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
333    mergedResults.allocateBuffer();
334
335    kernel::StreamsMerge streamsMergeK(iBuilder, 1, REs.size());
336    streamsMergeK.generateKernel(MatchResultsBufs, {&mergedResults});
337
338    kernel::LineBreakKernelBuilder linebreakK(iBuilder, "lb", encodingBits);
339    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
340    LineBreakStream.allocateBuffer();
341    linebreakK.generateKernel({&BasisBits}, {&LineBreakStream});
342   
343    KernelList.push_back(&linebreakK);
344    for(unsigned i=0; i<REs.size(); i++){
345        icgrepKs[i]->generateKernel({&BasisBits, &LineBreakStream}, {MatchResultsBufs[i]});
346        KernelList.push_back(icgrepKs[i]);
347    }
348    KernelList.push_back(&streamsMergeK);
349
350    if (CountOnly) {
351        kernel::MatchCount matchCountK(iBuilder);
352        matchCountK.generateKernel({&mergedResults}, {}); 
353
354        KernelList.push_back(&matchCountK); 
355
356        generatePipeline(iBuilder, KernelList);
357        iBuilder->CreateRet(matchCountK.getScalarField(matchCountK.getInstance(), "matchedLineCount"));
358
359    } else {
360        kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType, encodingBits);
361        scanMatchK.generateKernel({byteStream, &mergedResults, &LineBreakStream}, {});
362        scanMatchK.setInitialArguments({fileIdx});
363
364        KernelList.push_back(&scanMatchK);
365
366        generatePipeline(iBuilder, KernelList);
367       
368        iBuilder->CreateRetVoid();
369    }
370   
371    mEngine = JIT_to_ExecutionEngine(M);
372    ApplyObjectCache(mEngine);
373    icgrep_Linking(M, mEngine);
374
375#ifndef NDEBUG
376    verifyModule(*M, &dbgs());
377#endif
378
379    mEngine->finalizeObject();
380    delete iBuilder;
381    delete sourceK;
382    delete byteStream;
383
384    if (CountOnly) {
385        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
386    } else {
387        mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
388    }
389
390}
391
392void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType, const bool usingStdIn) {
393    isUTF_16 = UTF_16;
394    int addrSpace = 0;
395    bool CPU_Only = true;
396    Module * M = nullptr; 
397    IDISA::IDISA_Builder * iBuilder = nullptr; 
398
399#ifdef CUDA_ENABLED
400    setNVPTXOption(); 
401    if (codegen::NVPTX) {
402        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
403        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
404        M = gpuM;
405        iBuilder = GPUBuilder;
406        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
407        M->setTargetTriple("nvptx64-nvidia-cuda");
408        addrSpace = 1;
409        CPU_Only = false;
410        codegen::BlockSize = 64;
411    }
412#endif
413
414    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
415    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
416
417    if (CPU_Only) {
418        M = cpuM;
419        iBuilder = CPUBuilder;
420    }
421
422    // segment size made availabe for each call to the mmap source kernel
423    const unsigned segmentSize = codegen::SegmentSize;
424    const unsigned bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
425    const unsigned encodingBits = UTF_16 ? 16 : 8;
426
427    mGrepType = grepType;
428
429    Type * const size_ty = iBuilder->getSizeTy();
430    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
431    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
432
433    Function * mainFn = nullptr;
434    Value * inputStream = nullptr;
435    Value * fileSize = nullptr;
436    Value * fileIdx = nullptr;
437
438#ifdef CUDA_ENABLED   
439    Value * outputStream = nullptr;
440    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), addrSpace);
441    if (codegen::NVPTX){
442        if (CountOnly){
443            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
444            mainFn->setCallingConv(CallingConv::C);
445            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
446            Function::arg_iterator args = mainFn->arg_begin();
447           
448            inputStream = &*(args++);
449            inputStream->setName("input");
450            fileSize = &*(args++);
451            fileSize->setName("fileSize");
452        } else {
453            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
454            mainFn->setCallingConv(CallingConv::C);
455            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
456            Function::arg_iterator args = mainFn->arg_begin();
457           
458            inputStream = &*(args++);
459            inputStream->setName("input");
460            fileSize = &*(args++);
461            fileSize->setName("fileSize");
462            outputStream = &*(args++);
463            outputStream->setName("output");
464        }
465    } 
466#endif
467    if (CPU_Only) {
468        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
469        mainFn->setCallingConv(CallingConv::C);
470        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
471        Function::arg_iterator args = mainFn->arg_begin();
472       
473        inputStream = &*(args++);
474        inputStream->setName("input");
475        fileSize = &*(args++);
476        fileSize->setName("fileSize");
477        fileIdx = &*(args++);
478        fileIdx->setName("fileIdx");
479
480    } 
481
482    StreamSetBuffer * byteStream = nullptr;
483    kernel::KernelBuilder * sourceK = nullptr;
484    if (usingStdIn) {
485        byteStream = new ExtensibleBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8), segmentSize * bufferSegments);
486        cast<ExtensibleBuffer>(byteStream)->allocateBuffer();
487        sourceK = new kernel::StdInKernel(iBuilder, segmentSize);
488        sourceK->generateKernel({}, {byteStream});
489    } else {
490        byteStream = new ExternalFileBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8));
491        cast<ExternalFileBuffer>(byteStream)->setStreamSetBuffer(inputStream);
492        sourceK = new kernel::MMapSourceKernel(iBuilder, segmentSize);
493        sourceK->generateKernel({}, {byteStream});
494        sourceK->setInitialArguments({fileSize});
495    }
496   
497    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
498
499    kernel::S2PKernel  s2pk(iBuilder);
500    s2pk.generateKernel({byteStream}, {&BasisBits});
501   
502    kernel::LineBreakKernelBuilder linebreakK(iBuilder, "lb", encodingBits);
503    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
504
505    linebreakK.generateKernel({&BasisBits}, {&LineBreakStream});
506    LineBreakStream.allocateBuffer();
507
508    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}, Binding{iBuilder->getStreamSetTy(1, 1), "linebreak"}});
509    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
510    pablo_function_passes(&icgrepK);
511
512
513    BasisBits.allocateBuffer();
514
515    if (CountOnly) {
516        icgrepK.generateKernel({&BasisBits, &LineBreakStream}, {});
517        generatePipeline(iBuilder, {sourceK, &s2pk, &linebreakK, &icgrepK});
518        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
519    } else {
520#ifdef CUDA_ENABLED
521        if (codegen::NVPTX){
522            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), addrSpace);
523            MatchResults.setStreamSetBuffer(outputStream);
524
525            icgrepK.generateKernel({&BasisBits, &LineBreakStream},  {&MatchResults});
526            generatePipelineLoop(iBuilder, {sourceK, &s2pk, &linebreakK, &icgrepK});
527
528        }
529#endif
530        if (CPU_Only) {
531            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
532            MatchResults.allocateBuffer();
533
534            icgrepK.generateKernel({&BasisBits, &LineBreakStream}, {&MatchResults});
535
536            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType, encodingBits);
537            scanMatchK.generateKernel({byteStream, &MatchResults, &LineBreakStream}, {});
538            scanMatchK.setInitialArguments({fileIdx});
539           
540            generatePipeline(iBuilder, {sourceK, &s2pk, &linebreakK, &icgrepK, &scanMatchK});
541        }
542        iBuilder->CreateRetVoid();
543    }
544
545#ifdef CUDA_ENABLED
546    Function * mainCPUFn = nullptr;
547    if(codegen::NVPTX){
548        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
549        MDNode * Node = MDNode::get(M->getContext(),
550                                    {llvm::ValueAsMetadata::get(kernelFunction),
551                                     MDString::get(M->getContext(), "kernel"), 
552                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
553        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
554        NMD->addOperand(Node);
555   
556        Compile2PTX(M, IRFilename, PTXFilename);
557        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
558        if (CountOnly) return;
559    }
560#endif
561
562
563    mEngine = JIT_to_ExecutionEngine(cpuM);
564    ApplyObjectCache(mEngine);
565    icgrep_Linking(cpuM, mEngine);
566
567#ifndef NDEBUG
568    verifyModule(*M, &dbgs());
569#endif
570
571    mEngine->finalizeObject();
572    delete iBuilder;
573    delete sourceK;
574    delete byteStream;
575   
576    if (CountOnly) {
577        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
578    } else {
579#ifdef CUDA_ENABLED
580        if(codegen::NVPTX){
581            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
582        }
583#endif
584        if (CPU_Only) {
585            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
586        }
587    }
588
589}
590
591re::CC * GrepEngine::grepCodepoints() {
592    parsedCodePointSet = re::makeCC();
593    char * mFileBuffer = getUnicodeNameDataPtr();
594    size_t mFileSize = getUnicodeNameDataSize();
595    mGrepFunction(mFileBuffer, mFileSize, 0);
596    return parsedCodePointSet;
597}
598
599const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
600    enum { MaxSupportedVectorWidthInBytes = 32 };
601    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
602    parsedPropertyValues.clear();
603    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
604    const auto n = str.length();
605    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
606    // erroneously matching garbage data when loading the final partial block.
607    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
608    std::memcpy(aligned, str.data(), n);
609    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
610    mGrepFunction(aligned, n, 0);
611    alloc.deallocate(aligned, 0);
612    return parsedPropertyValues;
613}
614
615static int * total_count;
616static std::stringstream * resultStrs = nullptr;
617static std::vector<std::string> inputFiles;
618
619void initFileResult(std::vector<std::string> filenames){
620    const int n = filenames.size();
621    if (n > 1) {
622        ShowFileNames = true;
623    }
624    inputFiles = filenames;
625    resultStrs = new std::stringstream[n];
626    total_count = new int[n];
627    for (unsigned i = 0; i < inputFiles.size(); ++i){
628        total_count[i] = 0;
629    }
630   
631}
632
633template<typename CodeUnit>
634void wrapped_report_match(const size_t lineNum, size_t line_start, size_t line_end, const CodeUnit * const buffer, const size_t filesize, const int fileIdx) {
635
636 //   errs() << lineNum << " : (" << line_start << ", " << line_end << ") -- " << filesize << "\n";
637
638    assert (buffer);
639    assert (line_start <= line_end);
640    assert (line_end <= filesize);
641
642#ifdef CUDA_ENABLED
643if (codegen::NVPTX){
644    while(line_start>startPoints[blockNo]) blockNo++;
645    line_start -= accumBytes[blockNo-1];
646    line_end -= accumBytes[blockNo-1];
647}
648#endif
649
650    if (ShowFileNames) {
651        resultStrs[fileIdx] << inputFiles[fileIdx] << ':';
652    }
653    if (ShowLineNumbers) {
654        resultStrs[fileIdx] << lineNum << ":";
655    }
656
657    // If the line "starts" on the LF of a CRLF, it is actually the end of the last line.
658    if ((buffer[line_start] == 0xA) && (line_start != line_end)) {
659        ++line_start;
660    }
661
662    if (LLVM_UNLIKELY(line_end == filesize)) {
663        // The match position is at end-of-file.   We have a final unterminated line.
664        resultStrs[fileIdx].write((char *)&buffer[line_start], (line_end - line_start) * sizeof(CodeUnit));
665        if (NormalizeLineBreaks) {
666            resultStrs[fileIdx] << '\n';  // terminate it
667        }
668    } else {
669        const auto end_byte = buffer[line_end];
670        if (NormalizeLineBreaks) {
671            if (LLVM_UNLIKELY(end_byte == 0x85)) {
672                // Line terminated with NEL, on the second byte.  Back up 1.
673                line_end -= 1;
674            } else if (LLVM_UNLIKELY(end_byte > 0xD)) {
675                // Line terminated with PS or LS, on the third byte.  Back up 2.
676                line_end -= 2;
677            }
678            resultStrs[fileIdx].write((char *)&buffer[line_start], (line_end - line_start) * sizeof(CodeUnit));
679            resultStrs[fileIdx] << '\n';
680        } else {
681            if (end_byte == 0x0D) {
682                // Check for line_end on first byte of CRLF; we don't want to access past the end of buffer.
683                if ((line_end + 1) < filesize) {
684                    if (buffer[line_end + 1] == 0x0A) {
685                        // Found CRLF; preserve both bytes.
686                        ++line_end;
687                    }
688                }
689            }
690            resultStrs[fileIdx].write((char *)&buffer[line_start], (line_end - line_start + 1) * sizeof(CodeUnit));
691        }
692    }
693}
694
695void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
696   
697    if(CountOnly){
698        if (!ShowFileNames) {
699            for (unsigned i = 0; i < inputFiles.size(); ++i){
700                std::cout << total_CountOnly[i] << std::endl;
701            }
702        }
703        else {
704            for (unsigned i = 0; i < inputFiles.size(); ++i){
705                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
706            };
707        }
708        return;
709    }
710   
711    for (unsigned i = 0; i < inputFiles.size(); ++i){
712        std::cout << resultStrs[i].str();
713    }
714}
715
716void insert_codepoints(const size_t lineNum, const size_t line_start, const size_t line_end, const char * const buffer) {
717    assert (buffer);
718    assert (line_start <= line_end);
719    re::codepoint_t c = 0;
720    size_t line_pos = line_start;
721    while (isxdigit(buffer[line_pos])) {
722        assert (line_pos < line_end);
723        if (isdigit(buffer[line_pos])) {
724            c = (c << 4) | (buffer[line_pos] - '0');
725        }
726        else {
727            c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
728        }
729        line_pos++;
730    }
731    assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.
732    parsedCodePointSet->insert(c);
733}
734
735void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
736    assert (line_start <= line_end);
737    parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
738}
739
740void icgrep_Linking(Module * m, ExecutionEngine * e) {
741    Module::FunctionListType & fns = m->getFunctionList();
742    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
743        std::string fnName = it->getName().str();
744        if (fnName == "s2p_block") continue;
745        if (fnName == "process_block") continue;
746        if (fnName == "process_block_initialize_carries") continue;
747       
748        if (fnName == "wrapped_report_match8") {
749            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match<uint8_t>);
750        }
751        if (fnName == "wrapped_report_match16") {
752            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match<uint16_t>);
753        }
754        if (fnName == "insert_codepoints") {
755            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
756        }
757        if (fnName == "insert_property_values") {
758            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
759        }
760    }
761}
762
763GrepEngine::GrepEngine()
764: mGrepFunction(nullptr)
765, mGrepFunction_CountOnly(nullptr)
766, mGrepFunction_CPU(nullptr)
767, mGrepType(GrepType::Normal)
768, mEngine(nullptr) {
769
770}
771
772GrepEngine::~GrepEngine() {
773    delete mEngine;
774}
Note: See TracBrowser for help on using the repository browser.