source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5339

Last change on this file since 5339 was 5339, checked in by lindanl, 2 years ago

A tiny fix.

File size: 29.9 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "grep_engine.h"
8#include <llvm/IR/Module.h>
9#include <llvm/ExecutionEngine/MCJIT.h>
10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
16#include <UCD/UnicodeNameData.h>
17#include <UCD/resolve_properties.h>
18#include <kernels/cc_kernel.h>
19#include <kernels/unicode_linebreak_kernel.h>
20#include <kernels/streams_merge.h>
21#include <kernels/pipeline.h>
22#include <kernels/mmap_kernel.h>
23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <pablo/pablo_compiler.h>
27#include <pablo/pablo_kernel.h>
28#include <pablo/pablo_toolchain.h>
29#include <re/re_cc.h>
30#include <re/re_toolchain.h>
31#include <toolchain.h>
32#include <iostream>
33#include <sstream>
34#ifdef CUDA_ENABLED
35#include <IR_Gen/CudaDriver.h>
36#include "preprocess.cpp"
37#endif
38#include <util/aligned_allocator.h>
39
40#define UNICODE_LINE_BREAK (!re::AlgorithmOptionIsSet(re::DisableUnicodeLineBreak))
41
42using namespace parabix;
43using namespace llvm;
44
45static cl::OptionCategory bGrepOutputOptions("Output Options",
46                                             "These options control the output.");
47static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
48
49static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
50
51static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
52
53static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
54static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
55
56static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
57static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
58
59static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
60
61static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
62
63bool isUTF_16 = false;
64std::string IRFilename = "icgrep.ll";
65std::string PTXFilename = "icgrep.ptx";
66
67static re::CC * parsedCodePointSet = nullptr;
68static std::vector<std::string> parsedPropertyValues;
69
70#ifdef CUDA_ENABLED
71int blockNo = 0;
72size_t * startPoints = nullptr;
73size_t * accumBytes = nullptr;
74#endif
75
76void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
77    boost::filesystem::path file(fileName);
78    if (exists(file)) {
79        if (is_directory(file)) {
80            return;
81        }
82    } else {
83        if (!SilenceFileErrors) {
84            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
85            return;
86        }
87    }
88
89    const auto fileSize = file_size(file);
90    if (fileSize > 0) {
91        try {
92            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
93            char * fileBuffer = const_cast<char *>(source.data());
94           
95#ifdef CUDA_ENABLED 
96            if(codegen::NVPTX){
97                codegen::BlockSize = 128;
98                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize);
99
100                const unsigned numOfGroups = codegen::GroupNum;
101                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
102                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
103                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
104                    exit(-1);
105                }
106
107                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
108                if (CountOnly){
109                    exit(0);
110                }
111                else{
112                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
113                    mGrepFunction_CPU((char *)rslt, fileBuffer, intputSize, fileIdx);
114                    return;
115                }
116               
117            } 
118#endif
119            if (CountOnly) {
120                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
121            } else {
122                mGrepFunction(fileBuffer, fileSize, fileIdx);
123            }
124            source.close();
125        } catch (std::exception & e) {
126            if (!SilenceFileErrors) {
127                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
128                return;
129            }
130        }
131    } else {
132#ifdef CUDA_ENABLED
133        if (codegen::NVPTX){
134            std::cout << 0 << std::endl;
135            exit(0);
136        }
137#endif
138        if (CountOnly) {
139            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
140        } else {
141            mGrepFunction(nullptr, 0, fileIdx);
142        }
143    }
144}
145
146
147Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
148    Type * const int64ty = iBuilder->getInt64Ty();
149    Type * const size_ty = iBuilder->getSizeTy();
150    Type * const int32ty = iBuilder->getInt32Ty();
151    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
152    Type * const int64tyPtr = PointerType::get(int64ty, 1);
153    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
154    Type * const resultTy = iBuilder->getVoidTy();
155    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
156    kernelFunc->setCallingConv(CallingConv::C);
157    Function::arg_iterator args = kernelFunc->arg_begin();
158
159    Value * const inputPtr = &*(args++);
160    inputPtr->setName("inputPtr");
161    Value * const startPointsPtr = &*(args++);
162    startPointsPtr->setName("startPointsPtr");
163    Value * const bufferSizesPtr = &*(args++);
164    bufferSizesPtr->setName("bufferSizesPtr");
165    Value * const outputPtr = &*(args++);
166    outputPtr->setName("resultPtr");
167
168    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
169    iBuilder->SetInsertPoint(entryBlock);
170
171    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
172    Value * tid = iBuilder->CreateCall(tidFunc);
173    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
174    Value * bid = iBuilder->CreateCall(bidFunc);
175
176    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
177
178    Function * mainFunc = m->getFunction("Main");
179    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
180    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
181    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
182    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
183    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
184
185    if (CountOnly){
186        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
187        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
188        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
189        iBuilder->CreateStore(result, outputThreadPtr);
190    }
191    else {
192        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
193        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
194        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
195        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
196    }   
197
198    iBuilder->CreateRetVoid();
199    return kernelFunc;
200}
201
202Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
203    Type * const size_ty = iBuilder->getSizeTy();
204    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
205    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
206    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
207    mainCPUFn->setCallingConv(CallingConv::C);
208    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
209    Function::arg_iterator args = mainCPUFn->arg_begin();
210   
211    Value * const rsltStream = &*(args++);
212    rsltStream->setName("rslt");
213    Value * const inputStream = &*(args++);
214    inputStream->setName("input");
215    Value * const fileSize = &*(args++);
216    fileSize->setName("fileSize");
217    Value * const fileIdx = &*(args++);
218    fileIdx->setName("fileIdx");
219
220    const unsigned segmentSize = codegen::SegmentSize;
221
222    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1));
223    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
224
225    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
226    mmapK.generateKernel({}, {&MatchResults});
227    mmapK.setInitialArguments({fileSize});
228
229
230
231    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
232    scanMatchK.generateKernel({&MatchResults}, {});
233           
234    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
235   
236    generatePipelineLoop(iBuilder, {&mmapK, &scanMatchK});
237    iBuilder->CreateRetVoid();
238
239    return mainCPUFn;
240}
241
242void GrepEngine::multiGrepCodeGen(std::string moduleName, std::vector<re::RE *> REs, bool CountOnly, bool UTF_16, GrepType grepType) {
243
244    isUTF_16 = UTF_16;
245    Module * M = new Module(moduleName + ":icgrep", getGlobalContext());; 
246    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);; 
247
248    const unsigned segmentSize = codegen::SegmentSize;
249    const unsigned bufferSegments = segmentPipelineParallel ? (codegen::BufferSegments * codegen::ThreadNum) : codegen::BufferSegments;
250    const unsigned encodingBits = UTF_16 ? 16 : 8;
251
252    mGrepType = grepType;
253
254    Type * const size_ty = iBuilder->getSizeTy();
255    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
256    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), 0);
257    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
258
259    Function * mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
260    mainFn->setCallingConv(CallingConv::C);
261    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
262    Function::arg_iterator args = mainFn->arg_begin();
263   
264    Value * inputStream = &*(args++);
265    inputStream->setName("input");
266    Value * fileSize = &*(args++);
267    fileSize->setName("fileSize");
268    Value * fileIdx = &*(args++);
269    fileIdx->setName("fileIdx");
270
271    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));   
272    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
273    ByteStream.setStreamSetBuffer(inputStream, fileSize);
274    BasisBits.allocateBuffer();
275   
276    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
277    mmapK.generateKernel({}, {&ByteStream});
278    mmapK.setInitialArguments({fileSize});
279
280    kernel::S2PKernel  s2pk(iBuilder);
281    s2pk.generateKernel({&ByteStream}, {&BasisBits});
282
283    std::vector<re::CC *> LF;
284    LF.push_back(re::makeCC(0x0A));
285   
286    kernel::UnicodeLineBreakKernelBuilder unicodelbK(iBuilder, "unicodelinebreak", encodingBits);
287    kernel::ParabixCharacterClassKernelBuilder linefeedK(iBuilder, "linefeed", LF, encodingBits);
288
289    pablo::PabloKernel *linebreakK = UNICODE_LINE_BREAK ? &cast<pablo::PabloKernel>(unicodelbK) :  &cast<pablo::PabloKernel>(linefeedK);
290    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
291    LineBreakStream.allocateBuffer();
292    linebreakK->generateKernel({&BasisBits}, {&LineBreakStream});
293
294    std::vector<pablo::PabloKernel *> icgrepKs;
295    std::vector<StreamSetBuffer *> MatchResultsBufs;
296
297    for(unsigned i=0; i<REs.size(); i++){   
298        pablo::PabloKernel * icgrepK = new pablo::PabloKernel(iBuilder, "icgrep"+std::to_string(i), {Binding{iBuilder->getStreamSetTy(8), "basis"}});
299        re::re2pablo_compiler(icgrepK, re::regular_expression_passes(REs[i]), CountOnly);
300        pablo_function_passes(icgrepK);
301        icgrepKs.push_back(icgrepK);
302        CircularBuffer * MatchResults = new CircularBuffer(iBuilder, iBuilder->getStreamSetTy(2, 1), segmentSize * bufferSegments);       
303        MatchResults->allocateBuffer();
304        MatchResultsBufs.push_back(MatchResults);
305    }   
306
307    std::vector<kernel::KernelBuilder *> KernelList;
308    KernelList.push_back(&mmapK);
309    KernelList.push_back(&s2pk);   
310    KernelList.push_back(linebreakK);
311
312    CircularBuffer mergedResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
313    mergedResults.allocateBuffer();
314
315    kernel::StreamsMerge streamsMergeK(iBuilder, 1, REs.size());
316    streamsMergeK.generateKernel(MatchResultsBufs, {&mergedResults});
317
318    kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
319    scanMatchK.generateKernel({&mergedResults, &LineBreakStream}, {});               
320    scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
321
322    for(unsigned i=0; i<REs.size(); i++){
323        icgrepKs[i]->generateKernel({&BasisBits}, {MatchResultsBufs[i]});
324        KernelList.push_back(icgrepKs[i]);
325    }
326    KernelList.push_back(&streamsMergeK);
327    KernelList.push_back(&scanMatchK);
328   
329    if (pipelineParallel){
330        generatePipelineParallel(iBuilder, KernelList);
331    } else if (segmentPipelineParallel){
332        generateSegmentParallelPipeline(iBuilder, KernelList);
333    }  else{
334        generatePipelineLoop(iBuilder, KernelList);
335    }
336   
337    iBuilder->CreateRetVoid();
338   
339    mEngine = JIT_to_ExecutionEngine(M);
340    ApplyObjectCache(mEngine);
341    icgrep_Linking(M, mEngine);
342
343#ifndef NDEBUG
344    verifyModule(*M, &dbgs());
345#endif
346
347    mEngine->finalizeObject();
348    delete iBuilder;
349   
350    mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
351
352}
353
354void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
355    isUTF_16 = UTF_16;
356    int addrSpace = 0;
357    bool CPU_Only = true;
358    Module * M = nullptr; 
359    IDISA::IDISA_Builder * iBuilder = nullptr; 
360
361#ifdef CUDA_ENABLED
362    setNVPTXOption(); 
363    if (codegen::NVPTX) {
364        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
365        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
366        M = gpuM;
367        iBuilder = GPUBuilder;
368        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
369        M->setTargetTriple("nvptx64-nvidia-cuda");
370        addrSpace = 1;
371        CPU_Only = false;
372        codegen::BlockSize = 64;
373    }
374#endif
375
376    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
377    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
378
379    if (CPU_Only) {
380        M = cpuM;
381        iBuilder = CPUBuilder;
382    }
383
384    // segment size made availabe for each call to the mmap source kernel
385    const unsigned segmentSize = codegen::SegmentSize;
386    const unsigned bufferSegments = segmentPipelineParallel ? (codegen::BufferSegments * codegen::ThreadNum) : codegen::BufferSegments;
387    const unsigned encodingBits = UTF_16 ? 16 : 8;
388
389    mGrepType = grepType;
390
391    Type * const size_ty = iBuilder->getSizeTy();
392    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
393    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
394    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
395
396    Function * mainFn = nullptr;
397    Value * inputStream = nullptr;
398    Value * fileSize = nullptr;
399    Value * fileIdx = nullptr;
400
401#ifdef CUDA_ENABLED   
402    Value * outputStream = nullptr;
403    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
404    if (codegen::NVPTX){
405        if (CountOnly){
406            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
407            mainFn->setCallingConv(CallingConv::C);
408            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
409            Function::arg_iterator args = mainFn->arg_begin();
410           
411            inputStream = &*(args++);
412            inputStream->setName("input");
413            fileSize = &*(args++);
414            fileSize->setName("fileSize");
415        } else {
416            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
417            mainFn->setCallingConv(CallingConv::C);
418            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
419            Function::arg_iterator args = mainFn->arg_begin();
420           
421            inputStream = &*(args++);
422            inputStream->setName("input");
423            fileSize = &*(args++);
424            fileSize->setName("fileSize");
425            outputStream = &*(args++);
426            outputStream->setName("output");
427        }
428    } 
429#endif
430    if (CPU_Only){
431        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
432        mainFn->setCallingConv(CallingConv::C);
433        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
434        Function::arg_iterator args = mainFn->arg_begin();
435       
436        inputStream = &*(args++);
437        inputStream->setName("input");
438        fileSize = &*(args++);
439        fileSize->setName("fileSize");
440        fileIdx = &*(args++);
441        fileIdx->setName("fileIdx");
442    }
443       
444    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
445   
446    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
447    mmapK.generateKernel({}, {&ByteStream});
448    mmapK.setInitialArguments({fileSize});
449   
450    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
451
452    kernel::S2PKernel  s2pk(iBuilder);
453    s2pk.generateKernel({&ByteStream}, {&BasisBits});
454   
455    std::vector<re::CC *> LF;
456    LF.push_back(re::makeCC(0x0A));
457   
458    kernel::UnicodeLineBreakKernelBuilder unicodelbK(iBuilder, "unicodelinebreak", encodingBits);
459    kernel::ParabixCharacterClassKernelBuilder linefeedK(iBuilder, "linefeed", LF, encodingBits);
460
461    pablo::PabloKernel *linebreakK = UNICODE_LINE_BREAK ? &cast<pablo::PabloKernel>(unicodelbK) :  &cast<pablo::PabloKernel>(linefeedK);
462    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
463    LineBreakStream.allocateBuffer();
464    linebreakK->generateKernel({&BasisBits}, {&LineBreakStream});
465
466    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}});
467    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
468    pablo_function_passes(&icgrepK);
469
470    ByteStream.setStreamSetBuffer(inputStream, fileSize);
471    BasisBits.allocateBuffer();
472
473    if (CountOnly) {
474        icgrepK.generateKernel({&BasisBits}, {});
475        if (pipelineParallel){
476            generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK});
477        } else if (segmentPipelineParallel){
478            generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK});
479        } else {
480            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
481        }
482        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
483    } else {
484#ifdef CUDA_ENABLED
485        if (codegen::NVPTX){
486            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1), addrSpace);
487            MatchResults.setStreamSetBuffer(outputStream, fileSize);
488
489            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
490            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
491
492        }
493#endif
494        if (CPU_Only) {
495            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
496            MatchResults.allocateBuffer();
497
498            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
499
500            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
501            scanMatchK.generateKernel({&MatchResults, &LineBreakStream}, {});               
502            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
503           
504            if (pipelineParallel){
505                generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
506            } else if (segmentPipelineParallel){
507                generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
508            }  else{
509                generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
510            }
511        }
512        iBuilder->CreateRetVoid();
513    }
514
515#ifdef CUDA_ENABLED
516    Function * mainCPUFn = nullptr;
517    if(codegen::NVPTX){
518        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
519        MDNode * Node = MDNode::get(M->getContext(),
520                                    {llvm::ValueAsMetadata::get(kernelFunction),
521                                     MDString::get(M->getContext(), "kernel"), 
522                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
523        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
524        NMD->addOperand(Node);
525   
526        Compile2PTX(M, IRFilename, PTXFilename);
527        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
528        if (CountOnly) return;
529    }
530#endif
531
532
533    mEngine = JIT_to_ExecutionEngine(cpuM);
534    ApplyObjectCache(mEngine);
535    icgrep_Linking(cpuM, mEngine);
536
537#ifndef NDEBUG
538    verifyModule(*M, &dbgs());
539#endif
540
541    mEngine->finalizeObject();
542    delete iBuilder;
543   
544    if (CountOnly) {
545        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
546    } else {
547#ifdef CUDA_ENABLED
548        if(codegen::NVPTX){
549            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
550        }
551#endif
552        if (CPU_Only) {
553            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
554        }
555    }
556
557}
558
559re::CC * GrepEngine::grepCodepoints() {
560    parsedCodePointSet = re::makeCC();
561    char * mFileBuffer = getUnicodeNameDataPtr();
562    size_t mFileSize = getUnicodeNameDataSize();
563    mGrepFunction(mFileBuffer, mFileSize, 0);
564    return parsedCodePointSet;
565}
566
567const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
568    enum { MaxSupportedVectorWidthInBytes = 32 };
569    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
570    parsedPropertyValues.clear();
571    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
572    const auto n = str.length();
573    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
574    // erroneously matching garbage data when loading the final partial block.
575    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
576    std::memcpy(aligned, str.data(), n);
577    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
578    mGrepFunction(aligned, n, 0);
579    alloc.deallocate(aligned, 0);
580    return parsedPropertyValues;
581}
582
583static int * total_count;
584static std::stringstream * resultStrs = nullptr;
585static std::vector<std::string> inputFiles;
586
587void initResult(std::vector<std::string> filenames){
588    const int n = filenames.size();
589    if (n > 1) {
590        ShowFileNames = true;
591    }
592    inputFiles = filenames;
593    resultStrs = new std::stringstream[n];
594    total_count = new int[n];
595    for (unsigned i = 0; i < inputFiles.size(); ++i){
596        total_count[i] = 0;
597    }
598   
599}
600
601extern "C" {
602    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
603        assert (buffer);
604#ifdef CUDA_ENABLED
605    if (codegen::NVPTX){
606        while(line_start>startPoints[blockNo]) blockNo++;
607        line_start -= accumBytes[blockNo-1];
608        line_end -= accumBytes[blockNo-1];
609    }
610#endif
611        int index = isUTF_16 ? 2 : 1;
612        int idx = fileIdx;
613         
614        if (ShowFileNames) {
615            resultStrs[idx] << inputFiles[idx] << ':';
616        }
617        if (ShowLineNumbers) {
618            resultStrs[idx] << lineNum << ":";
619        }
620       
621        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
622            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
623            line_start++;
624        }
625        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
626            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
627            line_start += 2;
628        }
629        if (line_end == filesize) {
630            // The match position is at end-of-file.   We have a final unterminated line.
631            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
632            if (NormalizeLineBreaks) {
633                resultStrs[idx] << '\n';  // terminate it
634            }
635            return;
636        }
637        unsigned char end_byte = (unsigned char)buffer[line_end]; 
638        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
639        if (NormalizeLineBreaks) {
640            if (end_byte == 0x85) {
641                // Line terminated with NEL, on the second byte.  Back up 1.
642                line_end--;
643            } else if (end_byte > 0xD) {
644                // Line terminated with PS or LS, on the third byte.  Back up 2.
645                isUTF_16 ? line_end-- : line_end -= 2;
646            }
647            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
648            resultStrs[idx] << '\n';
649        } else {
650            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
651                // Check for line_end on first byte of CRLF;  note that we don't
652                // want to access past the end of buffer.
653                if (line_end + 1 < filesize) {
654                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
655                        // Found CRLF; preserve both bytes.
656                        line_end++;
657                    }
658                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
659                        // Found CRLF; preserve both bytes.
660                        line_end += 2;
661                    }
662                }
663            }
664            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
665        }
666    }
667}
668
669void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
670   
671    if(CountOnly){
672        if (!ShowFileNames) {
673            for (unsigned i = 0; i < inputFiles.size(); ++i){
674                std::cout << total_CountOnly[i] << std::endl;
675            }
676        }
677        else {
678            for (unsigned i = 0; i < inputFiles.size(); ++i){
679                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
680            };
681        }
682        return;
683    }
684   
685    for (unsigned i = 0; i < inputFiles.size(); ++i){
686        std::cout << resultStrs[i].str();
687    }
688}
689
690extern "C" {
691    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
692        assert (buffer);
693        re::codepoint_t c = 0;
694        ssize_t line_pos = line_start;
695        while (isxdigit(buffer[line_pos])) {
696            if (isdigit(buffer[line_pos])) {
697                c = (c << 4) | (buffer[line_pos] - '0');
698            }
699            else {
700                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
701            }
702            line_pos++;
703        }
704        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
705        parsedCodePointSet->insert(c);
706    }
707}
708
709extern "C" {
710    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
711        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
712    }
713}
714
715void icgrep_Linking(Module * m, ExecutionEngine * e) {
716    Module::FunctionListType & fns = m->getFunctionList();
717    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
718        std::string fnName = it->getName().str();
719        if (fnName == "s2p_block") continue;
720        if (fnName == "process_block") continue;
721        if (fnName == "process_block_initialize_carries") continue;
722       
723        if (fnName == "wrapped_report_match") {
724            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
725        }
726        if (fnName == "insert_codepoints") {
727            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
728        }
729        if (fnName == "insert_property_values") {
730            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
731        }
732    }
733}
734
735GrepEngine::GrepEngine()
736: mGrepFunction(nullptr)
737, mGrepFunction_CountOnly(nullptr)
738, mGrepFunction_CPU(nullptr)
739, mGrepType(GrepType::Normal)
740, mEngine(nullptr) {
741
742}
743
744GrepEngine::~GrepEngine() {
745    delete mEngine;
746}
Note: See TracBrowser for help on using the repository browser.