source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5336

Last change on this file since 5336 was 5336, checked in by xuedongx, 2 years ago

add UnicodeLineBreak? kernel for icGrep

File size: 25.2 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "grep_engine.h"
8#include <llvm/IR/Module.h>
9#include <llvm/ExecutionEngine/MCJIT.h>
10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
16#include <UCD/UnicodeNameData.h>
17#include <UCD/resolve_properties.h>
18#include <kernels/cc_kernel.h>
19#include <kernels/unicode_linebreak_kernel.h>
20#include <kernels/pipeline.h>
21#include <kernels/mmap_kernel.h>
22#include <kernels/s2p_kernel.h>
23#include <kernels/scanmatchgen.h>
24#include <kernels/streamset.h>
25#include <pablo/pablo_compiler.h>
26#include <pablo/pablo_kernel.h>
27#include <pablo/pablo_toolchain.h>
28#include <re/re_cc.h>
29#include <re/re_toolchain.h>
30#include <toolchain.h>
31#include <iostream>
32#include <sstream>
33#ifdef CUDA_ENABLED
34#include <IR_Gen/CudaDriver.h>
35#include "preprocess.cpp"
36#endif
37#include <util/aligned_allocator.h>
38
39#define UNICODE_LINE_BREAK (!re::AlgorithmOptionIsSet(re::DisableUnicodeLineBreak))
40
41using namespace parabix;
42using namespace llvm;
43
44static cl::OptionCategory bGrepOutputOptions("Output Options",
45                                             "These options control the output.");
46static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
47
48static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
49
50static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
51
52static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
53static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
54
55static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
56static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
57
58static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
59
60static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
61
62bool isUTF_16 = false;
63std::string IRFilename = "icgrep.ll";
64std::string PTXFilename = "icgrep.ptx";
65
66static re::CC * parsedCodePointSet = nullptr;
67static std::vector<std::string> parsedPropertyValues;
68
69#ifdef CUDA_ENABLED
70int blockNo = 0;
71size_t * startPoints = nullptr;
72size_t * accumBytes = nullptr;
73#endif
74
75void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
76    boost::filesystem::path file(fileName);
77    if (exists(file)) {
78        if (is_directory(file)) {
79            return;
80        }
81    } else {
82        if (!SilenceFileErrors) {
83            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
84            return;
85        }
86    }
87
88    const auto fileSize = file_size(file);
89    if (fileSize > 0) {
90        try {
91            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
92            char * fileBuffer = const_cast<char *>(source.data());
93           
94#ifdef CUDA_ENABLED 
95            if(codegen::NVPTX){
96                codegen::BlockSize = 128;
97                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize);
98
99                const unsigned numOfGroups = codegen::GroupNum;
100                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
101                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
102                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
103                    exit(-1);
104                }
105
106                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
107                if (CountOnly){
108                    exit(0);
109                }
110                else{
111                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
112                    mGrepFunction_CPU((char *)rslt, fileBuffer, intputSize, fileIdx);
113                    return;
114                }
115               
116            } 
117#endif
118            if (CountOnly) {
119                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
120            } else {
121                mGrepFunction(fileBuffer, fileSize, fileIdx);
122            }
123            source.close();
124        } catch (std::exception & e) {
125            if (!SilenceFileErrors) {
126                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
127                return;
128            }
129        }
130    } else {
131#ifdef CUDA_ENABLED
132        if (codegen::NVPTX){
133            std::cout << 0 << std::endl;
134            exit(0);
135        }
136#endif
137        if (CountOnly) {
138            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
139        } else {
140            mGrepFunction(nullptr, 0, fileIdx);
141        }
142    }
143}
144
145
146Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
147    Type * const int64ty = iBuilder->getInt64Ty();
148    Type * const size_ty = iBuilder->getSizeTy();
149    Type * const int32ty = iBuilder->getInt32Ty();
150    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
151    Type * const int64tyPtr = PointerType::get(int64ty, 1);
152    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
153    Type * const resultTy = iBuilder->getVoidTy();
154    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
155    kernelFunc->setCallingConv(CallingConv::C);
156    Function::arg_iterator args = kernelFunc->arg_begin();
157
158    Value * const inputPtr = &*(args++);
159    inputPtr->setName("inputPtr");
160    Value * const startPointsPtr = &*(args++);
161    startPointsPtr->setName("startPointsPtr");
162    Value * const bufferSizesPtr = &*(args++);
163    bufferSizesPtr->setName("bufferSizesPtr");
164    Value * const outputPtr = &*(args++);
165    outputPtr->setName("resultPtr");
166
167    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
168    iBuilder->SetInsertPoint(entryBlock);
169
170    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
171    Value * tid = iBuilder->CreateCall(tidFunc);
172    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
173    Value * bid = iBuilder->CreateCall(bidFunc);
174
175    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
176
177    Function * mainFunc = m->getFunction("Main");
178    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
179    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
180    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
181    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
182    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
183
184    if (CountOnly){
185        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
186        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
187        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
188        iBuilder->CreateStore(result, outputThreadPtr);
189    }
190    else {
191        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
192        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
193        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
194        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
195    }   
196
197    iBuilder->CreateRetVoid();
198    return kernelFunc;
199}
200
201Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
202    Type * const size_ty = iBuilder->getSizeTy();
203    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
204    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
205    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
206    mainCPUFn->setCallingConv(CallingConv::C);
207    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
208    Function::arg_iterator args = mainCPUFn->arg_begin();
209   
210    Value * const rsltStream = &*(args++);
211    rsltStream->setName("rslt");
212    Value * const inputStream = &*(args++);
213    inputStream->setName("input");
214    Value * const fileSize = &*(args++);
215    fileSize->setName("fileSize");
216    Value * const fileIdx = &*(args++);
217    fileIdx->setName("fileIdx");
218
219    const unsigned segmentSize = codegen::SegmentSize;
220
221    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1));
222    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
223
224    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
225    mmapK.generateKernel({}, {&MatchResults});
226    mmapK.setInitialArguments({fileSize});
227
228
229
230    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
231    scanMatchK.generateKernel({&MatchResults}, {});
232           
233    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
234   
235    generatePipelineLoop(iBuilder, {&mmapK, &scanMatchK});
236    iBuilder->CreateRetVoid();
237
238    return mainCPUFn;
239}
240
241void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
242    isUTF_16 = UTF_16;
243    int addrSpace = 0;
244    bool CPU_Only = true;
245    Module * M = nullptr; 
246    IDISA::IDISA_Builder * iBuilder = nullptr; 
247
248#ifdef CUDA_ENABLED
249    setNVPTXOption(); 
250    if (codegen::NVPTX) {
251        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
252        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
253        M = gpuM;
254        iBuilder = GPUBuilder;
255        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
256        M->setTargetTriple("nvptx64-nvidia-cuda");
257        addrSpace = 1;
258        CPU_Only = false;
259        codegen::BlockSize = 64;
260    }
261#endif
262
263    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
264    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
265
266    if (CPU_Only) {
267        M = cpuM;
268        iBuilder = CPUBuilder;
269    }
270
271    // segment size made availabe for each call to the mmap source kernel
272    const unsigned segmentSize = codegen::SegmentSize;
273    const unsigned bufferSegments = segmentPipelineParallel ? (codegen::BufferSegments * codegen::ThreadNum) : codegen::BufferSegments;
274    const unsigned encodingBits = UTF_16 ? 16 : 8;
275
276    mGrepType = grepType;
277
278    Type * const size_ty = iBuilder->getSizeTy();
279    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
280    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
281    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
282
283    Function * mainFn = nullptr;
284    Value * inputStream = nullptr;
285    Value * fileSize = nullptr;
286    Value * fileIdx = nullptr;
287
288#ifdef CUDA_ENABLED   
289    Value * outputStream = nullptr;
290    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
291    if (codegen::NVPTX){
292        if (CountOnly){
293            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
294            mainFn->setCallingConv(CallingConv::C);
295            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
296            Function::arg_iterator args = mainFn->arg_begin();
297           
298            inputStream = &*(args++);
299            inputStream->setName("input");
300            fileSize = &*(args++);
301            fileSize->setName("fileSize");
302        } else {
303            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
304            mainFn->setCallingConv(CallingConv::C);
305            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
306            Function::arg_iterator args = mainFn->arg_begin();
307           
308            inputStream = &*(args++);
309            inputStream->setName("input");
310            fileSize = &*(args++);
311            fileSize->setName("fileSize");
312            outputStream = &*(args++);
313            outputStream->setName("output");
314        }
315    } 
316#endif
317    if (CPU_Only){
318        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
319        mainFn->setCallingConv(CallingConv::C);
320        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
321        Function::arg_iterator args = mainFn->arg_begin();
322       
323        inputStream = &*(args++);
324        inputStream->setName("input");
325        fileSize = &*(args++);
326        fileSize->setName("fileSize");
327        fileIdx = &*(args++);
328        fileIdx->setName("fileIdx");
329    }
330       
331    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
332   
333    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
334    mmapK.generateKernel({}, {&ByteStream});
335    mmapK.setInitialArguments({fileSize});
336   
337    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
338
339    kernel::S2PKernel  s2pk(iBuilder);
340    s2pk.generateKernel({&ByteStream}, {&BasisBits});
341   
342    std::vector<re::CC *> LF;
343    LF.push_back(re::makeCC(0x0A));
344   
345    kernel::UnicodeLineBreakKernelBuilder unicodelbK(iBuilder, "unicodelinebreak", encodingBits);
346    kernel::ParabixCharacterClassKernelBuilder linefeedK(iBuilder, "linefeed", LF, encodingBits);
347
348    pablo::PabloKernel *linebreakK = UNICODE_LINE_BREAK ? &cast<pablo::PabloKernel>(unicodelbK) :  &cast<pablo::PabloKernel>(linefeedK);
349    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
350    LineBreakStream.allocateBuffer();
351    linebreakK->generateKernel({&BasisBits}, {&LineBreakStream});
352
353    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}});
354    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
355    pablo_function_passes(&icgrepK);
356
357    ByteStream.setStreamSetBuffer(inputStream, fileSize);
358    BasisBits.allocateBuffer();
359
360    if (CountOnly) {
361        icgrepK.generateKernel({&BasisBits}, {});
362        if (pipelineParallel){
363            generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK});
364        } else if (segmentPipelineParallel){
365            generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK});
366        } else {
367            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
368        }
369        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
370    } else {
371#ifdef CUDA_ENABLED
372        if (codegen::NVPTX){
373            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1), addrSpace);
374            MatchResults.setStreamSetBuffer(outputStream, fileSize);
375
376            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
377            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
378
379        }
380#endif
381        if (CPU_Only) {
382            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
383            MatchResults.allocateBuffer();
384
385            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
386
387            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
388            scanMatchK.generateKernel({&MatchResults, &LineBreakStream}, {});               
389            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
390           
391            if (pipelineParallel){
392                generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
393            } else if (segmentPipelineParallel){
394                generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
395            }  else{
396                generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK, linebreakK, &scanMatchK});
397            }
398        }
399        iBuilder->CreateRetVoid();
400    }
401
402#ifdef CUDA_ENABLED
403    Function * mainCPUFn = nullptr;
404    if(codegen::NVPTX){
405        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
406        MDNode * Node = MDNode::get(M->getContext(),
407                                    {llvm::ValueAsMetadata::get(kernelFunction),
408                                     MDString::get(M->getContext(), "kernel"), 
409                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
410        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
411        NMD->addOperand(Node);
412   
413        Compile2PTX(M, IRFilename, PTXFilename);
414        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
415        if (CountOnly) return;
416    }
417#endif
418
419
420    mEngine = JIT_to_ExecutionEngine(cpuM);
421    ApplyObjectCache(mEngine);
422    icgrep_Linking(cpuM, mEngine);
423
424#ifndef NDEBUG
425    verifyModule(*M, &dbgs());
426#endif
427
428    mEngine->finalizeObject();
429    delete iBuilder;
430   
431    if (CountOnly) {
432        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
433    } else {
434#ifdef CUDA_ENABLED
435        if(codegen::NVPTX){
436            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
437        }
438#endif
439        if (CPU_Only) {
440            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
441        }
442    }
443
444}
445
446re::CC * GrepEngine::grepCodepoints() {
447    parsedCodePointSet = re::makeCC();
448    char * mFileBuffer = getUnicodeNameDataPtr();
449    size_t mFileSize = getUnicodeNameDataSize();
450    mGrepFunction(mFileBuffer, mFileSize, 0);
451    return parsedCodePointSet;
452}
453
454const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
455    enum { MaxSupportedVectorWidthInBytes = 32 };
456    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
457    parsedPropertyValues.clear();
458    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
459    const auto n = str.length();
460    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
461    // erroneously matching garbage data when loading the final partial block.
462    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
463    std::memcpy(aligned, str.data(), n);
464    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
465    mGrepFunction(aligned, n, 0);
466    alloc.deallocate(aligned, 0);
467    return parsedPropertyValues;
468}
469
470static int * total_count;
471static std::stringstream * resultStrs = nullptr;
472static std::vector<std::string> inputFiles;
473
474void initResult(std::vector<std::string> filenames){
475    const int n = filenames.size();
476    if (n > 1) {
477        ShowFileNames = true;
478    }
479    inputFiles = filenames;
480    resultStrs = new std::stringstream[n];
481    total_count = new int[n];
482    for (unsigned i = 0; i < inputFiles.size(); ++i){
483        total_count[i] = 0;
484    }
485   
486}
487
488extern "C" {
489    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
490        assert (buffer);
491#ifdef CUDA_ENABLED
492    if (codegen::NVPTX){
493        while(line_start>startPoints[blockNo]) blockNo++;
494        line_start -= accumBytes[blockNo-1];
495        line_end -= accumBytes[blockNo-1];
496    }
497#endif
498        int index = isUTF_16 ? 2 : 1;
499        int idx = fileIdx;
500         
501        if (ShowFileNames) {
502            resultStrs[idx] << inputFiles[idx] << ':';
503        }
504        if (ShowLineNumbers) {
505            resultStrs[idx] << lineNum << ":";
506        }
507       
508        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
509            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
510            line_start++;
511        }
512        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
513            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
514            line_start += 2;
515        }
516        if (line_end == filesize) {
517            // The match position is at end-of-file.   We have a final unterminated line.
518            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
519            if (NormalizeLineBreaks) {
520                resultStrs[idx] << '\n';  // terminate it
521            }
522            return;
523        }
524        unsigned char end_byte = (unsigned char)buffer[line_end]; 
525        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
526        if (NormalizeLineBreaks) {
527            if (end_byte == 0x85) {
528                // Line terminated with NEL, on the second byte.  Back up 1.
529                line_end--;
530            } else if (end_byte > 0xD) {
531                // Line terminated with PS or LS, on the third byte.  Back up 2.
532                isUTF_16 ? line_end-- : line_end -= 2;
533            }
534            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
535            resultStrs[idx] << '\n';
536        } else {
537            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
538                // Check for line_end on first byte of CRLF;  note that we don't
539                // want to access past the end of buffer.
540                if (line_end + 1 < filesize) {
541                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
542                        // Found CRLF; preserve both bytes.
543                        line_end++;
544                    }
545                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
546                        // Found CRLF; preserve both bytes.
547                        line_end += 2;
548                    }
549                }
550            }
551            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
552        }
553    }
554}
555
556void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
557   
558    if(CountOnly){
559        if (!ShowFileNames) {
560            for (unsigned i = 0; i < inputFiles.size(); ++i){
561                std::cout << total_CountOnly[i] << std::endl;
562            }
563        }
564        else {
565            for (unsigned i = 0; i < inputFiles.size(); ++i){
566                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
567            };
568        }
569        return;
570    }
571   
572    for (unsigned i = 0; i < inputFiles.size(); ++i){
573        std::cout << resultStrs[i].str();
574    }
575}
576
577extern "C" {
578    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
579        assert (buffer);
580        re::codepoint_t c = 0;
581        ssize_t line_pos = line_start;
582        while (isxdigit(buffer[line_pos])) {
583            if (isdigit(buffer[line_pos])) {
584                c = (c << 4) | (buffer[line_pos] - '0');
585            }
586            else {
587                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
588            }
589            line_pos++;
590        }
591        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
592        parsedCodePointSet->insert(c);
593    }
594}
595
596extern "C" {
597    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
598        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
599    }
600}
601
602void icgrep_Linking(Module * m, ExecutionEngine * e) {
603    Module::FunctionListType & fns = m->getFunctionList();
604    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
605        std::string fnName = it->getName().str();
606        if (fnName == "s2p_block") continue;
607        if (fnName == "process_block") continue;
608        if (fnName == "process_block_initialize_carries") continue;
609       
610        if (fnName == "wrapped_report_match") {
611            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
612        }
613        if (fnName == "insert_codepoints") {
614            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
615        }
616        if (fnName == "insert_property_values") {
617            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
618        }
619    }
620}
621
622GrepEngine::GrepEngine()
623: mGrepFunction(nullptr)
624, mGrepFunction_CountOnly(nullptr)
625, mGrepFunction_CPU(nullptr)
626, mGrepType(GrepType::Normal)
627, mEngine(nullptr) {
628
629}
630
631GrepEngine::~GrepEngine() {
632    delete mEngine;
633}
Note: See TracBrowser for help on using the repository browser.