source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5294

Last change on this file since 5294 was 5294, checked in by lindanl, 2 years ago

Bug fixed for icgrep GPU version.

File size: 22.5 KB
RevLine 
[4324]1/*
[4947]2 *  Copyright (c) 2016 International Characters.
[4324]3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
[5234]7#include "grep_engine.h"
[5267]8#include <llvm/IR/Module.h>
[4946]9#include <llvm/ExecutionEngine/MCJIT.h>
[5234]10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
[5238]14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
[4949]16#include <UCD/UnicodeNameData.h>
[5206]17#include <UCD/resolve_properties.h>
[5142]18#include <kernels/cc_kernel.h>
[5087]19#include <kernels/pipeline.h>
[5254]20#include <kernels/mmap_kernel.h>
[5234]21#include <kernels/s2p_kernel.h>
22#include <kernels/scanmatchgen.h>
23#include <kernels/streamset.h>
24#include <pablo/pablo_compiler.h>
[5087]25#include <pablo/pablo_kernel.h>
26#include <pablo/pablo_toolchain.h>
[5234]27#include <re/re_cc.h>
28#include <re/re_toolchain.h>
29#include <toolchain.h>
30#include <iostream>
[4324]31#include <sstream>
[5267]32#ifdef CUDA_ENABLED
[5238]33#include <IR_Gen/CudaDriver.h>
[5151]34#endif
[5236]35#include <util/aligned_allocator.h>
[5151]36
[5241]37using namespace parabix;
[5267]38using namespace llvm;
[5241]39
[5033]40static cl::OptionCategory bGrepOutputOptions("Output Options",
41                                             "These options control the output.");
[5176]42static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]43
[5176]44static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
45
[5033]46static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]47
[5033]48static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
49static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
50
51static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
52static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
53
[5135]54static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5033]55
[5165]56static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5135]57
[5045]58bool isUTF_16 = false;
[5151]59std::string IRFilename = "icgrep.ll";
60std::string PTXFilename = "icgrep.ptx";
[5033]61
[5241]62static re::CC * parsedCodePointSet = nullptr;
63static std::vector<std::string> parsedPropertyValues;
64
[5106]65void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
[5101]66    boost::filesystem::path file(fileName);
[4788]67    if (exists(file)) {
68        if (is_directory(file)) {
[4969]69            return;
[4788]70        }
71    } else {
[5176]72        if (!SilenceFileErrors) {
73            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
74            return;
75        }
[4788]76    }
77
[5037]78    const auto fileSize = file_size(file);
[5001]79    if (fileSize > 0) {
[4883]80        try {
[5101]81            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
[5037]82            char * fileBuffer = const_cast<char *>(source.data());
[5151]83#ifdef CUDA_ENABLED 
84            if(codegen::NVPTX){
85                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
86                if (CountOnly){
87                    exit(0);
88                }
89                else{
90                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
91                    return;
92                }
93               
94            } 
95#endif
[5037]96            if (CountOnly) {
[5048]97                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
[5037]98            } else {
[5048]99                mGrepFunction(fileBuffer, fileSize, fileIdx);
[5037]100            }
101            source.close();
102        } catch (std::exception & e) {
[5176]103            if (!SilenceFileErrors) {
104                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
105                return;
106            }
[4883]107        }
[5037]108    } else {
[5151]109#ifdef CUDA_ENABLED
110        if (codegen::NVPTX){
111            std::cout << 0 << std::endl;
112            exit(0);
113        }
114#endif
[5048]115        if (CountOnly) {
[5106]116            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
[5037]117        } else {
[5048]118            mGrepFunction(nullptr, 0, fileIdx);
[5037]119        }
[5021]120    }
[4949]121}
122
[5151]123Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
124    Type * const int64ty = iBuilder->getInt64Ty();
125    Type * const inputType = PointerType::get(int64ty, 1);
126    Type * const resultTy = iBuilder->getVoidTy();
127    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
128    kernelFunc->setCallingConv(CallingConv::C);
129    Function::arg_iterator args = kernelFunc->arg_begin();
130
131    Value * const inputPtr = &*(args++);
132    inputPtr->setName("inputPtr");
133    Value * const bufferSizePtr = &*(args++);
134    bufferSizePtr->setName("bufferSizePtr");
135    Value * const outputPtr = &*(args++);
136    outputPtr->setName("resultPtr");
137
138    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
139    iBuilder->SetInsertPoint(entryBlock);
140
141    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
142    Value * id = iBuilder->CreateCall(tidFunc);
143
144    Function * mainFunc = m->getFunction("Main");
[5200]145    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
146    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
147    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
148
[5151]149    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
150    if (CountOnly){
151        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
152        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
153        iBuilder->CreateStore(result, outputThreadPtr);
154    }
155    else {
156        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
[5200]157        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
158        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
[5151]159        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
160    }   
161
162    iBuilder->CreateRetVoid();
163    return kernelFunc;
164}
165
[5206]166Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
[5151]167    Type * const size_ty = iBuilder->getSizeTy();
168    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
169    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
170    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
171    mainCPUFn->setCallingConv(CallingConv::C);
172    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
173    Function::arg_iterator args = mainCPUFn->arg_begin();
[5135]174   
[5151]175    Value * const rsltStream = &*(args++);
176    rsltStream->setName("rslt");
177    Value * const inputStream = &*(args++);
178    inputStream->setName("input");
179    Value * const fileSize = &*(args++);
180    fileSize->setName("fileSize");
181    Value * const fileIdx = &*(args++);
182    fileIdx->setName("fileIdx");
[4946]183
[5294]184    const unsigned segmentSize = codegen::SegmentSize;
185
[5217]186    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1));
[5151]187    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
188
[5294]189    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
190    mmapK.generateKernel({}, {&MatchResults});
191    mmapK.setInitialArguments({fileSize});
192
[5206]193    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
[5151]194    scanMatchK.generateKernel({&MatchResults}, {});
195           
[5220]196    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
[5151]197   
[5294]198    generatePipelineLoop(iBuilder, {&mmapK, &scanMatchK});
[5151]199    iBuilder->CreateRetVoid();
200
201    return mainCPUFn;
202}
203
[5206]204void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
[5151]205    isUTF_16 = UTF_16;
206    int addrSpace = 0;
207    bool CPU_Only = true;
[5200]208    Module * M = nullptr; 
209    IDISA::IDISA_Builder * iBuilder = nullptr; 
[5151]210
211#ifdef CUDA_ENABLED
212    setNVPTXOption(); 
[5202]213    if (codegen::NVPTX) {
214        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
[5151]215        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
216        M = gpuM;
217        iBuilder = GPUBuilder;
218        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
219        M->setTargetTriple("nvptx64-nvidia-cuda");
220        addrSpace = 1;
221        CPU_Only = false;
[5200]222        codegen::BlockSize = 64;
[5202]223    }
[5151]224#endif
225
[5202]226    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
227    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
[5200]228
[5204]229    if (CPU_Only) {
[5200]230        M = cpuM;
231        iBuilder = CPUBuilder;
232    }
233
[5273]234    // segment size made availabe for each call to the mmap source kernel
[5135]235    const unsigned segmentSize = codegen::SegmentSize;
[5273]236    unsigned bufferSegments = codegen::BufferSegments;
237    if (segmentPipelineParallel) 
238        {
239            bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
240        }
[5246]241    const unsigned encodingBits = UTF_16 ? 16 : 8;
[5033]242
[5206]243    mGrepType = grepType;
[5135]244
[5204]245    Type * const size_ty = iBuilder->getSizeTy();
[5135]246    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
[5246]247    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
[5204]248    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
[5151]249
250    Function * mainFn = nullptr;
251    Value * inputStream = nullptr;
252    Value * fileSize = nullptr;
253    Value * fileIdx = nullptr;
254
255#ifdef CUDA_ENABLED   
256    Value * outputStream = nullptr;
257    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
258    if (codegen::NVPTX){
259        if (CountOnly){
260            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
261            mainFn->setCallingConv(CallingConv::C);
262            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
263            Function::arg_iterator args = mainFn->arg_begin();
264           
265            inputStream = &*(args++);
266            inputStream->setName("input");
267            fileSize = &*(args++);
268            fileSize->setName("fileSize");
[5202]269        } else {
[5151]270            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
271            mainFn->setCallingConv(CallingConv::C);
272            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
273            Function::arg_iterator args = mainFn->arg_begin();
274           
275            inputStream = &*(args++);
276            inputStream->setName("input");
277            fileSize = &*(args++);
278            fileSize->setName("fileSize");
279            outputStream = &*(args++);
280            outputStream->setName("output");
281        }
282    } 
283#endif
284    if (CPU_Only){
[5204]285        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
[5151]286        mainFn->setCallingConv(CallingConv::C);
287        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
288        Function::arg_iterator args = mainFn->arg_begin();
289       
290        inputStream = &*(args++);
291        inputStream->setName("input");
292        fileSize = &*(args++);
293        fileSize->setName("fileSize");
294        fileIdx = &*(args++);
295        fileIdx->setName("fileIdx");
296    }
[5135]297       
[5217]298    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
[5254]299   
[5273]300    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
[5254]301    mmapK.generateKernel({}, {&ByteStream});
302    mmapK.setInitialArguments({fileSize});
303   
[5217]304    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8, 1), segmentSize * bufferSegments);
[5135]305
[5230]306    kernel::S2PKernel  s2pk(iBuilder);
[5135]307    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5142]308   
[5217]309    pablo::PabloKernel icgrepK(iBuilder, "icgrep");
310
[5142]311    re_ast = re::regular_expression_passes(re_ast);
[5217]312    re::re2pablo_compiler(&icgrepK, encodingBits, re_ast, CountOnly);
313    pablo_function_passes(&icgrepK);
[5135]314
[5142]315    ByteStream.setStreamSetBuffer(inputStream, fileSize);
[5135]316    BasisBits.allocateBuffer();
317
[5242]318    if (CountOnly) {
[5135]319        icgrepK.generateKernel({&BasisBits}, {});       
320        if (pipelineParallel){
[5254]321            generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5202]322        } else if (segmentPipelineParallel){
[5254]323            generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5202]324        } else {
[5254]325            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5135]326        }
[5202]327
[5220]328        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount");
[5202]329
[5135]330        iBuilder->CreateRet(matchCount);
331
[5202]332    } else {
[5151]333#ifdef CUDA_ENABLED
334        if (codegen::NVPTX){
[5293]335            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1), addrSpace);
[5151]336            MatchResults.setStreamSetBuffer(outputStream, fileSize);
[5135]337
[5151]338            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
[5254]339            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5135]340
341        }
[5151]342#endif
[5202]343        if (CPU_Only) {
[5217]344            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1), segmentSize * bufferSegments);
[5151]345            MatchResults.allocateBuffer();
346
[5202]347            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
[5151]348
[5206]349            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
[5151]350            scanMatchK.generateKernel({&MatchResults}, {});               
[5220]351            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
[5151]352
353            if (pipelineParallel){
[5254]354                generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
[5202]355            } else if (segmentPipelineParallel){
[5254]356                generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
[5202]357            }  else{
[5254]358                generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
[5151]359            }
[5135]360        }
361        iBuilder->CreateRetVoid();
362    }
[5151]363
364#ifdef CUDA_ENABLED
365    Function * mainCPUFn = nullptr;
366    if(codegen::NVPTX){
367        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
368        MDNode * Node = MDNode::get(M->getContext(),
369                                    {llvm::ValueAsMetadata::get(kernelFunction),
370                                     MDString::get(M->getContext(), "kernel"), 
371                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
372        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
373        NMD->addOperand(Node);
374   
375        Compile2PTX(M, IRFilename, PTXFilename);
[5206]376        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
[5151]377        if (CountOnly) return;
378    }
379#endif
380   
[5135]381     
[5151]382    mEngine = JIT_to_ExecutionEngine(cpuM);
[5135]383    ApplyObjectCache(mEngine);
[5151]384    icgrep_Linking(cpuM, mEngine);
[5135]385
386#ifndef NDEBUG
387    verifyModule(*M, &dbgs());
388#endif
389
390    mEngine->finalizeObject();
391    delete iBuilder;
392   
393    if (CountOnly) {
394        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
395    } else {
[5151]396#ifdef CUDA_ENABLED
397        if(codegen::NVPTX){
398            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
399        }
400#endif
401        if (CPU_Only) {
402            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
403        }
[5135]404    }
405
406}
407
[5241]408re::CC * GrepEngine::grepCodepoints() {
409    parsedCodePointSet = re::makeCC();
[4967]410    char * mFileBuffer = getUnicodeNameDataPtr();
[4969]411    size_t mFileSize = getUnicodeNameDataSize();
[5048]412    mGrepFunction(mFileBuffer, mFileSize, 0);
[5241]413    return parsedCodePointSet;
[4946]414}
[4968]415
[5206]416const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
[5245]417    enum { MaxSupportedVectorWidthInBytes = 32 };
418    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
[5241]419    parsedPropertyValues.clear();
[5236]420    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
[5241]421    const auto n = str.length();
[5245]422    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
423    // erroneously matching garbage data when loading the final partial block.
424    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
[5241]425    std::memcpy(aligned, str.data(), n);
[5245]426    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
[5241]427    mGrepFunction(aligned, n, 0);
[5236]428    alloc.deallocate(aligned, 0);
[5241]429    return parsedPropertyValues;
[5206]430}
431
[5033]432static int * total_count;
433static std::stringstream * resultStrs = nullptr;
434static std::vector<std::string> inputFiles;
435
436void initResult(std::vector<std::string> filenames){
437    const int n = filenames.size();
438    if (n > 1) {
439        ShowFileNames = true;
440    }
441    inputFiles = filenames;
442    resultStrs = new std::stringstream[n];
443    total_count = new int[n];
[5037]444    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]445        total_count[i] = 0;
446    }
447   
448}
449
450extern "C" {
[5106]451    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
[5048]452        int index = isUTF_16 ? 2 : 1;
453        int idx = fileIdx;
454         
[5033]455        if (ShowFileNames) {
456            resultStrs[idx] << inputFiles[idx] << ':';
457        }
458        if (ShowLineNumbers) {
459            resultStrs[idx] << lineNum << ":";
460        }
461       
[5045]462        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
[5033]463            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
464            line_start++;
465        }
[5045]466        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
467            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
468            line_start += 2;
469        }
[5033]470        if (line_end == filesize) {
471            // The match position is at end-of-file.   We have a final unterminated line.
[5045]472            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]473            if (NormalizeLineBreaks) {
474                resultStrs[idx] << '\n';  // terminate it
475            }
476            return;
477        }
478        unsigned char end_byte = (unsigned char)buffer[line_end]; 
[5048]479        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
[5033]480        if (NormalizeLineBreaks) {
481            if (end_byte == 0x85) {
482                // Line terminated with NEL, on the second byte.  Back up 1.
483                line_end--;
484            } else if (end_byte > 0xD) {
485                // Line terminated with PS or LS, on the third byte.  Back up 2.
[5045]486                isUTF_16 ? line_end-- : line_end -= 2;
[5033]487            }
[5045]488            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]489            resultStrs[idx] << '\n';
[5245]490        } else {
[5045]491            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
[5033]492                // Check for line_end on first byte of CRLF;  note that we don't
493                // want to access past the end of buffer.
[5048]494                if (line_end + 1 < filesize) {
495                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
496                        // Found CRLF; preserve both bytes.
497                        line_end++;
498                    }
499                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
500                        // Found CRLF; preserve both bytes.
501                        line_end += 2;
502                    }
503                }
[5033]504            }
[5045]505            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
[5033]506        }
507    }
508}
509
[5106]510void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
[5176]511   
[5033]512    if(CountOnly){
513        if (!ShowFileNames) {
[5037]514            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]515                std::cout << total_CountOnly[i] << std::endl;
516            }
517        }
518        else {
[5037]519            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]520                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
521            };
522        }
523        return;
524    }
525   
[5037]526    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]527        std::cout << resultStrs[i].str();
528    }
529}
530
531extern "C" {
[5106]532    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5033]533        re::codepoint_t c = 0;
534        ssize_t line_pos = line_start;
535        while (isxdigit(buffer[line_pos])) {
536            if (isdigit(buffer[line_pos])) {
537                c = (c << 4) | (buffer[line_pos] - '0');
538            }
539            else {
540                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
541            }
542            line_pos++;
543        }
544        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
545        parsedCodePointSet->insert(c);
546    }
547}
548
[5206]549extern "C" {
550    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5241]551        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
[5206]552    }
553}
554
[5033]555void icgrep_Linking(Module * m, ExecutionEngine * e) {
556    Module::FunctionListType & fns = m->getFunctionList();
[5234]557    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
[5033]558        std::string fnName = it->getName().str();
559        if (fnName == "s2p_block") continue;
560        if (fnName == "process_block") continue;
561        if (fnName == "process_block_initialize_carries") continue;
562       
563        if (fnName == "wrapped_report_match") {
564            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
565        }
566        if (fnName == "insert_codepoints") {
567            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
568        }
[5206]569        if (fnName == "insert_property_values") {
570            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
571        }
[5033]572    }
573}
574
[5240]575GrepEngine::GrepEngine()
576: mGrepFunction(nullptr)
577, mGrepFunction_CountOnly(nullptr)
578, mGrepFunction_CPU(nullptr)
579, mGrepType(GrepType::Normal)
580, mEngine(nullptr) {
581
582}
583
584GrepEngine::~GrepEngine() {
585    delete mEngine;
586}
Note: See TracBrowser for help on using the repository browser.