source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5254

Last change on this file since 5254 was 5254, checked in by cameron, 3 years ago

Add mmap kernel to all pipelines

File size: 22.3 KB
RevLine 
[4324]1/*
[4947]2 *  Copyright (c) 2016 International Characters.
[4324]3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
[5234]7#include "grep_engine.h"
[4946]8#include <llvm/ExecutionEngine/MCJIT.h>
[5234]9#include <llvm/IR/Verifier.h>
[4946]10#include <llvm/IRReader/IRReader.h>
[5234]11#include <llvm/Support/CommandLine.h>
[4946]12#include <llvm/Support/Debug.h>
[5234]13#include <boost/filesystem.hpp>
14#include <boost/iostreams/device/mapped_file.hpp>
[5238]15#include <IR_Gen/idisa_builder.h>
16#include <IR_Gen/idisa_target.h>
[4949]17#include <UCD/UnicodeNameData.h>
[5206]18#include <UCD/resolve_properties.h>
[5142]19#include <kernels/cc_kernel.h>
[5234]20#include <kernels/kernel.h>
[5087]21#include <kernels/pipeline.h>
[5254]22#include <kernels/mmap_kernel.h>
[5234]23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <pablo/pablo_compiler.h>
[5087]27#include <pablo/pablo_kernel.h>
28#include <pablo/pablo_toolchain.h>
[5234]29#include <pablo/pablo_toolchain.h>
30#include <re/re_cc.h>
31#include <re/re_toolchain.h>
32#include <toolchain.h>
33#include <iostream>
[4324]34#include <sstream>
[5151]35#ifdef CUDA_ENABLED
[5238]36#include <IR_Gen/CudaDriver.h>
[5151]37#endif
[5236]38#include <util/aligned_allocator.h>
[5151]39
[5241]40using namespace parabix;
41
[5033]42static cl::OptionCategory bGrepOutputOptions("Output Options",
43                                             "These options control the output.");
[5176]44static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]45
[5176]46static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
47
[5033]48static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]49
[5033]50static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
51static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
52
53static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
54static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
55
[5135]56static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5033]57
[5165]58static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5135]59
[5045]60bool isUTF_16 = false;
[5151]61std::string IRFilename = "icgrep.ll";
62std::string PTXFilename = "icgrep.ptx";
[5033]63
[5241]64static re::CC * parsedCodePointSet = nullptr;
65static std::vector<std::string> parsedPropertyValues;
66
[5106]67void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
[5101]68    boost::filesystem::path file(fileName);
[4788]69    if (exists(file)) {
70        if (is_directory(file)) {
[4969]71            return;
[4788]72        }
73    } else {
[5176]74        if (!SilenceFileErrors) {
75            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
76            return;
77        }
[4788]78    }
79
[5037]80    const auto fileSize = file_size(file);
[5001]81    if (fileSize > 0) {
[4883]82        try {
[5101]83            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
[5037]84            char * fileBuffer = const_cast<char *>(source.data());
[5151]85#ifdef CUDA_ENABLED 
86            if(codegen::NVPTX){
87                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
88                if (CountOnly){
89                    exit(0);
90                }
91                else{
92                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
93                    return;
94                }
95               
96            } 
97#endif
[5037]98            if (CountOnly) {
[5048]99                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
[5037]100            } else {
[5048]101                mGrepFunction(fileBuffer, fileSize, fileIdx);
[5037]102            }
103            source.close();
104        } catch (std::exception & e) {
[5176]105            if (!SilenceFileErrors) {
106                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
107                return;
108            }
[4883]109        }
[5037]110    } else {
[5151]111#ifdef CUDA_ENABLED
112        if (codegen::NVPTX){
113            std::cout << 0 << std::endl;
114            exit(0);
115        }
116#endif
[5048]117        if (CountOnly) {
[5106]118            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
[5037]119        } else {
[5048]120            mGrepFunction(nullptr, 0, fileIdx);
[5037]121        }
[5021]122    }
[4949]123}
124
[5151]125Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
126    Type * const int64ty = iBuilder->getInt64Ty();
127    Type * const inputType = PointerType::get(int64ty, 1);
128    Type * const resultTy = iBuilder->getVoidTy();
129    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
130    kernelFunc->setCallingConv(CallingConv::C);
131    Function::arg_iterator args = kernelFunc->arg_begin();
132
133    Value * const inputPtr = &*(args++);
134    inputPtr->setName("inputPtr");
135    Value * const bufferSizePtr = &*(args++);
136    bufferSizePtr->setName("bufferSizePtr");
137    Value * const outputPtr = &*(args++);
138    outputPtr->setName("resultPtr");
139
140    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
141    iBuilder->SetInsertPoint(entryBlock);
142
143    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
144    Value * id = iBuilder->CreateCall(tidFunc);
145
146    Function * mainFunc = m->getFunction("Main");
[5200]147    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
148    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
149    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
150
[5151]151    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
152    if (CountOnly){
153        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
154        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
155        iBuilder->CreateStore(result, outputThreadPtr);
156    }
157    else {
158        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
[5200]159        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
160        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
[5151]161        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
162    }   
163
164    iBuilder->CreateRetVoid();
165    return kernelFunc;
166}
167
[5206]168Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
[5151]169    Type * const size_ty = iBuilder->getSizeTy();
170    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
171    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
172    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
173    mainCPUFn->setCallingConv(CallingConv::C);
174    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
175    Function::arg_iterator args = mainCPUFn->arg_begin();
[5135]176   
[5151]177    Value * const rsltStream = &*(args++);
178    rsltStream->setName("rslt");
179    Value * const inputStream = &*(args++);
180    inputStream->setName("input");
181    Value * const fileSize = &*(args++);
182    fileSize->setName("fileSize");
183    Value * const fileIdx = &*(args++);
184    fileIdx->setName("fileIdx");
[4946]185
[5217]186    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1));
[5151]187    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
188
[5206]189    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
[5151]190    scanMatchK.generateKernel({&MatchResults}, {});
191           
[5220]192    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
[5151]193   
[5221]194    generatePipelineLoop(iBuilder, {&scanMatchK});
[5151]195    iBuilder->CreateRetVoid();
196
197    return mainCPUFn;
198}
199
[5206]200void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
[5151]201    isUTF_16 = UTF_16;
202    int addrSpace = 0;
203    bool CPU_Only = true;
[5200]204    Module * M = nullptr; 
205    IDISA::IDISA_Builder * iBuilder = nullptr; 
[5151]206
207#ifdef CUDA_ENABLED
208    setNVPTXOption(); 
[5202]209    if (codegen::NVPTX) {
210        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
[5151]211        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
212        M = gpuM;
213        iBuilder = GPUBuilder;
214        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
215        M->setTargetTriple("nvptx64-nvidia-cuda");
216        addrSpace = 1;
217        CPU_Only = false;
[5200]218        codegen::BlockSize = 64;
[5202]219    }
[5151]220#endif
221
[5202]222    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
223    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
[5200]224
[5204]225    if (CPU_Only) {
[5200]226        M = cpuM;
227        iBuilder = CPUBuilder;
228    }
229
[5135]230    const unsigned segmentSize = codegen::SegmentSize;
[5202]231    if (segmentPipelineParallel && codegen::BufferSegments < 2) {
232        codegen::BufferSegments = 2;
233    }
[5135]234    const unsigned bufferSegments = codegen::BufferSegments;
[5246]235    const unsigned encodingBits = UTF_16 ? 16 : 8;
[5033]236
[5206]237    mGrepType = grepType;
[5135]238
[5204]239    Type * const size_ty = iBuilder->getSizeTy();
[5135]240    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
[5246]241    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
[5204]242    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
[5151]243
244    Function * mainFn = nullptr;
245    Value * inputStream = nullptr;
246    Value * fileSize = nullptr;
247    Value * fileIdx = nullptr;
248
249#ifdef CUDA_ENABLED   
250    Value * outputStream = nullptr;
251    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
252    if (codegen::NVPTX){
253        if (CountOnly){
254            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
255            mainFn->setCallingConv(CallingConv::C);
256            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
257            Function::arg_iterator args = mainFn->arg_begin();
258           
259            inputStream = &*(args++);
260            inputStream->setName("input");
261            fileSize = &*(args++);
262            fileSize->setName("fileSize");
[5202]263        } else {
[5151]264            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
265            mainFn->setCallingConv(CallingConv::C);
266            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
267            Function::arg_iterator args = mainFn->arg_begin();
268           
269            inputStream = &*(args++);
270            inputStream->setName("input");
271            fileSize = &*(args++);
272            fileSize->setName("fileSize");
273            outputStream = &*(args++);
274            outputStream->setName("output");
275        }
276    } 
277#endif
278    if (CPU_Only){
[5204]279        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
[5151]280        mainFn->setCallingConv(CallingConv::C);
281        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
282        Function::arg_iterator args = mainFn->arg_begin();
283       
284        inputStream = &*(args++);
285        inputStream->setName("input");
286        fileSize = &*(args++);
287        fileSize->setName("fileSize");
288        fileIdx = &*(args++);
289        fileIdx->setName("fileIdx");
290    }
[5135]291       
[5217]292    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
[5254]293   
294    kernel::MMapSourceKernel mmapK(iBuilder, iBuilder->getStride()); 
295    mmapK.generateKernel({}, {&ByteStream});
296    mmapK.setInitialArguments({fileSize});
297   
[5217]298    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8, 1), segmentSize * bufferSegments);
[5135]299
[5230]300    kernel::S2PKernel  s2pk(iBuilder);
[5135]301    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5142]302   
[5217]303    pablo::PabloKernel icgrepK(iBuilder, "icgrep");
304
[5142]305    re_ast = re::regular_expression_passes(re_ast);
[5217]306    re::re2pablo_compiler(&icgrepK, encodingBits, re_ast, CountOnly);
307    pablo_function_passes(&icgrepK);
[5135]308
[5142]309    ByteStream.setStreamSetBuffer(inputStream, fileSize);
[5135]310    BasisBits.allocateBuffer();
311
[5242]312    if (CountOnly) {
[5135]313        icgrepK.generateKernel({&BasisBits}, {});       
314        if (pipelineParallel){
[5254]315            generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5202]316        } else if (segmentPipelineParallel){
[5254]317            generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5202]318        } else {
[5254]319            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5135]320        }
[5202]321
[5220]322        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount");
[5202]323
[5135]324        iBuilder->CreateRet(matchCount);
325
[5202]326    } else {
[5151]327#ifdef CUDA_ENABLED
328        if (codegen::NVPTX){
[5217]329            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, i1), addrSpace);
[5151]330            MatchResults.setStreamSetBuffer(outputStream, fileSize);
[5135]331
[5151]332            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
[5254]333            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
[5135]334
335        }
[5151]336#endif
[5202]337        if (CPU_Only) {
[5217]338            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1), segmentSize * bufferSegments);
[5151]339            MatchResults.allocateBuffer();
340
[5202]341            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
[5151]342
[5206]343            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
[5151]344            scanMatchK.generateKernel({&MatchResults}, {});               
[5220]345            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
[5151]346
347            if (pipelineParallel){
[5254]348                generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
[5202]349            } else if (segmentPipelineParallel){
[5254]350                generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
[5202]351            }  else{
[5254]352                generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
[5151]353            }
[5135]354        }
355        iBuilder->CreateRetVoid();
356    }
[5151]357
358#ifdef CUDA_ENABLED
359    Function * mainCPUFn = nullptr;
360    if(codegen::NVPTX){
361        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
362        MDNode * Node = MDNode::get(M->getContext(),
363                                    {llvm::ValueAsMetadata::get(kernelFunction),
364                                     MDString::get(M->getContext(), "kernel"), 
365                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
366        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
367        NMD->addOperand(Node);
368   
369        Compile2PTX(M, IRFilename, PTXFilename);
[5206]370        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
[5151]371        if (CountOnly) return;
372    }
373#endif
374   
[5135]375     
[5151]376    mEngine = JIT_to_ExecutionEngine(cpuM);
[5135]377    ApplyObjectCache(mEngine);
[5151]378    icgrep_Linking(cpuM, mEngine);
[5135]379
380#ifndef NDEBUG
381    verifyModule(*M, &dbgs());
382#endif
383
384    mEngine->finalizeObject();
385    delete iBuilder;
386   
387    if (CountOnly) {
388        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
389    } else {
[5151]390#ifdef CUDA_ENABLED
391        if(codegen::NVPTX){
392            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
393        }
394#endif
395        if (CPU_Only) {
396            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
397        }
[5135]398    }
399
400}
401
[5241]402re::CC * GrepEngine::grepCodepoints() {
403    parsedCodePointSet = re::makeCC();
[4967]404    char * mFileBuffer = getUnicodeNameDataPtr();
[4969]405    size_t mFileSize = getUnicodeNameDataSize();
[5048]406    mGrepFunction(mFileBuffer, mFileSize, 0);
[5241]407    return parsedCodePointSet;
[4946]408}
[4968]409
[5206]410const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
[5245]411    enum { MaxSupportedVectorWidthInBytes = 32 };
412    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
[5241]413    parsedPropertyValues.clear();
[5236]414    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
[5241]415    const auto n = str.length();
[5245]416    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
417    // erroneously matching garbage data when loading the final partial block.
418    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
[5241]419    std::memcpy(aligned, str.data(), n);
[5245]420    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
[5241]421    mGrepFunction(aligned, n, 0);
[5236]422    alloc.deallocate(aligned, 0);
[5241]423    return parsedPropertyValues;
[5206]424}
425
[5033]426static int * total_count;
427static std::stringstream * resultStrs = nullptr;
428static std::vector<std::string> inputFiles;
429
430void initResult(std::vector<std::string> filenames){
431    const int n = filenames.size();
432    if (n > 1) {
433        ShowFileNames = true;
434    }
435    inputFiles = filenames;
436    resultStrs = new std::stringstream[n];
437    total_count = new int[n];
[5037]438    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]439        total_count[i] = 0;
440    }
441   
442}
443
444extern "C" {
[5106]445    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
[5048]446        int index = isUTF_16 ? 2 : 1;
447        int idx = fileIdx;
448         
[5033]449        if (ShowFileNames) {
450            resultStrs[idx] << inputFiles[idx] << ':';
451        }
452        if (ShowLineNumbers) {
453            resultStrs[idx] << lineNum << ":";
454        }
455       
[5045]456        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
[5033]457            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
458            line_start++;
459        }
[5045]460        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
461            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
462            line_start += 2;
463        }
[5033]464        if (line_end == filesize) {
465            // The match position is at end-of-file.   We have a final unterminated line.
[5045]466            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]467            if (NormalizeLineBreaks) {
468                resultStrs[idx] << '\n';  // terminate it
469            }
470            return;
471        }
472        unsigned char end_byte = (unsigned char)buffer[line_end]; 
[5048]473        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
[5033]474        if (NormalizeLineBreaks) {
475            if (end_byte == 0x85) {
476                // Line terminated with NEL, on the second byte.  Back up 1.
477                line_end--;
478            } else if (end_byte > 0xD) {
479                // Line terminated with PS or LS, on the third byte.  Back up 2.
[5045]480                isUTF_16 ? line_end-- : line_end -= 2;
[5033]481            }
[5045]482            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]483            resultStrs[idx] << '\n';
[5245]484        } else {
[5045]485            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
[5033]486                // Check for line_end on first byte of CRLF;  note that we don't
487                // want to access past the end of buffer.
[5048]488                if (line_end + 1 < filesize) {
489                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
490                        // Found CRLF; preserve both bytes.
491                        line_end++;
492                    }
493                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
494                        // Found CRLF; preserve both bytes.
495                        line_end += 2;
496                    }
497                }
[5033]498            }
[5045]499            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
[5033]500        }
501    }
502}
503
[5106]504void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
[5176]505   
[5033]506    if(CountOnly){
507        if (!ShowFileNames) {
[5037]508            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]509                std::cout << total_CountOnly[i] << std::endl;
510            }
511        }
512        else {
[5037]513            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]514                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
515            };
516        }
517        return;
518    }
519   
[5037]520    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]521        std::cout << resultStrs[i].str();
522    }
523}
524
525extern "C" {
[5106]526    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5033]527        re::codepoint_t c = 0;
528        ssize_t line_pos = line_start;
529        while (isxdigit(buffer[line_pos])) {
530            if (isdigit(buffer[line_pos])) {
531                c = (c << 4) | (buffer[line_pos] - '0');
532            }
533            else {
534                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
535            }
536            line_pos++;
537        }
538        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
539        parsedCodePointSet->insert(c);
540    }
541}
542
[5206]543extern "C" {
544    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5241]545        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
[5206]546    }
547}
548
[5033]549void icgrep_Linking(Module * m, ExecutionEngine * e) {
550    Module::FunctionListType & fns = m->getFunctionList();
[5234]551    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
[5033]552        std::string fnName = it->getName().str();
553        if (fnName == "s2p_block") continue;
554        if (fnName == "process_block") continue;
555        if (fnName == "process_block_initialize_carries") continue;
556       
557        if (fnName == "wrapped_report_match") {
558            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
559        }
560        if (fnName == "insert_codepoints") {
561            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
562        }
[5206]563        if (fnName == "insert_property_values") {
564            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
565        }
[5033]566    }
567}
568
[5240]569GrepEngine::GrepEngine()
570: mGrepFunction(nullptr)
571, mGrepFunction_CountOnly(nullptr)
572, mGrepFunction_CPU(nullptr)
573, mGrepType(GrepType::Normal)
574, mEngine(nullptr) {
575
576}
577
578GrepEngine::~GrepEngine() {
579    delete mEngine;
580}
Note: See TracBrowser for help on using the repository browser.