source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5250

Last change on this file since 5250 was 5246, checked in by nmedfort, 3 years ago

Code clean up to enforce proper calling order of KernelBuilder? methods

File size: 22.1 KB
RevLine 
[4324]1/*
[4947]2 *  Copyright (c) 2016 International Characters.
[4324]3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
[5234]7#include "grep_engine.h"
[4946]8#include <llvm/ExecutionEngine/MCJIT.h>
[5234]9#include <llvm/IR/Verifier.h>
[4946]10#include <llvm/IRReader/IRReader.h>
[5234]11#include <llvm/Support/CommandLine.h>
[4946]12#include <llvm/Support/Debug.h>
[5234]13#include <boost/filesystem.hpp>
14#include <boost/iostreams/device/mapped_file.hpp>
[5238]15#include <IR_Gen/idisa_builder.h>
16#include <IR_Gen/idisa_target.h>
[4949]17#include <UCD/UnicodeNameData.h>
[5206]18#include <UCD/resolve_properties.h>
[5142]19#include <kernels/cc_kernel.h>
[5234]20#include <kernels/kernel.h>
[5087]21#include <kernels/pipeline.h>
[5234]22#include <kernels/pipeline.h>
23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <pablo/pablo_compiler.h>
[5087]27#include <pablo/pablo_kernel.h>
28#include <pablo/pablo_toolchain.h>
[5234]29#include <pablo/pablo_toolchain.h>
30#include <re/re_cc.h>
31#include <re/re_toolchain.h>
32#include <toolchain.h>
33#include <iostream>
[4324]34#include <sstream>
[5151]35#ifdef CUDA_ENABLED
[5238]36#include <IR_Gen/CudaDriver.h>
[5151]37#endif
[5236]38#include <util/aligned_allocator.h>
[5151]39
[5241]40using namespace parabix;
41
[5033]42static cl::OptionCategory bGrepOutputOptions("Output Options",
43                                             "These options control the output.");
[5176]44static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]45
[5176]46static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
47
[5033]48static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]49
[5033]50static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
51static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
52
53static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
54static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
55
[5135]56static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5033]57
[5165]58static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5135]59
[5045]60bool isUTF_16 = false;
[5151]61std::string IRFilename = "icgrep.ll";
62std::string PTXFilename = "icgrep.ptx";
[5033]63
[5241]64static re::CC * parsedCodePointSet = nullptr;
65static std::vector<std::string> parsedPropertyValues;
66
[5106]67void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
[5101]68    boost::filesystem::path file(fileName);
[4788]69    if (exists(file)) {
70        if (is_directory(file)) {
[4969]71            return;
[4788]72        }
73    } else {
[5176]74        if (!SilenceFileErrors) {
75            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
76            return;
77        }
[4788]78    }
79
[5037]80    const auto fileSize = file_size(file);
[5001]81    if (fileSize > 0) {
[4883]82        try {
[5101]83            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
[5037]84            char * fileBuffer = const_cast<char *>(source.data());
[5151]85#ifdef CUDA_ENABLED 
86            if(codegen::NVPTX){
87                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
88                if (CountOnly){
89                    exit(0);
90                }
91                else{
92                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
93                    return;
94                }
95               
96            } 
97#endif
[5037]98            if (CountOnly) {
[5048]99                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
[5037]100            } else {
[5048]101                mGrepFunction(fileBuffer, fileSize, fileIdx);
[5037]102            }
103            source.close();
104        } catch (std::exception & e) {
[5176]105            if (!SilenceFileErrors) {
106                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
107                return;
108            }
[4883]109        }
[5037]110    } else {
[5151]111#ifdef CUDA_ENABLED
112        if (codegen::NVPTX){
113            std::cout << 0 << std::endl;
114            exit(0);
115        }
116#endif
[5048]117        if (CountOnly) {
[5106]118            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
[5037]119        } else {
[5048]120            mGrepFunction(nullptr, 0, fileIdx);
[5037]121        }
[5021]122    }
[4949]123}
124
[5151]125Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
126    Type * const int64ty = iBuilder->getInt64Ty();
127    Type * const inputType = PointerType::get(int64ty, 1);
128    Type * const resultTy = iBuilder->getVoidTy();
129    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
130    kernelFunc->setCallingConv(CallingConv::C);
131    Function::arg_iterator args = kernelFunc->arg_begin();
132
133    Value * const inputPtr = &*(args++);
134    inputPtr->setName("inputPtr");
135    Value * const bufferSizePtr = &*(args++);
136    bufferSizePtr->setName("bufferSizePtr");
137    Value * const outputPtr = &*(args++);
138    outputPtr->setName("resultPtr");
139
140    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
141    iBuilder->SetInsertPoint(entryBlock);
142
143    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
144    Value * id = iBuilder->CreateCall(tidFunc);
145
146    Function * mainFunc = m->getFunction("Main");
[5200]147    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
148    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
149    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
150
[5151]151    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
152    if (CountOnly){
153        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
154        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
155        iBuilder->CreateStore(result, outputThreadPtr);
156    }
157    else {
158        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
[5200]159        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
160        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
[5151]161        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
162    }   
163
164    iBuilder->CreateRetVoid();
165    return kernelFunc;
166}
167
[5206]168Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
[5151]169    Type * const size_ty = iBuilder->getSizeTy();
170    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
171    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
172    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
173    mainCPUFn->setCallingConv(CallingConv::C);
174    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
175    Function::arg_iterator args = mainCPUFn->arg_begin();
[5135]176   
[5151]177    Value * const rsltStream = &*(args++);
178    rsltStream->setName("rslt");
179    Value * const inputStream = &*(args++);
180    inputStream->setName("input");
181    Value * const fileSize = &*(args++);
182    fileSize->setName("fileSize");
183    Value * const fileIdx = &*(args++);
184    fileIdx->setName("fileIdx");
[4946]185
[5217]186    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1));
[5151]187    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
188
[5206]189    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
[5151]190    scanMatchK.generateKernel({&MatchResults}, {});
191           
[5220]192    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
[5151]193   
[5221]194    generatePipelineLoop(iBuilder, {&scanMatchK});
[5151]195    iBuilder->CreateRetVoid();
196
197    return mainCPUFn;
198}
199
[5206]200void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
[5151]201    isUTF_16 = UTF_16;
202    int addrSpace = 0;
203    bool CPU_Only = true;
[5200]204    Module * M = nullptr; 
205    IDISA::IDISA_Builder * iBuilder = nullptr; 
[5151]206
207#ifdef CUDA_ENABLED
208    setNVPTXOption(); 
[5202]209    if (codegen::NVPTX) {
210        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
[5151]211        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
212        M = gpuM;
213        iBuilder = GPUBuilder;
214        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
215        M->setTargetTriple("nvptx64-nvidia-cuda");
216        addrSpace = 1;
217        CPU_Only = false;
[5200]218        codegen::BlockSize = 64;
[5202]219    }
[5151]220#endif
221
[5202]222    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
223    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
[5200]224
[5204]225    if (CPU_Only) {
[5200]226        M = cpuM;
227        iBuilder = CPUBuilder;
228    }
229
[5135]230    const unsigned segmentSize = codegen::SegmentSize;
[5202]231    if (segmentPipelineParallel && codegen::BufferSegments < 2) {
232        codegen::BufferSegments = 2;
233    }
[5135]234    const unsigned bufferSegments = codegen::BufferSegments;
[5246]235    const unsigned encodingBits = UTF_16 ? 16 : 8;
[5033]236
[5206]237    mGrepType = grepType;
[5135]238
[5204]239    Type * const size_ty = iBuilder->getSizeTy();
[5135]240    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
[5246]241    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
[5204]242    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
[5151]243
244    Function * mainFn = nullptr;
245    Value * inputStream = nullptr;
246    Value * fileSize = nullptr;
247    Value * fileIdx = nullptr;
248
249#ifdef CUDA_ENABLED   
250    Value * outputStream = nullptr;
251    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
252    if (codegen::NVPTX){
253        if (CountOnly){
254            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
255            mainFn->setCallingConv(CallingConv::C);
256            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
257            Function::arg_iterator args = mainFn->arg_begin();
258           
259            inputStream = &*(args++);
260            inputStream->setName("input");
261            fileSize = &*(args++);
262            fileSize->setName("fileSize");
[5202]263        } else {
[5151]264            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
265            mainFn->setCallingConv(CallingConv::C);
266            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
267            Function::arg_iterator args = mainFn->arg_begin();
268           
269            inputStream = &*(args++);
270            inputStream->setName("input");
271            fileSize = &*(args++);
272            fileSize->setName("fileSize");
273            outputStream = &*(args++);
274            outputStream->setName("output");
275        }
276    } 
277#endif
278    if (CPU_Only){
[5204]279        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
[5151]280        mainFn->setCallingConv(CallingConv::C);
281        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
282        Function::arg_iterator args = mainFn->arg_begin();
283       
284        inputStream = &*(args++);
285        inputStream->setName("input");
286        fileSize = &*(args++);
287        fileSize->setName("fileSize");
288        fileIdx = &*(args++);
289        fileIdx->setName("fileIdx");
290    }
[5135]291       
[5217]292    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
293    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8, 1), segmentSize * bufferSegments);
[5135]294
[5230]295    kernel::S2PKernel  s2pk(iBuilder);
[5135]296    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5142]297   
[5217]298    pablo::PabloKernel icgrepK(iBuilder, "icgrep");
299
[5142]300    re_ast = re::regular_expression_passes(re_ast);
[5217]301    re::re2pablo_compiler(&icgrepK, encodingBits, re_ast, CountOnly);
302    pablo_function_passes(&icgrepK);
[5135]303
[5142]304    ByteStream.setStreamSetBuffer(inputStream, fileSize);
[5135]305    BasisBits.allocateBuffer();
306
[5242]307    if (CountOnly) {
[5135]308        icgrepK.generateKernel({&BasisBits}, {});       
309        if (pipelineParallel){
[5220]310            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK});
[5202]311        } else if (segmentPipelineParallel){
[5221]312            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK});
[5202]313        } else {
[5221]314            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK});
[5135]315        }
[5202]316
[5220]317        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount");
[5202]318
[5135]319        iBuilder->CreateRet(matchCount);
320
[5202]321    } else {
[5151]322#ifdef CUDA_ENABLED
323        if (codegen::NVPTX){
[5217]324            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, i1), addrSpace);
[5151]325            MatchResults.setStreamSetBuffer(outputStream, fileSize);
[5135]326
[5151]327            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
[5221]328            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK});
[5135]329
330        }
[5151]331#endif
[5202]332        if (CPU_Only) {
[5217]333            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1), segmentSize * bufferSegments);
[5151]334            MatchResults.allocateBuffer();
335
[5202]336            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
[5151]337
[5206]338            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
[5151]339            scanMatchK.generateKernel({&MatchResults}, {});               
[5220]340            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
[5151]341
342            if (pipelineParallel){
[5220]343                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
[5202]344            } else if (segmentPipelineParallel){
[5221]345                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
[5202]346            }  else{
[5221]347                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
[5151]348            }
[5135]349        }
350        iBuilder->CreateRetVoid();
351    }
[5151]352
353#ifdef CUDA_ENABLED
354    Function * mainCPUFn = nullptr;
355    if(codegen::NVPTX){
356        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
357        MDNode * Node = MDNode::get(M->getContext(),
358                                    {llvm::ValueAsMetadata::get(kernelFunction),
359                                     MDString::get(M->getContext(), "kernel"), 
360                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
361        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
362        NMD->addOperand(Node);
363   
364        Compile2PTX(M, IRFilename, PTXFilename);
[5206]365        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
[5151]366        if (CountOnly) return;
367    }
368#endif
369   
[5135]370     
[5151]371    mEngine = JIT_to_ExecutionEngine(cpuM);
[5135]372    ApplyObjectCache(mEngine);
[5151]373    icgrep_Linking(cpuM, mEngine);
[5135]374
375#ifndef NDEBUG
376    verifyModule(*M, &dbgs());
377#endif
378
379    mEngine->finalizeObject();
380    delete iBuilder;
381   
382    if (CountOnly) {
383        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
384    } else {
[5151]385#ifdef CUDA_ENABLED
386        if(codegen::NVPTX){
387            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
388        }
389#endif
390        if (CPU_Only) {
391            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
392        }
[5135]393    }
394
395}
396
[5241]397re::CC * GrepEngine::grepCodepoints() {
398    parsedCodePointSet = re::makeCC();
[4967]399    char * mFileBuffer = getUnicodeNameDataPtr();
[4969]400    size_t mFileSize = getUnicodeNameDataSize();
[5048]401    mGrepFunction(mFileBuffer, mFileSize, 0);
[5241]402    return parsedCodePointSet;
[4946]403}
[4968]404
[5206]405const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
[5245]406    enum { MaxSupportedVectorWidthInBytes = 32 };
407    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
[5241]408    parsedPropertyValues.clear();
[5236]409    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
[5241]410    const auto n = str.length();
[5245]411    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
412    // erroneously matching garbage data when loading the final partial block.
413    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
[5241]414    std::memcpy(aligned, str.data(), n);
[5245]415    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
[5241]416    mGrepFunction(aligned, n, 0);
[5236]417    alloc.deallocate(aligned, 0);
[5241]418    return parsedPropertyValues;
[5206]419}
420
[5033]421static int * total_count;
422static std::stringstream * resultStrs = nullptr;
423static std::vector<std::string> inputFiles;
424
425void initResult(std::vector<std::string> filenames){
426    const int n = filenames.size();
427    if (n > 1) {
428        ShowFileNames = true;
429    }
430    inputFiles = filenames;
431    resultStrs = new std::stringstream[n];
432    total_count = new int[n];
[5037]433    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]434        total_count[i] = 0;
435    }
436   
437}
438
439extern "C" {
[5106]440    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
[5048]441        int index = isUTF_16 ? 2 : 1;
442        int idx = fileIdx;
443         
[5033]444        if (ShowFileNames) {
445            resultStrs[idx] << inputFiles[idx] << ':';
446        }
447        if (ShowLineNumbers) {
448            resultStrs[idx] << lineNum << ":";
449        }
450       
[5045]451        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
[5033]452            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
453            line_start++;
454        }
[5045]455        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
456            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
457            line_start += 2;
458        }
[5033]459        if (line_end == filesize) {
460            // The match position is at end-of-file.   We have a final unterminated line.
[5045]461            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]462            if (NormalizeLineBreaks) {
463                resultStrs[idx] << '\n';  // terminate it
464            }
465            return;
466        }
467        unsigned char end_byte = (unsigned char)buffer[line_end]; 
[5048]468        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
[5033]469        if (NormalizeLineBreaks) {
470            if (end_byte == 0x85) {
471                // Line terminated with NEL, on the second byte.  Back up 1.
472                line_end--;
473            } else if (end_byte > 0xD) {
474                // Line terminated with PS or LS, on the third byte.  Back up 2.
[5045]475                isUTF_16 ? line_end-- : line_end -= 2;
[5033]476            }
[5045]477            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]478            resultStrs[idx] << '\n';
[5245]479        } else {
[5045]480            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
[5033]481                // Check for line_end on first byte of CRLF;  note that we don't
482                // want to access past the end of buffer.
[5048]483                if (line_end + 1 < filesize) {
484                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
485                        // Found CRLF; preserve both bytes.
486                        line_end++;
487                    }
488                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
489                        // Found CRLF; preserve both bytes.
490                        line_end += 2;
491                    }
492                }
[5033]493            }
[5045]494            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
[5033]495        }
496    }
497}
498
[5106]499void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
[5176]500   
[5033]501    if(CountOnly){
502        if (!ShowFileNames) {
[5037]503            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]504                std::cout << total_CountOnly[i] << std::endl;
505            }
506        }
507        else {
[5037]508            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]509                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
510            };
511        }
512        return;
513    }
514   
[5037]515    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]516        std::cout << resultStrs[i].str();
517    }
518}
519
520extern "C" {
[5106]521    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5033]522        re::codepoint_t c = 0;
523        ssize_t line_pos = line_start;
524        while (isxdigit(buffer[line_pos])) {
525            if (isdigit(buffer[line_pos])) {
526                c = (c << 4) | (buffer[line_pos] - '0');
527            }
528            else {
529                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
530            }
531            line_pos++;
532        }
533        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
534        parsedCodePointSet->insert(c);
535    }
536}
537
[5206]538extern "C" {
539    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5241]540        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
[5206]541    }
542}
543
[5033]544void icgrep_Linking(Module * m, ExecutionEngine * e) {
545    Module::FunctionListType & fns = m->getFunctionList();
[5234]546    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
[5033]547        std::string fnName = it->getName().str();
548        if (fnName == "s2p_block") continue;
549        if (fnName == "process_block") continue;
550        if (fnName == "process_block_initialize_carries") continue;
551       
552        if (fnName == "wrapped_report_match") {
553            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
554        }
555        if (fnName == "insert_codepoints") {
556            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
557        }
[5206]558        if (fnName == "insert_property_values") {
559            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
560        }
[5033]561    }
562}
563
[5240]564GrepEngine::GrepEngine()
565: mGrepFunction(nullptr)
566, mGrepFunction_CountOnly(nullptr)
567, mGrepFunction_CPU(nullptr)
568, mGrepType(GrepType::Normal)
569, mEngine(nullptr) {
570
571}
572
573GrepEngine::~GrepEngine() {
574    delete mEngine;
575}
Note: See TracBrowser for help on using the repository browser.