source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5239

Last change on this file since 5239 was 5238, checked in by cameron, 2 years ago

IR_Gen subdirectory for all IR generation utility functions

File size: 23.3 KB
RevLine 
[4324]1/*
[4947]2 *  Copyright (c) 2016 International Characters.
[4324]3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
[5234]7#include "grep_engine.h"
[4946]8#include <llvm/ExecutionEngine/MCJIT.h>
[5234]9#include <llvm/IR/Verifier.h>
[4946]10#include <llvm/IRReader/IRReader.h>
[5234]11#include <llvm/Support/CommandLine.h>
[4946]12#include <llvm/Support/Debug.h>
[5234]13#include <boost/filesystem.hpp>
14#include <boost/iostreams/device/mapped_file.hpp>
[5238]15#include <IR_Gen/idisa_builder.h>
16#include <IR_Gen/idisa_target.h>
[4949]17#include <UCD/UnicodeNameData.h>
[5206]18#include <UCD/resolve_properties.h>
[5142]19#include <kernels/cc_kernel.h>
[5234]20#include <kernels/kernel.h>
[5087]21#include <kernels/pipeline.h>
[5234]22#include <kernels/pipeline.h>
23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <pablo/pablo_compiler.h>
[5087]27#include <pablo/pablo_kernel.h>
28#include <pablo/pablo_toolchain.h>
[5234]29#include <pablo/pablo_toolchain.h>
30#include <re/re_cc.h>
31#include <re/re_toolchain.h>
32#include <toolchain.h>
33#include <iostream>
[4324]34#include <sstream>
[5151]35#ifdef CUDA_ENABLED
[5238]36#include <IR_Gen/CudaDriver.h>
[5151]37#endif
[5236]38#include <util/aligned_allocator.h>
[5151]39
[5033]40static cl::OptionCategory bGrepOutputOptions("Output Options",
41                                             "These options control the output.");
[5176]42static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]43
[5176]44static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
45
[5033]46static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]47
[5033]48static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
49static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
50
51static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
52static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
53
[5135]54static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5033]55
[5165]56static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5135]57
[5045]58bool isUTF_16 = false;
[5151]59std::string IRFilename = "icgrep.ll";
60std::string PTXFilename = "icgrep.ptx";
[5033]61
[5106]62void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
[5101]63    boost::filesystem::path file(fileName);
[4788]64    if (exists(file)) {
65        if (is_directory(file)) {
[4969]66            return;
[4788]67        }
68    } else {
[5176]69        if (!SilenceFileErrors) {
70            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
71            return;
72        }
[4788]73    }
74
[5037]75    const auto fileSize = file_size(file);
[5001]76    if (fileSize > 0) {
[4883]77        try {
[5101]78            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
[5037]79            char * fileBuffer = const_cast<char *>(source.data());
[5151]80#ifdef CUDA_ENABLED 
81            if(codegen::NVPTX){
82                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
83                if (CountOnly){
84                    exit(0);
85                }
86                else{
87                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
88                    return;
89                }
90               
91            } 
92#endif
[5037]93            if (CountOnly) {
[5048]94                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
[5037]95            } else {
[5048]96                mGrepFunction(fileBuffer, fileSize, fileIdx);
[5037]97            }
98            source.close();
99        } catch (std::exception & e) {
[5176]100            if (!SilenceFileErrors) {
101                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
102                return;
103            }
[4883]104        }
[5037]105    } else {
[5151]106#ifdef CUDA_ENABLED
107        if (codegen::NVPTX){
108            std::cout << 0 << std::endl;
109            exit(0);
110        }
111#endif
[5048]112        if (CountOnly) {
[5106]113            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
[5037]114        } else {
[5048]115            mGrepFunction(nullptr, 0, fileIdx);
[5037]116        }
[5021]117    }
[4949]118}
119
[5100]120using namespace parabix;
[4946]121
[5151]122Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
123    Type * const int64ty = iBuilder->getInt64Ty();
124    Type * const inputType = PointerType::get(int64ty, 1);
125    Type * const resultTy = iBuilder->getVoidTy();
126    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
127    kernelFunc->setCallingConv(CallingConv::C);
128    Function::arg_iterator args = kernelFunc->arg_begin();
129
130    Value * const inputPtr = &*(args++);
131    inputPtr->setName("inputPtr");
132    Value * const bufferSizePtr = &*(args++);
133    bufferSizePtr->setName("bufferSizePtr");
134    Value * const outputPtr = &*(args++);
135    outputPtr->setName("resultPtr");
136
137    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
138    iBuilder->SetInsertPoint(entryBlock);
139
140    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
141    Value * id = iBuilder->CreateCall(tidFunc);
142
143    Function * mainFunc = m->getFunction("Main");
[5200]144    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
145    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
146    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
147
[5151]148    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
149    if (CountOnly){
150        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
151        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
152        iBuilder->CreateStore(result, outputThreadPtr);
153    }
154    else {
155        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
[5200]156        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
157        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
[5151]158        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
159    }   
160
161    iBuilder->CreateRetVoid();
162    return kernelFunc;
163}
164
[5206]165Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
[5151]166    Type * const size_ty = iBuilder->getSizeTy();
167    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
168    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
169    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
170    mainCPUFn->setCallingConv(CallingConv::C);
171    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
172    Function::arg_iterator args = mainCPUFn->arg_begin();
[5135]173   
[5151]174    Value * const rsltStream = &*(args++);
175    rsltStream->setName("rslt");
176    Value * const inputStream = &*(args++);
177    inputStream->setName("input");
178    Value * const fileSize = &*(args++);
179    fileSize->setName("fileSize");
180    Value * const fileIdx = &*(args++);
181    fileIdx->setName("fileIdx");
[4946]182
[5217]183    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1));
[5151]184    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
185
[5206]186    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
[5151]187    scanMatchK.generateKernel({&MatchResults}, {});
188           
[5220]189    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
[5151]190   
[5221]191    generatePipelineLoop(iBuilder, {&scanMatchK});
[5151]192    iBuilder->CreateRetVoid();
193
194    return mainCPUFn;
195}
196
[5206]197void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
[5151]198    isUTF_16 = UTF_16;
199    int addrSpace = 0;
200    bool CPU_Only = true;
[5200]201    Module * M = nullptr; 
202    IDISA::IDISA_Builder * iBuilder = nullptr; 
[5151]203
204#ifdef CUDA_ENABLED
205    setNVPTXOption(); 
[5202]206    if (codegen::NVPTX) {
207        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
[5151]208        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
209        M = gpuM;
210        iBuilder = GPUBuilder;
211        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
212        M->setTargetTriple("nvptx64-nvidia-cuda");
213        addrSpace = 1;
214        CPU_Only = false;
[5200]215        codegen::BlockSize = 64;
[5202]216    }
[5151]217#endif
218
[5202]219    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
220    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
[5200]221
[5204]222    if (CPU_Only) {
[5200]223        M = cpuM;
224        iBuilder = CPUBuilder;
225    }
226
[5135]227    const unsigned segmentSize = codegen::SegmentSize;
[5202]228    if (segmentPipelineParallel && codegen::BufferSegments < 2) {
229        codegen::BufferSegments = 2;
230    }
[5135]231    const unsigned bufferSegments = codegen::BufferSegments;
[5033]232
[5165]233
[5137]234    unsigned encodingBits = UTF_16 ? 16 : 8;
[5033]235
[5206]236    mGrepType = grepType;
[5135]237
238    Type * const int32ty = iBuilder->getInt32Ty();
[5204]239    Type * const size_ty = iBuilder->getSizeTy();
[5135]240    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
[5227]241    Type * const voidTy = iBuilder->getVoidTy();
242    Type * const voidPtrTy = iBuilder->getVoidPtrTy();
[5151]243    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), (UTF_16 ? 16 : 8)), 1), addrSpace);
[5204]244    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
[5151]245
246    Function * mainFn = nullptr;
247    Value * inputStream = nullptr;
248    Value * fileSize = nullptr;
249    Value * fileIdx = nullptr;
250
251#ifdef CUDA_ENABLED   
252    Value * outputStream = nullptr;
253    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
254    if (codegen::NVPTX){
255        if (CountOnly){
256            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
257            mainFn->setCallingConv(CallingConv::C);
258            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
259            Function::arg_iterator args = mainFn->arg_begin();
260           
261            inputStream = &*(args++);
262            inputStream->setName("input");
263            fileSize = &*(args++);
264            fileSize->setName("fileSize");
[5202]265        } else {
[5151]266            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
267            mainFn->setCallingConv(CallingConv::C);
268            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
269            Function::arg_iterator args = mainFn->arg_begin();
270           
271            inputStream = &*(args++);
272            inputStream->setName("input");
273            fileSize = &*(args++);
274            fileSize->setName("fileSize");
275            outputStream = &*(args++);
276            outputStream->setName("output");
277        }
278    } 
279#endif
280    if (CPU_Only){
[5204]281        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
[5151]282        mainFn->setCallingConv(CallingConv::C);
283        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
284        Function::arg_iterator args = mainFn->arg_begin();
285       
286        inputStream = &*(args++);
287        inputStream->setName("input");
288        fileSize = &*(args++);
289        fileSize->setName("fileSize");
290        fileIdx = &*(args++);
291        fileIdx->setName("fileIdx");
292    }
[5135]293       
[5217]294    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
295    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8, 1), segmentSize * bufferSegments);
[5135]296
[5230]297    kernel::S2PKernel  s2pk(iBuilder);
[5135]298    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5142]299   
[5217]300    pablo::PabloKernel icgrepK(iBuilder, "icgrep");
301
[5142]302    re_ast = re::regular_expression_passes(re_ast);
[5217]303    re::re2pablo_compiler(&icgrepK, encodingBits, re_ast, CountOnly);
304    pablo_function_passes(&icgrepK);
[5135]305
[5217]306
307
[5142]308    ByteStream.setStreamSetBuffer(inputStream, fileSize);
[5135]309    BasisBits.allocateBuffer();
310
[5204]311    Type * pthreadTy = size_ty;
[5135]312    FunctionType * funVoidPtrVoidTy = FunctionType::get(voidTy, int8PtrTy, false);   
313   
314    Function * pthreadCreateFunc = cast<Function>(M->getOrInsertFunction("pthread_create",
315                                        int32ty, 
316                                        pthreadTy->getPointerTo(), 
317                                        voidPtrTy, 
318                                        static_cast<Type *>(funVoidPtrVoidTy)->getPointerTo(),
319                                        voidPtrTy, nullptr));
320    pthreadCreateFunc->setCallingConv(llvm::CallingConv::C);
321    Function * pthreadJoinFunc = cast<Function>(M->getOrInsertFunction("pthread_join", 
322                                        int32ty, 
323                                        pthreadTy, 
324                                        PointerType::get(int8PtrTy, 0), nullptr));
325    pthreadJoinFunc->setCallingConv(llvm::CallingConv::C);
326
327    Function * pthreadExitFunc = cast<Function>(M->getOrInsertFunction("pthread_exit", 
328                                        voidTy, 
329                                        voidPtrTy, nullptr));
330    pthreadExitFunc->addFnAttr(llvm::Attribute::NoReturn);
331    pthreadExitFunc->setCallingConv(llvm::CallingConv::C);
332
[5217]333    if (CountOnly) {       
[5135]334        icgrepK.generateKernel({&BasisBits}, {});       
335        if (pipelineParallel){
[5220]336            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK});
[5202]337        } else if (segmentPipelineParallel){
[5221]338            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK});
[5202]339        } else {
[5221]340            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK});
[5135]341        }
[5202]342
[5220]343        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount");
[5202]344
[5135]345        iBuilder->CreateRet(matchCount);
346
[5202]347    } else {
[5151]348#ifdef CUDA_ENABLED
349        if (codegen::NVPTX){
[5217]350            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, i1), addrSpace);
[5151]351            MatchResults.setStreamSetBuffer(outputStream, fileSize);
[5135]352
[5151]353            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
[5221]354            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK});
[5135]355
356        }
[5151]357#endif
[5202]358        if (CPU_Only) {
[5217]359            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1), segmentSize * bufferSegments);
[5151]360            MatchResults.allocateBuffer();
361
[5202]362            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
[5151]363
[5206]364            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
[5151]365            scanMatchK.generateKernel({&MatchResults}, {});               
[5220]366            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
[5151]367
368            if (pipelineParallel){
[5220]369                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
[5202]370            } else if (segmentPipelineParallel){
[5221]371                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
[5202]372            }  else{
[5221]373                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
[5151]374            }
[5135]375        }
376
377        iBuilder->CreateRetVoid();
378
379    }
[5151]380
381#ifdef CUDA_ENABLED
382    Function * mainCPUFn = nullptr;
383    if(codegen::NVPTX){
384        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
385        MDNode * Node = MDNode::get(M->getContext(),
386                                    {llvm::ValueAsMetadata::get(kernelFunction),
387                                     MDString::get(M->getContext(), "kernel"), 
388                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
389        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
390        NMD->addOperand(Node);
391   
392        Compile2PTX(M, IRFilename, PTXFilename);
[5206]393        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
[5151]394        if (CountOnly) return;
395    }
396#endif
397   
[5135]398     
[5151]399    mEngine = JIT_to_ExecutionEngine(cpuM);
[5135]400    ApplyObjectCache(mEngine);
[5151]401    icgrep_Linking(cpuM, mEngine);
[5135]402
403#ifndef NDEBUG
404    verifyModule(*M, &dbgs());
405#endif
406
407    mEngine->finalizeObject();
408    delete iBuilder;
409   
410    if (CountOnly) {
411        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
412    } else {
[5151]413#ifdef CUDA_ENABLED
414        if(codegen::NVPTX){
415            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
416        }
417#endif
418        if (CPU_Only) {
419            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
420        }
[5135]421    }
422
423}
424
[4947]425re::CC *  GrepEngine::grepCodepoints() {
[4974]426
[4946]427    setParsedCodePointSet();
[4967]428    char * mFileBuffer = getUnicodeNameDataPtr();
[4969]429    size_t mFileSize = getUnicodeNameDataSize();
[4967]430
[5048]431    mGrepFunction(mFileBuffer, mFileSize, 0);
[4967]432
[4946]433    return getParsedCodePointSet();
434}
[4968]435
[5206]436const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
[5236]437    AlignedAllocator<char, 32> alloc;
[5206]438    setParsedPropertyValues();
[5236]439    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
440    char * aligned = alloc.allocate(str.length() + 1, 0);
441    std::memcpy(aligned, str.data(), str.length());
442    aligned[str.length()] = '\0';
443    mGrepFunction(aligned, str.length(), 0);
444    alloc.deallocate(aligned, 0);
[5234]445    return getParsedPropertyValues();
[5206]446}
447
[4968]448GrepEngine::~GrepEngine() {
[5176]449//    delete mEngine;
[4968]450}
[5033]451
452static int * total_count;
453static std::stringstream * resultStrs = nullptr;
454static std::vector<std::string> inputFiles;
455
456void initResult(std::vector<std::string> filenames){
457    const int n = filenames.size();
458    if (n > 1) {
459        ShowFileNames = true;
460    }
461    inputFiles = filenames;
462    resultStrs = new std::stringstream[n];
463    total_count = new int[n];
[5037]464    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]465        total_count[i] = 0;
466    }
467   
468}
469
470extern "C" {
[5106]471    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
[5048]472        int index = isUTF_16 ? 2 : 1;
473        int idx = fileIdx;
474         
[5033]475        if (ShowFileNames) {
476            resultStrs[idx] << inputFiles[idx] << ':';
477        }
478        if (ShowLineNumbers) {
479            resultStrs[idx] << lineNum << ":";
480        }
481       
[5045]482        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
[5033]483            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
484            line_start++;
485        }
[5045]486        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
487            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
488            line_start += 2;
489        }
[5033]490        if (line_end == filesize) {
491            // The match position is at end-of-file.   We have a final unterminated line.
[5045]492            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]493            if (NormalizeLineBreaks) {
494                resultStrs[idx] << '\n';  // terminate it
495            }
496            return;
497        }
498        unsigned char end_byte = (unsigned char)buffer[line_end]; 
[5048]499        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
[5033]500        if (NormalizeLineBreaks) {
501            if (end_byte == 0x85) {
502                // Line terminated with NEL, on the second byte.  Back up 1.
503                line_end--;
504            } else if (end_byte > 0xD) {
505                // Line terminated with PS or LS, on the third byte.  Back up 2.
[5045]506                isUTF_16 ? line_end-- : line_end -= 2;
[5033]507            }
[5045]508            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]509            resultStrs[idx] << '\n';
510        }
[5048]511        else {   
[5045]512            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
[5033]513                // Check for line_end on first byte of CRLF;  note that we don't
514                // want to access past the end of buffer.
[5048]515                if (line_end + 1 < filesize) {
516                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
517                        // Found CRLF; preserve both bytes.
518                        line_end++;
519                    }
520                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
521                        // Found CRLF; preserve both bytes.
522                        line_end += 2;
523                    }
524                }
[5033]525            }
[5045]526            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
[5033]527        }
528    }
529}
530
[5106]531void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
[5176]532   
[5033]533    if(CountOnly){
534        if (!ShowFileNames) {
[5037]535            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]536                std::cout << total_CountOnly[i] << std::endl;
537            }
538        }
539        else {
[5037]540            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]541                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
542            };
543        }
544        return;
545    }
546   
[5037]547    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]548        std::cout << resultStrs[i].str();
549    }
550}
551
552re::CC * parsedCodePointSet;
553
554extern "C" {
[5106]555    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5033]556        re::codepoint_t c = 0;
557        ssize_t line_pos = line_start;
558        while (isxdigit(buffer[line_pos])) {
559            if (isdigit(buffer[line_pos])) {
560                c = (c << 4) | (buffer[line_pos] - '0');
561            }
562            else {
563                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
564            }
565            line_pos++;
566        }
567        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
568        parsedCodePointSet->insert(c);
569    }
570}
571
572void setParsedCodePointSet(){
573    parsedCodePointSet = re::makeCC();
574}
575
576re::CC * getParsedCodePointSet(){
577    return parsedCodePointSet;
578}
579
580
[5234]581static std::vector<std::string> parsedPropertyValues;
[5206]582
583extern "C" {
584    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
585        auto result = std::string(buffer + line_start, buffer + line_end);
586        parsedPropertyValues.push_back(result);
587    }
588}
589
590inline void setParsedPropertyValues() {
591    parsedPropertyValues.clear();
592}
593
[5234]594inline const std::vector<std::string>& getParsedPropertyValues() {
[5206]595    return parsedPropertyValues;
596}
597
598
[5033]599void icgrep_Linking(Module * m, ExecutionEngine * e) {
600    Module::FunctionListType & fns = m->getFunctionList();
[5234]601    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
[5033]602        std::string fnName = it->getName().str();
603        if (fnName == "s2p_block") continue;
604        if (fnName == "process_block") continue;
605        if (fnName == "process_block_initialize_carries") continue;
606       
607        if (fnName == "wrapped_report_match") {
608            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
609        }
610        if (fnName == "insert_codepoints") {
611            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
612        }
[5206]613        if (fnName == "insert_property_values") {
614            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
615        }
[5033]616    }
617}
618
Note: See TracBrowser for help on using the repository browser.