source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5203

Last change on this file since 5203 was 5203, checked in by nmedfort, 3 years ago

Fix for 32-bit architectures.

File size: 23.9 KB
RevLine 
[4324]1/*
[4947]2 *  Copyright (c) 2016 International Characters.
[4324]3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
[4946]7#include <grep_engine.h>
[4984]8#include <IDISA/idisa_builder.h>
9#include <IDISA/idisa_target.h>
[5033]10#include <llvm/Support/CommandLine.h>
[4984]11#include <re/re_toolchain.h>
[5033]12#include <re/re_cc.h>
13
[4984]14#include <pablo/pablo_toolchain.h>
[4946]15#include <toolchain.h>
16#include <pablo/pablo_compiler.h>
17#include <kernels/pipeline.h>
18#include <llvm/IR/Function.h>
19#include <llvm/IR/Type.h>
20#include <llvm/IR/Module.h>
21#include <llvm/ExecutionEngine/MCJIT.h>
22#include <llvm/IRReader/IRReader.h>
23#include <llvm/Support/Debug.h>
24#include <llvm/IR/Verifier.h>
[5135]25#include <llvm/IR/TypeBuilder.h>
[4949]26#include <UCD/UnicodeNameData.h>
[4324]27
[5087]28
29#include <kernels/streamset.h>
30#include <kernels/scanmatchgen.h>
31#include <kernels/s2p_kernel.h>
[5142]32#include <kernels/cc_kernel.h>
[5087]33#include <kernels/pipeline.h>
34
35#include <pablo/function.h>
36#include <pablo/pablo_kernel.h>
37#include <pablo/pablo_toolchain.h>
38
39#include <llvm/IR/Intrinsics.h>
40#include "llvm/Support/SourceMgr.h"
41#include "llvm/IRReader/IRReader.h"
42#include "llvm/Linker/Linker.h"
[5176]43#include "llvm-c/Core.h"
[5087]44
[4324]45#include <fstream>
46#include <sstream>
47#include <iostream>
48#include <string>
49#include <stdint.h>
50
51#include <stdio.h>
52#include <stdlib.h>
53#include <unistd.h>
54#include <errno.h>
55#include <sys/types.h>
56#include <sys/stat.h>
[4430]57#include <stdexcept>
[4802]58#include <cctype>
[4324]59
60
[4788]61#include <llvm/Support/raw_os_ostream.h>
62
[4324]63// mmap system
[4788]64#include <boost/filesystem.hpp>
[4778]65#include <boost/iostreams/device/mapped_file.hpp>
[4974]66
[4324]67#include <fcntl.h>
68
[4946]69#include <kernels/kernel.h>
[4324]70
[5151]71#ifdef CUDA_ENABLED
72#include <IDISA/CudaDriver.h>
73#endif
74
[5033]75static cl::OptionCategory bGrepOutputOptions("Output Options",
76                                             "These options control the output.");
[5176]77static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]78
[5176]79static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
80
[5033]81static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
[4324]82
[5033]83static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
84static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
85
86static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
87static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
88
[5135]89static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5033]90
[5165]91static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
[5135]92
[5045]93bool isUTF_16 = false;
[5151]94std::string IRFilename = "icgrep.ll";
95std::string PTXFilename = "icgrep.ptx";
[5033]96
[5106]97void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
[5101]98    boost::filesystem::path file(fileName);
[4788]99    if (exists(file)) {
100        if (is_directory(file)) {
[4969]101            return;
[4788]102        }
103    } else {
[5176]104        if (!SilenceFileErrors) {
105            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
106            return;
107        }
[4788]108    }
109
[5037]110    const auto fileSize = file_size(file);
[5001]111    if (fileSize > 0) {
[4883]112        try {
[5101]113            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
[5037]114            char * fileBuffer = const_cast<char *>(source.data());
[5151]115#ifdef CUDA_ENABLED 
116            if(codegen::NVPTX){
117                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
118                if (CountOnly){
119                    exit(0);
120                }
121                else{
122                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
123                    return;
124                }
125               
126            } 
127#endif
[5037]128            if (CountOnly) {
[5048]129                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
[5037]130            } else {
[5048]131                mGrepFunction(fileBuffer, fileSize, fileIdx);
[5037]132            }
133            source.close();
134        } catch (std::exception & e) {
[5176]135            if (!SilenceFileErrors) {
136                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
137                return;
138            }
[4883]139        }
[5037]140    } else {
[5151]141#ifdef CUDA_ENABLED
142        if (codegen::NVPTX){
143            std::cout << 0 << std::endl;
144            exit(0);
145        }
146#endif
[5048]147        if (CountOnly) {
[5106]148            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
[5037]149        } else {
[5048]150            mGrepFunction(nullptr, 0, fileIdx);
[5037]151        }
[5021]152    }
[4949]153}
154
[5100]155using namespace parabix;
[4946]156
[5151]157Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
158    Type * const int64ty = iBuilder->getInt64Ty();
159    Type * const inputType = PointerType::get(int64ty, 1);
160    Type * const resultTy = iBuilder->getVoidTy();
161    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
162    kernelFunc->setCallingConv(CallingConv::C);
163    Function::arg_iterator args = kernelFunc->arg_begin();
164
165    Value * const inputPtr = &*(args++);
166    inputPtr->setName("inputPtr");
167    Value * const bufferSizePtr = &*(args++);
168    bufferSizePtr->setName("bufferSizePtr");
169    Value * const outputPtr = &*(args++);
170    outputPtr->setName("resultPtr");
171
172    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
173    iBuilder->SetInsertPoint(entryBlock);
174
175    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
176    Value * id = iBuilder->CreateCall(tidFunc);
177
178    Function * mainFunc = m->getFunction("Main");
[5200]179    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
180    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
181    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
182
[5151]183    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
184    if (CountOnly){
185        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
186        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
187        iBuilder->CreateStore(result, outputThreadPtr);
188    }
189    else {
190        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
[5200]191        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
192        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
[5151]193        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
194    }   
195
196    iBuilder->CreateRetVoid();
197    return kernelFunc;
198}
199
200Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool isNameExpression){
201    Type * const size_ty = iBuilder->getSizeTy();
202    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
203    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
204    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
205    mainCPUFn->setCallingConv(CallingConv::C);
206    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
207    Function::arg_iterator args = mainCPUFn->arg_begin();
[5135]208   
[5151]209    Value * const rsltStream = &*(args++);
210    rsltStream->setName("rslt");
211    Value * const inputStream = &*(args++);
212    inputStream->setName("input");
213    Value * const fileSize = &*(args++);
214    fileSize->setName("fileSize");
215    Value * const fileIdx = &*(args++);
216    fileIdx->setName("fileIdx");
[4946]217
[5202]218    ExternalFileBuffer MatchResults(iBuilder, StreamSetType(iBuilder, 2, 1));
[5151]219    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
220
221    kernel::scanMatchKernel scanMatchK(iBuilder, isNameExpression);
222    scanMatchK.generateKernel({&MatchResults}, {});
223           
224    Value * scanMatchInstance = scanMatchK.createInstance({inputStream, fileSize, fileIdx});
225   
226    generatePipelineLoop(iBuilder, {&scanMatchK}, {scanMatchInstance}, fileSize);
227    iBuilder->CreateRetVoid();
228
229    return mainCPUFn;
230}
231
232void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, bool isNameExpression) {
233    isUTF_16 = UTF_16;
234    int addrSpace = 0;
235    bool CPU_Only = true;
[5200]236    Module * M = nullptr; 
237    IDISA::IDISA_Builder * iBuilder = nullptr; 
[5151]238
239#ifdef CUDA_ENABLED
240    setNVPTXOption(); 
[5202]241    if (codegen::NVPTX) {
242        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
[5151]243        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
244        M = gpuM;
245        iBuilder = GPUBuilder;
246        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
247        M->setTargetTriple("nvptx64-nvidia-cuda");
248        addrSpace = 1;
249        CPU_Only = false;
[5200]250        codegen::BlockSize = 64;
[5202]251    }
[5151]252#endif
253
[5202]254    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
255    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
[5200]256
257    if(CPU_Only) {
258        M = cpuM;
259        iBuilder = CPUBuilder;
260    }
261
[5135]262    const unsigned segmentSize = codegen::SegmentSize;
[5202]263    if (segmentPipelineParallel && codegen::BufferSegments < 2) {
264        codegen::BufferSegments = 2;
265    }
[5135]266    const unsigned bufferSegments = codegen::BufferSegments;
[5033]267
[5165]268
[5137]269    unsigned encodingBits = UTF_16 ? 16 : 8;
[5033]270
[5135]271    mIsNameExpression = isNameExpression;
272
273    Type * const int32ty = iBuilder->getInt32Ty();
[5203]274    Type * const int64ty = iBuilder->getInt64Ty();
[5135]275    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
276    Type * const voidTy = Type::getVoidTy(M->getContext());   
277    Type * const voidPtrTy = TypeBuilder<void *, false>::get(M->getContext());
[5151]278    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), (UTF_16 ? 16 : 8)), 1), addrSpace);
[5203]279    Type * const resultTy = CountOnly ? int64ty : iBuilder->getVoidTy();
[5151]280
281    Function * mainFn = nullptr;
282    Value * inputStream = nullptr;
283    Value * fileSize = nullptr;
284    Value * fileIdx = nullptr;
285
286#ifdef CUDA_ENABLED   
287    Value * outputStream = nullptr;
288    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
289    if (codegen::NVPTX){
290        if (CountOnly){
291            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
292            mainFn->setCallingConv(CallingConv::C);
293            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
294            Function::arg_iterator args = mainFn->arg_begin();
295           
296            inputStream = &*(args++);
297            inputStream->setName("input");
298            fileSize = &*(args++);
299            fileSize->setName("fileSize");
[5202]300        } else {
[5151]301            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
302            mainFn->setCallingConv(CallingConv::C);
303            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
304            Function::arg_iterator args = mainFn->arg_begin();
305           
306            inputStream = &*(args++);
307            inputStream->setName("input");
308            fileSize = &*(args++);
309            fileSize->setName("fileSize");
310            outputStream = &*(args++);
311            outputStream->setName("output");
312        }
313    } 
314#endif
315    if (CPU_Only){
[5203]316        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, int64ty, int64ty, nullptr));
[5151]317        mainFn->setCallingConv(CallingConv::C);
318        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
319        Function::arg_iterator args = mainFn->arg_begin();
320       
321        inputStream = &*(args++);
322        inputStream->setName("input");
323        fileSize = &*(args++);
324        fileSize->setName("fileSize");
325        fileIdx = &*(args++);
326        fileIdx->setName("fileIdx");
327    }
[5135]328       
[5202]329    ExternalFileBuffer ByteStream(iBuilder, StreamSetType(iBuilder, 1, 8));
330    CircularBuffer BasisBits(iBuilder, StreamSetType(iBuilder, 8, 1), segmentSize * bufferSegments);
[5135]331
332    kernel::s2pKernel  s2pk(iBuilder);
333    s2pk.generateKernel({&ByteStream}, {&BasisBits});
[5142]334   
335    re_ast = re::regular_expression_passes(re_ast);
[5137]336    pablo::PabloFunction * function = re::re2pablo_compiler(encodingBits, re_ast, CountOnly);
[5135]337    pablo_function_passes(function);
338
[5142]339    ByteStream.setStreamSetBuffer(inputStream, fileSize);
[5135]340    BasisBits.allocateBuffer();
341
342    Value * s2pInstance = s2pk.createInstance({});
343 
[5203]344    Type * pthreadTy = int64ty;
[5135]345    FunctionType * funVoidPtrVoidTy = FunctionType::get(voidTy, int8PtrTy, false);   
346   
347    Function * pthreadCreateFunc = cast<Function>(M->getOrInsertFunction("pthread_create",
348                                        int32ty, 
349                                        pthreadTy->getPointerTo(), 
350                                        voidPtrTy, 
351                                        static_cast<Type *>(funVoidPtrVoidTy)->getPointerTo(),
352                                        voidPtrTy, nullptr));
353    pthreadCreateFunc->setCallingConv(llvm::CallingConv::C);
354    Function * pthreadJoinFunc = cast<Function>(M->getOrInsertFunction("pthread_join", 
355                                        int32ty, 
356                                        pthreadTy, 
357                                        PointerType::get(int8PtrTy, 0), nullptr));
358    pthreadJoinFunc->setCallingConv(llvm::CallingConv::C);
359
360    Function * pthreadExitFunc = cast<Function>(M->getOrInsertFunction("pthread_exit", 
361                                        voidTy, 
362                                        voidPtrTy, nullptr));
363    pthreadExitFunc->addFnAttr(llvm::Attribute::NoReturn);
364    pthreadExitFunc->setCallingConv(llvm::CallingConv::C);
365
366    if (CountOnly) {
[5202]367        pablo::PabloKernel icgrepK(iBuilder, "icgrep", function);
[5135]368        icgrepK.generateKernel({&BasisBits}, {});       
369        Value * icgrepInstance = icgrepK.createInstance({});
370        if (pipelineParallel){
371            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance});
[5202]372        } else if (segmentPipelineParallel){
[5165]373            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
[5202]374        } else {
[5135]375            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
376        }
[5202]377
[5135]378        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepInstance, "matchedLineCount");
[5202]379
[5135]380        iBuilder->CreateRet(matchCount);
381
[5202]382    } else {
[5151]383#ifdef CUDA_ENABLED
384        if (codegen::NVPTX){
[5202]385            ExternalFileBuffer MatchResults(iBuilder, StreamSetType(iBuilder,2, i1), addrSpace);
[5151]386            MatchResults.setStreamSetBuffer(outputStream, fileSize);
[5135]387
[5151]388            pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {});
389            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
390            Value * icgrepInstance = icgrepK.createInstance({});
[5135]391
[5151]392            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
[5135]393
394        }
[5151]395#endif
[5202]396        if (CPU_Only) {
397            CircularBuffer MatchResults(iBuilder, StreamSetType(iBuilder, 2, 1), segmentSize * bufferSegments);
[5151]398            MatchResults.allocateBuffer();
399
[5202]400            pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function);
401            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
[5151]402            Value * icgrepInstance = icgrepK.createInstance({});
403
404            kernel::scanMatchKernel scanMatchK(iBuilder, mIsNameExpression);
405            scanMatchK.generateKernel({&MatchResults}, {});               
406            Value * scanMatchInstance = scanMatchK.createInstance({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
407
408            if (pipelineParallel){
409                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance});
[5202]410            } else if (segmentPipelineParallel){
[5165]411                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
[5202]412            }  else{
[5151]413                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
414            }
[5135]415        }
416
417        iBuilder->CreateRetVoid();
418
419    }
[5151]420
421#ifdef CUDA_ENABLED
422    Function * mainCPUFn = nullptr;
423    if(codegen::NVPTX){
424        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
425        MDNode * Node = MDNode::get(M->getContext(),
426                                    {llvm::ValueAsMetadata::get(kernelFunction),
427                                     MDString::get(M->getContext(), "kernel"), 
428                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
429        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
430        NMD->addOperand(Node);
431   
432        Compile2PTX(M, IRFilename, PTXFilename);
433        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mIsNameExpression);
434        if (CountOnly) return;
435    }
436#endif
437   
[5135]438     
[5151]439    mEngine = JIT_to_ExecutionEngine(cpuM);
[5135]440    ApplyObjectCache(mEngine);
[5151]441    icgrep_Linking(cpuM, mEngine);
[5135]442
443#ifndef NDEBUG
444    verifyModule(*M, &dbgs());
445#endif
446
447    mEngine->finalizeObject();
448    delete iBuilder;
449   
450    if (CountOnly) {
451        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
452    } else {
[5151]453#ifdef CUDA_ENABLED
454        if(codegen::NVPTX){
455            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
456        }
457#endif
458        if (CPU_Only) {
459            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
460        }
[5135]461    }
462
463}
464
[4947]465re::CC *  GrepEngine::grepCodepoints() {
[4974]466
[4946]467    setParsedCodePointSet();
[4967]468    char * mFileBuffer = getUnicodeNameDataPtr();
[4969]469    size_t mFileSize = getUnicodeNameDataSize();
[4967]470
[5048]471    mGrepFunction(mFileBuffer, mFileSize, 0);
[4967]472
[4946]473    return getParsedCodePointSet();
474}
[4968]475
476GrepEngine::~GrepEngine() {
[5176]477//    delete mEngine;
[4968]478}
[5033]479
480static int * total_count;
481static std::stringstream * resultStrs = nullptr;
482static std::vector<std::string> inputFiles;
483
484void initResult(std::vector<std::string> filenames){
485    const int n = filenames.size();
486    if (n > 1) {
487        ShowFileNames = true;
488    }
489    inputFiles = filenames;
490    resultStrs = new std::stringstream[n];
491    total_count = new int[n];
[5037]492    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]493        total_count[i] = 0;
494    }
495   
496}
497
498extern "C" {
[5106]499    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
[5048]500        int index = isUTF_16 ? 2 : 1;
501        int idx = fileIdx;
502         
[5033]503        if (ShowFileNames) {
504            resultStrs[idx] << inputFiles[idx] << ':';
505        }
506        if (ShowLineNumbers) {
507            resultStrs[idx] << lineNum << ":";
508        }
509       
[5045]510        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
[5033]511            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
512            line_start++;
513        }
[5045]514        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
515            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
516            line_start += 2;
517        }
[5033]518        if (line_end == filesize) {
519            // The match position is at end-of-file.   We have a final unterminated line.
[5045]520            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]521            if (NormalizeLineBreaks) {
522                resultStrs[idx] << '\n';  // terminate it
523            }
524            return;
525        }
526        unsigned char end_byte = (unsigned char)buffer[line_end]; 
[5048]527        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
[5033]528        if (NormalizeLineBreaks) {
529            if (end_byte == 0x85) {
530                // Line terminated with NEL, on the second byte.  Back up 1.
531                line_end--;
532            } else if (end_byte > 0xD) {
533                // Line terminated with PS or LS, on the third byte.  Back up 2.
[5045]534                isUTF_16 ? line_end-- : line_end -= 2;
[5033]535            }
[5045]536            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
[5033]537            resultStrs[idx] << '\n';
538        }
[5048]539        else {   
[5045]540            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
[5033]541                // Check for line_end on first byte of CRLF;  note that we don't
542                // want to access past the end of buffer.
[5048]543                if (line_end + 1 < filesize) {
544                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
545                        // Found CRLF; preserve both bytes.
546                        line_end++;
547                    }
548                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
549                        // Found CRLF; preserve both bytes.
550                        line_end += 2;
551                    }
552                }
[5033]553            }
[5045]554            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
[5033]555        }
556    }
557}
558
[5106]559void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
[5176]560   
[5033]561    if(CountOnly){
562        if (!ShowFileNames) {
[5037]563            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]564                std::cout << total_CountOnly[i] << std::endl;
565            }
566        }
567        else {
[5037]568            for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]569                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
570            };
571        }
572        return;
573    }
574   
[5037]575    for (unsigned i = 0; i < inputFiles.size(); ++i){
[5033]576        std::cout << resultStrs[i].str();
577    }
578}
579
580re::CC * parsedCodePointSet;
581
582extern "C" {
[5106]583    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
[5033]584        re::codepoint_t c = 0;
585        ssize_t line_pos = line_start;
586        while (isxdigit(buffer[line_pos])) {
587            if (isdigit(buffer[line_pos])) {
588                c = (c << 4) | (buffer[line_pos] - '0');
589            }
590            else {
591                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
592            }
593            line_pos++;
594        }
595        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
596        parsedCodePointSet->insert(c);
597    }
598}
599
600void setParsedCodePointSet(){
601    parsedCodePointSet = re::makeCC();
602}
603
604re::CC * getParsedCodePointSet(){
605    return parsedCodePointSet;
606}
607
608
609void icgrep_Linking(Module * m, ExecutionEngine * e) {
610    Module::FunctionListType & fns = m->getFunctionList();
611    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
612        std::string fnName = it->getName().str();
613        if (fnName == "s2p_block") continue;
614        if (fnName == "process_block") continue;
615        if (fnName == "process_block_initialize_carries") continue;
616       
617        if (fnName == "wrapped_report_match") {
618            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
619        }
620        if (fnName == "insert_codepoints") {
621            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
622        }
623#ifndef DISABLE_PREGENERATED_UCD_FUNCTIONS
624        else {
625            const UCD::ExternalProperty & ep = UCD::resolveExternalProperty(fnName);
626            e->addGlobalMapping(cast<GlobalValue>(it), std::get<0>(ep));
627        }
628#endif
629    }
630}
631
Note: See TracBrowser for help on using the repository browser.