source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5320

Last change on this file since 5320 was 5320, checked in by nmedfort, 2 years ago

memcpy/memset support for 32-bit systems; more error messages/handling; bug fix for ParabixCharacterClassKernelBuilder?. continued work on parenthesis matching + expandable buffers.

File size: 24.6 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "grep_engine.h"
8#include <llvm/IR/Module.h>
9#include <llvm/ExecutionEngine/MCJIT.h>
10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
16#include <UCD/UnicodeNameData.h>
17#include <UCD/resolve_properties.h>
18#include <kernels/cc_kernel.h>
19#include <kernels/pipeline.h>
20#include <kernels/mmap_kernel.h>
21#include <kernels/s2p_kernel.h>
22#include <kernels/scanmatchgen.h>
23#include <kernels/streamset.h>
24#include <pablo/pablo_compiler.h>
25#include <pablo/pablo_kernel.h>
26#include <pablo/pablo_toolchain.h>
27#include <re/re_cc.h>
28#include <re/re_toolchain.h>
29#include <toolchain.h>
30#include <iostream>
31#include <sstream>
32#ifdef CUDA_ENABLED
33#include <IR_Gen/CudaDriver.h>
34#include "preprocess.cpp"
35#endif
36#include <util/aligned_allocator.h>
37
38using namespace parabix;
39using namespace llvm;
40
41static cl::OptionCategory bGrepOutputOptions("Output Options",
42                                             "These options control the output.");
43static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
44
45static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
46
47static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
48
49static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
50static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
51
52static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
53static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
54
55static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
56
57static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
58
59bool isUTF_16 = false;
60std::string IRFilename = "icgrep.ll";
61std::string PTXFilename = "icgrep.ptx";
62
63static re::CC * parsedCodePointSet = nullptr;
64static std::vector<std::string> parsedPropertyValues;
65
66#ifdef CUDA_ENABLED
67int blockNo = 0;
68size_t * startPoints = nullptr;
69size_t * accumBytes = nullptr;
70#endif
71
72void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
73    boost::filesystem::path file(fileName);
74    if (exists(file)) {
75        if (is_directory(file)) {
76            return;
77        }
78    } else {
79        if (!SilenceFileErrors) {
80            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
81            return;
82        }
83    }
84
85    const auto fileSize = file_size(file);
86    if (fileSize > 0) {
87        try {
88            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
89            char * fileBuffer = const_cast<char *>(source.data());
90           
91#ifdef CUDA_ENABLED 
92            if(codegen::NVPTX){
93                codegen::BlockSize = 128;
94                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize);
95
96                const unsigned numOfGroups = codegen::GroupNum;
97                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
98                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
99                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
100                    exit(-1);
101                }
102
103                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
104                if (CountOnly){
105                    exit(0);
106                }
107                else{
108                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
109                    mGrepFunction_CPU((char *)rslt, fileBuffer, intputSize, fileIdx);
110                    return;
111                }
112               
113            } 
114#endif
115            if (CountOnly) {
116                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
117            } else {
118                mGrepFunction(fileBuffer, fileSize, fileIdx);
119            }
120            source.close();
121        } catch (std::exception & e) {
122            if (!SilenceFileErrors) {
123                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
124                return;
125            }
126        }
127    } else {
128#ifdef CUDA_ENABLED
129        if (codegen::NVPTX){
130            std::cout << 0 << std::endl;
131            exit(0);
132        }
133#endif
134        if (CountOnly) {
135            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
136        } else {
137            mGrepFunction(nullptr, 0, fileIdx);
138        }
139    }
140}
141
142
143Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
144    Type * const int64ty = iBuilder->getInt64Ty();
145    Type * const size_ty = iBuilder->getSizeTy();
146    Type * const int32ty = iBuilder->getInt32Ty();
147    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
148    Type * const int64tyPtr = PointerType::get(int64ty, 1);
149    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
150    Type * const resultTy = iBuilder->getVoidTy();
151    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
152    kernelFunc->setCallingConv(CallingConv::C);
153    Function::arg_iterator args = kernelFunc->arg_begin();
154
155    Value * const inputPtr = &*(args++);
156    inputPtr->setName("inputPtr");
157    Value * const startPointsPtr = &*(args++);
158    startPointsPtr->setName("startPointsPtr");
159    Value * const bufferSizesPtr = &*(args++);
160    bufferSizesPtr->setName("bufferSizesPtr");
161    Value * const outputPtr = &*(args++);
162    outputPtr->setName("resultPtr");
163
164    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
165    iBuilder->SetInsertPoint(entryBlock);
166
167    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
168    Value * tid = iBuilder->CreateCall(tidFunc);
169    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
170    Value * bid = iBuilder->CreateCall(bidFunc);
171
172    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
173
174    Function * mainFunc = m->getFunction("Main");
175    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
176    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
177    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
178    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
179    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
180
181    if (CountOnly){
182        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
183        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
184        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
185        iBuilder->CreateStore(result, outputThreadPtr);
186    }
187    else {
188        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
189        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
190        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
191        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
192    }   
193
194    iBuilder->CreateRetVoid();
195    return kernelFunc;
196}
197
198Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
199    Type * const size_ty = iBuilder->getSizeTy();
200    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
201    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
202    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
203    mainCPUFn->setCallingConv(CallingConv::C);
204    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
205    Function::arg_iterator args = mainCPUFn->arg_begin();
206   
207    Value * const rsltStream = &*(args++);
208    rsltStream->setName("rslt");
209    Value * const inputStream = &*(args++);
210    inputStream->setName("input");
211    Value * const fileSize = &*(args++);
212    fileSize->setName("fileSize");
213    Value * const fileIdx = &*(args++);
214    fileIdx->setName("fileIdx");
215
216    const unsigned segmentSize = codegen::SegmentSize;
217
218    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1));
219    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
220
221    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
222    mmapK.generateKernel({}, {&MatchResults});
223    mmapK.setInitialArguments({fileSize});
224
225
226
227    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
228    scanMatchK.generateKernel({&MatchResults}, {});
229           
230    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
231   
232    generatePipelineLoop(iBuilder, {&mmapK, &scanMatchK});
233    iBuilder->CreateRetVoid();
234
235    return mainCPUFn;
236}
237
238void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
239    isUTF_16 = UTF_16;
240    int addrSpace = 0;
241    bool CPU_Only = true;
242    Module * M = nullptr; 
243    IDISA::IDISA_Builder * iBuilder = nullptr; 
244
245#ifdef CUDA_ENABLED
246    setNVPTXOption(); 
247    if (codegen::NVPTX) {
248        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
249        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
250        M = gpuM;
251        iBuilder = GPUBuilder;
252        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
253        M->setTargetTriple("nvptx64-nvidia-cuda");
254        addrSpace = 1;
255        CPU_Only = false;
256        codegen::BlockSize = 64;
257    }
258#endif
259
260    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
261    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
262
263    if (CPU_Only) {
264        M = cpuM;
265        iBuilder = CPUBuilder;
266    }
267
268    // segment size made availabe for each call to the mmap source kernel
269    const unsigned segmentSize = codegen::SegmentSize;
270    const unsigned bufferSegments = segmentPipelineParallel ? (codegen::BufferSegments * codegen::ThreadNum) : codegen::BufferSegments;
271    const unsigned encodingBits = UTF_16 ? 16 : 8;
272
273    mGrepType = grepType;
274
275    Type * const size_ty = iBuilder->getSizeTy();
276    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
277    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
278    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
279
280    Function * mainFn = nullptr;
281    Value * inputStream = nullptr;
282    Value * fileSize = nullptr;
283    Value * fileIdx = nullptr;
284
285#ifdef CUDA_ENABLED   
286    Value * outputStream = nullptr;
287    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
288    if (codegen::NVPTX){
289        if (CountOnly){
290            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
291            mainFn->setCallingConv(CallingConv::C);
292            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
293            Function::arg_iterator args = mainFn->arg_begin();
294           
295            inputStream = &*(args++);
296            inputStream->setName("input");
297            fileSize = &*(args++);
298            fileSize->setName("fileSize");
299        } else {
300            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
301            mainFn->setCallingConv(CallingConv::C);
302            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
303            Function::arg_iterator args = mainFn->arg_begin();
304           
305            inputStream = &*(args++);
306            inputStream->setName("input");
307            fileSize = &*(args++);
308            fileSize->setName("fileSize");
309            outputStream = &*(args++);
310            outputStream->setName("output");
311        }
312    } 
313#endif
314    if (CPU_Only){
315        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
316        mainFn->setCallingConv(CallingConv::C);
317        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
318        Function::arg_iterator args = mainFn->arg_begin();
319       
320        inputStream = &*(args++);
321        inputStream->setName("input");
322        fileSize = &*(args++);
323        fileSize->setName("fileSize");
324        fileIdx = &*(args++);
325        fileIdx->setName("fileIdx");
326    }
327       
328    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
329   
330    kernel::MMapSourceKernel mmapK(iBuilder, segmentSize); 
331    mmapK.generateKernel({}, {&ByteStream});
332    mmapK.setInitialArguments({fileSize});
333   
334
335    // ParabixCharacterClassKernelBuilder(IDISA::IDISA_Builder * iBuilder, std::string ccSetName, const std::vector<re::CC *> & charClasses, unsigned basisBitsCount);
336
337    std::vector<re::CC *> Y;
338    Y.push_back(re::makeCC(1, 9));
339
340    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
341
342    kernel::S2PKernel  s2pk(iBuilder);
343    s2pk.generateKernel({&ByteStream}, {&BasisBits});
344       
345    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}});
346    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
347    pablo_function_passes(&icgrepK);
348
349    ByteStream.setStreamSetBuffer(inputStream, fileSize);
350    BasisBits.allocateBuffer();
351
352    if (CountOnly) {
353        icgrepK.generateKernel({&BasisBits}, {});
354        if (pipelineParallel){
355            generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK});
356        } else if (segmentPipelineParallel){
357            generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK});
358        } else {
359            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
360        }
361        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
362    } else {
363#ifdef CUDA_ENABLED
364        if (codegen::NVPTX){
365            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1), addrSpace);
366            MatchResults.setStreamSetBuffer(outputStream, fileSize);
367
368            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
369            generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK});
370
371        }
372#endif
373        if (CPU_Only) {
374            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, 1), segmentSize * bufferSegments);
375            MatchResults.allocateBuffer();
376
377            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
378
379            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
380            scanMatchK.generateKernel({&MatchResults}, {});               
381            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
382
383            if (pipelineParallel){
384                generatePipelineParallel(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
385            } else if (segmentPipelineParallel){
386                generateSegmentParallelPipeline(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
387            }  else{
388                generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &icgrepK, &scanMatchK});
389            }
390        }
391        iBuilder->CreateRetVoid();
392    }
393
394#ifdef CUDA_ENABLED
395    Function * mainCPUFn = nullptr;
396    if(codegen::NVPTX){
397        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
398        MDNode * Node = MDNode::get(M->getContext(),
399                                    {llvm::ValueAsMetadata::get(kernelFunction),
400                                     MDString::get(M->getContext(), "kernel"), 
401                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
402        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
403        NMD->addOperand(Node);
404   
405        Compile2PTX(M, IRFilename, PTXFilename);
406        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
407        if (CountOnly) return;
408    }
409#endif
410
411
412    mEngine = JIT_to_ExecutionEngine(cpuM);
413    ApplyObjectCache(mEngine);
414    icgrep_Linking(cpuM, mEngine);
415
416#ifndef NDEBUG
417    verifyModule(*M, &dbgs());
418#endif
419
420    mEngine->finalizeObject();
421    delete iBuilder;
422   
423    if (CountOnly) {
424        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
425    } else {
426#ifdef CUDA_ENABLED
427        if(codegen::NVPTX){
428            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
429        }
430#endif
431        if (CPU_Only) {
432            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
433        }
434    }
435
436}
437
438re::CC * GrepEngine::grepCodepoints() {
439    parsedCodePointSet = re::makeCC();
440    char * mFileBuffer = getUnicodeNameDataPtr();
441    size_t mFileSize = getUnicodeNameDataSize();
442    mGrepFunction(mFileBuffer, mFileSize, 0);
443    return parsedCodePointSet;
444}
445
446const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
447    enum { MaxSupportedVectorWidthInBytes = 32 };
448    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
449    parsedPropertyValues.clear();
450    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
451    const auto n = str.length();
452    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
453    // erroneously matching garbage data when loading the final partial block.
454    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
455    std::memcpy(aligned, str.data(), n);
456    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
457    mGrepFunction(aligned, n, 0);
458    alloc.deallocate(aligned, 0);
459    return parsedPropertyValues;
460}
461
462static int * total_count;
463static std::stringstream * resultStrs = nullptr;
464static std::vector<std::string> inputFiles;
465
466void initResult(std::vector<std::string> filenames){
467    const int n = filenames.size();
468    if (n > 1) {
469        ShowFileNames = true;
470    }
471    inputFiles = filenames;
472    resultStrs = new std::stringstream[n];
473    total_count = new int[n];
474    for (unsigned i = 0; i < inputFiles.size(); ++i){
475        total_count[i] = 0;
476    }
477   
478}
479
480extern "C" {
481    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
482
483#ifdef CUDA_ENABLED
484    if (codegen::NVPTX){
485        while(line_start>startPoints[blockNo]) blockNo++;
486        line_start -= accumBytes[blockNo-1];
487        line_end -= accumBytes[blockNo-1];
488    }
489#endif
490        int index = isUTF_16 ? 2 : 1;
491        int idx = fileIdx;
492         
493        if (ShowFileNames) {
494            resultStrs[idx] << inputFiles[idx] << ':';
495        }
496        if (ShowLineNumbers) {
497            resultStrs[idx] << lineNum << ":";
498        }
499       
500        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
501            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
502            line_start++;
503        }
504        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
505            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
506            line_start += 2;
507        }
508        if (line_end == filesize) {
509            // The match position is at end-of-file.   We have a final unterminated line.
510            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
511            if (NormalizeLineBreaks) {
512                resultStrs[idx] << '\n';  // terminate it
513            }
514            return;
515        }
516        unsigned char end_byte = (unsigned char)buffer[line_end]; 
517        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
518        if (NormalizeLineBreaks) {
519            if (end_byte == 0x85) {
520                // Line terminated with NEL, on the second byte.  Back up 1.
521                line_end--;
522            } else if (end_byte > 0xD) {
523                // Line terminated with PS or LS, on the third byte.  Back up 2.
524                isUTF_16 ? line_end-- : line_end -= 2;
525            }
526            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
527            resultStrs[idx] << '\n';
528        } else {
529            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
530                // Check for line_end on first byte of CRLF;  note that we don't
531                // want to access past the end of buffer.
532                if (line_end + 1 < filesize) {
533                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
534                        // Found CRLF; preserve both bytes.
535                        line_end++;
536                    }
537                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
538                        // Found CRLF; preserve both bytes.
539                        line_end += 2;
540                    }
541                }
542            }
543            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
544        }
545    }
546}
547
548void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
549   
550    if(CountOnly){
551        if (!ShowFileNames) {
552            for (unsigned i = 0; i < inputFiles.size(); ++i){
553                std::cout << total_CountOnly[i] << std::endl;
554            }
555        }
556        else {
557            for (unsigned i = 0; i < inputFiles.size(); ++i){
558                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
559            };
560        }
561        return;
562    }
563   
564    for (unsigned i = 0; i < inputFiles.size(); ++i){
565        std::cout << resultStrs[i].str();
566    }
567}
568
569extern "C" {
570    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
571        re::codepoint_t c = 0;
572        ssize_t line_pos = line_start;
573        while (isxdigit(buffer[line_pos])) {
574            if (isdigit(buffer[line_pos])) {
575                c = (c << 4) | (buffer[line_pos] - '0');
576            }
577            else {
578                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
579            }
580            line_pos++;
581        }
582        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
583        parsedCodePointSet->insert(c);
584    }
585}
586
587extern "C" {
588    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
589        parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
590    }
591}
592
593void icgrep_Linking(Module * m, ExecutionEngine * e) {
594    Module::FunctionListType & fns = m->getFunctionList();
595    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
596        std::string fnName = it->getName().str();
597        if (fnName == "s2p_block") continue;
598        if (fnName == "process_block") continue;
599        if (fnName == "process_block_initialize_carries") continue;
600       
601        if (fnName == "wrapped_report_match") {
602            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
603        }
604        if (fnName == "insert_codepoints") {
605            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
606        }
607        if (fnName == "insert_property_values") {
608            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
609        }
610    }
611}
612
613GrepEngine::GrepEngine()
614: mGrepFunction(nullptr)
615, mGrepFunction_CountOnly(nullptr)
616, mGrepFunction_CPU(nullptr)
617, mGrepType(GrepType::Normal)
618, mEngine(nullptr) {
619
620}
621
622GrepEngine::~GrepEngine() {
623    delete mEngine;
624}
Note: See TracBrowser for help on using the repository browser.