source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5179

Last change on this file since 5179 was 5176, checked in by cameron, 3 years ago

Engine deletion causes segfaults with LLVM 3.9 changes

File size: 23.9 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <grep_engine.h>
8#include <IDISA/idisa_builder.h>
9#include <IDISA/idisa_target.h>
10#include <llvm/Support/CommandLine.h>
11#include <re/re_toolchain.h>
12#include <re/re_cc.h>
13
14#include <pablo/pablo_toolchain.h>
15#include <toolchain.h>
16#include <pablo/pablo_compiler.h>
17#include <kernels/pipeline.h>
18#include <llvm/IR/Function.h>
19#include <llvm/IR/Type.h>
20#include <llvm/IR/Module.h>
21#include <llvm/ExecutionEngine/MCJIT.h>
22#include <llvm/IRReader/IRReader.h>
23#include <llvm/Support/Debug.h>
24#include <llvm/IR/Verifier.h>
25#include <llvm/IR/TypeBuilder.h>
26#include <UCD/UnicodeNameData.h>
27
28
29#include <kernels/streamset.h>
30#include <kernels/scanmatchgen.h>
31#include <kernels/s2p_kernel.h>
32#include <kernels/cc_kernel.h>
33#include <kernels/pipeline.h>
34
35#include <pablo/function.h>
36#include <pablo/pablo_kernel.h>
37#include <pablo/pablo_toolchain.h>
38
39#include <llvm/IR/Intrinsics.h>
40#include "llvm/Support/SourceMgr.h"
41#include "llvm/IRReader/IRReader.h"
42#include "llvm/Linker/Linker.h"
43#include "llvm-c/Core.h"
44
45#include <fstream>
46#include <sstream>
47#include <iostream>
48#include <string>
49#include <stdint.h>
50
51#include <stdio.h>
52#include <stdlib.h>
53#include <unistd.h>
54#include <errno.h>
55#include <sys/types.h>
56#include <sys/stat.h>
57#include <stdexcept>
58#include <cctype>
59
60
61#include <llvm/Support/raw_os_ostream.h>
62
63// mmap system
64#include <boost/filesystem.hpp>
65#include <boost/iostreams/device/mapped_file.hpp>
66
67#include <fcntl.h>
68
69#include <kernels/kernel.h>
70
71#ifdef CUDA_ENABLED
72#include <IDISA/CudaDriver.h>
73#endif
74
75static cl::OptionCategory bGrepOutputOptions("Output Options",
76                                             "These options control the output.");
77static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
78
79static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
80
81static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
82
83static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
84static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
85
86static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
87static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
88
89static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
90
91static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
92
93bool isUTF_16 = false;
94std::string IRFilename = "icgrep.ll";
95std::string PTXFilename = "icgrep.ptx";
96
97void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
98    boost::filesystem::path file(fileName);
99    if (exists(file)) {
100        if (is_directory(file)) {
101            return;
102        }
103    } else {
104        if (!SilenceFileErrors) {
105            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
106            return;
107        }
108    }
109
110    const auto fileSize = file_size(file);
111    if (fileSize > 0) {
112        try {
113            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
114            char * fileBuffer = const_cast<char *>(source.data());
115#ifdef CUDA_ENABLED 
116            if(codegen::NVPTX){
117                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
118                if (CountOnly){
119                    exit(0);
120                }
121                else{
122                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
123                    return;
124                }
125               
126            } 
127#endif
128            if (CountOnly) {
129                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
130            } else {
131                mGrepFunction(fileBuffer, fileSize, fileIdx);
132            }
133            source.close();
134        } catch (std::exception & e) {
135            if (!SilenceFileErrors) {
136                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
137                return;
138            }
139        }
140    } else {
141#ifdef CUDA_ENABLED
142        if (codegen::NVPTX){
143            std::cout << 0 << std::endl;
144            exit(0);
145        }
146#endif
147        if (CountOnly) {
148            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
149        } else {
150            mGrepFunction(nullptr, 0, fileIdx);
151        }
152    }
153}
154
155using namespace parabix;
156
157Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
158    Type * const int64ty = iBuilder->getInt64Ty();
159    Type * const inputType = PointerType::get(int64ty, 1);
160    Type * const resultTy = iBuilder->getVoidTy();
161    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
162    kernelFunc->setCallingConv(CallingConv::C);
163    Function::arg_iterator args = kernelFunc->arg_begin();
164
165    Value * const inputPtr = &*(args++);
166    inputPtr->setName("inputPtr");
167    Value * const bufferSizePtr = &*(args++);
168    bufferSizePtr->setName("bufferSizePtr");
169    Value * const outputPtr = &*(args++);
170    outputPtr->setName("resultPtr");
171
172    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
173    iBuilder->SetInsertPoint(entryBlock);
174
175    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
176    Value * id = iBuilder->CreateCall(tidFunc);
177
178    Function * mainFunc = m->getFunction("Main");
179    Value * inputThreadPtr = iBuilder->CreateGEP(inputPtr, iBuilder->CreateMul(id, iBuilder->getInt32(8)));
180    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);
181    Value * inputStream = iBuilder->CreateBitCast(inputThreadPtr, inputStreamType);   
182    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
183    if (CountOnly){
184        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
185        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
186        iBuilder->CreateStore(result, outputThreadPtr);
187    }
188    else {
189        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateMul(id, iBuilder->getInt32(2)));
190        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
191        Value * outputStream = iBuilder->CreateBitCast(outputThreadPtr, outputStremType);
192        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
193    }   
194
195    iBuilder->CreateRetVoid();
196    return kernelFunc;
197}
198
199Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool isNameExpression){
200    Type * const size_ty = iBuilder->getSizeTy();
201    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
202    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
203    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
204    mainCPUFn->setCallingConv(CallingConv::C);
205    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
206    Function::arg_iterator args = mainCPUFn->arg_begin();
207   
208    Value * const rsltStream = &*(args++);
209    rsltStream->setName("rslt");
210    Value * const inputStream = &*(args++);
211    inputStream->setName("input");
212    Value * const fileSize = &*(args++);
213    fileSize->setName("fileSize");
214    Value * const fileIdx = &*(args++);
215    fileIdx->setName("fileIdx");
216
217    ExternalFileBuffer MatchResults(iBuilder, StreamSetType(2, i1));
218    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
219
220    kernel::scanMatchKernel scanMatchK(iBuilder, isNameExpression);
221    scanMatchK.generateKernel({&MatchResults}, {});
222           
223    Value * scanMatchInstance = scanMatchK.createInstance({inputStream, fileSize, fileIdx});
224   
225    generatePipelineLoop(iBuilder, {&scanMatchK}, {scanMatchInstance}, fileSize);
226    iBuilder->CreateRetVoid();
227
228    return mainCPUFn;
229}
230
231void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, bool isNameExpression) {
232    isUTF_16 = UTF_16;
233    int addrSpace = 0;
234    bool CPU_Only = true;
235    LLVMContext TheContext;
236    Module * cpuM = new Module(moduleName+":cpu", TheContext);
237    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM); 
238    Module * M = cpuM; 
239    IDISA::IDISA_Builder * iBuilder = CPUBuilder; 
240
241#ifdef CUDA_ENABLED
242    setNVPTXOption(); 
243    if(codegen::NVPTX){     
244        Module * gpuM = new Module(moduleName+":gpu", TheContext);
245        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
246        M = gpuM;
247        iBuilder = GPUBuilder;
248        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
249        M->setTargetTriple("nvptx64-nvidia-cuda");
250        addrSpace = 1;
251        CPU_Only = false;
252    }   
253#endif
254
255    const unsigned segmentSize = codegen::SegmentSize;
256    if (segmentPipelineParallel && codegen::BufferSegments < 2) codegen::BufferSegments = 2;
257    const unsigned bufferSegments = codegen::BufferSegments;
258
259
260    unsigned encodingBits = UTF_16 ? 16 : 8;
261
262    mIsNameExpression = isNameExpression;
263
264    Type * const int32ty = iBuilder->getInt32Ty();
265    Type * const size_ty = iBuilder->getSizeTy();
266    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
267    Type * const voidTy = Type::getVoidTy(M->getContext());   
268    Type * const voidPtrTy = TypeBuilder<void *, false>::get(M->getContext());
269    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), (UTF_16 ? 16 : 8)), 1), addrSpace);
270    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
271
272    Function * mainFn = nullptr;
273    Value * inputStream = nullptr;
274    Value * fileSize = nullptr;
275    Value * fileIdx = nullptr;
276
277#ifdef CUDA_ENABLED   
278    Value * outputStream = nullptr;
279    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
280    if (codegen::NVPTX){
281        if (CountOnly){
282            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
283            mainFn->setCallingConv(CallingConv::C);
284            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
285            Function::arg_iterator args = mainFn->arg_begin();
286           
287            inputStream = &*(args++);
288            inputStream->setName("input");
289            fileSize = &*(args++);
290            fileSize->setName("fileSize");
291        }
292        else{
293            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
294            mainFn->setCallingConv(CallingConv::C);
295            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
296            Function::arg_iterator args = mainFn->arg_begin();
297           
298            inputStream = &*(args++);
299            inputStream->setName("input");
300            fileSize = &*(args++);
301            fileSize->setName("fileSize");
302            outputStream = &*(args++);
303            outputStream->setName("output");
304        }
305    } 
306#endif
307    if (CPU_Only){
308        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));   
309        mainFn->setCallingConv(CallingConv::C);
310        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
311        Function::arg_iterator args = mainFn->arg_begin();
312       
313        inputStream = &*(args++);
314        inputStream->setName("input");
315        fileSize = &*(args++);
316        fileSize->setName("fileSize");
317        fileIdx = &*(args++);
318        fileIdx->setName("fileIdx");
319    }
320       
321    ExternalFileBuffer ByteStream(iBuilder, StreamSetType(1, i8));
322    CircularBuffer BasisBits(iBuilder, StreamSetType(8, i1), segmentSize * bufferSegments);
323
324    kernel::s2pKernel  s2pk(iBuilder);
325    s2pk.generateKernel({&ByteStream}, {&BasisBits});
326   
327    re_ast = re::regular_expression_passes(re_ast);
328    pablo::PabloFunction * function = re::re2pablo_compiler(encodingBits, re_ast, CountOnly);
329    pablo_function_passes(function);
330
331    ByteStream.setStreamSetBuffer(inputStream, fileSize);
332    BasisBits.allocateBuffer();
333
334    Value * s2pInstance = s2pk.createInstance({});
335 
336    Type * pthreadTy = size_ty;
337    FunctionType * funVoidPtrVoidTy = FunctionType::get(voidTy, int8PtrTy, false);   
338   
339    Function * pthreadCreateFunc = cast<Function>(M->getOrInsertFunction("pthread_create",
340                                        int32ty, 
341                                        pthreadTy->getPointerTo(), 
342                                        voidPtrTy, 
343                                        static_cast<Type *>(funVoidPtrVoidTy)->getPointerTo(),
344                                        voidPtrTy, nullptr));
345    pthreadCreateFunc->setCallingConv(llvm::CallingConv::C);
346    Function * pthreadJoinFunc = cast<Function>(M->getOrInsertFunction("pthread_join", 
347                                        int32ty, 
348                                        pthreadTy, 
349                                        PointerType::get(int8PtrTy, 0), nullptr));
350    pthreadJoinFunc->setCallingConv(llvm::CallingConv::C);
351
352    Function * pthreadExitFunc = cast<Function>(M->getOrInsertFunction("pthread_exit", 
353                                        voidTy, 
354                                        voidPtrTy, nullptr));
355    pthreadExitFunc->addFnAttr(llvm::Attribute::NoReturn);
356    pthreadExitFunc->setCallingConv(llvm::CallingConv::C);
357
358    if (CountOnly) {
359        pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {"matchedLineCount"});
360        icgrepK.generateKernel({&BasisBits}, {});       
361        Value * icgrepInstance = icgrepK.createInstance({});
362
363        if (pipelineParallel){
364            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance});
365        }
366        else if (segmentPipelineParallel){           
367            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
368        }
369        else{
370            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
371        }
372       
373        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepInstance, "matchedLineCount");
374        iBuilder->CreateRet(matchCount);
375
376    }
377    else {
378#ifdef CUDA_ENABLED
379        if (codegen::NVPTX){
380            ExternalFileBuffer MatchResults(iBuilder, StreamSetType(2, i1), addrSpace);
381            MatchResults.setStreamSetBuffer(outputStream, fileSize);
382
383            pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {});
384            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
385            Value * icgrepInstance = icgrepK.createInstance({});
386
387            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
388
389        }
390#endif
391        if (CPU_Only){
392            CircularBuffer MatchResults(iBuilder, StreamSetType(2, i1), segmentSize * bufferSegments);
393            MatchResults.allocateBuffer();
394
395            pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {});
396            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
397            Value * icgrepInstance = icgrepK.createInstance({});
398
399            kernel::scanMatchKernel scanMatchK(iBuilder, mIsNameExpression);
400            scanMatchK.generateKernel({&MatchResults}, {});               
401            Value * scanMatchInstance = scanMatchK.createInstance({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
402
403            if (pipelineParallel){
404                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance});
405            }
406            else if (segmentPipelineParallel){
407                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
408            } 
409            else{
410                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
411            }
412        }
413
414        iBuilder->CreateRetVoid();
415
416    }
417
418#ifdef CUDA_ENABLED
419    Function * mainCPUFn = nullptr;
420    if(codegen::NVPTX){
421        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
422        MDNode * Node = MDNode::get(M->getContext(),
423                                    {llvm::ValueAsMetadata::get(kernelFunction),
424                                     MDString::get(M->getContext(), "kernel"), 
425                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
426        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
427        NMD->addOperand(Node);
428   
429        Compile2PTX(M, IRFilename, PTXFilename);
430        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mIsNameExpression);
431        if (CountOnly) return;
432    }
433#endif
434   
435     
436    mEngine = JIT_to_ExecutionEngine(cpuM);
437    ApplyObjectCache(mEngine);
438    icgrep_Linking(cpuM, mEngine);
439
440#ifndef NDEBUG
441    verifyModule(*M, &dbgs());
442#endif
443
444    mEngine->finalizeObject();
445    delete iBuilder;
446   
447    if (CountOnly) {
448        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
449    } else {
450#ifdef CUDA_ENABLED
451        if(codegen::NVPTX){
452            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
453        }
454#endif
455        if (CPU_Only) {
456            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
457        }
458    }
459
460}
461
462re::CC *  GrepEngine::grepCodepoints() {
463
464    setParsedCodePointSet();
465    char * mFileBuffer = getUnicodeNameDataPtr();
466    size_t mFileSize = getUnicodeNameDataSize();
467
468    mGrepFunction(mFileBuffer, mFileSize, 0);
469
470    return getParsedCodePointSet();
471}
472
473GrepEngine::~GrepEngine() {
474//    delete mEngine;
475}
476
477
478static int * total_count;
479static std::stringstream * resultStrs = nullptr;
480static std::vector<std::string> inputFiles;
481
482void initResult(std::vector<std::string> filenames){
483    const int n = filenames.size();
484    if (n > 1) {
485        ShowFileNames = true;
486    }
487    inputFiles = filenames;
488    resultStrs = new std::stringstream[n];
489    total_count = new int[n];
490    for (unsigned i = 0; i < inputFiles.size(); ++i){
491        total_count[i] = 0;
492    }
493   
494}
495
496extern "C" {
497    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
498        int index = isUTF_16 ? 2 : 1;
499        int idx = fileIdx;
500         
501        if (ShowFileNames) {
502            resultStrs[idx] << inputFiles[idx] << ':';
503        }
504        if (ShowLineNumbers) {
505            resultStrs[idx] << lineNum << ":";
506        }
507       
508        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
509            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
510            line_start++;
511        }
512        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
513            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
514            line_start += 2;
515        }
516        if (line_end == filesize) {
517            // The match position is at end-of-file.   We have a final unterminated line.
518            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
519            if (NormalizeLineBreaks) {
520                resultStrs[idx] << '\n';  // terminate it
521            }
522            return;
523        }
524        unsigned char end_byte = (unsigned char)buffer[line_end]; 
525        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
526        if (NormalizeLineBreaks) {
527            if (end_byte == 0x85) {
528                // Line terminated with NEL, on the second byte.  Back up 1.
529                line_end--;
530            } else if (end_byte > 0xD) {
531                // Line terminated with PS or LS, on the third byte.  Back up 2.
532                isUTF_16 ? line_end-- : line_end -= 2;
533            }
534            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
535            resultStrs[idx] << '\n';
536        }
537        else {   
538            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
539                // Check for line_end on first byte of CRLF;  note that we don't
540                // want to access past the end of buffer.
541                if (line_end + 1 < filesize) {
542                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
543                        // Found CRLF; preserve both bytes.
544                        line_end++;
545                    }
546                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
547                        // Found CRLF; preserve both bytes.
548                        line_end += 2;
549                    }
550                }
551            }
552            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
553        }
554    }
555}
556
557void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
558   
559    if(CountOnly){
560        if (!ShowFileNames) {
561            for (unsigned i = 0; i < inputFiles.size(); ++i){
562                std::cout << total_CountOnly[i] << std::endl;
563            }
564        }
565        else {
566            for (unsigned i = 0; i < inputFiles.size(); ++i){
567                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
568            };
569        }
570        return;
571    }
572   
573    for (unsigned i = 0; i < inputFiles.size(); ++i){
574        std::cout << resultStrs[i].str();
575    }
576}
577
578re::CC * parsedCodePointSet;
579
580extern "C" {
581    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
582        re::codepoint_t c = 0;
583        ssize_t line_pos = line_start;
584        while (isxdigit(buffer[line_pos])) {
585            if (isdigit(buffer[line_pos])) {
586                c = (c << 4) | (buffer[line_pos] - '0');
587            }
588            else {
589                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
590            }
591            line_pos++;
592        }
593        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
594        parsedCodePointSet->insert(c);
595    }
596}
597
598void setParsedCodePointSet(){
599    parsedCodePointSet = re::makeCC();
600}
601
602re::CC * getParsedCodePointSet(){
603    return parsedCodePointSet;
604}
605
606
607void icgrep_Linking(Module * m, ExecutionEngine * e) {
608    Module::FunctionListType & fns = m->getFunctionList();
609    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
610        std::string fnName = it->getName().str();
611        if (fnName == "s2p_block") continue;
612        if (fnName == "process_block") continue;
613        if (fnName == "process_block_initialize_carries") continue;
614       
615        if (fnName == "wrapped_report_match") {
616            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
617        }
618        if (fnName == "insert_codepoints") {
619            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
620        }
621#ifndef DISABLE_PREGENERATED_UCD_FUNCTIONS
622        else {
623            const UCD::ExternalProperty & ep = UCD::resolveExternalProperty(fnName);
624            e->addGlobalMapping(cast<GlobalValue>(it), std::get<0>(ep));
625        }
626#endif
627    }
628}
629
Note: See TracBrowser for help on using the repository browser.