source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5165

Last change on this file since 5165 was 5165, checked in by lindanl, 3 years ago

Add segment pipeline parallel strategy. Move ballot function to IDISA NVPTX.

File size: 23.5 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <grep_engine.h>
8#include <IDISA/idisa_builder.h>
9#include <IDISA/idisa_target.h>
10#include <llvm/Support/CommandLine.h>
11#include <re/re_toolchain.h>
12#include <re/re_cc.h>
13
14#include <pablo/pablo_toolchain.h>
15#include <toolchain.h>
16#include <pablo/pablo_compiler.h>
17#include <kernels/pipeline.h>
18#include <llvm/IR/Function.h>
19#include <llvm/IR/Type.h>
20#include <llvm/IR/Module.h>
21#include <llvm/ExecutionEngine/MCJIT.h>
22#include <llvm/IRReader/IRReader.h>
23#include <llvm/Support/Debug.h>
24#include <llvm/IR/Verifier.h>
25#include <llvm/IR/TypeBuilder.h>
26#include <UCD/UnicodeNameData.h>
27
28
29#include <kernels/streamset.h>
30#include <kernels/scanmatchgen.h>
31#include <kernels/s2p_kernel.h>
32#include <kernels/cc_kernel.h>
33#include <kernels/pipeline.h>
34
35#include <pablo/function.h>
36#include <pablo/pablo_kernel.h>
37#include <pablo/pablo_toolchain.h>
38
39#include <llvm/IR/Intrinsics.h>
40#include "llvm/Support/SourceMgr.h"
41#include "llvm/IRReader/IRReader.h"
42#include "llvm/Linker/Linker.h"
43
44
45#include <fstream>
46#include <sstream>
47#include <iostream>
48#include <string>
49#include <stdint.h>
50
51#include <stdio.h>
52#include <stdlib.h>
53#include <unistd.h>
54#include <errno.h>
55#include <sys/types.h>
56#include <sys/stat.h>
57#include <stdexcept>
58#include <cctype>
59
60
61#include <llvm/Support/raw_os_ostream.h>
62
63// mmap system
64#include <boost/filesystem.hpp>
65#include <boost/iostreams/device/mapped_file.hpp>
66
67#include <fcntl.h>
68
69#include <kernels/kernel.h>
70
71#ifdef CUDA_ENABLED
72#include <IDISA/CudaDriver.h>
73#endif
74
75static cl::OptionCategory bGrepOutputOptions("Output Options",
76                                             "These options control the output.");
77
78static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
79
80static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
81static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
82
83static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
84static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
85
86static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
87
88static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
89
90bool isUTF_16 = false;
91std::string IRFilename = "icgrep.ll";
92std::string PTXFilename = "icgrep.ptx";
93
94void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
95    boost::filesystem::path file(fileName);
96    if (exists(file)) {
97        if (is_directory(file)) {
98            return;
99        }
100    } else {
101        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
102        return;
103    }
104
105    const auto fileSize = file_size(file);
106    if (fileSize > 0) {
107        try {
108            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
109            char * fileBuffer = const_cast<char *>(source.data());
110#ifdef CUDA_ENABLED 
111            if(codegen::NVPTX){
112                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
113                if (CountOnly){
114                    exit(0);
115                }
116                else{
117                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
118                    return;
119                }
120               
121            } 
122#endif
123            if (CountOnly) {
124                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
125            } else {
126                mGrepFunction(fileBuffer, fileSize, fileIdx);
127            }
128            source.close();
129        } catch (std::exception & e) {
130            throw std::runtime_error("Boost mmap error: " + fileName + ": " + e.what());
131        }
132    } else {
133#ifdef CUDA_ENABLED
134        if (codegen::NVPTX){
135            std::cout << 0 << std::endl;
136            exit(0);
137        }
138#endif
139        if (CountOnly) {
140            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
141        } else {
142            mGrepFunction(nullptr, 0, fileIdx);
143        }
144    }
145}
146
147using namespace parabix;
148
149Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
150    Type * const int64ty = iBuilder->getInt64Ty();
151    Type * const inputType = PointerType::get(int64ty, 1);
152    Type * const resultTy = iBuilder->getVoidTy();
153    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
154    kernelFunc->setCallingConv(CallingConv::C);
155    Function::arg_iterator args = kernelFunc->arg_begin();
156
157    Value * const inputPtr = &*(args++);
158    inputPtr->setName("inputPtr");
159    Value * const bufferSizePtr = &*(args++);
160    bufferSizePtr->setName("bufferSizePtr");
161    Value * const outputPtr = &*(args++);
162    outputPtr->setName("resultPtr");
163
164    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
165    iBuilder->SetInsertPoint(entryBlock);
166
167    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
168    Value * id = iBuilder->CreateCall(tidFunc);
169
170    Function * mainFunc = m->getFunction("Main");
171    Value * inputThreadPtr = iBuilder->CreateGEP(inputPtr, iBuilder->CreateMul(id, iBuilder->getInt32(8)));
172    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);
173    Value * inputStream = iBuilder->CreateBitCast(inputThreadPtr, inputStreamType);   
174    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
175    if (CountOnly){
176        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
177        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
178        iBuilder->CreateStore(result, outputThreadPtr);
179    }
180    else {
181        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateMul(id, iBuilder->getInt32(2)));
182        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
183        Value * outputStream = iBuilder->CreateBitCast(outputThreadPtr, outputStremType);
184        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
185    }   
186
187    iBuilder->CreateRetVoid();
188    return kernelFunc;
189}
190
191Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool isNameExpression){
192    Type * const size_ty = iBuilder->getSizeTy();
193    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
194    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
195    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
196    mainCPUFn->setCallingConv(CallingConv::C);
197    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
198    Function::arg_iterator args = mainCPUFn->arg_begin();
199   
200    Value * const rsltStream = &*(args++);
201    rsltStream->setName("rslt");
202    Value * const inputStream = &*(args++);
203    inputStream->setName("input");
204    Value * const fileSize = &*(args++);
205    fileSize->setName("fileSize");
206    Value * const fileIdx = &*(args++);
207    fileIdx->setName("fileIdx");
208
209    ExternalFileBuffer MatchResults(iBuilder, StreamSetType(2, i1));
210    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
211
212    kernel::scanMatchKernel scanMatchK(iBuilder, isNameExpression);
213    scanMatchK.generateKernel({&MatchResults}, {});
214           
215    Value * scanMatchInstance = scanMatchK.createInstance({inputStream, fileSize, fileIdx});
216   
217    generatePipelineLoop(iBuilder, {&scanMatchK}, {scanMatchInstance}, fileSize);
218    iBuilder->CreateRetVoid();
219
220    return mainCPUFn;
221}
222
223void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, bool isNameExpression) {
224    isUTF_16 = UTF_16;
225    int addrSpace = 0;
226    bool CPU_Only = true;
227
228    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
229    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM); 
230    Module * M = cpuM; 
231    IDISA::IDISA_Builder * iBuilder = CPUBuilder; 
232
233#ifdef CUDA_ENABLED
234    setNVPTXOption(); 
235    if(codegen::NVPTX){     
236        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
237        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
238        M = gpuM;
239        iBuilder = GPUBuilder;
240        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
241        M->setTargetTriple("nvptx64-nvidia-cuda");
242        addrSpace = 1;
243        CPU_Only = false;
244    }   
245#endif
246
247    const unsigned segmentSize = codegen::SegmentSize;
248    if (segmentPipelineParallel && codegen::BufferSegments < 2) codegen::BufferSegments = 2;
249    const unsigned bufferSegments = codegen::BufferSegments;
250
251
252    unsigned encodingBits = UTF_16 ? 16 : 8;
253
254    mIsNameExpression = isNameExpression;
255
256    Type * const int32ty = iBuilder->getInt32Ty();
257    Type * const size_ty = iBuilder->getSizeTy();
258    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
259    Type * const voidTy = Type::getVoidTy(M->getContext());   
260    Type * const voidPtrTy = TypeBuilder<void *, false>::get(M->getContext());
261    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), (UTF_16 ? 16 : 8)), 1), addrSpace);
262    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
263
264    Function * mainFn = nullptr;
265    Value * inputStream = nullptr;
266    Value * fileSize = nullptr;
267    Value * fileIdx = nullptr;
268
269#ifdef CUDA_ENABLED   
270    Value * outputStream = nullptr;
271    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
272    if (codegen::NVPTX){
273        if (CountOnly){
274            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
275            mainFn->setCallingConv(CallingConv::C);
276            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
277            Function::arg_iterator args = mainFn->arg_begin();
278           
279            inputStream = &*(args++);
280            inputStream->setName("input");
281            fileSize = &*(args++);
282            fileSize->setName("fileSize");
283        }
284        else{
285            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
286            mainFn->setCallingConv(CallingConv::C);
287            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
288            Function::arg_iterator args = mainFn->arg_begin();
289           
290            inputStream = &*(args++);
291            inputStream->setName("input");
292            fileSize = &*(args++);
293            fileSize->setName("fileSize");
294            outputStream = &*(args++);
295            outputStream->setName("output");
296        }
297    } 
298#endif
299    if (CPU_Only){
300        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));   
301        mainFn->setCallingConv(CallingConv::C);
302        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
303        Function::arg_iterator args = mainFn->arg_begin();
304       
305        inputStream = &*(args++);
306        inputStream->setName("input");
307        fileSize = &*(args++);
308        fileSize->setName("fileSize");
309        fileIdx = &*(args++);
310        fileIdx->setName("fileIdx");
311    }
312       
313    ExternalFileBuffer ByteStream(iBuilder, StreamSetType(1, i8));
314    CircularBuffer BasisBits(iBuilder, StreamSetType(8, i1), segmentSize * bufferSegments);
315
316    kernel::s2pKernel  s2pk(iBuilder);
317    s2pk.generateKernel({&ByteStream}, {&BasisBits});
318   
319    re_ast = re::regular_expression_passes(re_ast);
320    pablo::PabloFunction * function = re::re2pablo_compiler(encodingBits, re_ast, CountOnly);
321    pablo_function_passes(function);
322
323    ByteStream.setStreamSetBuffer(inputStream, fileSize);
324    BasisBits.allocateBuffer();
325
326    Value * s2pInstance = s2pk.createInstance({});
327 
328    Type * pthreadTy = size_ty;
329    FunctionType * funVoidPtrVoidTy = FunctionType::get(voidTy, int8PtrTy, false);   
330   
331    Function * pthreadCreateFunc = cast<Function>(M->getOrInsertFunction("pthread_create",
332                                        int32ty, 
333                                        pthreadTy->getPointerTo(), 
334                                        voidPtrTy, 
335                                        static_cast<Type *>(funVoidPtrVoidTy)->getPointerTo(),
336                                        voidPtrTy, nullptr));
337    pthreadCreateFunc->setCallingConv(llvm::CallingConv::C);
338    Function * pthreadJoinFunc = cast<Function>(M->getOrInsertFunction("pthread_join", 
339                                        int32ty, 
340                                        pthreadTy, 
341                                        PointerType::get(int8PtrTy, 0), nullptr));
342    pthreadJoinFunc->setCallingConv(llvm::CallingConv::C);
343
344    Function * pthreadExitFunc = cast<Function>(M->getOrInsertFunction("pthread_exit", 
345                                        voidTy, 
346                                        voidPtrTy, nullptr));
347    pthreadExitFunc->addFnAttr(llvm::Attribute::NoReturn);
348    pthreadExitFunc->setCallingConv(llvm::CallingConv::C);
349
350    if (CountOnly) {
351        pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {"matchedLineCount"});
352        icgrepK.generateKernel({&BasisBits}, {});       
353        Value * icgrepInstance = icgrepK.createInstance({});
354
355        if (pipelineParallel){
356            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance});
357        }
358        else if (segmentPipelineParallel){           
359            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
360        }
361        else{
362            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
363        }
364       
365        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepInstance, "matchedLineCount");
366        iBuilder->CreateRet(matchCount);
367
368    }
369    else {
370#ifdef CUDA_ENABLED
371        if (codegen::NVPTX){
372            ExternalFileBuffer MatchResults(iBuilder, StreamSetType(2, i1), addrSpace);
373            MatchResults.setStreamSetBuffer(outputStream, fileSize);
374
375            pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {});
376            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
377            Value * icgrepInstance = icgrepK.createInstance({});
378
379            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
380
381        }
382#endif
383        if (CPU_Only){
384            CircularBuffer MatchResults(iBuilder, StreamSetType(2, i1), segmentSize * bufferSegments);
385            MatchResults.allocateBuffer();
386
387            pablo::PabloKernel  icgrepK(iBuilder, "icgrep", function, {});
388            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
389            Value * icgrepInstance = icgrepK.createInstance({});
390
391            kernel::scanMatchKernel scanMatchK(iBuilder, mIsNameExpression);
392            scanMatchK.generateKernel({&MatchResults}, {});               
393            Value * scanMatchInstance = scanMatchK.createInstance({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
394
395            if (pipelineParallel){
396                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance});
397            }
398            else if (segmentPipelineParallel){
399                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
400            } 
401            else{
402                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
403            }
404        }
405
406        iBuilder->CreateRetVoid();
407
408    }
409
410#ifdef CUDA_ENABLED
411    Function * mainCPUFn = nullptr;
412    if(codegen::NVPTX){
413        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
414        MDNode * Node = MDNode::get(M->getContext(),
415                                    {llvm::ValueAsMetadata::get(kernelFunction),
416                                     MDString::get(M->getContext(), "kernel"), 
417                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
418        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
419        NMD->addOperand(Node);
420   
421        Compile2PTX(M, IRFilename, PTXFilename);
422        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mIsNameExpression);
423        if (CountOnly) return;
424    }
425#endif
426   
427     
428    mEngine = JIT_to_ExecutionEngine(cpuM);
429    ApplyObjectCache(mEngine);
430    icgrep_Linking(cpuM, mEngine);
431
432#ifndef NDEBUG
433    verifyModule(*M, &dbgs());
434#endif
435
436    mEngine->finalizeObject();
437    delete iBuilder;
438   
439    if (CountOnly) {
440        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
441    } else {
442#ifdef CUDA_ENABLED
443        if(codegen::NVPTX){
444            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
445        }
446#endif
447        if (CPU_Only) {
448            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
449        }
450    }
451
452}
453
454re::CC *  GrepEngine::grepCodepoints() {
455
456    setParsedCodePointSet();
457    char * mFileBuffer = getUnicodeNameDataPtr();
458    size_t mFileSize = getUnicodeNameDataSize();
459
460    mGrepFunction(mFileBuffer, mFileSize, 0);
461
462    return getParsedCodePointSet();
463}
464
465GrepEngine::~GrepEngine() {
466    delete mEngine;
467}
468
469
470static int * total_count;
471static std::stringstream * resultStrs = nullptr;
472static std::vector<std::string> inputFiles;
473
474void initResult(std::vector<std::string> filenames){
475    const int n = filenames.size();
476    if (n > 1) {
477        ShowFileNames = true;
478    }
479    inputFiles = filenames;
480    resultStrs = new std::stringstream[n];
481    total_count = new int[n];
482    for (unsigned i = 0; i < inputFiles.size(); ++i){
483        total_count[i] = 0;
484    }
485   
486}
487
488extern "C" {
489    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
490        int index = isUTF_16 ? 2 : 1;
491        int idx = fileIdx;
492         
493        if (ShowFileNames) {
494            resultStrs[idx] << inputFiles[idx] << ':';
495        }
496        if (ShowLineNumbers) {
497            resultStrs[idx] << lineNum << ":";
498        }
499       
500        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
501            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
502            line_start++;
503        }
504        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
505            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
506            line_start += 2;
507        }
508        if (line_end == filesize) {
509            // The match position is at end-of-file.   We have a final unterminated line.
510            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
511            if (NormalizeLineBreaks) {
512                resultStrs[idx] << '\n';  // terminate it
513            }
514            return;
515        }
516        unsigned char end_byte = (unsigned char)buffer[line_end]; 
517        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
518        if (NormalizeLineBreaks) {
519            if (end_byte == 0x85) {
520                // Line terminated with NEL, on the second byte.  Back up 1.
521                line_end--;
522            } else if (end_byte > 0xD) {
523                // Line terminated with PS or LS, on the third byte.  Back up 2.
524                isUTF_16 ? line_end-- : line_end -= 2;
525            }
526            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
527            resultStrs[idx] << '\n';
528        }
529        else {   
530            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
531                // Check for line_end on first byte of CRLF;  note that we don't
532                // want to access past the end of buffer.
533                if (line_end + 1 < filesize) {
534                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
535                        // Found CRLF; preserve both bytes.
536                        line_end++;
537                    }
538                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
539                        // Found CRLF; preserve both bytes.
540                        line_end += 2;
541                    }
542                }
543            }
544            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
545        }
546    }
547}
548
549void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
550    if(CountOnly){
551        if (!ShowFileNames) {
552            for (unsigned i = 0; i < inputFiles.size(); ++i){
553                std::cout << total_CountOnly[i] << std::endl;
554            }
555        }
556        else {
557            for (unsigned i = 0; i < inputFiles.size(); ++i){
558                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
559            };
560        }
561        return;
562    }
563   
564    for (unsigned i = 0; i < inputFiles.size(); ++i){
565        std::cout << resultStrs[i].str();
566    }
567}
568
569re::CC * parsedCodePointSet;
570
571extern "C" {
572    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
573        re::codepoint_t c = 0;
574        ssize_t line_pos = line_start;
575        while (isxdigit(buffer[line_pos])) {
576            if (isdigit(buffer[line_pos])) {
577                c = (c << 4) | (buffer[line_pos] - '0');
578            }
579            else {
580                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
581            }
582            line_pos++;
583        }
584        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
585        parsedCodePointSet->insert(c);
586    }
587}
588
589void setParsedCodePointSet(){
590    parsedCodePointSet = re::makeCC();
591}
592
593re::CC * getParsedCodePointSet(){
594    return parsedCodePointSet;
595}
596
597
598void icgrep_Linking(Module * m, ExecutionEngine * e) {
599    Module::FunctionListType & fns = m->getFunctionList();
600    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
601        std::string fnName = it->getName().str();
602        if (fnName == "s2p_block") continue;
603        if (fnName == "process_block") continue;
604        if (fnName == "process_block_initialize_carries") continue;
605       
606        if (fnName == "wrapped_report_match") {
607            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
608        }
609        if (fnName == "insert_codepoints") {
610            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
611        }
612#ifndef DISABLE_PREGENERATED_UCD_FUNCTIONS
613        else {
614            const UCD::ExternalProperty & ep = UCD::resolveExternalProperty(fnName);
615            e->addGlobalMapping(cast<GlobalValue>(it), std::get<0>(ep));
616        }
617#endif
618    }
619}
620
Note: See TracBrowser for help on using the repository browser.