source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5217

Last change on this file since 5217 was 5217, checked in by nmedfort, 2 years ago

Merged PabloFunction? and PabloKernel? classes. Updated projects where necessary.

File size: 24.8 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <grep_engine.h>
8#include <IDISA/idisa_builder.h>
9#include <IDISA/idisa_target.h>
10#include <llvm/Support/CommandLine.h>
11#include <re/re_toolchain.h>
12#include <re/re_cc.h>
13
14#include <pablo/pablo_toolchain.h>
15#include <toolchain.h>
16#include <pablo/pablo_compiler.h>
17#include <kernels/pipeline.h>
18#include <llvm/IR/Function.h>
19#include <llvm/IR/Type.h>
20#include <llvm/IR/Module.h>
21#include <llvm/ExecutionEngine/MCJIT.h>
22#include <llvm/IRReader/IRReader.h>
23#include <llvm/Support/Debug.h>
24#include <llvm/IR/Verifier.h>
25#include <llvm/IR/TypeBuilder.h>
26#include <UCD/UnicodeNameData.h>
27#include <UCD/resolve_properties.h>
28
29
30#include <kernels/streamset.h>
31#include <kernels/scanmatchgen.h>
32#include <kernels/s2p_kernel.h>
33#include <kernels/cc_kernel.h>
34#include <kernels/pipeline.h>
35
36#include <pablo/prototype.h>
37#include <pablo/pablo_kernel.h>
38#include <pablo/pablo_toolchain.h>
39
40#include <llvm/IR/Intrinsics.h>
41#include "llvm/Support/SourceMgr.h"
42#include "llvm/IRReader/IRReader.h"
43#include "llvm/Linker/Linker.h"
44#include "llvm-c/Core.h"
45
46#include <fstream>
47#include <sstream>
48#include <iostream>
49#include <string>
50#include <stdint.h>
51
52#include <stdio.h>
53#include <stdlib.h>
54#include <unistd.h>
55#include <errno.h>
56#include <sys/types.h>
57#include <sys/stat.h>
58#include <stdexcept>
59#include <cctype>
60
61
62#include <llvm/Support/raw_os_ostream.h>
63
64// mmap system
65#include <boost/filesystem.hpp>
66#include <boost/iostreams/device/mapped_file.hpp>
67
68#include <fcntl.h>
69
70#include <kernels/kernel.h>
71
72#ifdef CUDA_ENABLED
73#include <IDISA/CudaDriver.h>
74#endif
75
76static cl::OptionCategory bGrepOutputOptions("Output Options",
77                                             "These options control the output.");
78static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
79
80static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
81
82static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
83
84static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
85static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
86
87static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
88static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
89
90static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
91
92static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
93
94bool isUTF_16 = false;
95std::string IRFilename = "icgrep.ll";
96std::string PTXFilename = "icgrep.ptx";
97
98void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
99    boost::filesystem::path file(fileName);
100    if (exists(file)) {
101        if (is_directory(file)) {
102            return;
103        }
104    } else {
105        if (!SilenceFileErrors) {
106            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
107            return;
108        }
109    }
110
111    const auto fileSize = file_size(file);
112    if (fileSize > 0) {
113        try {
114            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
115            char * fileBuffer = const_cast<char *>(source.data());
116#ifdef CUDA_ENABLED 
117            if(codegen::NVPTX){
118                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
119                if (CountOnly){
120                    exit(0);
121                }
122                else{
123                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
124                    return;
125                }
126               
127            } 
128#endif
129            if (CountOnly) {
130                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
131            } else {
132                mGrepFunction(fileBuffer, fileSize, fileIdx);
133            }
134            source.close();
135        } catch (std::exception & e) {
136            if (!SilenceFileErrors) {
137                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
138                return;
139            }
140        }
141    } else {
142#ifdef CUDA_ENABLED
143        if (codegen::NVPTX){
144            std::cout << 0 << std::endl;
145            exit(0);
146        }
147#endif
148        if (CountOnly) {
149            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
150        } else {
151            mGrepFunction(nullptr, 0, fileIdx);
152        }
153    }
154}
155
156using namespace parabix;
157
158Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
159    Type * const int64ty = iBuilder->getInt64Ty();
160    Type * const inputType = PointerType::get(int64ty, 1);
161    Type * const resultTy = iBuilder->getVoidTy();
162    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
163    kernelFunc->setCallingConv(CallingConv::C);
164    Function::arg_iterator args = kernelFunc->arg_begin();
165
166    Value * const inputPtr = &*(args++);
167    inputPtr->setName("inputPtr");
168    Value * const bufferSizePtr = &*(args++);
169    bufferSizePtr->setName("bufferSizePtr");
170    Value * const outputPtr = &*(args++);
171    outputPtr->setName("resultPtr");
172
173    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
174    iBuilder->SetInsertPoint(entryBlock);
175
176    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
177    Value * id = iBuilder->CreateCall(tidFunc);
178
179    Function * mainFunc = m->getFunction("Main");
180    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
181    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
182    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
183
184    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
185    if (CountOnly){
186        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
187        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
188        iBuilder->CreateStore(result, outputThreadPtr);
189    }
190    else {
191        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
192        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
193        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
194        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
195    }   
196
197    iBuilder->CreateRetVoid();
198    return kernelFunc;
199}
200
201Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
202    Type * const size_ty = iBuilder->getSizeTy();
203    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
204    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
205    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
206    mainCPUFn->setCallingConv(CallingConv::C);
207    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
208    Function::arg_iterator args = mainCPUFn->arg_begin();
209   
210    Value * const rsltStream = &*(args++);
211    rsltStream->setName("rslt");
212    Value * const inputStream = &*(args++);
213    inputStream->setName("input");
214    Value * const fileSize = &*(args++);
215    fileSize->setName("fileSize");
216    Value * const fileIdx = &*(args++);
217    fileIdx->setName("fileIdx");
218
219    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1));
220    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
221
222    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
223    scanMatchK.generateKernel({&MatchResults}, {});
224           
225    Value * scanMatchInstance = scanMatchK.createInstance({inputStream, fileSize, fileIdx});
226   
227    generatePipelineLoop(iBuilder, {&scanMatchK}, {scanMatchInstance}, fileSize);
228    iBuilder->CreateRetVoid();
229
230    return mainCPUFn;
231}
232
233void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
234    isUTF_16 = UTF_16;
235    int addrSpace = 0;
236    bool CPU_Only = true;
237    Module * M = nullptr; 
238    IDISA::IDISA_Builder * iBuilder = nullptr; 
239
240#ifdef CUDA_ENABLED
241    setNVPTXOption(); 
242    if (codegen::NVPTX) {
243        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
244        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
245        M = gpuM;
246        iBuilder = GPUBuilder;
247        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
248        M->setTargetTriple("nvptx64-nvidia-cuda");
249        addrSpace = 1;
250        CPU_Only = false;
251        codegen::BlockSize = 64;
252    }
253#endif
254
255    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
256    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
257
258    if (CPU_Only) {
259        M = cpuM;
260        iBuilder = CPUBuilder;
261    }
262
263    const unsigned segmentSize = codegen::SegmentSize;
264    if (segmentPipelineParallel && codegen::BufferSegments < 2) {
265        codegen::BufferSegments = 2;
266    }
267    const unsigned bufferSegments = codegen::BufferSegments;
268
269
270    unsigned encodingBits = UTF_16 ? 16 : 8;
271
272    mGrepType = grepType;
273
274    Type * const int32ty = iBuilder->getInt32Ty();
275    Type * const size_ty = iBuilder->getSizeTy();
276    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
277    Type * const voidTy = Type::getVoidTy(M->getContext());   
278    Type * const voidPtrTy = TypeBuilder<void *, false>::get(M->getContext());
279    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), (UTF_16 ? 16 : 8)), 1), addrSpace);
280    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
281
282    Function * mainFn = nullptr;
283    Value * inputStream = nullptr;
284    Value * fileSize = nullptr;
285    Value * fileIdx = nullptr;
286
287#ifdef CUDA_ENABLED   
288    Value * outputStream = nullptr;
289    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
290    if (codegen::NVPTX){
291        if (CountOnly){
292            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
293            mainFn->setCallingConv(CallingConv::C);
294            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
295            Function::arg_iterator args = mainFn->arg_begin();
296           
297            inputStream = &*(args++);
298            inputStream->setName("input");
299            fileSize = &*(args++);
300            fileSize->setName("fileSize");
301        } else {
302            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
303            mainFn->setCallingConv(CallingConv::C);
304            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
305            Function::arg_iterator args = mainFn->arg_begin();
306           
307            inputStream = &*(args++);
308            inputStream->setName("input");
309            fileSize = &*(args++);
310            fileSize->setName("fileSize");
311            outputStream = &*(args++);
312            outputStream->setName("output");
313        }
314    } 
315#endif
316    if (CPU_Only){
317        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
318        mainFn->setCallingConv(CallingConv::C);
319        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
320        Function::arg_iterator args = mainFn->arg_begin();
321       
322        inputStream = &*(args++);
323        inputStream->setName("input");
324        fileSize = &*(args++);
325        fileSize->setName("fileSize");
326        fileIdx = &*(args++);
327        fileIdx->setName("fileIdx");
328    }
329       
330    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
331    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8, 1), segmentSize * bufferSegments);
332
333    kernel::s2pKernel  s2pk(iBuilder);
334    s2pk.generateKernel({&ByteStream}, {&BasisBits});
335   
336    pablo::PabloKernel icgrepK(iBuilder, "icgrep");
337
338    re_ast = re::regular_expression_passes(re_ast);
339    re::re2pablo_compiler(&icgrepK, encodingBits, re_ast, CountOnly);
340    pablo_function_passes(&icgrepK);
341
342
343
344    ByteStream.setStreamSetBuffer(inputStream, fileSize);
345    BasisBits.allocateBuffer();
346
347    Value * s2pInstance = s2pk.createInstance({});
348 
349    Type * pthreadTy = size_ty;
350    FunctionType * funVoidPtrVoidTy = FunctionType::get(voidTy, int8PtrTy, false);   
351   
352    Function * pthreadCreateFunc = cast<Function>(M->getOrInsertFunction("pthread_create",
353                                        int32ty, 
354                                        pthreadTy->getPointerTo(), 
355                                        voidPtrTy, 
356                                        static_cast<Type *>(funVoidPtrVoidTy)->getPointerTo(),
357                                        voidPtrTy, nullptr));
358    pthreadCreateFunc->setCallingConv(llvm::CallingConv::C);
359    Function * pthreadJoinFunc = cast<Function>(M->getOrInsertFunction("pthread_join", 
360                                        int32ty, 
361                                        pthreadTy, 
362                                        PointerType::get(int8PtrTy, 0), nullptr));
363    pthreadJoinFunc->setCallingConv(llvm::CallingConv::C);
364
365    Function * pthreadExitFunc = cast<Function>(M->getOrInsertFunction("pthread_exit", 
366                                        voidTy, 
367                                        voidPtrTy, nullptr));
368    pthreadExitFunc->addFnAttr(llvm::Attribute::NoReturn);
369    pthreadExitFunc->setCallingConv(llvm::CallingConv::C);
370
371    if (CountOnly) {       
372        icgrepK.generateKernel({&BasisBits}, {});       
373        Value * icgrepInstance = icgrepK.createInstance({});
374        if (pipelineParallel){
375            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance});
376        } else if (segmentPipelineParallel){
377            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
378        } else {
379            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
380        }
381
382        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepInstance, "matchedLineCount");
383
384        iBuilder->CreateRet(matchCount);
385
386    } else {
387#ifdef CUDA_ENABLED
388        if (codegen::NVPTX){
389            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, i1), addrSpace);
390            MatchResults.setStreamSetBuffer(outputStream, fileSize);
391
392            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
393            Value * icgrepInstance = icgrepK.createInstance({});
394
395            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK}, {s2pInstance, icgrepInstance}, fileSize);
396
397        }
398#endif
399        if (CPU_Only) {
400            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1), segmentSize * bufferSegments);
401            MatchResults.allocateBuffer();
402
403            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
404            Value * icgrepInstance = icgrepK.createInstance({});
405
406            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
407            scanMatchK.generateKernel({&MatchResults}, {});               
408            Value * scanMatchInstance = scanMatchK.createInstance({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
409
410            if (pipelineParallel){
411                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance});
412            } else if (segmentPipelineParallel){
413                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
414            }  else{
415                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK}, {s2pInstance, icgrepInstance, scanMatchInstance}, fileSize);
416            }
417        }
418
419        iBuilder->CreateRetVoid();
420
421    }
422
423#ifdef CUDA_ENABLED
424    Function * mainCPUFn = nullptr;
425    if(codegen::NVPTX){
426        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
427        MDNode * Node = MDNode::get(M->getContext(),
428                                    {llvm::ValueAsMetadata::get(kernelFunction),
429                                     MDString::get(M->getContext(), "kernel"), 
430                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
431        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
432        NMD->addOperand(Node);
433   
434        Compile2PTX(M, IRFilename, PTXFilename);
435        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
436        if (CountOnly) return;
437    }
438#endif
439   
440     
441    mEngine = JIT_to_ExecutionEngine(cpuM);
442    ApplyObjectCache(mEngine);
443    icgrep_Linking(cpuM, mEngine);
444
445#ifndef NDEBUG
446    verifyModule(*M, &dbgs());
447#endif
448
449    mEngine->finalizeObject();
450    delete iBuilder;
451   
452    if (CountOnly) {
453        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
454    } else {
455#ifdef CUDA_ENABLED
456        if(codegen::NVPTX){
457            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
458        }
459#endif
460        if (CPU_Only) {
461            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
462        }
463    }
464
465}
466
467re::CC *  GrepEngine::grepCodepoints() {
468
469    setParsedCodePointSet();
470    char * mFileBuffer = getUnicodeNameDataPtr();
471    size_t mFileSize = getUnicodeNameDataSize();
472
473    mGrepFunction(mFileBuffer, mFileSize, 0);
474
475    return getParsedCodePointSet();
476}
477
478const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
479    setParsedPropertyValues();
480
481    std::string str = UCD::getPropertyValueGrepString(propertyName);
482    char* grepInput = nullptr;
483    posix_memalign( (void**)&grepInput, 32, str.size() * sizeof(char));
484    strncpy(grepInput, str.c_str(), str.size());
485    mGrepFunction(grepInput, str.size(), 0);
486    free(grepInput);
487
488    return getParsedProeprtyValues();
489}
490
491GrepEngine::~GrepEngine() {
492//    delete mEngine;
493}
494
495static int * total_count;
496static std::stringstream * resultStrs = nullptr;
497static std::vector<std::string> inputFiles;
498
499void initResult(std::vector<std::string> filenames){
500    const int n = filenames.size();
501    if (n > 1) {
502        ShowFileNames = true;
503    }
504    inputFiles = filenames;
505    resultStrs = new std::stringstream[n];
506    total_count = new int[n];
507    for (unsigned i = 0; i < inputFiles.size(); ++i){
508        total_count[i] = 0;
509    }
510   
511}
512
513extern "C" {
514    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
515        int index = isUTF_16 ? 2 : 1;
516        int idx = fileIdx;
517         
518        if (ShowFileNames) {
519            resultStrs[idx] << inputFiles[idx] << ':';
520        }
521        if (ShowLineNumbers) {
522            resultStrs[idx] << lineNum << ":";
523        }
524       
525        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
526            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
527            line_start++;
528        }
529        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
530            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
531            line_start += 2;
532        }
533        if (line_end == filesize) {
534            // The match position is at end-of-file.   We have a final unterminated line.
535            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
536            if (NormalizeLineBreaks) {
537                resultStrs[idx] << '\n';  // terminate it
538            }
539            return;
540        }
541        unsigned char end_byte = (unsigned char)buffer[line_end]; 
542        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
543        if (NormalizeLineBreaks) {
544            if (end_byte == 0x85) {
545                // Line terminated with NEL, on the second byte.  Back up 1.
546                line_end--;
547            } else if (end_byte > 0xD) {
548                // Line terminated with PS or LS, on the third byte.  Back up 2.
549                isUTF_16 ? line_end-- : line_end -= 2;
550            }
551            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
552            resultStrs[idx] << '\n';
553        }
554        else {   
555            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
556                // Check for line_end on first byte of CRLF;  note that we don't
557                // want to access past the end of buffer.
558                if (line_end + 1 < filesize) {
559                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
560                        // Found CRLF; preserve both bytes.
561                        line_end++;
562                    }
563                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
564                        // Found CRLF; preserve both bytes.
565                        line_end += 2;
566                    }
567                }
568            }
569            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
570        }
571    }
572}
573
574void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
575   
576    if(CountOnly){
577        if (!ShowFileNames) {
578            for (unsigned i = 0; i < inputFiles.size(); ++i){
579                std::cout << total_CountOnly[i] << std::endl;
580            }
581        }
582        else {
583            for (unsigned i = 0; i < inputFiles.size(); ++i){
584                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
585            };
586        }
587        return;
588    }
589   
590    for (unsigned i = 0; i < inputFiles.size(); ++i){
591        std::cout << resultStrs[i].str();
592    }
593}
594
595re::CC * parsedCodePointSet;
596
597extern "C" {
598    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
599        re::codepoint_t c = 0;
600        ssize_t line_pos = line_start;
601        while (isxdigit(buffer[line_pos])) {
602            if (isdigit(buffer[line_pos])) {
603                c = (c << 4) | (buffer[line_pos] - '0');
604            }
605            else {
606                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
607            }
608            line_pos++;
609        }
610        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
611        parsedCodePointSet->insert(c);
612    }
613}
614
615void setParsedCodePointSet(){
616    parsedCodePointSet = re::makeCC();
617}
618
619re::CC * getParsedCodePointSet(){
620    return parsedCodePointSet;
621}
622
623
624std::vector<std::string> parsedPropertyValues;
625
626extern "C" {
627    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
628        auto result = std::string(buffer + line_start, buffer + line_end);
629        parsedPropertyValues.push_back(result);
630    }
631}
632
633inline void setParsedPropertyValues() {
634    parsedPropertyValues.clear();
635}
636
637inline const std::vector<std::string>& getParsedProeprtyValues() {
638    return parsedPropertyValues;
639}
640
641
642void icgrep_Linking(Module * m, ExecutionEngine * e) {
643    Module::FunctionListType & fns = m->getFunctionList();
644    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
645        std::string fnName = it->getName().str();
646        if (fnName == "s2p_block") continue;
647        if (fnName == "process_block") continue;
648        if (fnName == "process_block_initialize_carries") continue;
649       
650        if (fnName == "wrapped_report_match") {
651            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
652        }
653        if (fnName == "insert_codepoints") {
654            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
655        }
656        if (fnName == "insert_property_values") {
657            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
658        }
659#ifndef DISABLE_PREGENERATED_UCD_FUNCTIONS
660        else {
661            const UCD::ExternalProperty & ep = UCD::resolveExternalProperty(fnName);
662            e->addGlobalMapping(cast<GlobalValue>(it), std::get<0>(ep));
663        }
664#endif
665    }
666}
667
Note: See TracBrowser for help on using the repository browser.