source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5230

Last change on this file since 5230 was 5230, checked in by nmedfort, 2 years ago

Multi-threading support for PabloAST / PabloCompiler?. Requires unique LLVM Context / Module for each thread.

File size: 24.0 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <grep_engine.h>
8#include <IDISA/idisa_builder.h>
9#include <IDISA/idisa_target.h>
10#include <llvm/Support/CommandLine.h>
11#include <re/re_toolchain.h>
12#include <re/re_cc.h>
13
14#include <pablo/pablo_toolchain.h>
15#include <toolchain.h>
16#include <pablo/pablo_compiler.h>
17#include <kernels/pipeline.h>
18#include <llvm/IR/Function.h>
19#include <llvm/IR/Type.h>
20#include <llvm/IR/Module.h>
21#include <llvm/ExecutionEngine/MCJIT.h>
22#include <llvm/IRReader/IRReader.h>
23#include <llvm/Support/Debug.h>
24#include <llvm/IR/Verifier.h>
25#include <UCD/UnicodeNameData.h>
26#include <UCD/resolve_properties.h>
27
28
29#include <kernels/streamset.h>
30#include <kernels/scanmatchgen.h>
31#include <kernels/s2p_kernel.h>
32#include <kernels/cc_kernel.h>
33#include <kernels/pipeline.h>
34
35#include <pablo/pablo_kernel.h>
36#include <pablo/pablo_toolchain.h>
37
38#include <llvm/IR/Intrinsics.h>
39#include "llvm/Support/SourceMgr.h"
40#include "llvm/IRReader/IRReader.h"
41#include "llvm/Linker/Linker.h"
42#include "llvm-c/Core.h"
43
44#include <fstream>
45#include <sstream>
46#include <iostream>
47#include <string>
48#include <stdint.h>
49
50#include <stdio.h>
51#include <stdlib.h>
52#include <unistd.h>
53#include <errno.h>
54#include <sys/types.h>
55#include <sys/stat.h>
56#include <stdexcept>
57#include <cctype>
58
59
60#include <llvm/Support/raw_os_ostream.h>
61
62// mmap system
63#include <boost/filesystem.hpp>
64#include <boost/iostreams/device/mapped_file.hpp>
65
66#include <fcntl.h>
67
68#include <kernels/kernel.h>
69
70#ifdef CUDA_ENABLED
71#include <IDISA/CudaDriver.h>
72#endif
73
74static cl::OptionCategory bGrepOutputOptions("Output Options",
75                                             "These options control the output.");
76static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
77
78static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
79
80static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
81
82static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
83static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
84
85static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
86static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
87
88static cl::opt<bool> pipelineParallel("enable-pipeline-parallel", cl::desc("Enable multithreading with pipeline parallelism."), cl::cat(bGrepOutputOptions));
89
90static cl::opt<bool> segmentPipelineParallel("enable-segment-pipeline-parallel", cl::desc("Enable multithreading with segment pipeline parallelism."), cl::cat(bGrepOutputOptions));
91
92bool isUTF_16 = false;
93std::string IRFilename = "icgrep.ll";
94std::string PTXFilename = "icgrep.ptx";
95
96void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly, bool UTF_16) {
97    boost::filesystem::path file(fileName);
98    if (exists(file)) {
99        if (is_directory(file)) {
100            return;
101        }
102    } else {
103        if (!SilenceFileErrors) {
104            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
105            return;
106        }
107    }
108
109    const auto fileSize = file_size(file);
110    if (fileSize > 0) {
111        try {
112            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
113            char * fileBuffer = const_cast<char *>(source.data());
114#ifdef CUDA_ENABLED 
115            if(codegen::NVPTX){
116                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly);
117                if (CountOnly){
118                    exit(0);
119                }
120                else{
121                    mGrepFunction_CPU((char *)rslt, fileBuffer, fileSize, fileIdx);
122                    return;
123                }
124               
125            } 
126#endif
127            if (CountOnly) {
128                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
129            } else {
130                mGrepFunction(fileBuffer, fileSize, fileIdx);
131            }
132            source.close();
133        } catch (std::exception & e) {
134            if (!SilenceFileErrors) {
135                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
136                return;
137            }
138        }
139    } else {
140#ifdef CUDA_ENABLED
141        if (codegen::NVPTX){
142            std::cout << 0 << std::endl;
143            exit(0);
144        }
145#endif
146        if (CountOnly) {
147            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
148        } else {
149            mGrepFunction(nullptr, 0, fileIdx);
150        }
151    }
152}
153
154using namespace parabix;
155
156Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
157    Type * const int64ty = iBuilder->getInt64Ty();
158    Type * const inputType = PointerType::get(int64ty, 1);
159    Type * const resultTy = iBuilder->getVoidTy();
160    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, inputType, inputType, nullptr));
161    kernelFunc->setCallingConv(CallingConv::C);
162    Function::arg_iterator args = kernelFunc->arg_begin();
163
164    Value * const inputPtr = &*(args++);
165    inputPtr->setName("inputPtr");
166    Value * const bufferSizePtr = &*(args++);
167    bufferSizePtr->setName("bufferSizePtr");
168    Value * const outputPtr = &*(args++);
169    outputPtr->setName("resultPtr");
170
171    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
172    iBuilder->SetInsertPoint(entryBlock);
173
174    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
175    Value * id = iBuilder->CreateCall(tidFunc);
176
177    Function * mainFunc = m->getFunction("Main");
178    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
179    Value * inputStreamPtr = iBuilder->CreateBitCast(inputPtr, inputStreamType); 
180    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, id);
181
182    Value * bufferSize = iBuilder->CreateLoad(bufferSizePtr);
183    if (CountOnly){
184        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, id);
185        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
186        iBuilder->CreateStore(result, outputThreadPtr);
187    }
188    else {
189        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 1);
190        Value * outputStreamPtr = iBuilder->CreateBitCast(outputPtr, outputStremType);
191        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, id);
192        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
193    }   
194
195    iBuilder->CreateRetVoid();
196    return kernelFunc;
197}
198
199Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
200    Type * const size_ty = iBuilder->getSizeTy();
201    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
202    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), 0);
203    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, int8PtrTy, size_ty, size_ty, nullptr));
204    mainCPUFn->setCallingConv(CallingConv::C);
205    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
206    Function::arg_iterator args = mainCPUFn->arg_begin();
207   
208    Value * const rsltStream = &*(args++);
209    rsltStream->setName("rslt");
210    Value * const inputStream = &*(args++);
211    inputStream->setName("input");
212    Value * const fileSize = &*(args++);
213    fileSize->setName("fileSize");
214    Value * const fileIdx = &*(args++);
215    fileIdx->setName("fileIdx");
216
217    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1));
218    MatchResults.setStreamSetBuffer(rsltStream, fileSize);
219
220    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType);
221    scanMatchK.generateKernel({&MatchResults}, {});
222           
223    scanMatchK.setInitialArguments({inputStream, fileSize, fileIdx});
224   
225    generatePipelineLoop(iBuilder, {&scanMatchK});
226    iBuilder->CreateRetVoid();
227
228    return mainCPUFn;
229}
230
231void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType) {
232    isUTF_16 = UTF_16;
233    int addrSpace = 0;
234    bool CPU_Only = true;
235    Module * M = nullptr; 
236    IDISA::IDISA_Builder * iBuilder = nullptr; 
237
238#ifdef CUDA_ENABLED
239    setNVPTXOption(); 
240    if (codegen::NVPTX) {
241        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
242        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
243        M = gpuM;
244        iBuilder = GPUBuilder;
245        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
246        M->setTargetTriple("nvptx64-nvidia-cuda");
247        addrSpace = 1;
248        CPU_Only = false;
249        codegen::BlockSize = 64;
250    }
251#endif
252
253    Module * cpuM = new Module(moduleName+":cpu", getGlobalContext());
254    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
255
256    if (CPU_Only) {
257        M = cpuM;
258        iBuilder = CPUBuilder;
259    }
260
261    const unsigned segmentSize = codegen::SegmentSize;
262    if (segmentPipelineParallel && codegen::BufferSegments < 2) {
263        codegen::BufferSegments = 2;
264    }
265    const unsigned bufferSegments = codegen::BufferSegments;
266
267
268    unsigned encodingBits = UTF_16 ? 16 : 8;
269
270    mGrepType = grepType;
271
272    Type * const int32ty = iBuilder->getInt32Ty();
273    Type * const size_ty = iBuilder->getSizeTy();
274    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
275    Type * const voidTy = iBuilder->getVoidTy();
276    Type * const voidPtrTy = iBuilder->getVoidPtrTy();
277    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), (UTF_16 ? 16 : 8)), 1), addrSpace);
278    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
279
280    Function * mainFn = nullptr;
281    Value * inputStream = nullptr;
282    Value * fileSize = nullptr;
283    Value * fileIdx = nullptr;
284
285#ifdef CUDA_ENABLED   
286    Value * outputStream = nullptr;
287    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 2), addrSpace);
288    if (codegen::NVPTX){
289        if (CountOnly){
290            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
291            mainFn->setCallingConv(CallingConv::C);
292            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
293            Function::arg_iterator args = mainFn->arg_begin();
294           
295            inputStream = &*(args++);
296            inputStream->setName("input");
297            fileSize = &*(args++);
298            fileSize->setName("fileSize");
299        } else {
300            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
301            mainFn->setCallingConv(CallingConv::C);
302            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
303            Function::arg_iterator args = mainFn->arg_begin();
304           
305            inputStream = &*(args++);
306            inputStream->setName("input");
307            fileSize = &*(args++);
308            fileSize->setName("fileSize");
309            outputStream = &*(args++);
310            outputStream->setName("output");
311        }
312    } 
313#endif
314    if (CPU_Only){
315        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
316        mainFn->setCallingConv(CallingConv::C);
317        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
318        Function::arg_iterator args = mainFn->arg_begin();
319       
320        inputStream = &*(args++);
321        inputStream->setName("input");
322        fileSize = &*(args++);
323        fileSize->setName("fileSize");
324        fileIdx = &*(args++);
325        fileIdx->setName("fileIdx");
326    }
327       
328    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
329    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8, 1), segmentSize * bufferSegments);
330
331    kernel::S2PKernel  s2pk(iBuilder);
332    s2pk.generateKernel({&ByteStream}, {&BasisBits});
333   
334    pablo::PabloKernel icgrepK(iBuilder, "icgrep");
335
336    re_ast = re::regular_expression_passes(re_ast);
337    re::re2pablo_compiler(&icgrepK, encodingBits, re_ast, CountOnly);
338    pablo_function_passes(&icgrepK);
339
340
341
342    ByteStream.setStreamSetBuffer(inputStream, fileSize);
343    BasisBits.allocateBuffer();
344
345    Type * pthreadTy = size_ty;
346    FunctionType * funVoidPtrVoidTy = FunctionType::get(voidTy, int8PtrTy, false);   
347   
348    Function * pthreadCreateFunc = cast<Function>(M->getOrInsertFunction("pthread_create",
349                                        int32ty, 
350                                        pthreadTy->getPointerTo(), 
351                                        voidPtrTy, 
352                                        static_cast<Type *>(funVoidPtrVoidTy)->getPointerTo(),
353                                        voidPtrTy, nullptr));
354    pthreadCreateFunc->setCallingConv(llvm::CallingConv::C);
355    Function * pthreadJoinFunc = cast<Function>(M->getOrInsertFunction("pthread_join", 
356                                        int32ty, 
357                                        pthreadTy, 
358                                        PointerType::get(int8PtrTy, 0), nullptr));
359    pthreadJoinFunc->setCallingConv(llvm::CallingConv::C);
360
361    Function * pthreadExitFunc = cast<Function>(M->getOrInsertFunction("pthread_exit", 
362                                        voidTy, 
363                                        voidPtrTy, nullptr));
364    pthreadExitFunc->addFnAttr(llvm::Attribute::NoReturn);
365    pthreadExitFunc->setCallingConv(llvm::CallingConv::C);
366
367    if (CountOnly) {       
368        icgrepK.generateKernel({&BasisBits}, {});       
369        if (pipelineParallel){
370            generatePipelineParallel(iBuilder, {&s2pk, &icgrepK});
371        } else if (segmentPipelineParallel){
372            generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK});
373        } else {
374            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK});
375        }
376
377        Value * matchCount = icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount");
378
379        iBuilder->CreateRet(matchCount);
380
381    } else {
382#ifdef CUDA_ENABLED
383        if (codegen::NVPTX){
384            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(2, i1), addrSpace);
385            MatchResults.setStreamSetBuffer(outputStream, fileSize);
386
387            icgrepK.generateKernel({&BasisBits},  {&MatchResults});
388            generatePipelineLoop(iBuilder, {&s2pk, &icgrepK});
389
390        }
391#endif
392        if (CPU_Only) {
393            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( 2, 1), segmentSize * bufferSegments);
394            MatchResults.allocateBuffer();
395
396            icgrepK.generateKernel({&BasisBits}, {&MatchResults});
397
398            kernel::ScanMatchKernel scanMatchK(iBuilder, mGrepType);
399            scanMatchK.generateKernel({&MatchResults}, {});               
400            scanMatchK.setInitialArguments({iBuilder->CreateBitCast(inputStream, int8PtrTy), fileSize, fileIdx});
401
402            if (pipelineParallel){
403                generatePipelineParallel(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
404            } else if (segmentPipelineParallel){
405                generateSegmentParallelPipeline(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
406            }  else{
407                generatePipelineLoop(iBuilder, {&s2pk, &icgrepK, &scanMatchK});
408            }
409        }
410
411        iBuilder->CreateRetVoid();
412
413    }
414
415#ifdef CUDA_ENABLED
416    Function * mainCPUFn = nullptr;
417    if(codegen::NVPTX){
418        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
419        MDNode * Node = MDNode::get(M->getContext(),
420                                    {llvm::ValueAsMetadata::get(kernelFunction),
421                                     MDString::get(M->getContext(), "kernel"), 
422                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
423        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
424        NMD->addOperand(Node);
425   
426        Compile2PTX(M, IRFilename, PTXFilename);
427        mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
428        if (CountOnly) return;
429    }
430#endif
431   
432     
433    mEngine = JIT_to_ExecutionEngine(cpuM);
434    ApplyObjectCache(mEngine);
435    icgrep_Linking(cpuM, mEngine);
436
437#ifndef NDEBUG
438    verifyModule(*M, &dbgs());
439#endif
440
441    mEngine->finalizeObject();
442    delete iBuilder;
443   
444    if (CountOnly) {
445        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
446    } else {
447#ifdef CUDA_ENABLED
448        if(codegen::NVPTX){
449            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(mEngine->getPointerToFunction(mainCPUFn));
450        }
451#endif
452        if (CPU_Only) {
453            mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
454        }
455    }
456
457}
458
459re::CC *  GrepEngine::grepCodepoints() {
460
461    setParsedCodePointSet();
462    char * mFileBuffer = getUnicodeNameDataPtr();
463    size_t mFileSize = getUnicodeNameDataSize();
464
465    mGrepFunction(mFileBuffer, mFileSize, 0);
466
467    return getParsedCodePointSet();
468}
469
470const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
471    setParsedPropertyValues();
472
473    std::string str = UCD::getPropertyValueGrepString(propertyName);
474    char* grepInput = nullptr;
475    posix_memalign( (void**)&grepInput, 32, str.size() * sizeof(char));
476    strncpy(grepInput, str.c_str(), str.size());
477    mGrepFunction(grepInput, str.size(), 0);
478    free(grepInput);
479
480    return getParsedProeprtyValues();
481}
482
483GrepEngine::~GrepEngine() {
484//    delete mEngine;
485}
486
487static int * total_count;
488static std::stringstream * resultStrs = nullptr;
489static std::vector<std::string> inputFiles;
490
491void initResult(std::vector<std::string> filenames){
492    const int n = filenames.size();
493    if (n > 1) {
494        ShowFileNames = true;
495    }
496    inputFiles = filenames;
497    resultStrs = new std::stringstream[n];
498    total_count = new int[n];
499    for (unsigned i = 0; i < inputFiles.size(); ++i){
500        total_count[i] = 0;
501    }
502   
503}
504
505extern "C" {
506    void wrapped_report_match(size_t lineNum, size_t line_start, size_t line_end, const char * buffer, size_t filesize, int fileIdx) {
507        int index = isUTF_16 ? 2 : 1;
508        int idx = fileIdx;
509         
510        if (ShowFileNames) {
511            resultStrs[idx] << inputFiles[idx] << ':';
512        }
513        if (ShowLineNumbers) {
514            resultStrs[idx] << lineNum << ":";
515        }
516       
517        if ((!isUTF_16 && buffer[line_start] == 0xA) && (line_start != line_end)) {
518            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
519            line_start++;
520        }
521        if (((isUTF_16 && buffer[line_start] == 0x0) && buffer[line_start + 1] == 0xA) && (line_start != line_end)) {
522            // The line "starts" on the LF of a CRLF.  Really the end of the last line.
523            line_start += 2;
524        }
525        if (line_end == filesize) {
526            // The match position is at end-of-file.   We have a final unterminated line.
527            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
528            if (NormalizeLineBreaks) {
529                resultStrs[idx] << '\n';  // terminate it
530            }
531            return;
532        }
533        unsigned char end_byte = (unsigned char)buffer[line_end]; 
534        unsigned char penult_byte = (unsigned char)(buffer[line_end - 1]);
535        if (NormalizeLineBreaks) {
536            if (end_byte == 0x85) {
537                // Line terminated with NEL, on the second byte.  Back up 1.
538                line_end--;
539            } else if (end_byte > 0xD) {
540                // Line terminated with PS or LS, on the third byte.  Back up 2.
541                isUTF_16 ? line_end-- : line_end -= 2;
542            }
543            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start) * index);
544            resultStrs[idx] << '\n';
545        }
546        else {   
547            if ((!isUTF_16 && end_byte == 0x0D) || (isUTF_16 && (end_byte == 0x0D && penult_byte == 0x0))) {
548                // Check for line_end on first byte of CRLF;  note that we don't
549                // want to access past the end of buffer.
550                if (line_end + 1 < filesize) {
551                    if (!isUTF_16 && buffer[line_end + 1] == 0x0A) {
552                        // Found CRLF; preserve both bytes.
553                        line_end++;
554                    }
555                    if (isUTF_16 && buffer[line_end + 1] == 0x0 && buffer[line_end + 2] == 0x0A) {
556                        // Found CRLF; preserve both bytes.
557                        line_end += 2;
558                    }
559                }
560            }
561            resultStrs[idx].write(&buffer[line_start * index], (line_end - line_start + 1) * index);
562        }
563    }
564}
565
566void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
567   
568    if(CountOnly){
569        if (!ShowFileNames) {
570            for (unsigned i = 0; i < inputFiles.size(); ++i){
571                std::cout << total_CountOnly[i] << std::endl;
572            }
573        }
574        else {
575            for (unsigned i = 0; i < inputFiles.size(); ++i){
576                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
577            };
578        }
579        return;
580    }
581   
582    for (unsigned i = 0; i < inputFiles.size(); ++i){
583        std::cout << resultStrs[i].str();
584    }
585}
586
587re::CC * parsedCodePointSet;
588
589extern "C" {
590    void insert_codepoints(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
591        re::codepoint_t c = 0;
592        ssize_t line_pos = line_start;
593        while (isxdigit(buffer[line_pos])) {
594            if (isdigit(buffer[line_pos])) {
595                c = (c << 4) | (buffer[line_pos] - '0');
596            }
597            else {
598                c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
599            }
600            line_pos++;
601        }
602        assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.       
603        parsedCodePointSet->insert(c);
604    }
605}
606
607void setParsedCodePointSet(){
608    parsedCodePointSet = re::makeCC();
609}
610
611re::CC * getParsedCodePointSet(){
612    return parsedCodePointSet;
613}
614
615
616std::vector<std::string> parsedPropertyValues;
617
618extern "C" {
619    void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
620        auto result = std::string(buffer + line_start, buffer + line_end);
621        parsedPropertyValues.push_back(result);
622    }
623}
624
625inline void setParsedPropertyValues() {
626    parsedPropertyValues.clear();
627}
628
629inline const std::vector<std::string>& getParsedProeprtyValues() {
630    return parsedPropertyValues;
631}
632
633
634void icgrep_Linking(Module * m, ExecutionEngine * e) {
635    Module::FunctionListType & fns = m->getFunctionList();
636    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
637        std::string fnName = it->getName().str();
638        if (fnName == "s2p_block") continue;
639        if (fnName == "process_block") continue;
640        if (fnName == "process_block_initialize_carries") continue;
641       
642        if (fnName == "wrapped_report_match") {
643            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match);
644        }
645        if (fnName == "insert_codepoints") {
646            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
647        }
648        if (fnName == "insert_property_values") {
649            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
650        }
651#ifndef DISABLE_PREGENERATED_UCD_FUNCTIONS
652        else {
653            const UCD::ExternalProperty & ep = UCD::resolveExternalProperty(fnName);
654            e->addGlobalMapping(cast<GlobalValue>(it), std::get<0>(ep));
655        }
656#endif
657    }
658}
659
Note: See TracBrowser for help on using the repository browser.