source: icGREP/icgrep-devel/icgrep/grep_engine.cpp @ 5399

Last change on this file since 5399 was 5399, checked in by nmedfort, 2 years ago

Bug fixes for object cache. Minor optimization of FunctionTypeBuilder?.

File size: 31.0 KB
Line 
1/*
2 *  Copyright (c) 2016 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "grep_engine.h"
8#include <llvm/IR/Module.h>
9#include <llvm/ExecutionEngine/MCJIT.h>
10#include <llvm/IR/Verifier.h>
11#include <llvm/Support/CommandLine.h>
12#include <boost/filesystem.hpp>
13#include <boost/iostreams/device/mapped_file.hpp>
14#include <IR_Gen/idisa_builder.h>
15#include <IR_Gen/idisa_target.h>
16#include <UCD/UnicodeNameData.h>
17#include <UCD/resolve_properties.h>
18#include <kernels/cc_kernel.h>
19#include <kernels/linebreak_kernel.h>
20#include <kernels/streams_merge.h>
21#include <kernels/match_count.h>
22#include <kernels/mmap_kernel.h>
23#include <kernels/s2p_kernel.h>
24#include <kernels/scanmatchgen.h>
25#include <kernels/streamset.h>
26#include <kernels/stdin_kernel.h>
27#include <pablo/pablo_compiler.h>
28#include <pablo/pablo_kernel.h>
29#include <pablo/pablo_toolchain.h>
30#include <re/re_cc.h>
31#include <re/re_toolchain.h>
32#include <toolchain.h>
33#include <iostream>
34#include <sstream>
35#include <cc/multiplex_CCs.h>
36
37#include <llvm/Support/raw_ostream.h>
38#include <sys/stat.h>
39
40
41#ifdef CUDA_ENABLED
42#include <IR_Gen/CudaDriver.h>
43#include "preprocess.cpp"
44#endif
45#include <util/aligned_allocator.h>
46
47using namespace parabix;
48using namespace llvm;
49
50static cl::OptionCategory bGrepOutputOptions("Output Options",
51                                             "These options control the output.");
52static cl::opt<bool> SilenceFileErrors("s", cl::desc("Suppress messages for file errors."), cl::init(false),  cl::cat(bGrepOutputOptions));
53
54static cl::opt<bool> SuppressOutput("q", cl::desc("Suppress normal output; set return code only."), cl::init(false),  cl::cat(bGrepOutputOptions));
55
56static cl::opt<bool> NormalizeLineBreaks("normalize-line-breaks", cl::desc("Normalize line breaks to std::endl."), cl::init(false),  cl::cat(bGrepOutputOptions));
57
58static cl::opt<bool> ShowFileNames("H", cl::desc("Show the file name with each matching line."), cl::cat(bGrepOutputOptions));
59static cl::alias ShowFileNamesLong("with-filename", cl::desc("Alias for -H"), cl::aliasopt(ShowFileNames));
60
61static cl::opt<bool> ShowLineNumbers("n", cl::desc("Show the line number with each matching line."), cl::cat(bGrepOutputOptions));
62static cl::alias ShowLineNumbersLong("line-number", cl::desc("Alias for -n"), cl::aliasopt(ShowLineNumbers));
63
64/// iNVESTIGATE: icgrep is reporting stdin is not empty even when nothing is being piped into it?
65static cl::opt<bool> UseStdIn("stdin", cl::desc("Read from standard input."), cl::cat(bGrepOutputOptions));
66
67bool isUTF_16 = false;
68std::string IRFilename = "icgrep.ll";
69std::string PTXFilename = "icgrep.ptx";
70
71static re::CC * parsedCodePointSet = nullptr;
72static std::vector<std::string> parsedPropertyValues;
73
74#ifdef CUDA_ENABLED
75int blockNo = 0;
76size_t * startPoints = nullptr;
77size_t * accumBytes = nullptr;
78#endif
79
80void GrepEngine::doGrep(const std::string & fileName, const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly) {
81    boost::filesystem::path file(fileName);
82    if (exists(file)) {
83        if (is_directory(file)) {
84            return;
85        }
86    } else {
87        if (!SilenceFileErrors) {
88            std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
89            return;
90        }
91    }
92
93    const auto fileSize = file_size(file);
94    if (fileSize > 0) {
95        try {
96            boost::iostreams::mapped_file_source source(fileName, fileSize, 0);
97            char * fileBuffer = const_cast<char *>(source.data());
98           
99#ifdef CUDA_ENABLED 
100            if(codegen::NVPTX){
101                codegen::BlockSize = 128;
102                char * LineBreak;
103                if (posix_memalign((void**)&LineBreak, 32, fileSize)) {
104                    std::cerr << "Cannot allocate memory for linebreak.\n";
105                    exit(-1);
106                }
107                std::vector<size_t> LFPositions = preprocess(fileBuffer, fileSize, LineBreak);
108
109                const unsigned numOfGroups = codegen::GroupNum;
110                if (posix_memalign((void**)&startPoints, 8, (numOfGroups+1)*sizeof(size_t)) ||
111                    posix_memalign((void**)&accumBytes, 8, (numOfGroups+1)*sizeof(size_t))) {
112                    std::cerr << "Cannot allocate memory for startPoints or accumBytes.\n";
113                    exit(-1);
114                }
115
116                ulong * rslt = RunPTX(PTXFilename, fileBuffer, fileSize, CountOnly, LFPositions, startPoints, accumBytes);
117                if (CountOnly){
118                    exit(0);
119                }
120                else{
121                    size_t intputSize = startPoints[numOfGroups]-accumBytes[numOfGroups]+accumBytes[numOfGroups-1];
122                    mGrepFunction_CPU((char *)rslt, LineBreak, fileBuffer, intputSize, fileIdx);
123                    return;
124                }
125               
126            } 
127#endif
128            if (CountOnly) {
129                total_CountOnly[fileIdx] = mGrepFunction_CountOnly(fileBuffer, fileSize, fileIdx);
130            } else {
131                mGrepFunction(fileBuffer, fileSize, fileIdx);
132            }
133            source.close();
134        } catch (std::exception & e) {
135            if (!SilenceFileErrors) {
136                std::cerr << "Boost mmap error: " + fileName + ": " + e.what() + " Skipped.\n";
137                return;
138            }
139        }
140    } else {
141#ifdef CUDA_ENABLED
142        if (codegen::NVPTX){
143            std::cout << 0 << std::endl;
144            exit(0);
145        }
146#endif
147        if (CountOnly) {
148            total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
149        } else {
150            mGrepFunction(nullptr, 0, fileIdx);
151        }
152    }
153}
154
155void GrepEngine::doGrep(const int fileIdx, bool CountOnly, std::vector<size_t> & total_CountOnly) {
156    if (CountOnly) {
157        total_CountOnly[fileIdx] = mGrepFunction_CountOnly(nullptr, 0, fileIdx);
158    } else {
159        mGrepFunction(nullptr, 0, fileIdx);
160    }
161}
162
163#ifdef CUDA_ENABLED
164Function * generateGPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, bool CountOnly){
165    Type * const int64ty = iBuilder->getInt64Ty();
166    Type * const size_ty = iBuilder->getSizeTy();
167    Type * const int32ty = iBuilder->getInt32Ty();
168    Type * const sizeTyPtr = PointerType::get(size_ty, 1);
169    Type * const int64tyPtr = PointerType::get(int64ty, 1);
170    Type * const inputType = PointerType::get(iBuilder->getInt8Ty(), 1);
171    Type * const resultTy = iBuilder->getVoidTy();
172    Function * kernelFunc = cast<Function>(m->getOrInsertFunction("GPU_Main", resultTy, inputType, sizeTyPtr, sizeTyPtr, int64tyPtr, nullptr));
173    kernelFunc->setCallingConv(CallingConv::C);
174    Function::arg_iterator args = kernelFunc->arg_begin();
175
176    Value * const inputPtr = &*(args++);
177    inputPtr->setName("inputPtr");
178    Value * const startPointsPtr = &*(args++);
179    startPointsPtr->setName("startPointsPtr");
180    Value * const bufferSizesPtr = &*(args++);
181    bufferSizesPtr->setName("bufferSizesPtr");
182    Value * const outputPtr = &*(args++);
183    outputPtr->setName("resultPtr");
184
185    BasicBlock * entryBlock = BasicBlock::Create(m->getContext(), "entry", kernelFunc, 0);
186    iBuilder->SetInsertPoint(entryBlock);
187
188    Function * tidFunc = m->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
189    Value * tid = iBuilder->CreateCall(tidFunc);
190    Function * bidFunc = cast<Function>(m->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
191    Value * bid = iBuilder->CreateCall(bidFunc);
192
193    Value * startPoint = iBuilder->CreateLoad(iBuilder->CreateGEP(startPointsPtr, bid));
194
195    Function * mainFunc = m->getFunction("Main");
196    Value * startBlock = iBuilder->CreateUDiv(startPoint, ConstantInt::get(int64ty, iBuilder->getBitBlockWidth()));
197    Type * const inputStreamType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 1);   
198    Value * inputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(inputPtr, inputStreamType), startBlock);
199    Value * inputStream = iBuilder->CreateGEP(inputStreamPtr, tid);
200    Value * bufferSize = iBuilder->CreateLoad(iBuilder->CreateGEP(bufferSizesPtr, bid));
201
202    if (CountOnly) {
203        Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
204        Value * outputThreadPtr = iBuilder->CreateGEP(outputPtr, iBuilder->CreateAdd(iBuilder->CreateMul(bid, strideBlocks), tid));
205        Value * result = iBuilder->CreateCall(mainFunc, {inputStream, bufferSize});
206        iBuilder->CreateStore(result, outputThreadPtr);
207    } else {
208        Type * const outputStremType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 1);
209        Value * outputStreamPtr = iBuilder->CreateGEP(iBuilder->CreateBitCast(outputPtr, outputStremType), startBlock);
210        Value * outputStream = iBuilder->CreateGEP(outputStreamPtr, tid);
211        iBuilder->CreateCall(mainFunc, {inputStream, bufferSize, outputStream});
212    }   
213
214    iBuilder->CreateRetVoid();
215    return kernelFunc;
216}
217
218Function * generateCPUKernel(Module * m, IDISA::IDISA_Builder * iBuilder, GrepType grepType){
219    Type * const size_ty = iBuilder->getSizeTy();
220    Type * const int8PtrTy = iBuilder->getInt8PtrTy();
221    Type * const rsltType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), 0);
222    Function * const mainCPUFn = cast<Function>(m->getOrInsertFunction("CPU_Main", iBuilder->getVoidTy(), rsltType, rsltType, int8PtrTy, size_ty, size_ty, nullptr));
223    mainCPUFn->setCallingConv(CallingConv::C);
224    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", mainCPUFn, 0));
225    Function::arg_iterator args = mainCPUFn->arg_begin();
226   
227    Value * const rsltStream = &*(args++);
228    rsltStream->setName("rslt");
229    Value * const lbStream = &*(args++);
230    lbStream->setName("lb");
231    Value * const inputStream = &*(args++);
232    inputStream->setName("input");
233    Value * const fileSize = &*(args++);
234    fileSize->setName("fileSize");
235    Value * const fileIdx = &*(args++);
236    fileIdx->setName("fileIdx");
237
238    const unsigned segmentSize = codegen::SegmentSize;
239   
240    ExternalFileBuffer InputStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
241    InputStream.setStreamSetBuffer(inputStream);
242
243    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1));
244    MatchResults.setStreamSetBuffer(rsltStream);
245
246    kernel::MMapSourceKernel mmapK1(iBuilder, segmentSize); 
247    mmapK1.setName("mmap1");
248    mmapK1.generateKernel({}, {&MatchResults});
249    mmapK1.setInitialArguments({fileSize});
250
251    ExternalFileBuffer LineBreak(iBuilder, iBuilder->getStreamSetTy(1, 1));
252    LineBreak.setStreamSetBuffer(lbStream);
253   
254    kernel::MMapSourceKernel mmapK2(iBuilder, segmentSize); 
255    mmapK2.setName("mmap2");
256    mmapK2.generateKernel({}, {&LineBreak});
257    mmapK2.setInitialArguments({fileSize});
258
259    kernel::ScanMatchKernel scanMatchK(iBuilder, grepType, 8);
260    scanMatchK.generateKernel({&InputStream, &MatchResults, &LineBreak}, {});
261    scanMatchK.setInitialArguments({fileIdx});
262   
263    generatePipeline(iBuilder, {&mmapK1, &mmapK2, &scanMatchK});
264    iBuilder->CreateRetVoid();
265
266    return mainCPUFn;
267}
268#endif
269
270static int * total_count;
271static std::stringstream * resultStrs = nullptr;
272static std::vector<std::string> inputFiles;
273
274void initFileResult(std::vector<std::string> filenames){
275    const int n = filenames.size();
276    if (n > 1) {
277        ShowFileNames = true;
278    }
279    inputFiles = filenames;
280    resultStrs = new std::stringstream[n];
281    total_count = new int[n];
282    for (unsigned i = 0; i < inputFiles.size(); ++i){
283        total_count[i] = 0;
284    }
285
286}
287
288template<typename CodeUnit>
289void wrapped_report_match(const size_t lineNum, size_t line_start, size_t line_end, const CodeUnit * const buffer, const size_t filesize, const size_t fileIdx) {
290
291//    errs() << lineNum << " : (" << line_start << ", " << line_end << ", " << filesize << ")\n";
292
293    assert (buffer);
294    assert (line_start <= line_end);
295    assert (line_end <= filesize);
296
297    #ifdef CUDA_ENABLED
298    if (codegen::NVPTX){
299        while(line_start>startPoints[blockNo]) blockNo++;
300        line_start -= accumBytes[blockNo-1];
301        line_end -= accumBytes[blockNo-1];
302    }
303    #endif
304
305    if (ShowFileNames) {
306        resultStrs[fileIdx] << inputFiles[fileIdx] << ':';
307    }
308    if (ShowLineNumbers) {
309        resultStrs[fileIdx] << lineNum << ":";
310    }
311
312    // If the line "starts" on the LF of a CRLF, it is actually the end of the last line.
313    if ((buffer[line_start] == 0xA) && (line_start != line_end)) {
314        ++line_start;
315    }
316
317    if (LLVM_UNLIKELY(line_end == filesize)) {
318        // The match position is at end-of-file.   We have a final unterminated line.
319        resultStrs[fileIdx].write((char *)&buffer[line_start], (line_end - line_start) * sizeof(CodeUnit));
320        if (NormalizeLineBreaks) {
321            resultStrs[fileIdx] << '\n';  // terminate it
322        }
323    } else {
324        const auto end_byte = buffer[line_end];
325        if (NormalizeLineBreaks) {
326            if (LLVM_UNLIKELY(end_byte == 0x85)) {
327                // Line terminated with NEL, on the second byte.  Back up 1.
328                line_end -= 1;
329            } else if (LLVM_UNLIKELY(end_byte > 0xD)) {
330                // Line terminated with PS or LS, on the third byte.  Back up 2.
331                line_end -= 2;
332            }
333            resultStrs[fileIdx].write((char *)&buffer[line_start], (line_end - line_start) * sizeof(CodeUnit));
334            resultStrs[fileIdx] << '\n';
335        } else {
336            if (end_byte == 0x0D) {
337                // Check for line_end on first byte of CRLF; we don't want to access past the end of buffer.
338                if ((line_end + 1) < filesize) {
339                    if (buffer[line_end + 1] == 0x0A) {
340                        // Found CRLF; preserve both bytes.
341                        ++line_end;
342                    }
343                }
344            }
345            resultStrs[fileIdx].write((char *)&buffer[line_start], (line_end - line_start + 1) * sizeof(CodeUnit));
346        }
347    }
348}
349
350void PrintResult(bool CountOnly, std::vector<size_t> & total_CountOnly){
351    if (CountOnly) {
352        if (!ShowFileNames) {
353            for (unsigned i = 0; i < inputFiles.size(); ++i){
354                std::cout << total_CountOnly[i] << std::endl;
355            }
356        } else {
357            for (unsigned i = 0; i < inputFiles.size(); ++i){
358                std::cout << inputFiles[i] << ':' << total_CountOnly[i] << std::endl;
359            };
360        }
361    } else {
362        for (unsigned i = 0; i < inputFiles.size(); ++i){
363            std::cout << resultStrs[i].str();
364        }
365    }
366}
367
368void insert_codepoints(const size_t lineNum, const size_t line_start, const size_t line_end, const char * const buffer) {
369    assert (buffer);
370    assert (line_start <= line_end);
371    re::codepoint_t c = 0;
372    size_t line_pos = line_start;
373    while (isxdigit(buffer[line_pos])) {
374        assert (line_pos < line_end);
375        if (isdigit(buffer[line_pos])) {
376            c = (c << 4) | (buffer[line_pos] - '0');
377        }
378        else {
379            c = (c << 4) | (tolower(buffer[line_pos]) - 'a' + 10);
380        }
381        line_pos++;
382    }
383    assert(((line_pos - line_start) >= 4) && ((line_pos - line_start) <= 6)); // UCD format 4 to 6 hex digits.
384    parsedCodePointSet->insert(c);
385}
386
387void insert_property_values(size_t lineNum, size_t line_start, size_t line_end, const char * buffer) {
388    assert (line_start <= line_end);
389    parsedPropertyValues.emplace_back(buffer + line_start, buffer + line_end);
390}
391
392void GrepEngine::grepCodeGen(std::string moduleName, re::RE * re_ast, bool CountOnly, bool UTF_16, GrepType grepType, const bool usingStdIn) {
393    isUTF_16 = UTF_16;
394    int addrSpace = 0;
395    bool CPU_Only = true;
396    Module * M = nullptr;
397    IDISA::IDISA_Builder * iBuilder = nullptr;
398
399    #ifdef CUDA_ENABLED
400    setNVPTXOption();
401    if (codegen::NVPTX) {
402        Module * gpuM = new Module(moduleName+":gpu", getGlobalContext());
403        IDISA::IDISA_Builder * GPUBuilder = IDISA::GetIDISA_GPU_Builder(gpuM);
404        M = gpuM;
405        iBuilder = GPUBuilder;
406        M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
407        M->setTargetTriple("nvptx64-nvidia-cuda");
408        addrSpace = 1;
409        CPU_Only = false;
410        codegen::BlockSize = 64;
411    }
412    #endif
413
414    Module * cpuM = new Module(moduleName + ":cpu", getGlobalContext());
415    IDISA::IDISA_Builder * CPUBuilder = IDISA::GetIDISA_Builder(cpuM);
416    if (CPU_Only) {
417        M = cpuM;
418        iBuilder = CPUBuilder;
419    }
420    ParabixDriver pxDriver(iBuilder);
421
422    // segment size made availabe for each call to the mmap source kernel
423    const unsigned segmentSize = codegen::SegmentSize;
424    const unsigned bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
425    const unsigned encodingBits = UTF_16 ? 16 : 8;
426
427    Type * const size_ty = iBuilder->getSizeTy();
428    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), addrSpace);
429    Type * const resultTy = CountOnly ? size_ty : iBuilder->getVoidTy();
430
431    Function * mainFn = nullptr;
432    Value * inputStream = nullptr;
433    Value * fileSize = nullptr;
434    Value * fileIdx = nullptr;
435
436    #ifdef CUDA_ENABLED
437    Value * outputStream = nullptr;
438    Type * const outputType = PointerType::get(ArrayType::get(iBuilder->getBitBlockType(), 1), addrSpace);
439    if (codegen::NVPTX){
440        if (CountOnly){
441            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, nullptr));
442            mainFn->setCallingConv(CallingConv::C);
443            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
444            Function::arg_iterator args = mainFn->arg_begin();
445
446            inputStream = &*(args++);
447            inputStream->setName("input");
448            fileSize = &*(args++);
449            fileSize->setName("fileSize");
450        } else {
451            mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, outputType, nullptr));
452            mainFn->setCallingConv(CallingConv::C);
453            iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
454            Function::arg_iterator args = mainFn->arg_begin();
455
456            inputStream = &*(args++);
457            inputStream->setName("input");
458            fileSize = &*(args++);
459            fileSize->setName("fileSize");
460            outputStream = &*(args++);
461            outputStream->setName("output");
462        }
463    }
464    #endif
465
466    if (CPU_Only) {
467        mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, size_ty, size_ty, nullptr));
468        mainFn->setCallingConv(CallingConv::C);
469        iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
470        Function::arg_iterator args = mainFn->arg_begin();
471
472        inputStream = &*(args++);
473        inputStream->setName("input");
474        fileSize = &*(args++);
475        fileSize->setName("fileSize");
476        fileIdx = &*(args++);
477        fileIdx->setName("fileIdx");
478
479    }
480
481    StreamSetBuffer * byteStream = nullptr;
482    kernel::KernelBuilder * sourceK = nullptr;
483    if (usingStdIn) {
484        // TODO: use fstat(STDIN_FILENO) to see if we can mmap the stdin safely and avoid the calls to read
485        byteStream = new ExtensibleBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8), segmentSize);
486        sourceK = new kernel::StdInKernel(iBuilder, segmentSize);
487    } else {
488        byteStream = new SourceFileBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8));
489        sourceK = new kernel::FileSourceKernel(iBuilder, inputStream->getType(), segmentSize);
490        sourceK->setInitialArguments({inputStream, fileSize});
491    }
492    byteStream->allocateBuffer();
493    pxDriver.addKernelCall(*sourceK, {}, {byteStream});
494
495    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
496    BasisBits.allocateBuffer();
497
498    kernel::S2PKernel s2pk(iBuilder);
499    pxDriver.addKernelCall(s2pk, {byteStream}, {&BasisBits});
500
501    kernel::LineBreakKernelBuilder linebreakK(iBuilder, "lb", encodingBits);
502    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
503    LineBreakStream.allocateBuffer();
504
505    pxDriver.addKernelCall(linebreakK, {&BasisBits}, {&LineBreakStream});
506
507    pablo::PabloKernel icgrepK(iBuilder, "icgrep", {Binding{iBuilder->getStreamSetTy(8), "basis"}, Binding{iBuilder->getStreamSetTy(1, 1), "linebreak"}});
508    re::re2pablo_compiler(&icgrepK, re::regular_expression_passes(re_ast), CountOnly);
509    pablo_function_passes(&icgrepK);
510
511    if (CountOnly) {
512
513        pxDriver.addKernelCall(icgrepK, {&BasisBits, &LineBreakStream}, {});
514
515        pxDriver.generatePipelineIR();
516
517        iBuilder->CreateRet(icgrepK.createGetAccumulatorCall(icgrepK.getInstance(), "matchedLineCount"));
518
519        pxDriver.JITcompileMain();
520        pxDriver.linkAndFinalize();
521
522    } else {
523
524        #ifdef CUDA_ENABLED
525        if (codegen::NVPTX){
526            ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), addrSpace);
527            MatchResults.setStreamSetBuffer(outputStream);
528
529            pxDriver.addKernelCall(icgrepK, {&BasisBits, &LineBreakStream}, {&MatchResults});
530
531            pxDriver.generatePipelineIR();
532
533            iBuilder->CreateRetVoid();
534
535            pxDriver.JITcompileMain();
536            pxDriver.linkAndFinalize();
537        }
538        #endif
539
540        if (CPU_Only) {
541
542            CircularBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
543            MatchResults.allocateBuffer();
544
545            pxDriver.addKernelCall(icgrepK, {&BasisBits, &LineBreakStream}, {&MatchResults});
546
547            kernel::ScanMatchKernel scanMatchK(iBuilder, grepType, encodingBits);
548            scanMatchK.setInitialArguments({fileIdx});
549
550            pxDriver.addKernelCall(scanMatchK, {&MatchResults, &LineBreakStream, byteStream}, {});
551
552            switch (grepType) {
553                case GrepType::Normal:
554                    if (UTF_16) {
555                        pxDriver.addExternalLink(scanMatchK, "matcher", &wrapped_report_match<uint16_t>);
556                    } else {
557                        pxDriver.addExternalLink(scanMatchK, "matcher", &wrapped_report_match<uint8_t>);
558                    }
559                    break;
560                case GrepType::NameExpression:
561                    pxDriver.addExternalLink(scanMatchK, "matcher", &insert_codepoints);
562                    break;
563                case GrepType::PropertyValue:
564                    pxDriver.addExternalLink(scanMatchK, "matcher", &insert_property_values);
565                    break;
566            }
567
568            pxDriver.generatePipelineIR();
569
570            iBuilder->CreateRetVoid();
571
572            pxDriver.JITcompileMain();
573            pxDriver.linkAndFinalize();
574        }
575    }
576
577    #ifdef CUDA_ENABLED
578    if(codegen::NVPTX){
579        Function * kernelFunction = generateGPUKernel(M, iBuilder, CountOnly);
580        MDNode * Node = MDNode::get(M->getContext(),
581                                    {llvm::ValueAsMetadata::get(kernelFunction),
582                                     MDString::get(M->getContext(), "kernel"),
583                                     ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
584        NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
585        NMD->addOperand(Node);
586
587        Compile2PTX(M, IRFilename, PTXFilename);
588        Function * mainCPUFn = generateCPUKernel(cpuM, CPUBuilder, mGrepType);
589        if (CountOnly) return;
590    }
591    #endif
592
593    delete iBuilder;
594    delete sourceK;
595    delete byteStream;
596
597    if (CountOnly) {
598        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(pxDriver.getPointerToMain());
599    } else {
600        #ifdef CUDA_ENABLED
601        if(codegen::NVPTX){
602            mGrepFunction_CPU = reinterpret_cast<GrepFunctionType_CPU>(pxDriver.getPointerToMain());
603        }
604        #endif
605        if (CPU_Only) {
606            mGrepFunction = reinterpret_cast<GrepFunctionType>(pxDriver.getPointerToMain());
607        }
608    }
609}
610
611
612void GrepEngine::multiGrepCodeGen(std::string moduleName, std::vector<re::RE *> REs, bool CountOnly, bool UTF_16, GrepType grepType, const bool usingStdIn) {
613
614    isUTF_16 = UTF_16;
615    Module * M = new Module(moduleName + ":icgrep", getGlobalContext());;
616    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);;
617
618    const unsigned segmentSize = codegen::SegmentSize;
619    const unsigned bufferSegments = codegen::BufferSegments * codegen::ThreadNum;
620    const unsigned encodingBits = UTF_16 ? 16 : 8;
621
622    Type * const sizeTy = iBuilder->getSizeTy();
623    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), encodingBits), 1), 0);
624    Type * const resultTy = CountOnly ? sizeTy : iBuilder->getVoidTy();
625
626    Function * mainFn = cast<Function>(M->getOrInsertFunction("Main", resultTy, inputType, sizeTy, sizeTy, nullptr));
627    mainFn->setCallingConv(CallingConv::C);
628    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", mainFn, 0));
629    Function::arg_iterator args = mainFn->arg_begin();
630
631    Value * inputStream = &*(args++);
632    inputStream->setName("input");
633    Value * fileSize = &*(args++);
634    fileSize->setName("fileSize");
635    Value * fileIdx = &*(args++);
636    fileIdx->setName("fileIdx");
637
638    StreamSetBuffer * byteStream = nullptr;
639    kernel::KernelBuilder * sourceK = nullptr;
640    if (usingStdIn) {
641        byteStream = new ExtensibleBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8), segmentSize);
642        cast<ExtensibleBuffer>(byteStream)->allocateBuffer();
643        sourceK = new kernel::StdInKernel(iBuilder, segmentSize);
644    } else {
645        byteStream = new ExternalFileBuffer(iBuilder, iBuilder->getStreamSetTy(1, 8));
646        cast<ExternalFileBuffer>(byteStream)->setStreamSetBuffer(inputStream);
647        sourceK = new kernel::MMapSourceKernel(iBuilder, segmentSize);
648        sourceK->setInitialArguments({fileSize});
649    }
650    sourceK->generateKernel({}, {byteStream});
651
652    CircularBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8), segmentSize * bufferSegments);
653    BasisBits.allocateBuffer();
654
655    kernel::S2PKernel  s2pk(iBuilder);
656    s2pk.generateKernel({byteStream}, {&BasisBits});
657
658    std::vector<pablo::PabloKernel *> icgrepKs;
659    std::vector<StreamSetBuffer *> MatchResultsBufs;
660
661    for(unsigned i=0; i<REs.size(); i++){
662        pablo::PabloKernel * icgrepK = new pablo::PabloKernel(iBuilder, "icgrep"+std::to_string(i), {Binding{iBuilder->getStreamSetTy(8), "basis"}, Binding{iBuilder->getStreamSetTy(1, 1), "linebreak"}});
663        re::re2pablo_compiler(icgrepK, re::regular_expression_passes(REs[i]), false);
664        pablo_function_passes(icgrepK);
665        icgrepKs.push_back(icgrepK);
666        CircularBuffer * MatchResults = new CircularBuffer(iBuilder, iBuilder->getStreamSetTy(2, 1), segmentSize * bufferSegments);
667        MatchResults->allocateBuffer();
668        MatchResultsBufs.push_back(MatchResults);
669    }
670
671    std::vector<kernel::KernelBuilder *> KernelList;
672    KernelList.push_back(sourceK);
673    KernelList.push_back(&s2pk);
674
675    CircularBuffer mergedResults(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
676    mergedResults.allocateBuffer();
677
678    kernel::StreamsMerge streamsMergeK(iBuilder, 1, REs.size());
679    streamsMergeK.generateKernel(MatchResultsBufs, {&mergedResults});
680
681    kernel::LineBreakKernelBuilder linebreakK(iBuilder, "lb", encodingBits);
682    CircularBuffer LineBreakStream(iBuilder, iBuilder->getStreamSetTy(1, 1), segmentSize * bufferSegments);
683    LineBreakStream.allocateBuffer();
684    linebreakK.generateKernel({&BasisBits}, {&LineBreakStream});
685
686    KernelList.push_back(&linebreakK);
687    for(unsigned i=0; i<REs.size(); i++){
688        icgrepKs[i]->generateKernel({&BasisBits, &LineBreakStream}, {MatchResultsBufs[i]});
689        KernelList.push_back(icgrepKs[i]);
690    }
691    KernelList.push_back(&streamsMergeK);
692
693    if (CountOnly) {
694        kernel::MatchCount matchCountK(iBuilder);
695        matchCountK.generateKernel({&mergedResults}, {});
696
697        KernelList.push_back(&matchCountK);
698
699        generatePipeline(iBuilder, KernelList);
700        iBuilder->CreateRet(matchCountK.getScalarField(matchCountK.getInstance(), "matchedLineCount"));
701
702    } else {
703        kernel::ScanMatchKernel scanMatchK(iBuilder, grepType, encodingBits);
704        scanMatchK.generateKernel({byteStream, &mergedResults, &LineBreakStream}, {});
705        scanMatchK.setInitialArguments({fileIdx});
706
707        KernelList.push_back(&scanMatchK);
708
709        generatePipeline(iBuilder, KernelList);
710
711        iBuilder->CreateRetVoid();
712    }
713
714    mEngine = JIT_to_ExecutionEngine(M);
715    ApplyObjectCache(mEngine);
716    icgrep_Linking(M, mEngine);
717
718    mEngine->finalizeObject();
719    delete iBuilder;
720    delete sourceK;
721    delete byteStream;
722
723    if (CountOnly) {
724        mGrepFunction_CountOnly = reinterpret_cast<GrepFunctionType_CountOnly>(mEngine->getPointerToFunction(mainFn));
725    } else {
726        mGrepFunction = reinterpret_cast<GrepFunctionType>(mEngine->getPointerToFunction(mainFn));
727    }
728
729}
730
731re::CC * GrepEngine::grepCodepoints() {
732    parsedCodePointSet = re::makeCC();
733    char * mFileBuffer = getUnicodeNameDataPtr();
734    size_t mFileSize = getUnicodeNameDataSize();
735    mGrepFunction(mFileBuffer, mFileSize, 0);
736    return parsedCodePointSet;
737}
738
739const std::vector<std::string> & GrepEngine::grepPropertyValues(const std::string& propertyName) {
740    enum { MaxSupportedVectorWidthInBytes = 32 };
741    AlignedAllocator<char, MaxSupportedVectorWidthInBytes> alloc;
742    parsedPropertyValues.clear();
743    const std::string & str = UCD::getPropertyValueGrepString(propertyName);
744    const auto n = str.length();
745    // NOTE: MaxSupportedVectorWidthInBytes of trailing 0s are needed to prevent the grep function from
746    // erroneously matching garbage data when loading the final partial block.
747    char * aligned = alloc.allocate(n + MaxSupportedVectorWidthInBytes, 0);
748    std::memcpy(aligned, str.data(), n);
749    std::memset(aligned + n, 0, MaxSupportedVectorWidthInBytes);
750    mGrepFunction(aligned, n, 0);
751    alloc.deallocate(aligned, 0);
752    return parsedPropertyValues;
753}
754
755void icgrep_Linking(Module * m, ExecutionEngine * e) {
756    Module::FunctionListType & fns = m->getFunctionList();
757    for (auto it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
758        std::string fnName = it->getName().str();
759        if (fnName == "s2p_block") continue;
760        if (fnName == "process_block") continue;
761        if (fnName == "process_block_initialize_carries") continue;
762       
763        if (fnName == "wrapped_report_match8") {
764            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match<uint8_t>);
765        }
766        if (fnName == "wrapped_report_match16") {
767            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_match<uint16_t>);
768        }
769        if (fnName == "insert_codepoints") {
770            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_codepoints);
771        }
772        if (fnName == "insert_property_values") {
773            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&insert_property_values);
774        }
775    }
776}
777
778GrepEngine::GrepEngine()
779: mGrepFunction(nullptr)
780, mGrepFunction_CountOnly(nullptr)
781, mGrepFunction_CPU(nullptr)
782, mEngine(nullptr) {
783
784}
785
786GrepEngine::~GrepEngine() {
787    delete mEngine;
788}
Note: See TracBrowser for help on using the repository browser.