source: icGREP/icgrep-devel/icgrep/editd/editd.cpp @ 5217

Last change on this file since 5217 was 5217, checked in by nmedfort, 2 years ago

Merged PabloFunction? and PabloKernel? classes. Updated projects where necessary.

  • Property svn:executable set to *
File size: 24.7 KB
Line 
1/*
2 *  Copyright (c) 2015 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <string>
8#include <iostream>
9#include <iomanip>
10#include <fstream>
11#include <sstream>
12
13
14#include <toolchain.h>
15#include <pablo/pablo_toolchain.h>
16#include <llvm/IR/Function.h>
17#include <llvm/IR/Module.h>
18#include <llvm/ExecutionEngine/ExecutionEngine.h>
19#include <llvm/ExecutionEngine/MCJIT.h>
20#include "llvm/Linker/Linker.h"
21
22#include <llvm/Support/CommandLine.h>
23#include <llvm/Support/raw_ostream.h>
24
25#include <re/re_cc.h>
26#include <cc/cc_compiler.h>
27#include <pablo/prototype.h>
28#include <pablo/pablo_compiler.h>
29#include <pablo/pablo_kernel.h>
30#include <IDISA/idisa_builder.h>
31#include <IDISA/idisa_target.h>
32#include <kernels/streamset.h>
33#include <kernels/interface.h>
34#include <kernels/kernel.h>
35#include <kernels/s2p_kernel.h>
36#include <editd/editdscan_kernel.h>
37#include <kernels/pipeline.h>
38
39#include <re/re_alt.h>
40#include <editd/pattern_compiler.h>
41
42// mmap system
43#include <boost/filesystem.hpp>
44#include <boost/iostreams/device/mapped_file.hpp>
45#include <fcntl.h>
46
47#ifdef CUDA_ENABLED
48#include <editd/EditdCudaDriver.h>
49#include <editd/editd_gpu_kernel.h>
50#endif
51
52static cl::list<std::string> inputFiles(cl::Positional, cl::desc("<regex> <input file ...>"), cl::OneOrMore);
53
54static cl::list<std::string> pattVector("e", cl::desc("pattern"), cl::ZeroOrMore);
55static cl::opt<std::string> PatternFilename("f", cl::desc("Take patterns (one per line) from a file"), cl::value_desc("regex file"), cl::init(""));
56
57static cl::opt<bool> CaseInsensitive("i", cl::desc("Ignore case distinctions in the pattern and the file."));
58
59static cl::opt<int> editDistance("edit-dist", cl::desc("Edit Distance Value"), cl::init(2));
60static cl::opt<int> optPosition("opt-pos", cl::desc("Optimize position"), cl::init(8));
61static cl::opt<int> stepSize("step-size", cl::desc("Step Size"), cl::init(3));
62static cl::opt<int> prefixLen("prefix", cl::desc("Prefix length"), cl::init(4));
63
64using namespace kernel;
65using namespace pablo;
66
67std::string IRFilename = "editd.ll";
68std::string PTXFilename = "editd.ptx";
69
70struct matchPosition
71{
72    size_t pos;
73    size_t dist;
74};
75
76std::vector<struct matchPosition> matchList;
77std::vector<std::vector<std::string>> pattGroups;
78
79void run_second_filter(int total_len, int pattern_segs, float errRate){
80   
81    if(matchList.size() == 0) return;
82
83    //remove the duplicates
84    bool cleared = true;
85    while(cleared){
86        cleared = false;
87        for (unsigned i=0; i<matchList.size()-1; i++){
88            if(matchList[i].pos == matchList[i+1].pos && matchList[i].dist == matchList[i+1].dist){
89                matchList.erase(matchList.begin() + i);
90                cleared = true;
91            }
92        }
93    }
94
95    //Sort match position
96    bool exchanged = true;
97    while(exchanged){
98        exchanged = false;
99        for (unsigned i=0; i<matchList.size()-1; i++){
100            if(matchList[i].pos > matchList[i+1].pos){
101                size_t tmp_pos = matchList[i].pos;
102                size_t tmp_dist = matchList[i].dist;
103                matchList[i].pos = matchList[i+1].pos;
104                matchList[i].dist = matchList[i+1].dist;
105                matchList[i+1].pos = tmp_pos;
106                matchList[i+1].dist = tmp_dist;
107                exchanged = true;
108            }
109        }
110    }
111
112    std::cerr << "pattern_segs = " << pattern_segs << ", total_len = " << total_len << std::endl;
113
114    int v = pattern_segs * (editDistance+1) - total_len * errRate;
115
116    int startPos = matchList[0].pos;
117    int sum = matchList[0].dist;
118    int curIdx = 0;
119    unsigned i = 0;
120    int count = 0;
121    while (i < matchList.size()){
122        if(matchList[i].pos - startPos < total_len * (errRate+1)){
123            sum += matchList[i].dist;
124            i++;
125        }
126        else{
127            if(sum > v) count++;
128            sum -= matchList[curIdx].dist;
129            curIdx++;
130            startPos = matchList[curIdx].pos;
131        }
132    }
133    std::cout << "matching value is " << v << std::endl;
134    std::cout << "total candidate from the first filter is " << matchList.size() << std::endl;
135    std::cout << "total candidate from the second filter is " << count << std::endl;
136}
137
138extern "C" {
139void wrapped_report_pos(size_t match_pos, int dist) {
140        struct matchPosition curMatch;
141        curMatch.pos = match_pos;
142        curMatch.dist = dist;
143        matchList.push_back(curMatch);
144        // std::cout << "pos: " << match_pos << ", dist:" << dist << "\n";
145    }
146
147}
148
149void icgrep_Linking(Module * m, ExecutionEngine * e) {
150    Module::FunctionListType & fns = m->getFunctionList();
151    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
152        std::string fnName = it->getName().str();
153        if (fnName == "wrapped_report_pos") {
154            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_pos);
155        }
156    }
157}
158
159void get_editd_pattern(int & pattern_segs, int & total_len) {
160 
161    if (PatternFilename != "") {
162        std::ifstream pattFile(PatternFilename.c_str());
163        std::string r;
164        if (pattFile.is_open()) {
165            while (std::getline(pattFile, r)) {
166                pattVector.push_back(r);
167                pattern_segs ++; 
168                total_len += r.size(); 
169            }
170            std::sort(pattVector.begin(), pattVector.end());
171            unsigned i = 0;
172            while(i < pattVector.size()){
173                std::vector<std::string> pattGroup;
174                std::string prefix = pattVector[i].substr(0, prefixLen);
175                while(i < pattVector.size() && pattVector[i].substr(0, prefixLen) == prefix){
176                    pattGroup.push_back(pattVector[i]);
177                    i++;
178                } 
179                pattGroups.push_back(pattGroup);
180            }
181            pattFile.close();
182        }
183    }
184   
185    // if there are no regexes specified through -e or -f, the first positional argument
186    // must be a regex, not an input file.
187   
188    if (pattVector.size() == 0) {
189        pattVector.push_back(inputFiles[0]);
190        inputFiles.erase(inputFiles.begin());
191    }
192}
193
194void buildPatternKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
195    PabloBuilder entry(kernel.getEntryBlock());
196
197    Var * pat = kernel.addInput("pat", iBuilder->getStreamSetTy(4));
198
199    PabloAST * basisBits[4];
200
201    basisBits[0] = entry.createExtract(pat, 0, "A");
202    basisBits[1] = entry.createExtract(pat, 1, "C");
203    basisBits[2] = entry.createExtract(pat, 2, "T");
204    basisBits[3] = entry.createExtract(pat, 3, "G");
205
206    re::Pattern_Compiler pattern_compiler(kernel);
207    pattern_compiler.compile(patterns, entry, basisBits, editDistance, optPosition, stepSize);
208
209    pablo_function_passes(&kernel);
210}
211
212Function * editdPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
213   
214    ExternalFileBuffer ChStream(iBuilder, iBuilder->getStreamSetTy(4));
215    SingleBlockBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(editDistance + 1));
216
217    PabloKernel editdk(iBuilder, "editd");
218
219    buildPatternKernel(editdk, iBuilder, patterns);
220
221    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
222   
223    std::unique_ptr<Module> editdM = editdk.createKernelModule({&ChStream}, {&MatchResults});
224    std::unique_ptr<Module> scanM = editdScanK.createKernelModule({&MatchResults}, {});               
225   
226    editdk.addKernelDeclarations(mMod);
227    editdScanK.addKernelDeclarations(mMod);
228
229    Type * const size_ty = iBuilder->getSizeTy();
230    Type * const voidTy = Type::getVoidTy(mMod->getContext());
231    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 0);
232   
233    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, nullptr));
234    main->setCallingConv(CallingConv::C);
235    Function::arg_iterator args = main->arg_begin();
236   
237    Value * const inputStream = &*(args++);
238    inputStream->setName("input");
239    Value * const fileSize = &*(args++);
240    fileSize->setName("fileSize");
241   
242    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
243
244    ChStream.setStreamSetBuffer(inputStream, fileSize);
245    MatchResults.allocateBuffer();
246   
247    Value * editdInstance = editdk.createInstance({});
248    Value * scanMatchInstance = editdScanK.createInstance({});
249   
250    generatePipelineLoop(iBuilder, {&editdk, &editdScanK}, {editdInstance, scanMatchInstance}, fileSize);
251       
252    iBuilder->CreateRetVoid();
253   
254    Linker L(*mMod);
255    L.linkInModule(std::move(editdM));
256    L.linkInModule(std::move(scanM));
257   
258    return main;
259}
260
261void buildPreprocessKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder) {
262    cc::CC_Compiler ccc(&kernel);
263    PabloBuilder & pb = ccc.getBuilder();
264
265    PabloAST * A = ccc.compileCC(re::makeCC(re::makeCC(0x41), re::makeCC(0x61)), pb);
266    PabloAST * C = ccc.compileCC(re::makeCC(re::makeCC(0x43), re::makeCC(0x63)), pb);
267    PabloAST * T = ccc.compileCC(re::makeCC(re::makeCC(0x54), re::makeCC(0x74)), pb);
268    PabloAST * G = ccc.compileCC(re::makeCC(re::makeCC(0x47), re::makeCC(0x67)), pb);
269
270    Var * const pat = kernel.addOutput("pat", iBuilder->getStreamSetTy(4));
271
272    pb.createAssign(pb.createExtract(pat, 0), A);
273    pb.createAssign(pb.createExtract(pat, 1), C);
274    pb.createAssign(pb.createExtract(pat, 2), T);
275    pb.createAssign(pb.createExtract(pat, 3), G);
276
277    pablo_function_passes(&kernel);
278}
279
280Function * preprocessPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder) {
281    Type * mBitBlockType = iBuilder->getBitBlockType();
282   
283    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
284    SingleBlockBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8));
285    ExternalFileBuffer CCResults(iBuilder, iBuilder->getStreamSetTy(4));
286
287    s2pKernel  s2pk(iBuilder);
288    std::unique_ptr<Module> s2pM = s2pk.createKernelModule({&ByteStream}, {&BasisBits});
289
290    PabloKernel  ccck(iBuilder, "ccc");
291
292    buildPreprocessKernel(ccck, iBuilder);
293   
294    std::unique_ptr<Module> cccM = ccck.createKernelModule({&BasisBits}, {&CCResults});
295   
296    s2pk.addKernelDeclarations(mMod);
297    ccck.addKernelDeclarations(mMod);
298
299    Type * const size_ty = iBuilder->getSizeTy();
300    Type * const voidTy = Type::getVoidTy(mMod->getContext());
301    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(mBitBlockType, 8), 1), 0);
302    Type * const outputType = PointerType::get(ArrayType::get(mBitBlockType, 4), 0);
303   
304    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, outputType, nullptr));
305    main->setCallingConv(CallingConv::C);
306    Function::arg_iterator args = main->arg_begin();
307   
308    Value * const inputStream = &*(args++);
309    inputStream->setName("input");
310    Value * const fileSize = &*(args++);
311    fileSize->setName("fileSize");
312    Value * const outputStream = &*(args++);
313    outputStream->setName("output");
314   
315    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
316
317    ByteStream.setStreamSetBuffer(inputStream, fileSize);
318    BasisBits.allocateBuffer();
319    CCResults.setStreamSetBuffer(outputStream, fileSize);
320   
321    Value * s2pInstance = s2pk.createInstance({});
322    Value * cccInstance = ccck.createInstance({});
323   
324    generatePipelineLoop(iBuilder, {&s2pk, &ccck}, {s2pInstance, cccInstance}, fileSize);
325       
326    iBuilder->CreateRetVoid();
327   
328    Linker L(*mMod);
329    L.linkInModule(std::move(s2pM));
330    L.linkInModule(std::move(cccM));
331   
332    return main;
333}
334
335
336typedef void (*preprocessFunctionType)(char * byte_data, size_t filesize, char * output_data);
337
338preprocessFunctionType preprocessCodeGen() {
339                           
340    LLVMContext TheContext;
341    Module * M = new Module("preprocess", TheContext);
342    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
343
344    llvm::Function * main_IR = preprocessPipeline(M, idb);
345
346    ExecutionEngine * preprocessEngine = JIT_to_ExecutionEngine(M);
347   
348    preprocessEngine->finalizeObject();
349
350    delete idb;
351    return reinterpret_cast<preprocessFunctionType>(preprocessEngine->getPointerToFunction(main_IR));
352}
353
354typedef void (*editdFunctionType)(char * byte_data, size_t filesize);
355
356editdFunctionType editdCodeGen(const std::vector<std::string> & patterns) {
357                           
358    LLVMContext TheContext;
359    Module * M = new Module("editd", TheContext);
360    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
361
362    llvm::Function * main_IR = editdPipeline(M, idb, patterns);
363
364    ExecutionEngine * editdEngine = JIT_to_ExecutionEngine(M);
365   
366    editdEngine->finalizeObject();
367
368    delete idb;
369    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main_IR));
370}
371
372char * chStream;
373int size;
374
375char * preprocess(preprocessFunctionType fn_ptr) {
376    std::string fileName = inputFiles[0];
377    size_t fileSize;
378    char * fileBuffer;
379   
380    const boost::filesystem::path file(fileName);
381    if (exists(file)) {
382        if (is_directory(file)) {
383            exit(0);
384        }
385    } else {
386        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
387        exit(0);
388    }
389   
390    fileSize = file_size(file);
391    boost::iostreams::mapped_file_source mappedFile;
392    if (fileSize == 0) {
393        fileBuffer = nullptr;
394    }
395    else {
396        try {
397            mappedFile.open(fileName);
398        } catch (std::exception &e) {
399            std::cerr << "Error: Boost mmap of " << fileName << ": " << e.what() << std::endl;
400            exit(0);
401        }
402        fileBuffer = const_cast<char *>(mappedFile.data());
403    }
404
405    int ret = posix_memalign((void**)&chStream, 32, fileSize);
406    if (ret) {
407        std::cerr << "Cannot allocate memory for output.\n";
408        exit(-1);
409    }
410
411    fn_ptr(fileBuffer, fileSize, chStream);
412    size = fileSize;
413
414    mappedFile.close();
415
416    return chStream;   
417}
418
419void editd(editdFunctionType fn_ptr, char * inputStream, int size) {
420 
421    if (size == 0) {
422        inputStream = nullptr;
423    }
424
425    fn_ptr(inputStream, size);
426   
427}
428
429#ifdef CUDA_ENABLED
430
431#define GROUPTHREADS 64
432#define GROUPBLOCKS 64
433
434void editdGPUCodeGen(unsigned patternLen){ 
435    LLVMContext TheContext;
436    Module * M = new Module("editd-gpu", TheContext);
437    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
438    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
439    M->setTargetTriple("nvptx64-nvidia-cuda");
440    unsigned addrSpace = 1;
441
442    Type * const mBitBlockType = iBuilder->getBitBlockType();
443    Type * const inputSizeTy = PointerType::get(iBuilder->getSizeTy(), 1);
444    Type * const int32ty = iBuilder->getInt32Ty();
445    Type * const voidTy = Type::getVoidTy(M->getContext());
446    Type * const inputTy = PointerType::get(ArrayType::get(mBitBlockType, 4), 1);
447    Type * const patternPtrTy = PointerType::get(iBuilder->getInt8Ty(), 1);
448    Type * const outputTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
449    Type * const stridesTy = PointerType::get(int32ty, 1);
450
451    ExternalFileBuffer CCStream(iBuilder, iBuilder->getStreamSetTy( 4, 1), addrSpace);
452    ExternalFileBuffer ResultStream(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1), addrSpace);
453
454    kernel::editdGPUKernel editdk(iBuilder, editDistance, patternLen); 
455    editdk.generateKernel({&CCStream}, {&ResultStream});
456
457    Function * const main = cast<Function>(M->getOrInsertFunction("GPU_Main", voidTy, inputTy, inputSizeTy, patternPtrTy, outputTy, stridesTy, nullptr));
458    main->setCallingConv(CallingConv::C);
459    Function::arg_iterator args = main->arg_begin();
460   
461    Value * const inputStream = &*(args++);
462    inputStream->setName("input");
463    Value * const inputSizePtr = &*(args++);
464    inputSizePtr->setName("inputSizePtr");
465    Value * const pattStream = &*(args++);
466    pattStream->setName("pattStream");
467    Value * const resultStream = &*(args++);
468    resultStream->setName("resultStream");
469    Value * const stridesPtr = &*(args++);
470    stridesPtr->setName("stridesPtr");
471   
472    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
473
474    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
475    Value * tid = iBuilder->CreateCall(tidFunc);
476    Value * inputThreadPtr = iBuilder->CreateGEP(inputStream, tid);
477
478    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
479    Value * bid = iBuilder->CreateCall(bidFunc);
480    Value * strides = iBuilder->CreateLoad(stridesPtr);
481    Value * outputBlocks = iBuilder->CreateMul(strides, ConstantInt::get(int32ty, GROUPTHREADS));
482    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, iBuilder->CreateAdd(iBuilder->CreateMul(bid, outputBlocks), tid));
483
484    Value * inputSize = iBuilder->CreateLoad(inputSizePtr);
485    CCStream.setStreamSetBuffer(inputThreadPtr, inputSize);
486    ResultStream.setEmptyBuffer(resultStreamPtr);
487
488    const unsigned numOfCarries = patternLen * (editDistance + 1) * 4;
489    Type * strideCarryTy = ArrayType::get(mBitBlockType, numOfCarries);
490    Value * strideCarry = iBuilder->CreateAlloca(strideCarryTy);
491    iBuilder->CreateStore(Constant::getNullValue(strideCarryTy), strideCarry);
492
493    Value * editdInstance = editdk.createInstance({pattStream, strideCarry});
494   
495    generatePipelineLoop(iBuilder, {&editdk}, {editdInstance}, inputSize);
496       
497    iBuilder->CreateRetVoid();
498   
499    MDNode * Node = MDNode::get(M->getContext(),
500                                {llvm::ValueAsMetadata::get(main),
501                                 MDString::get(M->getContext(), "kernel"), 
502                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
503    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
504    NMD->addOperand(Node);
505
506    Compile2PTX(M, IRFilename, PTXFilename);
507
508}
509
510void mergeGPUCodeGen(){
511        LLVMContext TheContext;
512    Module * M = new Module("editd-gpu", TheContext);
513    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
514    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
515    M->setTargetTriple("nvptx64-nvidia-cuda");
516
517    Type * const mBitBlockType = iBuilder->getBitBlockType();
518    Type * const int32ty = iBuilder->getInt32Ty();
519    Type * const voidTy = Type::getVoidTy(M->getContext());
520    Type * const resultTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
521    Type * const stridesTy = PointerType::get(int32ty, 1);
522
523    Function * const main = cast<Function>(M->getOrInsertFunction("mergeResult", voidTy, resultTy, stridesTy, nullptr));
524    main->setCallingConv(CallingConv::C);
525    Function::arg_iterator args = main->arg_begin();
526   
527    Value * const resultStream = &*(args++);
528    resultStream->setName("resultStream");
529    Value * const stridesPtr = &*(args++);
530    stridesPtr->setName("stridesPtr");
531
532    BasicBlock * entryBlock = BasicBlock::Create(iBuilder->getContext(), "entryBlock", main, 0);
533    BasicBlock * strideLoopCond = BasicBlock::Create(iBuilder->getContext(), "strideLoopCond", main, 0);
534    BasicBlock * strideLoopBody = BasicBlock::Create(iBuilder->getContext(), "strideLoopBody", main, 0);
535    BasicBlock * stridesDone = BasicBlock::Create(iBuilder->getContext(), "stridesDone", main, 0);
536   
537    iBuilder->SetInsertPoint(entryBlock);
538
539    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
540    Value * tid = iBuilder->CreateCall(tidFunc);
541
542    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
543    Value * bid = iBuilder->CreateCall(bidFunc);
544    Value * strides = iBuilder->CreateLoad(stridesPtr);
545    Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
546    Value * outputBlocks = iBuilder->CreateMul(strides, strideBlocks);
547    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, tid);
548
549    iBuilder->CreateBr(strideLoopCond);
550    iBuilder->SetInsertPoint(strideLoopCond);
551    PHINode * strideNo = iBuilder->CreatePHI(int32ty, 2, "strideNo");
552    strideNo->addIncoming(ConstantInt::get(int32ty, 0), entryBlock);
553    Value * notDone = iBuilder->CreateICmpULT(strideNo, strides);
554    iBuilder->CreateCondBr(notDone, strideLoopBody, stridesDone);
555 
556    iBuilder->SetInsertPoint(strideLoopBody);
557    Value * myResultStreamPtr = iBuilder->CreateGEP(resultStreamPtr, {iBuilder->CreateMul(strideBlocks, strideNo)});
558    Value * myResultStream = iBuilder->CreateLoad(iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
559    for (unsigned i=1; i<GROUPBLOCKS; i++){
560        Value * nextStreamPtr = iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->CreateMul(outputBlocks, iBuilder->getInt32(i)), bid});
561        myResultStream = iBuilder->CreateOr(myResultStream, iBuilder->CreateLoad(nextStreamPtr));
562    }   
563    iBuilder->CreateStore(myResultStream, iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
564    strideNo->addIncoming(iBuilder->CreateAdd(strideNo, ConstantInt::get(int32ty, 1)), strideLoopBody);
565    iBuilder->CreateBr(strideLoopCond);
566   
567    iBuilder->SetInsertPoint(stridesDone);
568    iBuilder->CreateRetVoid();
569   
570    MDNode * Node = MDNode::get(M->getContext(),
571                                {llvm::ValueAsMetadata::get(main),
572                                 MDString::get(M->getContext(), "kernel"), 
573                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
574    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
575    NMD->addOperand(Node);
576
577    Compile2PTX(M, "merge.ll", "merge.ptx");
578
579}
580
581editdFunctionType editdScanCPUCodeGen() {
582                           
583    LLVMContext TheContext;
584    Module * M = new Module("editd", TheContext);
585    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);
586    ExecutionEngine * editdEngine = nullptr;
587
588    Type * mBitBlockType = iBuilder->getBitBlockType();
589    Type * const size_ty = iBuilder->getSizeTy();
590    Type * const voidTy = Type::getVoidTy(M->getContext());
591    Type * const inputType = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 0);
592
593    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1));
594    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
595    editdScanK.generateKernel({&MatchResults}, {});               
596   
597    Function * const main = cast<Function>(M->getOrInsertFunction("CPU_Main", voidTy, inputType, size_ty, nullptr));
598    main->setCallingConv(CallingConv::C);
599    Function::arg_iterator args = main->arg_begin();
600   
601    Value * const inputStream = &*(args++);
602    inputStream->setName("input");
603    Value * const fileSize = &*(args++);
604    fileSize->setName("fileSize");
605   
606    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
607
608    MatchResults.setStreamSetBuffer(inputStream, fileSize);
609    Value * scanMatchInstance = editdScanK.createInstance({});
610   
611    generatePipelineLoop(iBuilder, {&editdScanK}, {scanMatchInstance}, fileSize);
612       
613    iBuilder->CreateRetVoid();
614
615    editdEngine = JIT_to_ExecutionEngine(M);
616   
617    editdEngine->finalizeObject();
618
619    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main));
620}
621
622#endif
623
624int main(int argc, char *argv[]) {
625
626    cl::ParseCommandLineOptions(argc, argv);
627
628    int pattern_segs = 0;
629    int total_len = 0;
630
631    get_editd_pattern(pattern_segs, total_len);
632
633#ifdef CUDA_ENABLED
634    codegen::BlockSize = 64;
635#endif
636
637    preprocessFunctionType preprocess_ptr = preprocessCodeGen();
638    preprocess(preprocess_ptr);
639
640#ifdef CUDA_ENABLED 
641    setNVPTXOption();   
642    if(codegen::NVPTX){
643
644        std::ifstream t(PatternFilename);
645        if (!t.is_open()) {
646            std::cerr << "Error: cannot open " << PatternFilename << " for processing. Skipped.\n";
647            exit(-1);
648        } 
649        std::string patterns((std::istreambuf_iterator<char>(t)), std::istreambuf_iterator<char>());
650
651        editdGPUCodeGen(patterns.length()/GROUPTHREADS - 1);
652
653        mergeGPUCodeGen();
654
655        ulong * rslt = RunPTX(PTXFilename, chStream, size, patterns.c_str(), patterns.length(), editDistance);
656
657        editdFunctionType editd_ptr = editdScanCPUCodeGen();
658
659        editd(editd_ptr, (char*)rslt, size);
660       
661        run_second_filter(pattern_segs, total_len, 0.15);
662
663        return 0;
664    }
665#endif
666   
667    if(pattVector.size() == 1){
668        editdFunctionType editd_ptr = editdCodeGen(pattVector);
669        editd(editd_ptr, chStream, size);
670    }
671    else{
672        for(unsigned i=0; i<pattGroups.size(); i++){
673            editdFunctionType editd_ptr = editdCodeGen(pattGroups[i]);
674            editd(editd_ptr, chStream, size);
675        }
676        run_second_filter(pattern_segs, total_len, 0.15);
677    }
678
679    return 0;
680}
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
Note: See TracBrowser for help on using the repository browser.