source: icGREP/icgrep-devel/icgrep/editd/editd.cpp @ 5223

Last change on this file since 5223 was 5223, checked in by lindanl, 3 years ago

Some fixes.

  • Property svn:executable set to *
File size: 24.4 KB
Line 
1/*
2 *  Copyright (c) 2015 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <string>
8#include <iostream>
9#include <iomanip>
10#include <fstream>
11#include <sstream>
12
13
14#include <toolchain.h>
15#include <pablo/pablo_toolchain.h>
16#include <llvm/IR/Function.h>
17#include <llvm/IR/Module.h>
18#include <llvm/ExecutionEngine/ExecutionEngine.h>
19#include <llvm/ExecutionEngine/MCJIT.h>
20#include "llvm/Linker/Linker.h"
21
22#include <llvm/Support/CommandLine.h>
23#include <llvm/Support/raw_ostream.h>
24
25#include <re/re_cc.h>
26#include <cc/cc_compiler.h>
27#include <pablo/prototype.h>
28#include <pablo/pablo_compiler.h>
29#include <pablo/pablo_kernel.h>
30#include <IDISA/idisa_builder.h>
31#include <IDISA/idisa_target.h>
32#include <kernels/streamset.h>
33#include <kernels/interface.h>
34#include <kernels/kernel.h>
35#include <kernels/s2p_kernel.h>
36#include <editd/editdscan_kernel.h>
37#include <kernels/pipeline.h>
38
39#include <re/re_alt.h>
40#include <editd/pattern_compiler.h>
41
42// mmap system
43#include <boost/filesystem.hpp>
44#include <boost/iostreams/device/mapped_file.hpp>
45#include <fcntl.h>
46
47#ifdef CUDA_ENABLED
48#include <editd/EditdCudaDriver.h>
49#include <editd/editd_gpu_kernel.h>
50#endif
51
52static cl::list<std::string> inputFiles(cl::Positional, cl::desc("<regex> <input file ...>"), cl::OneOrMore);
53
54static cl::list<std::string> pattVector("e", cl::desc("pattern"), cl::ZeroOrMore);
55static cl::opt<std::string> PatternFilename("f", cl::desc("Take patterns (one per line) from a file"), cl::value_desc("regex file"), cl::init(""));
56
57static cl::opt<bool> CaseInsensitive("i", cl::desc("Ignore case distinctions in the pattern and the file."));
58
59static cl::opt<int> editDistance("edit-dist", cl::desc("Edit Distance Value"), cl::init(2));
60static cl::opt<int> optPosition("opt-pos", cl::desc("Optimize position"), cl::init(8));
61static cl::opt<int> stepSize("step-size", cl::desc("Step Size"), cl::init(3));
62static cl::opt<int> prefixLen("prefix", cl::desc("Prefix length"), cl::init(4));
63static cl::opt<bool> ShowPositions("display", cl::desc("Display the match positions."), cl::init(false));
64
65using namespace kernel;
66using namespace pablo;
67
68std::string IRFilename = "editd.ll";
69std::string PTXFilename = "editd.ptx";
70
71struct matchPosition
72{
73    size_t pos;
74    size_t dist;
75};
76
77std::vector<struct matchPosition> matchList;
78std::vector<std::vector<std::string>> pattGroups;
79
80void run_second_filter(int total_len, int pattern_segs, float errRate){
81   
82    if(matchList.size() == 0) return;
83
84    //remove the duplicates
85    bool cleared = true;
86    while(cleared){
87        cleared = false;
88        for (unsigned i=0; i<matchList.size()-1; i++){
89            if(matchList[i].pos == matchList[i+1].pos && matchList[i].dist == matchList[i+1].dist){
90                matchList.erase(matchList.begin() + i);
91                cleared = true;
92            }
93        }
94    }
95
96    //Sort match position
97    bool exchanged = true;
98    while(exchanged){
99        exchanged = false;
100        for (unsigned i=0; i<matchList.size()-1; i++){
101            if(matchList[i].pos > matchList[i+1].pos){
102                size_t tmp_pos = matchList[i].pos;
103                size_t tmp_dist = matchList[i].dist;
104                matchList[i].pos = matchList[i+1].pos;
105                matchList[i].dist = matchList[i+1].dist;
106                matchList[i+1].pos = tmp_pos;
107                matchList[i+1].dist = tmp_dist;
108                exchanged = true;
109            }
110        }
111    }
112
113    std::cout << "pattern_segs = " << pattern_segs << ", total_len = " << total_len << std::endl;
114
115    int v = pattern_segs * (editDistance+1) - total_len * errRate;
116
117    int startPos = matchList[0].pos;
118    int sum = matchList[0].dist;
119    int curIdx = 0;
120    unsigned i = 0;
121    int count = 0;
122    while (i < matchList.size()){
123        if(matchList[i].pos - startPos < total_len * (errRate+1)){
124            sum += matchList[i].dist;
125            i++;
126        }
127        else{
128            if(sum > v) count++;
129            sum -= matchList[curIdx].dist;
130            curIdx++;
131            startPos = matchList[curIdx].pos;
132        }
133    }
134
135    std::cout << "total candidate from the first filter is " << matchList.size() << std::endl;
136    std::cout << "total candidate from the second filter is " << count << std::endl;
137}
138
139extern "C" {
140void wrapped_report_pos(size_t match_pos, int dist) {
141        struct matchPosition curMatch;
142        curMatch.pos = match_pos;
143        curMatch.dist = dist;
144        matchList.push_back(curMatch);
145        if(ShowPositions)
146            std::cout << "pos: " << match_pos << ", dist:" << dist << "\n";
147    }
148
149}
150
151void icgrep_Linking(Module * m, ExecutionEngine * e) {
152    Module::FunctionListType & fns = m->getFunctionList();
153    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
154        std::string fnName = it->getName().str();
155        if (fnName == "wrapped_report_pos") {
156            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_pos);
157        }
158    }
159}
160
161void get_editd_pattern(int & pattern_segs, int & total_len) {
162 
163    if (PatternFilename != "") {
164        std::ifstream pattFile(PatternFilename.c_str());
165        std::string r;
166        if (pattFile.is_open()) {
167            while (std::getline(pattFile, r)) {
168                pattVector.push_back(r);
169                pattern_segs ++; 
170                total_len += r.size(); 
171            }
172            std::sort(pattVector.begin(), pattVector.end());
173            unsigned i = 0;
174            while(i < pattVector.size()){
175                std::vector<std::string> pattGroup;
176                std::string prefix = pattVector[i].substr(0, prefixLen);
177                while(i < pattVector.size() && pattVector[i].substr(0, prefixLen) == prefix){
178                    pattGroup.push_back(pattVector[i]);
179                    i++;
180                } 
181                pattGroups.push_back(pattGroup);
182            }
183            pattFile.close();
184        }
185    }
186   
187    // if there are no regexes specified through -e or -f, the first positional argument
188    // must be a regex, not an input file.
189   
190    if (pattVector.size() == 0) {
191        pattVector.push_back(inputFiles[0]);
192        inputFiles.erase(inputFiles.begin());
193    }
194}
195
196void buildPatternKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
197    PabloBuilder entry(kernel.getEntryBlock());
198
199    Var * pat = kernel.addInput("pat", iBuilder->getStreamSetTy(4));
200
201    PabloAST * basisBits[4];
202
203    basisBits[0] = entry.createExtract(pat, 0, "A");
204    basisBits[1] = entry.createExtract(pat, 1, "C");
205    basisBits[2] = entry.createExtract(pat, 2, "T");
206    basisBits[3] = entry.createExtract(pat, 3, "G");
207
208    re::Pattern_Compiler pattern_compiler(kernel);
209    pattern_compiler.compile(patterns, entry, basisBits, editDistance, optPosition, stepSize);
210
211    pablo_function_passes(&kernel);
212}
213
214Function * editdPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
215   
216    ExternalFileBuffer ChStream(iBuilder, iBuilder->getStreamSetTy(4));
217    SingleBlockBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(editDistance + 1));
218
219    PabloKernel editdk(iBuilder, "editd");
220
221    buildPatternKernel(editdk, iBuilder, patterns);
222
223    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
224   
225    std::unique_ptr<Module> editdM = editdk.createKernelModule({&ChStream}, {&MatchResults});
226    std::unique_ptr<Module> scanM = editdScanK.createKernelModule({&MatchResults}, {});               
227   
228    editdk.addKernelDeclarations(mMod);
229    editdScanK.addKernelDeclarations(mMod);
230
231    Type * const size_ty = iBuilder->getSizeTy();
232    Type * const voidTy = Type::getVoidTy(mMod->getContext());
233    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 0);
234   
235    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, nullptr));
236    main->setCallingConv(CallingConv::C);
237    Function::arg_iterator args = main->arg_begin();
238   
239    Value * const inputStream = &*(args++);
240    inputStream->setName("input");
241    Value * const fileSize = &*(args++);
242    fileSize->setName("fileSize");
243   
244    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
245
246    ChStream.setStreamSetBuffer(inputStream, fileSize);
247    MatchResults.allocateBuffer();
248   
249    generatePipelineLoop(iBuilder, {&editdk, &editdScanK});
250       
251    iBuilder->CreateRetVoid();
252   
253    Linker L(*mMod);
254    L.linkInModule(std::move(editdM));
255    L.linkInModule(std::move(scanM));
256   
257    return main;
258}
259
260void buildPreprocessKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder) {
261    cc::CC_Compiler ccc(&kernel);
262    PabloBuilder & pb = ccc.getBuilder();
263
264    PabloAST * A = ccc.compileCC(re::makeCC(re::makeCC(0x41), re::makeCC(0x61)), pb);
265    PabloAST * C = ccc.compileCC(re::makeCC(re::makeCC(0x43), re::makeCC(0x63)), pb);
266    PabloAST * T = ccc.compileCC(re::makeCC(re::makeCC(0x54), re::makeCC(0x74)), pb);
267    PabloAST * G = ccc.compileCC(re::makeCC(re::makeCC(0x47), re::makeCC(0x67)), pb);
268
269    Var * const pat = kernel.addOutput("pat", iBuilder->getStreamSetTy(4));
270
271    pb.createAssign(pb.createExtract(pat, 0), A);
272    pb.createAssign(pb.createExtract(pat, 1), C);
273    pb.createAssign(pb.createExtract(pat, 2), T);
274    pb.createAssign(pb.createExtract(pat, 3), G);
275
276    pablo_function_passes(&kernel);
277}
278
279Function * preprocessPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder) {
280    Type * mBitBlockType = iBuilder->getBitBlockType();
281   
282    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
283    SingleBlockBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8));
284    ExternalFileBuffer CCResults(iBuilder, iBuilder->getStreamSetTy(4));
285
286    s2pKernel  s2pk(iBuilder);
287    std::unique_ptr<Module> s2pM = s2pk.createKernelModule({&ByteStream}, {&BasisBits});
288
289    PabloKernel  ccck(iBuilder, "ccc");
290
291    buildPreprocessKernel(ccck, iBuilder);
292   
293    std::unique_ptr<Module> cccM = ccck.createKernelModule({&BasisBits}, {&CCResults});
294   
295    s2pk.addKernelDeclarations(mMod);
296    ccck.addKernelDeclarations(mMod);
297
298    Type * const size_ty = iBuilder->getSizeTy();
299    Type * const voidTy = Type::getVoidTy(mMod->getContext());
300    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(mBitBlockType, 8), 1), 0);
301    Type * const outputType = PointerType::get(ArrayType::get(mBitBlockType, 4), 0);
302   
303    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, outputType, nullptr));
304    main->setCallingConv(CallingConv::C);
305    Function::arg_iterator args = main->arg_begin();
306   
307    Value * const inputStream = &*(args++);
308    inputStream->setName("input");
309    Value * const fileSize = &*(args++);
310    fileSize->setName("fileSize");
311    Value * const outputStream = &*(args++);
312    outputStream->setName("output");
313   
314    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
315
316    ByteStream.setStreamSetBuffer(inputStream, fileSize);
317    BasisBits.allocateBuffer();
318    CCResults.setStreamSetBuffer(outputStream, fileSize);
319   
320    generatePipelineLoop(iBuilder, {&s2pk, &ccck});
321       
322    iBuilder->CreateRetVoid();
323   
324    Linker L(*mMod);
325    L.linkInModule(std::move(s2pM));
326    L.linkInModule(std::move(cccM));
327   
328    return main;
329}
330
331
332typedef void (*preprocessFunctionType)(char * byte_data, size_t filesize, char * output_data);
333
334preprocessFunctionType preprocessCodeGen() {
335                           
336    LLVMContext TheContext;
337    Module * M = new Module("preprocess", TheContext);
338    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
339
340    llvm::Function * main_IR = preprocessPipeline(M, idb);
341
342    ExecutionEngine * preprocessEngine = JIT_to_ExecutionEngine(M);
343   
344    preprocessEngine->finalizeObject();
345
346    delete idb;
347    return reinterpret_cast<preprocessFunctionType>(preprocessEngine->getPointerToFunction(main_IR));
348}
349
350typedef void (*editdFunctionType)(char * byte_data, size_t filesize);
351
352editdFunctionType editdCodeGen(const std::vector<std::string> & patterns) {
353                           
354    LLVMContext TheContext;
355    Module * M = new Module("editd", TheContext);
356    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
357
358    llvm::Function * main_IR = editdPipeline(M, idb, patterns);
359
360    ExecutionEngine * editdEngine = JIT_to_ExecutionEngine(M);
361   
362    editdEngine->finalizeObject();
363
364    delete idb;
365    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main_IR));
366}
367
368char * chStream;
369int size;
370
371char * preprocess(preprocessFunctionType fn_ptr) {
372    std::string fileName = inputFiles[0];
373    size_t fileSize;
374    char * fileBuffer;
375   
376    const boost::filesystem::path file(fileName);
377    if (exists(file)) {
378        if (is_directory(file)) {
379            exit(0);
380        }
381    } else {
382        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
383        exit(0);
384    }
385   
386    fileSize = file_size(file);
387    boost::iostreams::mapped_file_source mappedFile;
388    if (fileSize == 0) {
389        fileBuffer = nullptr;
390    }
391    else {
392        try {
393            mappedFile.open(fileName);
394        } catch (std::exception &e) {
395            std::cerr << "Error: Boost mmap of " << fileName << ": " << e.what() << std::endl;
396            exit(0);
397        }
398        fileBuffer = const_cast<char *>(mappedFile.data());
399    }
400
401    int ret = posix_memalign((void**)&chStream, 32, fileSize);
402    if (ret) {
403        std::cerr << "Cannot allocate memory for output.\n";
404        exit(-1);
405    }
406
407    fn_ptr(fileBuffer, fileSize, chStream);
408    size = fileSize;
409
410    mappedFile.close();
411
412    return chStream;   
413}
414
415void editd(editdFunctionType fn_ptr, char * inputStream, int size) {
416 
417    if (size == 0) {
418        inputStream = nullptr;
419    }
420
421    fn_ptr(inputStream, size);
422   
423}
424
425#ifdef CUDA_ENABLED
426
427#define GROUPTHREADS 64
428#define GROUPBLOCKS 64
429
430void editdGPUCodeGen(unsigned patternLen){ 
431    LLVMContext TheContext;
432    Module * M = new Module("editd-gpu", TheContext);
433    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
434    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
435    M->setTargetTriple("nvptx64-nvidia-cuda");
436    unsigned addrSpace = 1;
437
438    Type * const mBitBlockType = iBuilder->getBitBlockType();
439    Type * const inputSizeTy = PointerType::get(iBuilder->getSizeTy(), 1);
440    Type * const int32ty = iBuilder->getInt32Ty();
441    Type * const voidTy = Type::getVoidTy(M->getContext());
442    Type * const inputTy = PointerType::get(ArrayType::get(mBitBlockType, 4), 1);
443    Type * const patternPtrTy = PointerType::get(iBuilder->getInt8Ty(), 1);
444    Type * const outputTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
445    Type * const stridesTy = PointerType::get(int32ty, 1);
446
447    ExternalFileBuffer CCStream(iBuilder, iBuilder->getStreamSetTy( 4, 1), addrSpace);
448    ExternalFileBuffer ResultStream(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1), addrSpace);
449
450    kernel::editdGPUKernel editdk(iBuilder, editDistance, patternLen); 
451    editdk.generateKernel({&CCStream}, {&ResultStream});
452
453    Function * const main = cast<Function>(M->getOrInsertFunction("GPU_Main", voidTy, inputTy, inputSizeTy, patternPtrTy, outputTy, stridesTy, nullptr));
454    main->setCallingConv(CallingConv::C);
455    Function::arg_iterator args = main->arg_begin();
456   
457    Value * const inputStream = &*(args++);
458    inputStream->setName("input");
459    Value * const inputSizePtr = &*(args++);
460    inputSizePtr->setName("inputSizePtr");
461    Value * const pattStream = &*(args++);
462    pattStream->setName("pattStream");
463    Value * const resultStream = &*(args++);
464    resultStream->setName("resultStream");
465    Value * const stridesPtr = &*(args++);
466    stridesPtr->setName("stridesPtr");
467   
468    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
469
470    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
471    Value * tid = iBuilder->CreateCall(tidFunc);
472    Value * inputThreadPtr = iBuilder->CreateGEP(inputStream, tid);
473
474    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
475    Value * bid = iBuilder->CreateCall(bidFunc);
476    Value * strides = iBuilder->CreateLoad(stridesPtr);
477    Value * outputBlocks = iBuilder->CreateMul(strides, ConstantInt::get(int32ty, GROUPTHREADS));
478    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, iBuilder->CreateAdd(iBuilder->CreateMul(bid, outputBlocks), tid));
479
480    Value * inputSize = iBuilder->CreateLoad(inputSizePtr);
481    CCStream.setStreamSetBuffer(inputThreadPtr, inputSize);
482    ResultStream.setEmptyBuffer(resultStreamPtr);
483
484    const unsigned numOfCarries = patternLen * (editDistance + 1) * 4;
485    Type * strideCarryTy = ArrayType::get(mBitBlockType, numOfCarries);
486    Value * strideCarry = iBuilder->CreateAlloca(strideCarryTy);
487    iBuilder->CreateStore(Constant::getNullValue(strideCarryTy), strideCarry);
488
489    editdk.setInitialArguments({pattStream, strideCarry});
490   
491    generatePipelineLoop(iBuilder, {&editdk});
492       
493    iBuilder->CreateRetVoid();
494   
495    MDNode * Node = MDNode::get(M->getContext(),
496                                {llvm::ValueAsMetadata::get(main),
497                                 MDString::get(M->getContext(), "kernel"), 
498                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
499    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
500    NMD->addOperand(Node);
501
502    Compile2PTX(M, IRFilename, PTXFilename);
503
504}
505
506void mergeGPUCodeGen(){
507        LLVMContext TheContext;
508    Module * M = new Module("editd-gpu", TheContext);
509    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
510    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
511    M->setTargetTriple("nvptx64-nvidia-cuda");
512
513    Type * const mBitBlockType = iBuilder->getBitBlockType();
514    Type * const int32ty = iBuilder->getInt32Ty();
515    Type * const voidTy = Type::getVoidTy(M->getContext());
516    Type * const resultTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
517    Type * const stridesTy = PointerType::get(int32ty, 1);
518
519    Function * const main = cast<Function>(M->getOrInsertFunction("mergeResult", voidTy, resultTy, stridesTy, nullptr));
520    main->setCallingConv(CallingConv::C);
521    Function::arg_iterator args = main->arg_begin();
522   
523    Value * const resultStream = &*(args++);
524    resultStream->setName("resultStream");
525    Value * const stridesPtr = &*(args++);
526    stridesPtr->setName("stridesPtr");
527
528    BasicBlock * entryBlock = BasicBlock::Create(iBuilder->getContext(), "entryBlock", main, 0);
529    BasicBlock * strideLoopCond = BasicBlock::Create(iBuilder->getContext(), "strideLoopCond", main, 0);
530    BasicBlock * strideLoopBody = BasicBlock::Create(iBuilder->getContext(), "strideLoopBody", main, 0);
531    BasicBlock * stridesDone = BasicBlock::Create(iBuilder->getContext(), "stridesDone", main, 0);
532   
533    iBuilder->SetInsertPoint(entryBlock);
534
535    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
536    Value * tid = iBuilder->CreateCall(tidFunc);
537
538    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
539    Value * bid = iBuilder->CreateCall(bidFunc);
540    Value * strides = iBuilder->CreateLoad(stridesPtr);
541    Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
542    Value * outputBlocks = iBuilder->CreateMul(strides, strideBlocks);
543    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, tid);
544
545    iBuilder->CreateBr(strideLoopCond);
546    iBuilder->SetInsertPoint(strideLoopCond);
547    PHINode * strideNo = iBuilder->CreatePHI(int32ty, 2, "strideNo");
548    strideNo->addIncoming(ConstantInt::get(int32ty, 0), entryBlock);
549    Value * notDone = iBuilder->CreateICmpULT(strideNo, strides);
550    iBuilder->CreateCondBr(notDone, strideLoopBody, stridesDone);
551 
552    iBuilder->SetInsertPoint(strideLoopBody);
553    Value * myResultStreamPtr = iBuilder->CreateGEP(resultStreamPtr, {iBuilder->CreateMul(strideBlocks, strideNo)});
554    Value * myResultStream = iBuilder->CreateLoad(iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
555    for (unsigned i=1; i<GROUPBLOCKS; i++){
556        Value * nextStreamPtr = iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->CreateMul(outputBlocks, iBuilder->getInt32(i)), bid});
557        myResultStream = iBuilder->CreateOr(myResultStream, iBuilder->CreateLoad(nextStreamPtr));
558    }   
559    iBuilder->CreateStore(myResultStream, iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
560    strideNo->addIncoming(iBuilder->CreateAdd(strideNo, ConstantInt::get(int32ty, 1)), strideLoopBody);
561    iBuilder->CreateBr(strideLoopCond);
562   
563    iBuilder->SetInsertPoint(stridesDone);
564    iBuilder->CreateRetVoid();
565   
566    MDNode * Node = MDNode::get(M->getContext(),
567                                {llvm::ValueAsMetadata::get(main),
568                                 MDString::get(M->getContext(), "kernel"), 
569                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
570    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
571    NMD->addOperand(Node);
572
573    Compile2PTX(M, "merge.ll", "merge.ptx");
574
575}
576
577editdFunctionType editdScanCPUCodeGen() {
578                           
579    LLVMContext TheContext;
580    Module * M = new Module("editd", TheContext);
581    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);
582    ExecutionEngine * editdEngine = nullptr;
583
584    Type * mBitBlockType = iBuilder->getBitBlockType();
585    Type * const size_ty = iBuilder->getSizeTy();
586    Type * const voidTy = Type::getVoidTy(M->getContext());
587    Type * const inputType = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 0);
588
589    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1));
590    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
591    editdScanK.generateKernel({&MatchResults}, {});               
592   
593    Function * const main = cast<Function>(M->getOrInsertFunction("CPU_Main", voidTy, inputType, size_ty, nullptr));
594    main->setCallingConv(CallingConv::C);
595    Function::arg_iterator args = main->arg_begin();
596   
597    Value * const inputStream = &*(args++);
598    inputStream->setName("input");
599    Value * const fileSize = &*(args++);
600    fileSize->setName("fileSize");
601   
602    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
603
604    MatchResults.setStreamSetBuffer(inputStream, fileSize);
605   
606    generatePipelineLoop(iBuilder, {&editdScanK});
607       
608    iBuilder->CreateRetVoid();
609
610    editdEngine = JIT_to_ExecutionEngine(M);
611   
612    editdEngine->finalizeObject();
613
614    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main));
615}
616
617#endif
618
619int main(int argc, char *argv[]) {
620
621    cl::ParseCommandLineOptions(argc, argv);
622
623    int pattern_segs = 0;
624    int total_len = 0;
625
626    get_editd_pattern(pattern_segs, total_len);
627
628#ifdef CUDA_ENABLED
629    codegen::BlockSize = 64;
630#endif
631
632    preprocessFunctionType preprocess_ptr = preprocessCodeGen();
633    preprocess(preprocess_ptr);
634
635#ifdef CUDA_ENABLED 
636    setNVPTXOption();   
637    if(codegen::NVPTX){
638
639        std::ifstream t(PatternFilename);
640        if (!t.is_open()) {
641            std::cerr << "Error: cannot open " << PatternFilename << " for processing. Skipped.\n";
642            exit(-1);
643        } 
644        std::string patterns((std::istreambuf_iterator<char>(t)), std::istreambuf_iterator<char>());
645
646        editdGPUCodeGen(patterns.length()/GROUPTHREADS - 1);
647
648        mergeGPUCodeGen();
649
650        ulong * rslt = RunPTX(PTXFilename, chStream, size, patterns.c_str(), patterns.length(), editDistance);
651
652        editdFunctionType editd_ptr = editdScanCPUCodeGen();
653
654        editd(editd_ptr, (char*)rslt, size);
655       
656        run_second_filter(pattern_segs, total_len, 0.15);
657
658        return 0;
659    }
660#endif
661   
662    if(pattVector.size() == 1){
663        editdFunctionType editd_ptr = editdCodeGen(pattVector);
664        editd(editd_ptr, chStream, size);
665    }
666    else{
667        for(unsigned i=0; i<pattGroups.size(); i++){
668            editdFunctionType editd_ptr = editdCodeGen(pattGroups[i]);
669            editd(editd_ptr, chStream, size);
670        }
671        run_second_filter(pattern_segs, total_len, 0.15);
672    }
673
674    return 0;
675}
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
Note: See TracBrowser for help on using the repository browser.