source: icGREP/icgrep-devel/icgrep/editd/editd.cpp @ 5260

Last change on this file since 5260 was 5260, checked in by nmedfort, 2 years ago

Changes working towards simplifying accessing stream elements + some modifications to simplify include / forward declarations within the CodeGen? library.

  • Property svn:executable set to *
File size: 26.4 KB
Line 
1/*
2 *  Copyright (c) 2015 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <string>
8#include <iostream>
9#include <iomanip>
10#include <fstream>
11#include <sstream>
12
13
14#include <toolchain.h>
15#include <pablo/pablo_toolchain.h>
16#include <llvm/IR/Function.h>
17#include <llvm/IR/Module.h>
18#include <llvm/ExecutionEngine/ExecutionEngine.h>
19#include <llvm/ExecutionEngine/MCJIT.h>
20#include "llvm/Linker/Linker.h"
21
22#include <llvm/Support/CommandLine.h>
23#include <llvm/Support/raw_ostream.h>
24
25#include <re/re_cc.h>
26#include <cc/cc_compiler.h>
27#include <pablo/pablo_compiler.h>
28#include <pablo/pablo_kernel.h>
29#include <IR_Gen/idisa_builder.h>
30#include <IR_Gen/idisa_target.h>
31#include <kernels/streamset.h>
32#include <kernels/interface.h>
33#include <kernels/kernel.h>
34#include <kernels/mmap_kernel.h>
35#include <kernels/s2p_kernel.h>
36#include <editd/editdscan_kernel.h>
37#include <kernels/pipeline.h>
38
39#include <re/re_alt.h>
40#include <editd/pattern_compiler.h>
41
42// mmap system
43#include <boost/filesystem.hpp>
44#include <boost/iostreams/device/mapped_file.hpp>
45#include <fcntl.h>
46#include <mutex>
47
48#ifdef CUDA_ENABLED
49#include <editd/EditdCudaDriver.h>
50#include <editd/editd_gpu_kernel.h>
51#endif
52
53static cl::list<std::string> inputFiles(cl::Positional, cl::desc("<regex> <input file ...>"), cl::OneOrMore);
54
55static cl::list<std::string> pattVector("e", cl::desc("pattern"), cl::ZeroOrMore);
56static cl::opt<std::string> PatternFilename("f", cl::desc("Take patterns (one per line) from a file"), cl::value_desc("regex file"), cl::init(""));
57
58static cl::opt<bool> CaseInsensitive("i", cl::desc("Ignore case distinctions in the pattern and the file."));
59
60static cl::opt<int> editDistance("edit-dist", cl::desc("Edit Distance Value"), cl::init(2));
61static cl::opt<int> optPosition("opt-pos", cl::desc("Optimize position"), cl::init(8));
62static cl::opt<int> stepSize("step-size", cl::desc("Step Size"), cl::init(3));
63static cl::opt<int> prefixLen("prefix", cl::desc("Prefix length"), cl::init(4));
64static cl::opt<bool> ShowPositions("display", cl::desc("Display the match positions."), cl::init(false));
65
66static cl::opt<int> Threads("threads", cl::desc("Total number of threads."), cl::init(1));
67
68using namespace kernel;
69using namespace pablo;
70using namespace parabix;
71
72const static std::string IRFilename = "editd.ll";
73const static std::string PTXFilename = "editd.ptx";
74
75struct matchPosition
76{
77    size_t pos;
78    size_t dist;
79};
80
81std::vector<struct matchPosition> matchList;
82std::vector<std::vector<std::string>> pattGroups;
83
84void run_second_filter(int total_len, int pattern_segs, float errRate){
85   
86    if(matchList.empty()) return;
87
88    //remove the duplicates
89    bool cleared = true;
90    while(cleared){
91        cleared = false;
92        for (unsigned i=0; i<matchList.size()-1; i++){
93            if(matchList[i].pos == matchList[i+1].pos && matchList[i].dist == matchList[i+1].dist){
94                matchList.erase(matchList.begin() + i);
95                cleared = true;
96            }
97        }
98    }
99
100    //Sort match position
101    bool exchanged = true;
102    while(exchanged){
103        exchanged = false;
104        for (unsigned i=0; i<matchList.size()-1; i++){
105            if(matchList[i].pos > matchList[i+1].pos){
106                size_t tmp_pos = matchList[i].pos;
107                size_t tmp_dist = matchList[i].dist;
108                matchList[i].pos = matchList[i+1].pos;
109                matchList[i].dist = matchList[i+1].dist;
110                matchList[i+1].pos = tmp_pos;
111                matchList[i+1].dist = tmp_dist;
112                exchanged = true;
113            }
114        }
115    }
116
117    std::cout << "pattern_segs = " << pattern_segs << ", total_len = " << total_len << std::endl;
118
119    int v = pattern_segs * (editDistance+1) - total_len * errRate;
120
121    int startPos = matchList[0].pos;
122    int sum = matchList[0].dist;
123    int curIdx = 0;
124    unsigned i = 0;
125    int count = 0;
126    while (i < matchList.size()){
127        if(matchList[i].pos - startPos < total_len * (errRate+1)){
128            sum += matchList[i].dist;
129            i++;
130        }
131        else{
132            if(sum > v) count++;
133            sum -= matchList[curIdx].dist;
134            curIdx++;
135            startPos = matchList[curIdx].pos;
136        }
137    }
138
139    std::cout << "total candidate from the first filter is " << matchList.size() << std::endl;
140    std::cout << "total candidate from the second filter is " << count << std::endl;
141}
142
143extern "C" {
144std::mutex store_mutex;
145void wrapped_report_pos(size_t match_pos, int dist) {
146        struct matchPosition curMatch;
147        curMatch.pos = match_pos;
148        curMatch.dist = dist;
149
150        store_mutex.lock();
151        matchList.push_back(curMatch);
152        if(ShowPositions)
153            std::cout << "pos: " << match_pos << ", dist:" << dist << "\n";
154        store_mutex.unlock();
155    }
156
157}
158
159void icgrep_Linking(Module * m, ExecutionEngine * e) {
160    Module::FunctionListType & fns = m->getFunctionList();
161    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
162        std::string fnName = it->getName().str();
163        if (fnName == "wrapped_report_pos") {
164            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_pos);
165        }
166    }
167}
168
169void get_editd_pattern(int & pattern_segs, int & total_len) {
170 
171    if (PatternFilename != "") {
172        std::ifstream pattFile(PatternFilename.c_str());
173        std::string r;
174        if (pattFile.is_open()) {
175            while (std::getline(pattFile, r)) {
176                pattVector.push_back(r);
177                pattern_segs ++; 
178                total_len += r.size(); 
179            }
180            std::sort(pattVector.begin(), pattVector.end());
181            unsigned i = 0;
182            while(i < pattVector.size()){
183                std::vector<std::string> pattGroup;
184                std::string prefix = pattVector[i].substr(0, prefixLen);
185                while(i < pattVector.size() && pattVector[i].substr(0, prefixLen) == prefix){
186                    pattGroup.push_back(pattVector[i]);
187                    i++;
188                } 
189                pattGroups.push_back(pattGroup);
190            }
191            pattFile.close();
192        }
193    }
194   
195    // if there are no regexes specified through -e or -f, the first positional argument
196    // must be a regex, not an input file.
197   
198    if (pattVector.size() == 0) {
199        pattVector.push_back(inputFiles[0]);
200        inputFiles.erase(inputFiles.begin());
201    }
202}
203
204void buildPatternKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
205    PabloBuilder entry(kernel.getEntryBlock());
206
207    Var * pat = kernel.addInput("pat", iBuilder->getStreamSetTy(4));
208
209    PabloAST * basisBits[4];
210
211    basisBits[0] = entry.createExtract(pat, 0, "A");
212    basisBits[1] = entry.createExtract(pat, 1, "C");
213    basisBits[2] = entry.createExtract(pat, 2, "T");
214    basisBits[3] = entry.createExtract(pat, 3, "G");
215
216    re::Pattern_Compiler pattern_compiler(kernel);
217    pattern_compiler.compile(patterns, entry, basisBits, editDistance, optPosition, stepSize);
218
219    pablo_function_passes(&kernel);
220}
221
222
223Function * editdPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
224   
225    Type * const size_ty = iBuilder->getSizeTy();
226    Type * const voidTy = iBuilder->getVoidTy();
227    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 0);
228   
229    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, nullptr));
230    main->setCallingConv(CallingConv::C);
231    Function::arg_iterator args = main->arg_begin();
232   
233    Value * const inputStream = &*(args++);
234    inputStream->setName("input");
235    Value * const fileSize = &*(args++);
236    fileSize->setName("fileSize");
237   
238    ExternalFileBuffer ChStream(iBuilder, iBuilder->getStreamSetTy(4));
239    SingleBlockBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(editDistance + 1));
240
241    MMapSourceKernel mmapK(iBuilder);
242    std::unique_ptr<Module> mmapM = mmapK.createKernelModule({}, {&ChStream});
243    mmapK.setInitialArguments({fileSize});
244   
245    PabloKernel editdk(iBuilder, "editd");
246
247    buildPatternKernel(editdk, iBuilder, patterns);
248
249    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
250   
251    std::unique_ptr<Module> editdM = editdk.createKernelModule({&ChStream}, {&MatchResults});
252    std::unique_ptr<Module> scanM = editdScanK.createKernelModule({&MatchResults}, {});               
253   
254    mmapK.addKernelDeclarations(mMod);
255    editdk.addKernelDeclarations(mMod);
256    editdScanK.addKernelDeclarations(mMod);
257
258    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
259
260    ChStream.setStreamSetBuffer(inputStream, fileSize);
261    MatchResults.allocateBuffer();
262   
263    generatePipelineLoop(iBuilder, {&mmapK, &editdk, &editdScanK});
264       
265    iBuilder->CreateRetVoid();
266   
267    Linker L(*mMod);
268    L.linkInModule(std::move(mmapM));
269    L.linkInModule(std::move(editdM));
270    L.linkInModule(std::move(scanM));
271   
272    return main;
273}
274
275void buildPreprocessKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder) {
276    cc::CC_Compiler ccc(&kernel);
277    PabloBuilder & pb = ccc.getBuilder();
278
279    PabloAST * A = ccc.compileCC(re::makeCC(re::makeCC(0x41), re::makeCC(0x61)), pb);
280    PabloAST * C = ccc.compileCC(re::makeCC(re::makeCC(0x43), re::makeCC(0x63)), pb);
281    PabloAST * T = ccc.compileCC(re::makeCC(re::makeCC(0x54), re::makeCC(0x74)), pb);
282    PabloAST * G = ccc.compileCC(re::makeCC(re::makeCC(0x47), re::makeCC(0x67)), pb);
283
284    Var * const pat = kernel.addOutput("pat", iBuilder->getStreamSetTy(4));
285
286    pb.createAssign(pb.createExtract(pat, 0), A);
287    pb.createAssign(pb.createExtract(pat, 1), C);
288    pb.createAssign(pb.createExtract(pat, 2), T);
289    pb.createAssign(pb.createExtract(pat, 3), G);
290
291    pablo_function_passes(&kernel);
292}
293
294Function * preprocessPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder) {
295    Type * mBitBlockType = iBuilder->getBitBlockType();
296   
297    Type * const size_ty = iBuilder->getSizeTy();
298    Type * const voidTy = iBuilder->getVoidTy();
299    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(mBitBlockType, 8), 1), 0);
300    Type * const outputType = PointerType::get(ArrayType::get(mBitBlockType, 4), 0);
301   
302    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, outputType, nullptr));
303    main->setCallingConv(CallingConv::C);
304    Function::arg_iterator args = main->arg_begin();
305   
306    Value * const inputStream = &*(args++);
307    inputStream->setName("input");
308    Value * const fileSize = &*(args++);
309    fileSize->setName("fileSize");
310    Value * const outputStream = &*(args++);
311    outputStream->setName("output");
312   
313    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
314    SingleBlockBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8));
315    ExternalFileBuffer CCResults(iBuilder, iBuilder->getStreamSetTy(4));
316
317    MMapSourceKernel mmapK(iBuilder);
318    std::unique_ptr<Module> mmapM = mmapK.createKernelModule({}, {&ByteStream});
319    mmapK.setInitialArguments({fileSize});
320   
321    S2PKernel  s2pk(iBuilder);
322    std::unique_ptr<Module> s2pM = s2pk.createKernelModule({&ByteStream}, {&BasisBits});
323
324    PabloKernel  ccck(iBuilder, "ccc");
325
326    buildPreprocessKernel(ccck, iBuilder);
327   
328    std::unique_ptr<Module> cccM = ccck.createKernelModule({&BasisBits}, {&CCResults});
329   
330    mmapK.addKernelDeclarations(mMod);
331    s2pk.addKernelDeclarations(mMod);
332    ccck.addKernelDeclarations(mMod);
333   
334    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
335
336    ByteStream.setStreamSetBuffer(inputStream, fileSize);
337    BasisBits.allocateBuffer();
338    CCResults.setStreamSetBuffer(outputStream, fileSize);
339   
340    generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &ccck});
341       
342    iBuilder->CreateRetVoid();
343   
344    Linker L(*mMod);
345    L.linkInModule(std::move(mmapM));
346    L.linkInModule(std::move(s2pM));
347    L.linkInModule(std::move(cccM));
348   
349    return main;
350}
351
352
353typedef void (*preprocessFunctionType)(char * byte_data, size_t filesize, char * output_data);
354
355preprocessFunctionType preprocessCodeGen() {
356                           
357    LLVMContext TheContext;
358    Module * M = new Module("preprocess", TheContext);
359    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
360
361    llvm::Function * main_IR = preprocessPipeline(M, idb);
362
363    ExecutionEngine * preprocessEngine = JIT_to_ExecutionEngine(M);
364   
365    preprocessEngine->finalizeObject();
366
367    delete idb;
368    return reinterpret_cast<preprocessFunctionType>(preprocessEngine->getPointerToFunction(main_IR));
369}
370
371typedef void (*editdFunctionType)(char * byte_data, size_t filesize);
372
373editdFunctionType editdCodeGen(const std::vector<std::string> & patterns) {
374                           
375    LLVMContext TheContext;
376    Module * M = new Module("editd", TheContext);
377    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
378
379    llvm::Function * main_IR = editdPipeline(M, idb, patterns);
380
381    ExecutionEngine * editdEngine = JIT_to_ExecutionEngine(M);
382   
383    editdEngine->finalizeObject();
384
385    delete idb;
386    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main_IR));
387}
388
389char * chStream;
390int size;
391
392char * preprocess(preprocessFunctionType fn_ptr) {
393    std::string fileName = inputFiles[0];
394    size_t fileSize;
395    char * fileBuffer;
396   
397    const boost::filesystem::path file(fileName);
398    if (exists(file)) {
399        if (is_directory(file)) {
400            exit(0);
401        }
402    } else {
403        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
404        exit(0);
405    }
406   
407    fileSize = file_size(file);
408    boost::iostreams::mapped_file_source mappedFile;
409    if (fileSize == 0) {
410        fileBuffer = nullptr;
411    }
412    else {
413        try {
414            mappedFile.open(fileName);
415        } catch (std::exception &e) {
416            std::cerr << "Error: Boost mmap of " << fileName << ": " << e.what() << std::endl;
417            exit(0);
418        }
419        fileBuffer = const_cast<char *>(mappedFile.data());
420    }
421
422    int ret = posix_memalign((void**)&chStream, 32, fileSize);
423    if (ret) {
424        std::cerr << "Cannot allocate memory for output.\n";
425        exit(-1);
426    }
427
428    fn_ptr(fileBuffer, fileSize, chStream);
429    size = fileSize;
430
431    mappedFile.close();
432
433    return chStream;   
434}
435
436void editd(editdFunctionType fn_ptr, char * inputStream, int size) {
437 
438    if (size == 0) {
439        inputStream = nullptr;
440    }
441
442    fn_ptr(inputStream, size);
443   
444}
445
446std::mutex count_mutex;
447size_t groupCount;
448void *DoEditd(void *threadid)
449{
450    size_t groupIdx;
451    count_mutex.lock();
452    groupIdx = groupCount;
453    groupCount++;
454    count_mutex.unlock();
455
456    while (groupIdx < pattGroups.size()){
457        editdFunctionType editd_ptr = editdCodeGen(pattGroups[groupIdx]);
458        editd(editd_ptr, chStream, size);
459
460        count_mutex.lock();
461        groupIdx = groupCount;
462        groupCount++;
463        count_mutex.unlock();
464    }
465
466    pthread_exit(NULL);
467}
468
469#ifdef CUDA_ENABLED
470
471#define GROUPTHREADS 64
472#define GROUPBLOCKS 64
473
474void editdGPUCodeGen(unsigned patternLen){ 
475    LLVMContext TheContext;
476    Module * M = new Module("editd-gpu", TheContext);
477    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
478    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
479    M->setTargetTriple("nvptx64-nvidia-cuda");
480    unsigned addrSpace = 1;
481
482    Type * const mBitBlockType = iBuilder->getBitBlockType();
483    Type * const inputSizeTy = PointerType::get(iBuilder->getSizeTy(), 1);
484    Type * const int32ty = iBuilder->getInt32Ty();
485    Type * const voidTy = Type::getVoidTy(M->getContext());
486    Type * const inputTy = PointerType::get(ArrayType::get(mBitBlockType, 4), 1);
487    Type * const patternPtrTy = PointerType::get(iBuilder->getInt8Ty(), 1);
488    Type * const outputTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
489    Type * const stridesTy = PointerType::get(int32ty, 1);
490
491    ExternalFileBuffer CCStream(iBuilder, iBuilder->getStreamSetTy( 4, 1), addrSpace);
492    ExternalFileBuffer ResultStream(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1), addrSpace);
493
494    kernel::editdGPUKernel editdk(iBuilder, editDistance, patternLen); 
495    editdk.generateKernel({&CCStream}, {&ResultStream});
496
497    Function * const main = cast<Function>(M->getOrInsertFunction("GPU_Main", voidTy, inputTy, inputSizeTy, patternPtrTy, outputTy, stridesTy, nullptr));
498    main->setCallingConv(CallingConv::C);
499    Function::arg_iterator args = main->arg_begin();
500   
501    Value * const inputStream = &*(args++);
502    inputStream->setName("input");
503    Value * const inputSizePtr = &*(args++);
504    inputSizePtr->setName("inputSizePtr");
505    Value * const pattStream = &*(args++);
506    pattStream->setName("pattStream");
507    Value * const resultStream = &*(args++);
508    resultStream->setName("resultStream");
509    Value * const stridesPtr = &*(args++);
510    stridesPtr->setName("stridesPtr");
511   
512    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
513
514    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
515    Value * tid = iBuilder->CreateCall(tidFunc);
516    Value * inputThreadPtr = iBuilder->CreateGEP(inputStream, tid);
517
518    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
519    Value * bid = iBuilder->CreateCall(bidFunc);
520    Value * strides = iBuilder->CreateLoad(stridesPtr);
521    Value * outputBlocks = iBuilder->CreateMul(strides, ConstantInt::get(int32ty, GROUPTHREADS));
522    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, iBuilder->CreateAdd(iBuilder->CreateMul(bid, outputBlocks), tid));
523
524    Value * inputSize = iBuilder->CreateLoad(inputSizePtr);
525    CCStream.setStreamSetBuffer(inputThreadPtr, inputSize);
526    ResultStream.setEmptyBuffer(resultStreamPtr);
527
528    const unsigned numOfCarries = patternLen * (editDistance + 1) * 4;
529    Type * strideCarryTy = ArrayType::get(mBitBlockType, numOfCarries);
530    Value * strideCarry = iBuilder->CreateAlloca(strideCarryTy);
531    iBuilder->CreateStore(Constant::getNullValue(strideCarryTy), strideCarry);
532
533    editdk.setInitialArguments({pattStream, strideCarry});
534   
535    generatePipelineLoop(iBuilder, {&editdk});
536       
537    iBuilder->CreateRetVoid();
538   
539    MDNode * Node = MDNode::get(M->getContext(),
540                                {llvm::ValueAsMetadata::get(main),
541                                 MDString::get(M->getContext(), "kernel"), 
542                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
543    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
544    NMD->addOperand(Node);
545
546    Compile2PTX(M, IRFilename, PTXFilename);
547
548}
549
550void mergeGPUCodeGen(){
551        LLVMContext TheContext;
552    Module * M = new Module("editd-gpu", TheContext);
553    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
554    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
555    M->setTargetTriple("nvptx64-nvidia-cuda");
556
557    Type * const mBitBlockType = iBuilder->getBitBlockType();
558    Type * const int32ty = iBuilder->getInt32Ty();
559    Type * const voidTy = Type::getVoidTy(M->getContext());
560    Type * const resultTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
561    Type * const stridesTy = PointerType::get(int32ty, 1);
562
563    Function * const main = cast<Function>(M->getOrInsertFunction("mergeResult", voidTy, resultTy, stridesTy, nullptr));
564    main->setCallingConv(CallingConv::C);
565    Function::arg_iterator args = main->arg_begin();
566   
567    Value * const resultStream = &*(args++);
568    resultStream->setName("resultStream");
569    Value * const stridesPtr = &*(args++);
570    stridesPtr->setName("stridesPtr");
571
572    BasicBlock * entryBlock = BasicBlock::Create(iBuilder->getContext(), "entryBlock", main, 0);
573    BasicBlock * strideLoopCond = BasicBlock::Create(iBuilder->getContext(), "strideLoopCond", main, 0);
574    BasicBlock * strideLoopBody = BasicBlock::Create(iBuilder->getContext(), "strideLoopBody", main, 0);
575    BasicBlock * stridesDone = BasicBlock::Create(iBuilder->getContext(), "stridesDone", main, 0);
576   
577    iBuilder->SetInsertPoint(entryBlock);
578
579    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
580    Value * tid = iBuilder->CreateCall(tidFunc);
581
582    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
583    Value * bid = iBuilder->CreateCall(bidFunc);
584    Value * strides = iBuilder->CreateLoad(stridesPtr);
585    Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
586    Value * outputBlocks = iBuilder->CreateMul(strides, strideBlocks);
587    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, tid);
588
589    iBuilder->CreateBr(strideLoopCond);
590    iBuilder->SetInsertPoint(strideLoopCond);
591    PHINode * strideNo = iBuilder->CreatePHI(int32ty, 2, "strideNo");
592    strideNo->addIncoming(ConstantInt::get(int32ty, 0), entryBlock);
593    Value * notDone = iBuilder->CreateICmpULT(strideNo, strides);
594    iBuilder->CreateCondBr(notDone, strideLoopBody, stridesDone);
595 
596    iBuilder->SetInsertPoint(strideLoopBody);
597    Value * myResultStreamPtr = iBuilder->CreateGEP(resultStreamPtr, {iBuilder->CreateMul(strideBlocks, strideNo)});
598    Value * myResultStream = iBuilder->CreateLoad(iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
599    for (unsigned i=1; i<GROUPBLOCKS; i++){
600        Value * nextStreamPtr = iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->CreateMul(outputBlocks, iBuilder->getInt32(i)), bid});
601        myResultStream = iBuilder->CreateOr(myResultStream, iBuilder->CreateLoad(nextStreamPtr));
602    }   
603    iBuilder->CreateStore(myResultStream, iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
604    strideNo->addIncoming(iBuilder->CreateAdd(strideNo, ConstantInt::get(int32ty, 1)), strideLoopBody);
605    iBuilder->CreateBr(strideLoopCond);
606   
607    iBuilder->SetInsertPoint(stridesDone);
608    iBuilder->CreateRetVoid();
609   
610    MDNode * Node = MDNode::get(M->getContext(),
611                                {llvm::ValueAsMetadata::get(main),
612                                 MDString::get(M->getContext(), "kernel"), 
613                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
614    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
615    NMD->addOperand(Node);
616
617    Compile2PTX(M, "merge.ll", "merge.ptx");
618
619}
620
621editdFunctionType editdScanCPUCodeGen() {
622                           
623    LLVMContext TheContext;
624    Module * M = new Module("editd", TheContext);
625    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);
626    ExecutionEngine * editdEngine = nullptr;
627
628    Type * mBitBlockType = iBuilder->getBitBlockType();
629    Type * const size_ty = iBuilder->getSizeTy();
630    Type * const voidTy = Type::getVoidTy(M->getContext());
631    Type * const inputType = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 0);
632
633    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1));
634    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
635    editdScanK.generateKernel({&MatchResults}, {});               
636   
637    Function * const main = cast<Function>(M->getOrInsertFunction("CPU_Main", voidTy, inputType, size_ty, nullptr));
638    main->setCallingConv(CallingConv::C);
639    Function::arg_iterator args = main->arg_begin();
640   
641    Value * const inputStream = &*(args++);
642    inputStream->setName("input");
643    Value * const fileSize = &*(args++);
644    fileSize->setName("fileSize");
645   
646    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
647
648    MatchResults.setStreamSetBuffer(inputStream, fileSize);
649   
650    generatePipelineLoop(iBuilder, {&editdScanK});
651       
652    iBuilder->CreateRetVoid();
653
654    editdEngine = JIT_to_ExecutionEngine(M);
655   
656    editdEngine->finalizeObject();
657
658    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main));
659}
660
661#endif
662
663int main(int argc, char *argv[]) {
664
665    cl::ParseCommandLineOptions(argc, argv);
666
667    int pattern_segs = 0;
668    int total_len = 0;
669
670    get_editd_pattern(pattern_segs, total_len);
671
672#ifdef CUDA_ENABLED
673    codegen::BlockSize = 64;
674#endif
675
676    preprocessFunctionType preprocess_ptr = preprocessCodeGen();
677    preprocess(preprocess_ptr);
678
679#ifdef CUDA_ENABLED 
680    setNVPTXOption();   
681    if(codegen::NVPTX){
682
683        std::ifstream t(PatternFilename);
684        if (!t.is_open()) {
685            std::cerr << "Error: cannot open " << PatternFilename << " for processing. Skipped.\n";
686            exit(-1);
687        } 
688        std::string patterns((std::istreambuf_iterator<char>(t)), std::istreambuf_iterator<char>());
689
690        editdGPUCodeGen(patterns.length()/GROUPTHREADS - 1);
691
692        mergeGPUCodeGen();
693
694        ulong * rslt = RunPTX(PTXFilename, chStream, size, patterns.c_str(), patterns.length(), editDistance);
695
696        editdFunctionType editd_ptr = editdScanCPUCodeGen();
697
698        editd(editd_ptr, (char*)rslt, size);
699       
700        run_second_filter(pattern_segs, total_len, 0.15);
701
702        return 0;
703    }
704#endif
705   
706    if(pattVector.size() == 1){
707        editdFunctionType editd_ptr = editdCodeGen(pattVector);
708        editd(editd_ptr, chStream, size);
709    }
710    else{
711        if (Threads == 1) {
712            for(unsigned i=0; i<pattGroups.size(); i++){
713                editdFunctionType editd_ptr = editdCodeGen(pattGroups[i]);
714                editd(editd_ptr, chStream, size);
715            }
716        }
717        else{
718            const unsigned numOfThreads = Threads;
719            pthread_t threads[numOfThreads];
720            groupCount = 0;
721
722            for(unsigned long i = 0; i < numOfThreads; ++i){
723                const int rc = pthread_create(&threads[i], NULL, DoEditd, (void *)i);
724                if (rc) {
725                    llvm::report_fatal_error("Failed to create thread: code " + std::to_string(rc));
726                }
727            }
728
729            for(unsigned i = 0; i < numOfThreads; ++i) {
730                void * status = nullptr;
731                const int rc = pthread_join(threads[i], &status);
732                if (rc) {
733                    llvm::report_fatal_error("Failed to join thread: code " + std::to_string(rc));
734                }
735            }
736
737        }
738        run_second_filter(pattern_segs, total_len, 0.15);
739    }
740
741    return 0;
742}
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
Note: See TracBrowser for help on using the repository browser.