source: icGREP/icgrep-devel/icgrep/editd/editd.cpp @ 5310

Last change on this file since 5310 was 5310, checked in by nmedfort, 3 years ago

Adjusted pablo compiler to use getInputStream and getOutputStream when accessing packed stream fields.

  • Property svn:executable set to *
File size: 26.3 KB
Line 
1/*
2 *  Copyright (c) 2015 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <string>
8#include <iostream>
9#include <fstream>
10#include <toolchain.h>
11#include <pablo/pablo_toolchain.h>
12#include <llvm/IR/Function.h>
13#include <llvm/IR/Module.h>
14#include <llvm/ExecutionEngine/ExecutionEngine.h>
15#include "llvm/Linker/Linker.h"
16#include <llvm/Support/CommandLine.h>
17#include <cc/cc_compiler.h>
18#include <pablo/pablo_compiler.h>
19#include <pablo/pablo_kernel.h>
20#include <IR_Gen/idisa_builder.h>
21#include <IR_Gen/idisa_target.h>
22#include <kernels/streamset.h>
23#include <kernels/mmap_kernel.h>
24#include <kernels/s2p_kernel.h>
25#include <editd/editdscan_kernel.h>
26#include <kernels/pipeline.h>
27#include <editd/pattern_compiler.h>
28#include <boost/filesystem.hpp>
29#include <boost/iostreams/device/mapped_file.hpp>
30#include <mutex>
31#ifdef CUDA_ENABLED
32#include <editd/EditdCudaDriver.h>
33#include <editd/editd_gpu_kernel.h>
34#endif
35
36using namespace llvm;
37
38static cl::list<std::string> inputFiles(cl::Positional, cl::desc("<regex> <input file ...>"), cl::OneOrMore);
39
40static cl::list<std::string> pattVector("e", cl::desc("pattern"), cl::ZeroOrMore);
41static cl::opt<std::string> PatternFilename("f", cl::desc("Take patterns (one per line) from a file"), cl::value_desc("regex file"), cl::init(""));
42
43static cl::opt<bool> CaseInsensitive("i", cl::desc("Ignore case distinctions in the pattern and the file."));
44
45static cl::opt<int> editDistance("edit-dist", cl::desc("Edit Distance Value"), cl::init(2));
46static cl::opt<int> optPosition("opt-pos", cl::desc("Optimize position"), cl::init(8));
47static cl::opt<int> stepSize("step-size", cl::desc("Step Size"), cl::init(3));
48static cl::opt<int> prefixLen("prefix", cl::desc("Prefix length"), cl::init(4));
49static cl::opt<bool> ShowPositions("display", cl::desc("Display the match positions."), cl::init(false));
50
51static cl::opt<int> Threads("threads", cl::desc("Total number of threads."), cl::init(1));
52
53using namespace kernel;
54using namespace pablo;
55using namespace parabix;
56
57const static std::string IRFilename = "editd.ll";
58const static std::string PTXFilename = "editd.ptx";
59
60struct matchPosition
61{
62    size_t pos;
63    size_t dist;
64};
65
66std::vector<struct matchPosition> matchList;
67std::vector<std::vector<std::string>> pattGroups;
68
69void run_second_filter(int total_len, int pattern_segs, float errRate){
70   
71    if(matchList.empty()) return;
72
73    //remove the duplicates
74    bool cleared = true;
75    while(cleared){
76        cleared = false;
77        for (unsigned i=0; i<matchList.size()-1; i++){
78            if(matchList[i].pos == matchList[i+1].pos && matchList[i].dist == matchList[i+1].dist){
79                matchList.erase(matchList.begin() + i);
80                cleared = true;
81            }
82        }
83    }
84
85    //Sort match position
86    bool exchanged = true;
87    while(exchanged){
88        exchanged = false;
89        for (unsigned i=0; i<matchList.size()-1; i++){
90            if(matchList[i].pos > matchList[i+1].pos){
91                size_t tmp_pos = matchList[i].pos;
92                size_t tmp_dist = matchList[i].dist;
93                matchList[i].pos = matchList[i+1].pos;
94                matchList[i].dist = matchList[i+1].dist;
95                matchList[i+1].pos = tmp_pos;
96                matchList[i+1].dist = tmp_dist;
97                exchanged = true;
98            }
99        }
100    }
101
102    std::cout << "pattern_segs = " << pattern_segs << ", total_len = " << total_len << std::endl;
103
104    int v = pattern_segs * (editDistance+1) - total_len * errRate;
105
106    int startPos = matchList[0].pos;
107    int sum = matchList[0].dist;
108    int curIdx = 0;
109    unsigned i = 0;
110    int count = 0;
111    while (i < matchList.size()){
112        if(matchList[i].pos - startPos < total_len * (errRate+1)){
113            sum += matchList[i].dist;
114            i++;
115        }
116        else{
117            if(sum > v) count++;
118            sum -= matchList[curIdx].dist;
119            curIdx++;
120            startPos = matchList[curIdx].pos;
121        }
122    }
123
124    std::cout << "total candidate from the first filter is " << matchList.size() << std::endl;
125    std::cout << "total candidate from the second filter is " << count << std::endl;
126}
127
128extern "C" {
129std::mutex store_mutex;
130void wrapped_report_pos(size_t match_pos, int dist) {
131        struct matchPosition curMatch;
132        curMatch.pos = match_pos;
133        curMatch.dist = dist;
134
135        store_mutex.lock();
136        matchList.push_back(curMatch);
137        if(ShowPositions)
138            std::cout << "pos: " << match_pos << ", dist:" << dist << "\n";
139        store_mutex.unlock();
140    }
141
142}
143
144void icgrep_Linking(Module * m, ExecutionEngine * e) {
145    Module::FunctionListType & fns = m->getFunctionList();
146    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
147        std::string fnName = it->getName().str();
148        if (fnName == "wrapped_report_pos") {
149            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_pos);
150        }
151    }
152}
153
154void get_editd_pattern(int & pattern_segs, int & total_len) {
155 
156    if (PatternFilename != "") {
157        std::ifstream pattFile(PatternFilename.c_str());
158        std::string r;
159        if (pattFile.is_open()) {
160            while (std::getline(pattFile, r)) {
161                pattVector.push_back(r);
162                pattern_segs ++; 
163                total_len += r.size(); 
164            }
165            std::sort(pattVector.begin(), pattVector.end());
166            unsigned i = 0;
167            while(i < pattVector.size()){
168                std::vector<std::string> pattGroup;
169                std::string prefix = pattVector[i].substr(0, prefixLen);
170                while(i < pattVector.size() && pattVector[i].substr(0, prefixLen) == prefix){
171                    pattGroup.push_back(pattVector[i]);
172                    i++;
173                } 
174                pattGroups.push_back(pattGroup);
175            }
176            pattFile.close();
177        }
178    }
179   
180    // if there are no regexes specified through -e or -f, the first positional argument
181    // must be a regex, not an input file.
182   
183    if (pattVector.size() == 0) {
184        pattVector.push_back(inputFiles[0]);
185        inputFiles.erase(inputFiles.begin());
186    }
187}
188
189void buildPatternKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
190    PabloBuilder entry(kernel.getEntryBlock());
191
192    Var * pat = kernel.getInputStreamVar("pat");
193
194    PabloAST * basisBits[4];
195
196    basisBits[0] = entry.createExtract(pat, 0, "A");
197    basisBits[1] = entry.createExtract(pat, 1, "C");
198    basisBits[2] = entry.createExtract(pat, 2, "T");
199    basisBits[3] = entry.createExtract(pat, 3, "G");
200
201    re::Pattern_Compiler pattern_compiler(kernel);
202    pattern_compiler.compile(patterns, entry, basisBits, editDistance, optPosition, stepSize);
203
204    pablo_function_passes(&kernel);
205}
206
207
208Function * editdPipeline(Module * m, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
209   
210    Type * const sizeTy = iBuilder->getSizeTy();
211    Type * const voidTy = iBuilder->getVoidTy();
212    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 0);
213   
214    Function * const main = cast<Function>(m->getOrInsertFunction("Main", voidTy, inputType, sizeTy, nullptr));
215    main->setCallingConv(CallingConv::C);
216    Function::arg_iterator args = main->arg_begin();
217   
218    Value * const inputStream = &*(args++);
219    inputStream->setName("input");
220    Value * const fileSize = &*(args++);
221    fileSize->setName("fileSize");
222   
223    ExternalFileBuffer ChStream(iBuilder, iBuilder->getStreamSetTy(4));
224    SingleBlockBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(editDistance + 1));
225
226    MMapSourceKernel mmapK(iBuilder);
227    std::unique_ptr<Module> mmapM = mmapK.createKernelModule({}, {&ChStream});
228    mmapK.setInitialArguments({fileSize});
229   
230    PabloKernel editdk(iBuilder, "editd",
231                        {Binding{iBuilder->getStreamSetTy(4), "pat"}},
232                        {Binding{iBuilder->getStreamSetTy(editDistance + 1), "E"}});
233
234    buildPatternKernel(editdk, iBuilder, patterns);
235
236    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
237   
238    std::unique_ptr<Module> editdM = editdk.createKernelModule({&ChStream}, {&MatchResults});
239    std::unique_ptr<Module> scanM = editdScanK.createKernelModule({&MatchResults}, {});               
240   
241    mmapK.addKernelDeclarations(m);
242    editdk.addKernelDeclarations(m);
243    editdScanK.addKernelDeclarations(m);
244
245    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", main,0));
246
247    ChStream.setStreamSetBuffer(inputStream, fileSize);
248    MatchResults.allocateBuffer();
249   
250    generatePipelineLoop(iBuilder, {&mmapK, &editdk, &editdScanK});
251       
252    iBuilder->CreateRetVoid();
253   
254    Linker L(*m);
255    L.linkInModule(std::move(mmapM));
256    L.linkInModule(std::move(editdM));
257    L.linkInModule(std::move(scanM));
258   
259    return main;
260}
261
262void buildPreprocessKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder) {
263    cc::CC_Compiler ccc(&kernel, kernel.getInputStreamVar("basis"));
264
265    PabloBuilder & pb = ccc.getBuilder();
266
267    PabloAST * A = ccc.compileCC(re::makeCC(re::makeCC(0x41), re::makeCC(0x61)), pb);
268    PabloAST * C = ccc.compileCC(re::makeCC(re::makeCC(0x43), re::makeCC(0x63)), pb);
269    PabloAST * T = ccc.compileCC(re::makeCC(re::makeCC(0x54), re::makeCC(0x74)), pb);
270    PabloAST * G = ccc.compileCC(re::makeCC(re::makeCC(0x47), re::makeCC(0x67)), pb);
271
272    Var * const pat = kernel.getOutputStreamVar("pat");
273
274    pb.createAssign(pb.createExtract(pat, 0), A);
275    pb.createAssign(pb.createExtract(pat, 1), C);
276    pb.createAssign(pb.createExtract(pat, 2), T);
277    pb.createAssign(pb.createExtract(pat, 3), G);
278
279    pablo_function_passes(&kernel);
280}
281
282Function * preprocessPipeline(Module * m, IDISA::IDISA_Builder * iBuilder) {
283    Type * mBitBlockType = iBuilder->getBitBlockType();
284   
285    Type * const size_ty = iBuilder->getSizeTy();
286    Type * const voidTy = iBuilder->getVoidTy();
287    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(mBitBlockType, 8), 1), 0);
288    Type * const outputType = PointerType::get(ArrayType::get(mBitBlockType, 4), 0);
289   
290    Function * const main = cast<Function>(m->getOrInsertFunction("Main", voidTy, inputType, size_ty, outputType, nullptr));
291    main->setCallingConv(CallingConv::C);
292    Function::arg_iterator args = main->arg_begin();
293   
294    Value * const inputStream = &*(args++);
295    inputStream->setName("input");
296    Value * const fileSize = &*(args++);
297    fileSize->setName("fileSize");
298    Value * const outputStream = &*(args++);
299    outputStream->setName("output");
300   
301    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
302    SingleBlockBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8));
303    ExternalFileBuffer CCResults(iBuilder, iBuilder->getStreamSetTy(4));
304
305    MMapSourceKernel mmapK(iBuilder);
306    std::unique_ptr<Module> mmapM = mmapK.createKernelModule({}, {&ByteStream});
307    mmapK.setInitialArguments({fileSize});
308   
309    S2PKernel  s2pk(iBuilder);
310    std::unique_ptr<Module> s2pM = s2pk.createKernelModule({&ByteStream}, {&BasisBits});
311
312    PabloKernel ccck(iBuilder, "ccc",
313                {{iBuilder->getStreamSetTy(8), "basis"}},
314                {{iBuilder->getStreamSetTy(4), "pat"}});
315
316    buildPreprocessKernel(ccck, iBuilder);
317   
318    std::unique_ptr<Module> cccM = ccck.createKernelModule({&BasisBits}, {&CCResults});
319   
320    mmapK.addKernelDeclarations(m);
321    s2pk.addKernelDeclarations(m);
322    ccck.addKernelDeclarations(m);
323   
324    iBuilder->SetInsertPoint(BasicBlock::Create(m->getContext(), "entry", main,0));
325
326    ByteStream.setStreamSetBuffer(inputStream, fileSize);
327    BasisBits.allocateBuffer();
328    CCResults.setStreamSetBuffer(outputStream, fileSize);
329   
330    generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &ccck});
331       
332    iBuilder->CreateRetVoid();
333   
334    Linker L(*m);
335    L.linkInModule(std::move(mmapM));
336    L.linkInModule(std::move(s2pM));
337    L.linkInModule(std::move(cccM));
338   
339    return main;
340}
341
342
343typedef void (*preprocessFunctionType)(char * byte_data, size_t filesize, char * output_data);
344
345preprocessFunctionType preprocessCodeGen() {
346                           
347    LLVMContext TheContext;
348    Module * M = new Module("preprocess", TheContext);
349    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
350
351    llvm::Function * main_IR = preprocessPipeline(M, idb);
352
353    ExecutionEngine * preprocessEngine = JIT_to_ExecutionEngine(M);
354   
355    preprocessEngine->finalizeObject();
356
357    delete idb;
358    return reinterpret_cast<preprocessFunctionType>(preprocessEngine->getPointerToFunction(main_IR));
359}
360
361typedef void (*editdFunctionType)(char * byte_data, size_t filesize);
362
363editdFunctionType editdCodeGen(const std::vector<std::string> & patterns) {
364                           
365    LLVMContext TheContext;
366    Module * M = new Module("editd", TheContext);
367    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
368
369    llvm::Function * main_IR = editdPipeline(M, idb, patterns);
370
371    ExecutionEngine * editdEngine = JIT_to_ExecutionEngine(M);
372   
373    editdEngine->finalizeObject();
374
375    delete idb;
376    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main_IR));
377}
378
379char * chStream;
380int size;
381
382char * preprocess(preprocessFunctionType fn_ptr) {
383    std::string fileName = inputFiles[0];
384    size_t fileSize;
385    char * fileBuffer;
386   
387    const boost::filesystem::path file(fileName);
388    if (exists(file)) {
389        if (is_directory(file)) {
390            exit(0);
391        }
392    } else {
393        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
394        exit(0);
395    }
396   
397    fileSize = file_size(file);
398    boost::iostreams::mapped_file_source mappedFile;
399    if (fileSize == 0) {
400        fileBuffer = nullptr;
401    }
402    else {
403        try {
404            mappedFile.open(fileName);
405        } catch (std::exception &e) {
406            std::cerr << "Error: Boost mmap of " << fileName << ": " << e.what() << std::endl;
407            exit(0);
408        }
409        fileBuffer = const_cast<char *>(mappedFile.data());
410    }
411
412    int ret = posix_memalign((void**)&chStream, 32, fileSize);
413    if (ret) {
414        std::cerr << "Cannot allocate memory for output.\n";
415        exit(-1);
416    }
417
418    fn_ptr(fileBuffer, fileSize, chStream);
419    size = fileSize;
420
421    mappedFile.close();
422
423    return chStream;   
424}
425
426void editd(editdFunctionType fn_ptr, char * inputStream, int size) {
427 
428    if (size == 0) {
429        inputStream = nullptr;
430    }
431
432    fn_ptr(inputStream, size);
433   
434}
435
436std::mutex count_mutex;
437size_t groupCount;
438void *DoEditd(void *threadid)
439{
440    size_t groupIdx;
441    count_mutex.lock();
442    groupIdx = groupCount;
443    groupCount++;
444    count_mutex.unlock();
445
446    while (groupIdx < pattGroups.size()){
447        editdFunctionType editd_ptr = editdCodeGen(pattGroups[groupIdx]);
448        editd(editd_ptr, chStream, size);
449
450        count_mutex.lock();
451        groupIdx = groupCount;
452        groupCount++;
453        count_mutex.unlock();
454    }
455
456    pthread_exit(NULL);
457}
458
459#ifdef CUDA_ENABLED
460
461#define GROUPTHREADS 64
462#define GROUPBLOCKS 64
463
464void editdGPUCodeGen(unsigned patternLen){ 
465    LLVMContext TheContext;
466    Module * M = new Module("editd-gpu", TheContext);
467    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
468    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
469    M->setTargetTriple("nvptx64-nvidia-cuda");
470    unsigned addrSpace = 1;
471
472    Type * const mBitBlockType = iBuilder->getBitBlockType();
473    Type * const inputSizeTy = PointerType::get(iBuilder->getSizeTy(), 1);
474    Type * const int32ty = iBuilder->getInt32Ty();
475    Type * const voidTy = Type::getVoidTy(M->getContext());
476    Type * const inputTy = PointerType::get(ArrayType::get(mBitBlockType, 4), 1);
477    Type * const patternPtrTy = PointerType::get(iBuilder->getInt8Ty(), 1);
478    Type * const outputTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
479    Type * const stridesTy = PointerType::get(int32ty, 1);
480
481    ExternalFileBuffer CCStream(iBuilder, iBuilder->getStreamSetTy( 4, 1), addrSpace);
482    ExternalFileBuffer ResultStream(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1), addrSpace);
483
484    kernel::editdGPUKernel editdk(iBuilder, editDistance, patternLen); 
485    editdk.generateKernel({&CCStream}, {&ResultStream});
486
487    Function * const main = cast<Function>(M->getOrInsertFunction("GPU_Main", voidTy, inputTy, inputSizeTy, patternPtrTy, outputTy, stridesTy, nullptr));
488    main->setCallingConv(CallingConv::C);
489    Function::arg_iterator args = main->arg_begin();
490   
491    Value * const inputStream = &*(args++);
492    inputStream->setName("input");
493    Value * const inputSizePtr = &*(args++);
494    inputSizePtr->setName("inputSizePtr");
495    Value * const pattStream = &*(args++);
496    pattStream->setName("pattStream");
497    Value * const resultStream = &*(args++);
498    resultStream->setName("resultStream");
499    Value * const stridesPtr = &*(args++);
500    stridesPtr->setName("stridesPtr");
501   
502    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
503
504    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
505    Value * tid = iBuilder->CreateCall(tidFunc);
506    Value * inputThreadPtr = iBuilder->CreateGEP(inputStream, tid);
507
508    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
509    Value * bid = iBuilder->CreateCall(bidFunc);
510    Value * strides = iBuilder->CreateLoad(stridesPtr);
511    Value * outputBlocks = iBuilder->CreateMul(strides, ConstantInt::get(int32ty, GROUPTHREADS));
512    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, iBuilder->CreateAdd(iBuilder->CreateMul(bid, outputBlocks), tid));
513
514    Value * inputSize = iBuilder->CreateLoad(inputSizePtr);
515    CCStream.setStreamSetBuffer(inputThreadPtr, inputSize);
516    ResultStream.setEmptyBuffer(resultStreamPtr);
517
518    const unsigned numOfCarries = patternLen * (editDistance + 1) * 4;
519    Type * strideCarryTy = ArrayType::get(mBitBlockType, numOfCarries);
520    Value * strideCarry = iBuilder->CreateAlloca(strideCarryTy);
521    iBuilder->CreateStore(Constant::getNullValue(strideCarryTy), strideCarry);
522
523    editdk.setInitialArguments({pattStream, strideCarry});
524   
525    generatePipelineLoop(iBuilder, {&editdk});
526       
527    iBuilder->CreateRetVoid();
528   
529    MDNode * Node = MDNode::get(M->getContext(),
530                                {llvm::ValueAsMetadata::get(main),
531                                 MDString::get(M->getContext(), "kernel"), 
532                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
533    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
534    NMD->addOperand(Node);
535
536    Compile2PTX(M, IRFilename, PTXFilename);
537
538}
539
540void mergeGPUCodeGen(){
541        LLVMContext TheContext;
542    Module * M = new Module("editd-gpu", TheContext);
543    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
544    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
545    M->setTargetTriple("nvptx64-nvidia-cuda");
546
547    Type * const mBitBlockType = iBuilder->getBitBlockType();
548    Type * const int32ty = iBuilder->getInt32Ty();
549    Type * const voidTy = Type::getVoidTy(M->getContext());
550    Type * const resultTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
551    Type * const stridesTy = PointerType::get(int32ty, 1);
552
553    Function * const main = cast<Function>(M->getOrInsertFunction("mergeResult", voidTy, resultTy, stridesTy, nullptr));
554    main->setCallingConv(CallingConv::C);
555    Function::arg_iterator args = main->arg_begin();
556   
557    Value * const resultStream = &*(args++);
558    resultStream->setName("resultStream");
559    Value * const stridesPtr = &*(args++);
560    stridesPtr->setName("stridesPtr");
561
562    BasicBlock * entryBlock = BasicBlock::Create(iBuilder->getContext(), "entryBlock", main, 0);
563    BasicBlock * strideLoopCond = BasicBlock::Create(iBuilder->getContext(), "strideLoopCond", main, 0);
564    BasicBlock * strideLoopBody = BasicBlock::Create(iBuilder->getContext(), "strideLoopBody", main, 0);
565    BasicBlock * stridesDone = BasicBlock::Create(iBuilder->getContext(), "stridesDone", main, 0);
566   
567    iBuilder->SetInsertPoint(entryBlock);
568
569    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
570    Value * tid = iBuilder->CreateCall(tidFunc);
571
572    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
573    Value * bid = iBuilder->CreateCall(bidFunc);
574    Value * strides = iBuilder->CreateLoad(stridesPtr);
575    Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
576    Value * outputBlocks = iBuilder->CreateMul(strides, strideBlocks);
577    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, tid);
578
579    iBuilder->CreateBr(strideLoopCond);
580    iBuilder->SetInsertPoint(strideLoopCond);
581    PHINode * strideNo = iBuilder->CreatePHI(int32ty, 2, "strideNo");
582    strideNo->addIncoming(ConstantInt::get(int32ty, 0), entryBlock);
583    Value * notDone = iBuilder->CreateICmpULT(strideNo, strides);
584    iBuilder->CreateCondBr(notDone, strideLoopBody, stridesDone);
585 
586    iBuilder->SetInsertPoint(strideLoopBody);
587    Value * myResultStreamPtr = iBuilder->CreateGEP(resultStreamPtr, {iBuilder->CreateMul(strideBlocks, strideNo)});
588    Value * myResultStream = iBuilder->CreateLoad(iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
589    for (unsigned i=1; i<GROUPBLOCKS; i++){
590        Value * nextStreamPtr = iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->CreateMul(outputBlocks, iBuilder->getInt32(i)), bid});
591        myResultStream = iBuilder->CreateOr(myResultStream, iBuilder->CreateLoad(nextStreamPtr));
592    }   
593    iBuilder->CreateStore(myResultStream, iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
594    strideNo->addIncoming(iBuilder->CreateAdd(strideNo, ConstantInt::get(int32ty, 1)), strideLoopBody);
595    iBuilder->CreateBr(strideLoopCond);
596   
597    iBuilder->SetInsertPoint(stridesDone);
598    iBuilder->CreateRetVoid();
599   
600    MDNode * Node = MDNode::get(M->getContext(),
601                                {llvm::ValueAsMetadata::get(main),
602                                 MDString::get(M->getContext(), "kernel"), 
603                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
604    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
605    NMD->addOperand(Node);
606
607    Compile2PTX(M, "merge.ll", "merge.ptx");
608
609}
610
611editdFunctionType editdScanCPUCodeGen() {
612                           
613    LLVMContext TheContext;
614    Module * M = new Module("editd", TheContext);
615    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);
616    ExecutionEngine * editdEngine = nullptr;
617
618    Type * mBitBlockType = iBuilder->getBitBlockType();
619    Type * const size_ty = iBuilder->getSizeTy();
620    Type * const voidTy = Type::getVoidTy(M->getContext());
621    Type * const inputType = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 0);
622
623    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1));
624    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
625    editdScanK.generateKernel({&MatchResults}, {});               
626   
627    Function * const main = cast<Function>(M->getOrInsertFunction("CPU_Main", voidTy, inputType, size_ty, nullptr));
628    main->setCallingConv(CallingConv::C);
629    Function::arg_iterator args = main->arg_begin();
630   
631    Value * const inputStream = &*(args++);
632    inputStream->setName("input");
633    Value * const fileSize = &*(args++);
634    fileSize->setName("fileSize");
635   
636    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
637
638    MatchResults.setStreamSetBuffer(inputStream, fileSize);
639   
640    generatePipelineLoop(iBuilder, {&editdScanK});
641       
642    iBuilder->CreateRetVoid();
643
644    editdEngine = JIT_to_ExecutionEngine(M);
645   
646    editdEngine->finalizeObject();
647
648    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main));
649}
650
651#endif
652
653int main(int argc, char *argv[]) {
654
655    cl::ParseCommandLineOptions(argc, argv);
656
657    int pattern_segs = 0;
658    int total_len = 0;
659
660    get_editd_pattern(pattern_segs, total_len);
661
662#ifdef CUDA_ENABLED
663    codegen::BlockSize = 64;
664#endif
665
666    preprocessFunctionType preprocess_ptr = preprocessCodeGen();
667    preprocess(preprocess_ptr);
668
669#ifdef CUDA_ENABLED 
670    setNVPTXOption();   
671    if(codegen::NVPTX){
672
673        std::ifstream t(PatternFilename);
674        if (!t.is_open()) {
675            std::cerr << "Error: cannot open " << PatternFilename << " for processing. Skipped.\n";
676            exit(-1);
677        } 
678        std::string patterns((std::istreambuf_iterator<char>(t)), std::istreambuf_iterator<char>());
679
680        editdGPUCodeGen(patterns.length()/GROUPTHREADS - 1);
681
682        mergeGPUCodeGen();
683
684        ulong * rslt = RunPTX(PTXFilename, chStream, size, patterns.c_str(), patterns.length(), editDistance);
685
686        editdFunctionType editd_ptr = editdScanCPUCodeGen();
687
688        editd(editd_ptr, (char*)rslt, size);
689       
690        run_second_filter(pattern_segs, total_len, 0.15);
691
692        return 0;
693    }
694#endif
695   
696    if(pattVector.size() == 1){
697        editdFunctionType editd_ptr = editdCodeGen(pattVector);
698        editd(editd_ptr, chStream, size);
699    }
700    else{
701        if (Threads == 1) {
702            for(unsigned i=0; i<pattGroups.size(); i++){
703                editdFunctionType editd_ptr = editdCodeGen(pattGroups[i]);
704                editd(editd_ptr, chStream, size);
705            }
706        }
707        else{
708            const unsigned numOfThreads = Threads;
709            pthread_t threads[numOfThreads];
710            groupCount = 0;
711
712            for(unsigned long i = 0; i < numOfThreads; ++i){
713                const int rc = pthread_create(&threads[i], NULL, DoEditd, (void *)i);
714                if (rc) {
715                    llvm::report_fatal_error("Failed to create thread: code " + std::to_string(rc));
716                }
717            }
718
719            for(unsigned i = 0; i < numOfThreads; ++i) {
720                void * status = nullptr;
721                const int rc = pthread_join(threads[i], &status);
722                if (rc) {
723                    llvm::report_fatal_error("Failed to join thread: code " + std::to_string(rc));
724                }
725            }
726
727        }
728        run_second_filter(pattern_segs, total_len, 0.15);
729    }
730
731    return 0;
732}
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
Note: See TracBrowser for help on using the repository browser.