source: icGREP/icgrep-devel/icgrep/editd/editd.cpp @ 5257

Last change on this file since 5257 was 5257, checked in by cameron, 2 years ago

finalSegment kernel methods initial check-in

  • Property svn:executable set to *
File size: 26.3 KB
Line 
1/*
2 *  Copyright (c) 2015 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <string>
8#include <iostream>
9#include <iomanip>
10#include <fstream>
11#include <sstream>
12
13
14#include <toolchain.h>
15#include <pablo/pablo_toolchain.h>
16#include <llvm/IR/Function.h>
17#include <llvm/IR/Module.h>
18#include <llvm/ExecutionEngine/ExecutionEngine.h>
19#include <llvm/ExecutionEngine/MCJIT.h>
20#include "llvm/Linker/Linker.h"
21
22#include <llvm/Support/CommandLine.h>
23#include <llvm/Support/raw_ostream.h>
24
25#include <re/re_cc.h>
26#include <cc/cc_compiler.h>
27#include <pablo/pablo_compiler.h>
28#include <pablo/pablo_kernel.h>
29#include <IR_Gen/idisa_builder.h>
30#include <IR_Gen/idisa_target.h>
31#include <kernels/streamset.h>
32#include <kernels/interface.h>
33#include <kernels/kernel.h>
34#include <kernels/mmap_kernel.h>
35#include <kernels/s2p_kernel.h>
36#include <editd/editdscan_kernel.h>
37#include <kernels/pipeline.h>
38
39#include <re/re_alt.h>
40#include <editd/pattern_compiler.h>
41
42// mmap system
43#include <boost/filesystem.hpp>
44#include <boost/iostreams/device/mapped_file.hpp>
45#include <fcntl.h>
46#include <mutex>
47
48#ifdef CUDA_ENABLED
49#include <editd/EditdCudaDriver.h>
50#include <editd/editd_gpu_kernel.h>
51#endif
52
53static cl::list<std::string> inputFiles(cl::Positional, cl::desc("<regex> <input file ...>"), cl::OneOrMore);
54
55static cl::list<std::string> pattVector("e", cl::desc("pattern"), cl::ZeroOrMore);
56static cl::opt<std::string> PatternFilename("f", cl::desc("Take patterns (one per line) from a file"), cl::value_desc("regex file"), cl::init(""));
57
58static cl::opt<bool> CaseInsensitive("i", cl::desc("Ignore case distinctions in the pattern and the file."));
59
60static cl::opt<int> editDistance("edit-dist", cl::desc("Edit Distance Value"), cl::init(2));
61static cl::opt<int> optPosition("opt-pos", cl::desc("Optimize position"), cl::init(8));
62static cl::opt<int> stepSize("step-size", cl::desc("Step Size"), cl::init(3));
63static cl::opt<int> prefixLen("prefix", cl::desc("Prefix length"), cl::init(4));
64static cl::opt<bool> ShowPositions("display", cl::desc("Display the match positions."), cl::init(false));
65
66static cl::opt<int> Threads("threads", cl::desc("Total number of threads."), cl::init(1));
67
68using namespace kernel;
69using namespace pablo;
70
71std::string IRFilename = "editd.ll";
72std::string PTXFilename = "editd.ptx";
73
74struct matchPosition
75{
76    size_t pos;
77    size_t dist;
78};
79
80std::vector<struct matchPosition> matchList;
81std::vector<std::vector<std::string>> pattGroups;
82
83void run_second_filter(int total_len, int pattern_segs, float errRate){
84   
85    if(matchList.empty()) return;
86
87    //remove the duplicates
88    bool cleared = true;
89    while(cleared){
90        cleared = false;
91        for (unsigned i=0; i<matchList.size()-1; i++){
92            if(matchList[i].pos == matchList[i+1].pos && matchList[i].dist == matchList[i+1].dist){
93                matchList.erase(matchList.begin() + i);
94                cleared = true;
95            }
96        }
97    }
98
99    //Sort match position
100    bool exchanged = true;
101    while(exchanged){
102        exchanged = false;
103        for (unsigned i=0; i<matchList.size()-1; i++){
104            if(matchList[i].pos > matchList[i+1].pos){
105                size_t tmp_pos = matchList[i].pos;
106                size_t tmp_dist = matchList[i].dist;
107                matchList[i].pos = matchList[i+1].pos;
108                matchList[i].dist = matchList[i+1].dist;
109                matchList[i+1].pos = tmp_pos;
110                matchList[i+1].dist = tmp_dist;
111                exchanged = true;
112            }
113        }
114    }
115
116    std::cout << "pattern_segs = " << pattern_segs << ", total_len = " << total_len << std::endl;
117
118    int v = pattern_segs * (editDistance+1) - total_len * errRate;
119
120    int startPos = matchList[0].pos;
121    int sum = matchList[0].dist;
122    int curIdx = 0;
123    unsigned i = 0;
124    int count = 0;
125    while (i < matchList.size()){
126        if(matchList[i].pos - startPos < total_len * (errRate+1)){
127            sum += matchList[i].dist;
128            i++;
129        }
130        else{
131            if(sum > v) count++;
132            sum -= matchList[curIdx].dist;
133            curIdx++;
134            startPos = matchList[curIdx].pos;
135        }
136    }
137
138    std::cout << "total candidate from the first filter is " << matchList.size() << std::endl;
139    std::cout << "total candidate from the second filter is " << count << std::endl;
140}
141
142extern "C" {
143std::mutex store_mutex;
144void wrapped_report_pos(size_t match_pos, int dist) {
145        struct matchPosition curMatch;
146        curMatch.pos = match_pos;
147        curMatch.dist = dist;
148
149        store_mutex.lock();
150        matchList.push_back(curMatch);
151        if(ShowPositions)
152            std::cout << "pos: " << match_pos << ", dist:" << dist << "\n";
153        store_mutex.unlock();
154    }
155
156}
157
158void icgrep_Linking(Module * m, ExecutionEngine * e) {
159    Module::FunctionListType & fns = m->getFunctionList();
160    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
161        std::string fnName = it->getName().str();
162        if (fnName == "wrapped_report_pos") {
163            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_pos);
164        }
165    }
166}
167
168void get_editd_pattern(int & pattern_segs, int & total_len) {
169 
170    if (PatternFilename != "") {
171        std::ifstream pattFile(PatternFilename.c_str());
172        std::string r;
173        if (pattFile.is_open()) {
174            while (std::getline(pattFile, r)) {
175                pattVector.push_back(r);
176                pattern_segs ++; 
177                total_len += r.size(); 
178            }
179            std::sort(pattVector.begin(), pattVector.end());
180            unsigned i = 0;
181            while(i < pattVector.size()){
182                std::vector<std::string> pattGroup;
183                std::string prefix = pattVector[i].substr(0, prefixLen);
184                while(i < pattVector.size() && pattVector[i].substr(0, prefixLen) == prefix){
185                    pattGroup.push_back(pattVector[i]);
186                    i++;
187                } 
188                pattGroups.push_back(pattGroup);
189            }
190            pattFile.close();
191        }
192    }
193   
194    // if there are no regexes specified through -e or -f, the first positional argument
195    // must be a regex, not an input file.
196   
197    if (pattVector.size() == 0) {
198        pattVector.push_back(inputFiles[0]);
199        inputFiles.erase(inputFiles.begin());
200    }
201}
202
203void buildPatternKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
204    PabloBuilder entry(kernel.getEntryBlock());
205
206    Var * pat = kernel.addInput("pat", iBuilder->getStreamSetTy(4));
207
208    PabloAST * basisBits[4];
209
210    basisBits[0] = entry.createExtract(pat, 0, "A");
211    basisBits[1] = entry.createExtract(pat, 1, "C");
212    basisBits[2] = entry.createExtract(pat, 2, "T");
213    basisBits[3] = entry.createExtract(pat, 3, "G");
214
215    re::Pattern_Compiler pattern_compiler(kernel);
216    pattern_compiler.compile(patterns, entry, basisBits, editDistance, optPosition, stepSize);
217
218    pablo_function_passes(&kernel);
219}
220
221
222Function * editdPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
223   
224    Type * const size_ty = iBuilder->getSizeTy();
225    Type * const voidTy = iBuilder->getVoidTy();
226    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 0);
227   
228    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, nullptr));
229    main->setCallingConv(CallingConv::C);
230    Function::arg_iterator args = main->arg_begin();
231   
232    Value * const inputStream = &*(args++);
233    inputStream->setName("input");
234    Value * const fileSize = &*(args++);
235    fileSize->setName("fileSize");
236   
237    ExternalFileBuffer ChStream(iBuilder, iBuilder->getStreamSetTy(4));
238    SingleBlockBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(editDistance + 1));
239
240    MMapSourceKernel mmapK(iBuilder);
241    std::unique_ptr<Module> mmapM = mmapK.createKernelModule({}, {&ChStream});
242    mmapK.setInitialArguments({fileSize});
243   
244    PabloKernel editdk(iBuilder, "editd");
245
246    buildPatternKernel(editdk, iBuilder, patterns);
247
248    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
249   
250    std::unique_ptr<Module> editdM = editdk.createKernelModule({&ChStream}, {&MatchResults});
251    std::unique_ptr<Module> scanM = editdScanK.createKernelModule({&MatchResults}, {});               
252   
253    mmapK.addKernelDeclarations(mMod);
254    editdk.addKernelDeclarations(mMod);
255    editdScanK.addKernelDeclarations(mMod);
256
257    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
258
259    ChStream.setStreamSetBuffer(inputStream, fileSize);
260    MatchResults.allocateBuffer();
261   
262    generatePipelineLoop(iBuilder, {&mmapK, &editdk, &editdScanK});
263       
264    iBuilder->CreateRetVoid();
265   
266    Linker L(*mMod);
267    L.linkInModule(std::move(mmapM));
268    L.linkInModule(std::move(editdM));
269    L.linkInModule(std::move(scanM));
270   
271    return main;
272}
273
274void buildPreprocessKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder) {
275    cc::CC_Compiler ccc(&kernel);
276    PabloBuilder & pb = ccc.getBuilder();
277
278    PabloAST * A = ccc.compileCC(re::makeCC(re::makeCC(0x41), re::makeCC(0x61)), pb);
279    PabloAST * C = ccc.compileCC(re::makeCC(re::makeCC(0x43), re::makeCC(0x63)), pb);
280    PabloAST * T = ccc.compileCC(re::makeCC(re::makeCC(0x54), re::makeCC(0x74)), pb);
281    PabloAST * G = ccc.compileCC(re::makeCC(re::makeCC(0x47), re::makeCC(0x67)), pb);
282
283    Var * const pat = kernel.addOutput("pat", iBuilder->getStreamSetTy(4));
284
285    pb.createAssign(pb.createExtract(pat, 0), A);
286    pb.createAssign(pb.createExtract(pat, 1), C);
287    pb.createAssign(pb.createExtract(pat, 2), T);
288    pb.createAssign(pb.createExtract(pat, 3), G);
289
290    pablo_function_passes(&kernel);
291}
292
293Function * preprocessPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder) {
294    Type * mBitBlockType = iBuilder->getBitBlockType();
295   
296    Type * const size_ty = iBuilder->getSizeTy();
297    Type * const voidTy = iBuilder->getVoidTy();
298    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(mBitBlockType, 8), 1), 0);
299    Type * const outputType = PointerType::get(ArrayType::get(mBitBlockType, 4), 0);
300   
301    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, outputType, nullptr));
302    main->setCallingConv(CallingConv::C);
303    Function::arg_iterator args = main->arg_begin();
304   
305    Value * const inputStream = &*(args++);
306    inputStream->setName("input");
307    Value * const fileSize = &*(args++);
308    fileSize->setName("fileSize");
309    Value * const outputStream = &*(args++);
310    outputStream->setName("output");
311   
312    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
313    SingleBlockBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8));
314    ExternalFileBuffer CCResults(iBuilder, iBuilder->getStreamSetTy(4));
315
316    MMapSourceKernel mmapK(iBuilder);
317    std::unique_ptr<Module> mmapM = mmapK.createKernelModule({}, {&ByteStream});
318    mmapK.setInitialArguments({fileSize});
319   
320    S2PKernel  s2pk(iBuilder);
321    std::unique_ptr<Module> s2pM = s2pk.createKernelModule({&ByteStream}, {&BasisBits});
322
323    PabloKernel  ccck(iBuilder, "ccc");
324
325    buildPreprocessKernel(ccck, iBuilder);
326   
327    std::unique_ptr<Module> cccM = ccck.createKernelModule({&BasisBits}, {&CCResults});
328   
329    mmapK.addKernelDeclarations(mMod);
330    s2pk.addKernelDeclarations(mMod);
331    ccck.addKernelDeclarations(mMod);
332   
333    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
334
335    ByteStream.setStreamSetBuffer(inputStream, fileSize);
336    BasisBits.allocateBuffer();
337    CCResults.setStreamSetBuffer(outputStream, fileSize);
338   
339    generatePipelineLoop(iBuilder, {&mmapK, &s2pk, &ccck});
340       
341    iBuilder->CreateRetVoid();
342   
343    Linker L(*mMod);
344    L.linkInModule(std::move(mmapM));
345    L.linkInModule(std::move(s2pM));
346    L.linkInModule(std::move(cccM));
347   
348    return main;
349}
350
351
352typedef void (*preprocessFunctionType)(char * byte_data, size_t filesize, char * output_data);
353
354preprocessFunctionType preprocessCodeGen() {
355                           
356    LLVMContext TheContext;
357    Module * M = new Module("preprocess", TheContext);
358    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
359
360    llvm::Function * main_IR = preprocessPipeline(M, idb);
361
362    ExecutionEngine * preprocessEngine = JIT_to_ExecutionEngine(M);
363   
364    preprocessEngine->finalizeObject();
365
366    delete idb;
367    return reinterpret_cast<preprocessFunctionType>(preprocessEngine->getPointerToFunction(main_IR));
368}
369
370typedef void (*editdFunctionType)(char * byte_data, size_t filesize);
371
372editdFunctionType editdCodeGen(const std::vector<std::string> & patterns) {
373                           
374    LLVMContext TheContext;
375    Module * M = new Module("editd", TheContext);
376    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
377
378    llvm::Function * main_IR = editdPipeline(M, idb, patterns);
379
380    ExecutionEngine * editdEngine = JIT_to_ExecutionEngine(M);
381   
382    editdEngine->finalizeObject();
383
384    delete idb;
385    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main_IR));
386}
387
388char * chStream;
389int size;
390
391char * preprocess(preprocessFunctionType fn_ptr) {
392    std::string fileName = inputFiles[0];
393    size_t fileSize;
394    char * fileBuffer;
395   
396    const boost::filesystem::path file(fileName);
397    if (exists(file)) {
398        if (is_directory(file)) {
399            exit(0);
400        }
401    } else {
402        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
403        exit(0);
404    }
405   
406    fileSize = file_size(file);
407    boost::iostreams::mapped_file_source mappedFile;
408    if (fileSize == 0) {
409        fileBuffer = nullptr;
410    }
411    else {
412        try {
413            mappedFile.open(fileName);
414        } catch (std::exception &e) {
415            std::cerr << "Error: Boost mmap of " << fileName << ": " << e.what() << std::endl;
416            exit(0);
417        }
418        fileBuffer = const_cast<char *>(mappedFile.data());
419    }
420
421    int ret = posix_memalign((void**)&chStream, 32, fileSize);
422    if (ret) {
423        std::cerr << "Cannot allocate memory for output.\n";
424        exit(-1);
425    }
426
427    fn_ptr(fileBuffer, fileSize, chStream);
428    size = fileSize;
429
430    mappedFile.close();
431
432    return chStream;   
433}
434
435void editd(editdFunctionType fn_ptr, char * inputStream, int size) {
436 
437    if (size == 0) {
438        inputStream = nullptr;
439    }
440
441    fn_ptr(inputStream, size);
442   
443}
444
445std::mutex count_mutex;
446size_t groupCount;
447void *DoEditd(void *threadid)
448{
449    size_t groupIdx;
450    count_mutex.lock();
451    groupIdx = groupCount;
452    groupCount++;
453    count_mutex.unlock();
454
455    while (groupIdx < pattGroups.size()){
456        editdFunctionType editd_ptr = editdCodeGen(pattGroups[groupIdx]);
457        editd(editd_ptr, chStream, size);
458
459        count_mutex.lock();
460        groupIdx = groupCount;
461        groupCount++;
462        count_mutex.unlock();
463    }
464
465    pthread_exit(NULL);
466}
467
468#ifdef CUDA_ENABLED
469
470#define GROUPTHREADS 64
471#define GROUPBLOCKS 64
472
473void editdGPUCodeGen(unsigned patternLen){ 
474    LLVMContext TheContext;
475    Module * M = new Module("editd-gpu", TheContext);
476    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
477    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
478    M->setTargetTriple("nvptx64-nvidia-cuda");
479    unsigned addrSpace = 1;
480
481    Type * const mBitBlockType = iBuilder->getBitBlockType();
482    Type * const inputSizeTy = PointerType::get(iBuilder->getSizeTy(), 1);
483    Type * const int32ty = iBuilder->getInt32Ty();
484    Type * const voidTy = Type::getVoidTy(M->getContext());
485    Type * const inputTy = PointerType::get(ArrayType::get(mBitBlockType, 4), 1);
486    Type * const patternPtrTy = PointerType::get(iBuilder->getInt8Ty(), 1);
487    Type * const outputTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
488    Type * const stridesTy = PointerType::get(int32ty, 1);
489
490    ExternalFileBuffer CCStream(iBuilder, iBuilder->getStreamSetTy( 4, 1), addrSpace);
491    ExternalFileBuffer ResultStream(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1), addrSpace);
492
493    kernel::editdGPUKernel editdk(iBuilder, editDistance, patternLen); 
494    editdk.generateKernel({&CCStream}, {&ResultStream});
495
496    Function * const main = cast<Function>(M->getOrInsertFunction("GPU_Main", voidTy, inputTy, inputSizeTy, patternPtrTy, outputTy, stridesTy, nullptr));
497    main->setCallingConv(CallingConv::C);
498    Function::arg_iterator args = main->arg_begin();
499   
500    Value * const inputStream = &*(args++);
501    inputStream->setName("input");
502    Value * const inputSizePtr = &*(args++);
503    inputSizePtr->setName("inputSizePtr");
504    Value * const pattStream = &*(args++);
505    pattStream->setName("pattStream");
506    Value * const resultStream = &*(args++);
507    resultStream->setName("resultStream");
508    Value * const stridesPtr = &*(args++);
509    stridesPtr->setName("stridesPtr");
510   
511    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
512
513    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
514    Value * tid = iBuilder->CreateCall(tidFunc);
515    Value * inputThreadPtr = iBuilder->CreateGEP(inputStream, tid);
516
517    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
518    Value * bid = iBuilder->CreateCall(bidFunc);
519    Value * strides = iBuilder->CreateLoad(stridesPtr);
520    Value * outputBlocks = iBuilder->CreateMul(strides, ConstantInt::get(int32ty, GROUPTHREADS));
521    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, iBuilder->CreateAdd(iBuilder->CreateMul(bid, outputBlocks), tid));
522
523    Value * inputSize = iBuilder->CreateLoad(inputSizePtr);
524    CCStream.setStreamSetBuffer(inputThreadPtr, inputSize);
525    ResultStream.setEmptyBuffer(resultStreamPtr);
526
527    const unsigned numOfCarries = patternLen * (editDistance + 1) * 4;
528    Type * strideCarryTy = ArrayType::get(mBitBlockType, numOfCarries);
529    Value * strideCarry = iBuilder->CreateAlloca(strideCarryTy);
530    iBuilder->CreateStore(Constant::getNullValue(strideCarryTy), strideCarry);
531
532    editdk.setInitialArguments({pattStream, strideCarry});
533   
534    generatePipelineLoop(iBuilder, {&editdk});
535       
536    iBuilder->CreateRetVoid();
537   
538    MDNode * Node = MDNode::get(M->getContext(),
539                                {llvm::ValueAsMetadata::get(main),
540                                 MDString::get(M->getContext(), "kernel"), 
541                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
542    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
543    NMD->addOperand(Node);
544
545    Compile2PTX(M, IRFilename, PTXFilename);
546
547}
548
549void mergeGPUCodeGen(){
550        LLVMContext TheContext;
551    Module * M = new Module("editd-gpu", TheContext);
552    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
553    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
554    M->setTargetTriple("nvptx64-nvidia-cuda");
555
556    Type * const mBitBlockType = iBuilder->getBitBlockType();
557    Type * const int32ty = iBuilder->getInt32Ty();
558    Type * const voidTy = Type::getVoidTy(M->getContext());
559    Type * const resultTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
560    Type * const stridesTy = PointerType::get(int32ty, 1);
561
562    Function * const main = cast<Function>(M->getOrInsertFunction("mergeResult", voidTy, resultTy, stridesTy, nullptr));
563    main->setCallingConv(CallingConv::C);
564    Function::arg_iterator args = main->arg_begin();
565   
566    Value * const resultStream = &*(args++);
567    resultStream->setName("resultStream");
568    Value * const stridesPtr = &*(args++);
569    stridesPtr->setName("stridesPtr");
570
571    BasicBlock * entryBlock = BasicBlock::Create(iBuilder->getContext(), "entryBlock", main, 0);
572    BasicBlock * strideLoopCond = BasicBlock::Create(iBuilder->getContext(), "strideLoopCond", main, 0);
573    BasicBlock * strideLoopBody = BasicBlock::Create(iBuilder->getContext(), "strideLoopBody", main, 0);
574    BasicBlock * stridesDone = BasicBlock::Create(iBuilder->getContext(), "stridesDone", main, 0);
575   
576    iBuilder->SetInsertPoint(entryBlock);
577
578    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
579    Value * tid = iBuilder->CreateCall(tidFunc);
580
581    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
582    Value * bid = iBuilder->CreateCall(bidFunc);
583    Value * strides = iBuilder->CreateLoad(stridesPtr);
584    Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
585    Value * outputBlocks = iBuilder->CreateMul(strides, strideBlocks);
586    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, tid);
587
588    iBuilder->CreateBr(strideLoopCond);
589    iBuilder->SetInsertPoint(strideLoopCond);
590    PHINode * strideNo = iBuilder->CreatePHI(int32ty, 2, "strideNo");
591    strideNo->addIncoming(ConstantInt::get(int32ty, 0), entryBlock);
592    Value * notDone = iBuilder->CreateICmpULT(strideNo, strides);
593    iBuilder->CreateCondBr(notDone, strideLoopBody, stridesDone);
594 
595    iBuilder->SetInsertPoint(strideLoopBody);
596    Value * myResultStreamPtr = iBuilder->CreateGEP(resultStreamPtr, {iBuilder->CreateMul(strideBlocks, strideNo)});
597    Value * myResultStream = iBuilder->CreateLoad(iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
598    for (unsigned i=1; i<GROUPBLOCKS; i++){
599        Value * nextStreamPtr = iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->CreateMul(outputBlocks, iBuilder->getInt32(i)), bid});
600        myResultStream = iBuilder->CreateOr(myResultStream, iBuilder->CreateLoad(nextStreamPtr));
601    }   
602    iBuilder->CreateStore(myResultStream, iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
603    strideNo->addIncoming(iBuilder->CreateAdd(strideNo, ConstantInt::get(int32ty, 1)), strideLoopBody);
604    iBuilder->CreateBr(strideLoopCond);
605   
606    iBuilder->SetInsertPoint(stridesDone);
607    iBuilder->CreateRetVoid();
608   
609    MDNode * Node = MDNode::get(M->getContext(),
610                                {llvm::ValueAsMetadata::get(main),
611                                 MDString::get(M->getContext(), "kernel"), 
612                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
613    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
614    NMD->addOperand(Node);
615
616    Compile2PTX(M, "merge.ll", "merge.ptx");
617
618}
619
620editdFunctionType editdScanCPUCodeGen() {
621                           
622    LLVMContext TheContext;
623    Module * M = new Module("editd", TheContext);
624    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);
625    ExecutionEngine * editdEngine = nullptr;
626
627    Type * mBitBlockType = iBuilder->getBitBlockType();
628    Type * const size_ty = iBuilder->getSizeTy();
629    Type * const voidTy = Type::getVoidTy(M->getContext());
630    Type * const inputType = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 0);
631
632    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1));
633    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
634    editdScanK.generateKernel({&MatchResults}, {});               
635   
636    Function * const main = cast<Function>(M->getOrInsertFunction("CPU_Main", voidTy, inputType, size_ty, nullptr));
637    main->setCallingConv(CallingConv::C);
638    Function::arg_iterator args = main->arg_begin();
639   
640    Value * const inputStream = &*(args++);
641    inputStream->setName("input");
642    Value * const fileSize = &*(args++);
643    fileSize->setName("fileSize");
644   
645    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
646
647    MatchResults.setStreamSetBuffer(inputStream, fileSize);
648   
649    generatePipelineLoop(iBuilder, {&editdScanK});
650       
651    iBuilder->CreateRetVoid();
652
653    editdEngine = JIT_to_ExecutionEngine(M);
654   
655    editdEngine->finalizeObject();
656
657    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main));
658}
659
660#endif
661
662int main(int argc, char *argv[]) {
663
664    cl::ParseCommandLineOptions(argc, argv);
665
666    int pattern_segs = 0;
667    int total_len = 0;
668
669    get_editd_pattern(pattern_segs, total_len);
670
671#ifdef CUDA_ENABLED
672    codegen::BlockSize = 64;
673#endif
674
675    preprocessFunctionType preprocess_ptr = preprocessCodeGen();
676    preprocess(preprocess_ptr);
677
678#ifdef CUDA_ENABLED 
679    setNVPTXOption();   
680    if(codegen::NVPTX){
681
682        std::ifstream t(PatternFilename);
683        if (!t.is_open()) {
684            std::cerr << "Error: cannot open " << PatternFilename << " for processing. Skipped.\n";
685            exit(-1);
686        } 
687        std::string patterns((std::istreambuf_iterator<char>(t)), std::istreambuf_iterator<char>());
688
689        editdGPUCodeGen(patterns.length()/GROUPTHREADS - 1);
690
691        mergeGPUCodeGen();
692
693        ulong * rslt = RunPTX(PTXFilename, chStream, size, patterns.c_str(), patterns.length(), editDistance);
694
695        editdFunctionType editd_ptr = editdScanCPUCodeGen();
696
697        editd(editd_ptr, (char*)rslt, size);
698       
699        run_second_filter(pattern_segs, total_len, 0.15);
700
701        return 0;
702    }
703#endif
704   
705    if(pattVector.size() == 1){
706        editdFunctionType editd_ptr = editdCodeGen(pattVector);
707        editd(editd_ptr, chStream, size);
708    }
709    else{
710        if (Threads == 1) {
711            for(unsigned i=0; i<pattGroups.size(); i++){
712                editdFunctionType editd_ptr = editdCodeGen(pattGroups[i]);
713                editd(editd_ptr, chStream, size);
714            }
715        }
716        else{
717            const unsigned numOfThreads = Threads;
718            pthread_t threads[numOfThreads];
719            groupCount = 0;
720
721            for(unsigned long i = 0; i < numOfThreads; ++i){
722                const int rc = pthread_create(&threads[i], NULL, DoEditd, (void *)i);
723                if (rc) {
724                    llvm::report_fatal_error("Failed to create thread: code " + std::to_string(rc));
725                }
726            }
727
728            for(unsigned i = 0; i < numOfThreads; ++i) {
729                void * status = nullptr;
730                const int rc = pthread_join(threads[i], &status);
731                if (rc) {
732                    llvm::report_fatal_error("Failed to join thread: code " + std::to_string(rc));
733                }
734            }
735
736        }
737        run_second_filter(pattern_segs, total_len, 0.15);
738    }
739
740    return 0;
741}
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
Note: See TracBrowser for help on using the repository browser.