source: icGREP/icgrep-devel/icgrep/editd/editd.cpp @ 5244

Last change on this file since 5244 was 5244, checked in by lindanl, 3 years ago

editd:simple multithreading with separate compilation in each thread.

  • Property svn:executable set to *
File size: 25.8 KB
Line 
1/*
2 *  Copyright (c) 2015 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include <string>
8#include <iostream>
9#include <iomanip>
10#include <fstream>
11#include <sstream>
12
13
14#include <toolchain.h>
15#include <pablo/pablo_toolchain.h>
16#include <llvm/IR/Function.h>
17#include <llvm/IR/Module.h>
18#include <llvm/ExecutionEngine/ExecutionEngine.h>
19#include <llvm/ExecutionEngine/MCJIT.h>
20#include "llvm/Linker/Linker.h"
21
22#include <llvm/Support/CommandLine.h>
23#include <llvm/Support/raw_ostream.h>
24
25#include <re/re_cc.h>
26#include <cc/cc_compiler.h>
27#include <pablo/pablo_compiler.h>
28#include <pablo/pablo_kernel.h>
29#include <IR_Gen/idisa_builder.h>
30#include <IR_Gen/idisa_target.h>
31#include <kernels/streamset.h>
32#include <kernels/interface.h>
33#include <kernels/kernel.h>
34#include <kernels/s2p_kernel.h>
35#include <editd/editdscan_kernel.h>
36#include <kernels/pipeline.h>
37
38#include <re/re_alt.h>
39#include <editd/pattern_compiler.h>
40
41// mmap system
42#include <boost/filesystem.hpp>
43#include <boost/iostreams/device/mapped_file.hpp>
44#include <fcntl.h>
45#include <mutex>
46
47#ifdef CUDA_ENABLED
48#include <editd/EditdCudaDriver.h>
49#include <editd/editd_gpu_kernel.h>
50#endif
51
52static cl::list<std::string> inputFiles(cl::Positional, cl::desc("<regex> <input file ...>"), cl::OneOrMore);
53
54static cl::list<std::string> pattVector("e", cl::desc("pattern"), cl::ZeroOrMore);
55static cl::opt<std::string> PatternFilename("f", cl::desc("Take patterns (one per line) from a file"), cl::value_desc("regex file"), cl::init(""));
56
57static cl::opt<bool> CaseInsensitive("i", cl::desc("Ignore case distinctions in the pattern and the file."));
58
59static cl::opt<int> editDistance("edit-dist", cl::desc("Edit Distance Value"), cl::init(2));
60static cl::opt<int> optPosition("opt-pos", cl::desc("Optimize position"), cl::init(8));
61static cl::opt<int> stepSize("step-size", cl::desc("Step Size"), cl::init(3));
62static cl::opt<int> prefixLen("prefix", cl::desc("Prefix length"), cl::init(4));
63static cl::opt<bool> ShowPositions("display", cl::desc("Display the match positions."), cl::init(false));
64
65static cl::opt<int> Threads("threads", cl::desc("Total number of threads."), cl::init(1));
66
67using namespace kernel;
68using namespace pablo;
69
70std::string IRFilename = "editd.ll";
71std::string PTXFilename = "editd.ptx";
72
73struct matchPosition
74{
75    size_t pos;
76    size_t dist;
77};
78
79std::vector<struct matchPosition> matchList;
80std::vector<std::vector<std::string>> pattGroups;
81
82void run_second_filter(int total_len, int pattern_segs, float errRate){
83   
84    if(matchList.empty()) return;
85
86    //remove the duplicates
87    bool cleared = true;
88    while(cleared){
89        cleared = false;
90        for (unsigned i=0; i<matchList.size()-1; i++){
91            if(matchList[i].pos == matchList[i+1].pos && matchList[i].dist == matchList[i+1].dist){
92                matchList.erase(matchList.begin() + i);
93                cleared = true;
94            }
95        }
96    }
97
98    //Sort match position
99    bool exchanged = true;
100    while(exchanged){
101        exchanged = false;
102        for (unsigned i=0; i<matchList.size()-1; i++){
103            if(matchList[i].pos > matchList[i+1].pos){
104                size_t tmp_pos = matchList[i].pos;
105                size_t tmp_dist = matchList[i].dist;
106                matchList[i].pos = matchList[i+1].pos;
107                matchList[i].dist = matchList[i+1].dist;
108                matchList[i+1].pos = tmp_pos;
109                matchList[i+1].dist = tmp_dist;
110                exchanged = true;
111            }
112        }
113    }
114
115    std::cout << "pattern_segs = " << pattern_segs << ", total_len = " << total_len << std::endl;
116
117    int v = pattern_segs * (editDistance+1) - total_len * errRate;
118
119    int startPos = matchList[0].pos;
120    int sum = matchList[0].dist;
121    int curIdx = 0;
122    unsigned i = 0;
123    int count = 0;
124    while (i < matchList.size()){
125        if(matchList[i].pos - startPos < total_len * (errRate+1)){
126            sum += matchList[i].dist;
127            i++;
128        }
129        else{
130            if(sum > v) count++;
131            sum -= matchList[curIdx].dist;
132            curIdx++;
133            startPos = matchList[curIdx].pos;
134        }
135    }
136
137    std::cout << "total candidate from the first filter is " << matchList.size() << std::endl;
138    std::cout << "total candidate from the second filter is " << count << std::endl;
139}
140
141extern "C" {
142std::mutex store_mutex;
143void wrapped_report_pos(size_t match_pos, int dist) {
144        struct matchPosition curMatch;
145        curMatch.pos = match_pos;
146        curMatch.dist = dist;
147
148        store_mutex.lock();
149        matchList.push_back(curMatch);
150        if(ShowPositions)
151            std::cout << "pos: " << match_pos << ", dist:" << dist << "\n";
152        store_mutex.unlock();
153    }
154
155}
156
157void icgrep_Linking(Module * m, ExecutionEngine * e) {
158    Module::FunctionListType & fns = m->getFunctionList();
159    for (Module::FunctionListType::iterator it = fns.begin(), it_end = fns.end(); it != it_end; ++it) {
160        std::string fnName = it->getName().str();
161        if (fnName == "wrapped_report_pos") {
162            e->addGlobalMapping(cast<GlobalValue>(it), (void *)&wrapped_report_pos);
163        }
164    }
165}
166
167void get_editd_pattern(int & pattern_segs, int & total_len) {
168 
169    if (PatternFilename != "") {
170        std::ifstream pattFile(PatternFilename.c_str());
171        std::string r;
172        if (pattFile.is_open()) {
173            while (std::getline(pattFile, r)) {
174                pattVector.push_back(r);
175                pattern_segs ++; 
176                total_len += r.size(); 
177            }
178            std::sort(pattVector.begin(), pattVector.end());
179            unsigned i = 0;
180            while(i < pattVector.size()){
181                std::vector<std::string> pattGroup;
182                std::string prefix = pattVector[i].substr(0, prefixLen);
183                while(i < pattVector.size() && pattVector[i].substr(0, prefixLen) == prefix){
184                    pattGroup.push_back(pattVector[i]);
185                    i++;
186                } 
187                pattGroups.push_back(pattGroup);
188            }
189            pattFile.close();
190        }
191    }
192   
193    // if there are no regexes specified through -e or -f, the first positional argument
194    // must be a regex, not an input file.
195   
196    if (pattVector.size() == 0) {
197        pattVector.push_back(inputFiles[0]);
198        inputFiles.erase(inputFiles.begin());
199    }
200}
201
202void buildPatternKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
203    PabloBuilder entry(kernel.getEntryBlock());
204
205    Var * pat = kernel.addInput("pat", iBuilder->getStreamSetTy(4));
206
207    PabloAST * basisBits[4];
208
209    basisBits[0] = entry.createExtract(pat, 0, "A");
210    basisBits[1] = entry.createExtract(pat, 1, "C");
211    basisBits[2] = entry.createExtract(pat, 2, "T");
212    basisBits[3] = entry.createExtract(pat, 3, "G");
213
214    re::Pattern_Compiler pattern_compiler(kernel);
215    pattern_compiler.compile(patterns, entry, basisBits, editDistance, optPosition, stepSize);
216
217    pablo_function_passes(&kernel);
218}
219
220
221Function * editdPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder, const std::vector<std::string> & patterns) {
222   
223    ExternalFileBuffer ChStream(iBuilder, iBuilder->getStreamSetTy(4));
224    SingleBlockBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy(editDistance + 1));
225
226    PabloKernel editdk(iBuilder, "editd");
227
228    buildPatternKernel(editdk, iBuilder, patterns);
229
230    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
231   
232    std::unique_ptr<Module> editdM = editdk.createKernelModule({&ChStream}, {&MatchResults});
233    std::unique_ptr<Module> scanM = editdScanK.createKernelModule({&MatchResults}, {});               
234   
235    editdk.addKernelDeclarations(mMod);
236    editdScanK.addKernelDeclarations(mMod);
237
238    Type * const size_ty = iBuilder->getSizeTy();
239    Type * const voidTy = iBuilder->getVoidTy();
240    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(iBuilder->getBitBlockType(), 8), 1), 0);
241   
242    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, nullptr));
243    main->setCallingConv(CallingConv::C);
244    Function::arg_iterator args = main->arg_begin();
245   
246    Value * const inputStream = &*(args++);
247    inputStream->setName("input");
248    Value * const fileSize = &*(args++);
249    fileSize->setName("fileSize");
250   
251    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
252
253    ChStream.setStreamSetBuffer(inputStream, fileSize);
254    MatchResults.allocateBuffer();
255   
256    generatePipelineLoop(iBuilder, {&editdk, &editdScanK});
257       
258    iBuilder->CreateRetVoid();
259   
260    Linker L(*mMod);
261    L.linkInModule(std::move(editdM));
262    L.linkInModule(std::move(scanM));
263   
264    return main;
265}
266
267void buildPreprocessKernel(PabloKernel & kernel, IDISA::IDISA_Builder * iBuilder) {
268    cc::CC_Compiler ccc(&kernel);
269    PabloBuilder & pb = ccc.getBuilder();
270
271    PabloAST * A = ccc.compileCC(re::makeCC(re::makeCC(0x41), re::makeCC(0x61)), pb);
272    PabloAST * C = ccc.compileCC(re::makeCC(re::makeCC(0x43), re::makeCC(0x63)), pb);
273    PabloAST * T = ccc.compileCC(re::makeCC(re::makeCC(0x54), re::makeCC(0x74)), pb);
274    PabloAST * G = ccc.compileCC(re::makeCC(re::makeCC(0x47), re::makeCC(0x67)), pb);
275
276    Var * const pat = kernel.addOutput("pat", iBuilder->getStreamSetTy(4));
277
278    pb.createAssign(pb.createExtract(pat, 0), A);
279    pb.createAssign(pb.createExtract(pat, 1), C);
280    pb.createAssign(pb.createExtract(pat, 2), T);
281    pb.createAssign(pb.createExtract(pat, 3), G);
282
283    pablo_function_passes(&kernel);
284}
285
286Function * preprocessPipeline(Module * mMod, IDISA::IDISA_Builder * iBuilder) {
287    Type * mBitBlockType = iBuilder->getBitBlockType();
288   
289    ExternalFileBuffer ByteStream(iBuilder, iBuilder->getStreamSetTy(1, 8));
290    SingleBlockBuffer BasisBits(iBuilder, iBuilder->getStreamSetTy(8));
291    ExternalFileBuffer CCResults(iBuilder, iBuilder->getStreamSetTy(4));
292
293    S2PKernel  s2pk(iBuilder);
294    std::unique_ptr<Module> s2pM = s2pk.createKernelModule({&ByteStream}, {&BasisBits});
295
296    PabloKernel  ccck(iBuilder, "ccc");
297
298    buildPreprocessKernel(ccck, iBuilder);
299   
300    std::unique_ptr<Module> cccM = ccck.createKernelModule({&BasisBits}, {&CCResults});
301   
302    s2pk.addKernelDeclarations(mMod);
303    ccck.addKernelDeclarations(mMod);
304
305    Type * const size_ty = iBuilder->getSizeTy();
306    Type * const voidTy = iBuilder->getVoidTy();
307    Type * const inputType = PointerType::get(ArrayType::get(ArrayType::get(mBitBlockType, 8), 1), 0);
308    Type * const outputType = PointerType::get(ArrayType::get(mBitBlockType, 4), 0);
309   
310    Function * const main = cast<Function>(mMod->getOrInsertFunction("Main", voidTy, inputType, size_ty, outputType, nullptr));
311    main->setCallingConv(CallingConv::C);
312    Function::arg_iterator args = main->arg_begin();
313   
314    Value * const inputStream = &*(args++);
315    inputStream->setName("input");
316    Value * const fileSize = &*(args++);
317    fileSize->setName("fileSize");
318    Value * const outputStream = &*(args++);
319    outputStream->setName("output");
320   
321    iBuilder->SetInsertPoint(BasicBlock::Create(mMod->getContext(), "entry", main,0));
322
323    ByteStream.setStreamSetBuffer(inputStream, fileSize);
324    BasisBits.allocateBuffer();
325    CCResults.setStreamSetBuffer(outputStream, fileSize);
326   
327    generatePipelineLoop(iBuilder, {&s2pk, &ccck});
328       
329    iBuilder->CreateRetVoid();
330   
331    Linker L(*mMod);
332    L.linkInModule(std::move(s2pM));
333    L.linkInModule(std::move(cccM));
334   
335    return main;
336}
337
338
339typedef void (*preprocessFunctionType)(char * byte_data, size_t filesize, char * output_data);
340
341preprocessFunctionType preprocessCodeGen() {
342                           
343    LLVMContext TheContext;
344    Module * M = new Module("preprocess", TheContext);
345    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
346
347    llvm::Function * main_IR = preprocessPipeline(M, idb);
348
349    ExecutionEngine * preprocessEngine = JIT_to_ExecutionEngine(M);
350   
351    preprocessEngine->finalizeObject();
352
353    delete idb;
354    return reinterpret_cast<preprocessFunctionType>(preprocessEngine->getPointerToFunction(main_IR));
355}
356
357typedef void (*editdFunctionType)(char * byte_data, size_t filesize);
358
359editdFunctionType editdCodeGen(const std::vector<std::string> & patterns) {
360                           
361    LLVMContext TheContext;
362    Module * M = new Module("editd", TheContext);
363    IDISA::IDISA_Builder * idb = IDISA::GetIDISA_Builder(M);
364
365    llvm::Function * main_IR = editdPipeline(M, idb, patterns);
366
367    ExecutionEngine * editdEngine = JIT_to_ExecutionEngine(M);
368   
369    editdEngine->finalizeObject();
370
371    delete idb;
372    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main_IR));
373}
374
375char * chStream;
376int size;
377
378char * preprocess(preprocessFunctionType fn_ptr) {
379    std::string fileName = inputFiles[0];
380    size_t fileSize;
381    char * fileBuffer;
382   
383    const boost::filesystem::path file(fileName);
384    if (exists(file)) {
385        if (is_directory(file)) {
386            exit(0);
387        }
388    } else {
389        std::cerr << "Error: cannot open " << fileName << " for processing. Skipped.\n";
390        exit(0);
391    }
392   
393    fileSize = file_size(file);
394    boost::iostreams::mapped_file_source mappedFile;
395    if (fileSize == 0) {
396        fileBuffer = nullptr;
397    }
398    else {
399        try {
400            mappedFile.open(fileName);
401        } catch (std::exception &e) {
402            std::cerr << "Error: Boost mmap of " << fileName << ": " << e.what() << std::endl;
403            exit(0);
404        }
405        fileBuffer = const_cast<char *>(mappedFile.data());
406    }
407
408    int ret = posix_memalign((void**)&chStream, 32, fileSize);
409    if (ret) {
410        std::cerr << "Cannot allocate memory for output.\n";
411        exit(-1);
412    }
413
414    fn_ptr(fileBuffer, fileSize, chStream);
415    size = fileSize;
416
417    mappedFile.close();
418
419    return chStream;   
420}
421
422void editd(editdFunctionType fn_ptr, char * inputStream, int size) {
423 
424    if (size == 0) {
425        inputStream = nullptr;
426    }
427
428    fn_ptr(inputStream, size);
429   
430}
431
432std::mutex count_mutex;
433size_t groupCount;
434void *DoEditd(void *threadid)
435{
436    size_t groupIdx;
437    count_mutex.lock();
438    groupIdx = groupCount;
439    groupCount++;
440    count_mutex.unlock();
441
442    while (groupIdx < pattGroups.size()){
443        editdFunctionType editd_ptr = editdCodeGen(pattGroups[groupIdx]);
444        editd(editd_ptr, chStream, size);
445
446        count_mutex.lock();
447        groupIdx = groupCount;
448        groupCount++;
449        count_mutex.unlock();
450    }
451
452    pthread_exit(NULL);
453}
454
455#ifdef CUDA_ENABLED
456
457#define GROUPTHREADS 64
458#define GROUPBLOCKS 64
459
460void editdGPUCodeGen(unsigned patternLen){ 
461    LLVMContext TheContext;
462    Module * M = new Module("editd-gpu", TheContext);
463    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
464    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
465    M->setTargetTriple("nvptx64-nvidia-cuda");
466    unsigned addrSpace = 1;
467
468    Type * const mBitBlockType = iBuilder->getBitBlockType();
469    Type * const inputSizeTy = PointerType::get(iBuilder->getSizeTy(), 1);
470    Type * const int32ty = iBuilder->getInt32Ty();
471    Type * const voidTy = Type::getVoidTy(M->getContext());
472    Type * const inputTy = PointerType::get(ArrayType::get(mBitBlockType, 4), 1);
473    Type * const patternPtrTy = PointerType::get(iBuilder->getInt8Ty(), 1);
474    Type * const outputTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
475    Type * const stridesTy = PointerType::get(int32ty, 1);
476
477    ExternalFileBuffer CCStream(iBuilder, iBuilder->getStreamSetTy( 4, 1), addrSpace);
478    ExternalFileBuffer ResultStream(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1), addrSpace);
479
480    kernel::editdGPUKernel editdk(iBuilder, editDistance, patternLen); 
481    editdk.generateKernel({&CCStream}, {&ResultStream});
482
483    Function * const main = cast<Function>(M->getOrInsertFunction("GPU_Main", voidTy, inputTy, inputSizeTy, patternPtrTy, outputTy, stridesTy, nullptr));
484    main->setCallingConv(CallingConv::C);
485    Function::arg_iterator args = main->arg_begin();
486   
487    Value * const inputStream = &*(args++);
488    inputStream->setName("input");
489    Value * const inputSizePtr = &*(args++);
490    inputSizePtr->setName("inputSizePtr");
491    Value * const pattStream = &*(args++);
492    pattStream->setName("pattStream");
493    Value * const resultStream = &*(args++);
494    resultStream->setName("resultStream");
495    Value * const stridesPtr = &*(args++);
496    stridesPtr->setName("stridesPtr");
497   
498    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
499
500    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
501    Value * tid = iBuilder->CreateCall(tidFunc);
502    Value * inputThreadPtr = iBuilder->CreateGEP(inputStream, tid);
503
504    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
505    Value * bid = iBuilder->CreateCall(bidFunc);
506    Value * strides = iBuilder->CreateLoad(stridesPtr);
507    Value * outputBlocks = iBuilder->CreateMul(strides, ConstantInt::get(int32ty, GROUPTHREADS));
508    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, iBuilder->CreateAdd(iBuilder->CreateMul(bid, outputBlocks), tid));
509
510    Value * inputSize = iBuilder->CreateLoad(inputSizePtr);
511    CCStream.setStreamSetBuffer(inputThreadPtr, inputSize);
512    ResultStream.setEmptyBuffer(resultStreamPtr);
513
514    const unsigned numOfCarries = patternLen * (editDistance + 1) * 4;
515    Type * strideCarryTy = ArrayType::get(mBitBlockType, numOfCarries);
516    Value * strideCarry = iBuilder->CreateAlloca(strideCarryTy);
517    iBuilder->CreateStore(Constant::getNullValue(strideCarryTy), strideCarry);
518
519    editdk.setInitialArguments({pattStream, strideCarry});
520   
521    generatePipelineLoop(iBuilder, {&editdk});
522       
523    iBuilder->CreateRetVoid();
524   
525    MDNode * Node = MDNode::get(M->getContext(),
526                                {llvm::ValueAsMetadata::get(main),
527                                 MDString::get(M->getContext(), "kernel"), 
528                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
529    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
530    NMD->addOperand(Node);
531
532    Compile2PTX(M, IRFilename, PTXFilename);
533
534}
535
536void mergeGPUCodeGen(){
537        LLVMContext TheContext;
538    Module * M = new Module("editd-gpu", TheContext);
539    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_GPU_Builder(M);
540    M->setDataLayout("e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v32:32:32-v64:64:64-v128:128:128-n16:32:64");
541    M->setTargetTriple("nvptx64-nvidia-cuda");
542
543    Type * const mBitBlockType = iBuilder->getBitBlockType();
544    Type * const int32ty = iBuilder->getInt32Ty();
545    Type * const voidTy = Type::getVoidTy(M->getContext());
546    Type * const resultTy = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 1);
547    Type * const stridesTy = PointerType::get(int32ty, 1);
548
549    Function * const main = cast<Function>(M->getOrInsertFunction("mergeResult", voidTy, resultTy, stridesTy, nullptr));
550    main->setCallingConv(CallingConv::C);
551    Function::arg_iterator args = main->arg_begin();
552   
553    Value * const resultStream = &*(args++);
554    resultStream->setName("resultStream");
555    Value * const stridesPtr = &*(args++);
556    stridesPtr->setName("stridesPtr");
557
558    BasicBlock * entryBlock = BasicBlock::Create(iBuilder->getContext(), "entryBlock", main, 0);
559    BasicBlock * strideLoopCond = BasicBlock::Create(iBuilder->getContext(), "strideLoopCond", main, 0);
560    BasicBlock * strideLoopBody = BasicBlock::Create(iBuilder->getContext(), "strideLoopBody", main, 0);
561    BasicBlock * stridesDone = BasicBlock::Create(iBuilder->getContext(), "stridesDone", main, 0);
562   
563    iBuilder->SetInsertPoint(entryBlock);
564
565    Function * tidFunc = M->getFunction("llvm.nvvm.read.ptx.sreg.tid.x");
566    Value * tid = iBuilder->CreateCall(tidFunc);
567
568    Function * bidFunc = cast<Function>(M->getOrInsertFunction("llvm.nvvm.read.ptx.sreg.ctaid.x", int32ty, nullptr));
569    Value * bid = iBuilder->CreateCall(bidFunc);
570    Value * strides = iBuilder->CreateLoad(stridesPtr);
571    Value * strideBlocks = ConstantInt::get(int32ty, iBuilder->getStride() / iBuilder->getBitBlockWidth());
572    Value * outputBlocks = iBuilder->CreateMul(strides, strideBlocks);
573    Value * resultStreamPtr = iBuilder->CreateGEP(resultStream, tid);
574
575    iBuilder->CreateBr(strideLoopCond);
576    iBuilder->SetInsertPoint(strideLoopCond);
577    PHINode * strideNo = iBuilder->CreatePHI(int32ty, 2, "strideNo");
578    strideNo->addIncoming(ConstantInt::get(int32ty, 0), entryBlock);
579    Value * notDone = iBuilder->CreateICmpULT(strideNo, strides);
580    iBuilder->CreateCondBr(notDone, strideLoopBody, stridesDone);
581 
582    iBuilder->SetInsertPoint(strideLoopBody);
583    Value * myResultStreamPtr = iBuilder->CreateGEP(resultStreamPtr, {iBuilder->CreateMul(strideBlocks, strideNo)});
584    Value * myResultStream = iBuilder->CreateLoad(iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
585    for (unsigned i=1; i<GROUPBLOCKS; i++){
586        Value * nextStreamPtr = iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->CreateMul(outputBlocks, iBuilder->getInt32(i)), bid});
587        myResultStream = iBuilder->CreateOr(myResultStream, iBuilder->CreateLoad(nextStreamPtr));
588    }   
589    iBuilder->CreateStore(myResultStream, iBuilder->CreateGEP(myResultStreamPtr, {iBuilder->getInt32(0), bid}));
590    strideNo->addIncoming(iBuilder->CreateAdd(strideNo, ConstantInt::get(int32ty, 1)), strideLoopBody);
591    iBuilder->CreateBr(strideLoopCond);
592   
593    iBuilder->SetInsertPoint(stridesDone);
594    iBuilder->CreateRetVoid();
595   
596    MDNode * Node = MDNode::get(M->getContext(),
597                                {llvm::ValueAsMetadata::get(main),
598                                 MDString::get(M->getContext(), "kernel"), 
599                                 ConstantAsMetadata::get(ConstantInt::get(iBuilder->getInt32Ty(), 1))});
600    NamedMDNode *NMD = M->getOrInsertNamedMetadata("nvvm.annotations");
601    NMD->addOperand(Node);
602
603    Compile2PTX(M, "merge.ll", "merge.ptx");
604
605}
606
607editdFunctionType editdScanCPUCodeGen() {
608                           
609    LLVMContext TheContext;
610    Module * M = new Module("editd", TheContext);
611    IDISA::IDISA_Builder * iBuilder = IDISA::GetIDISA_Builder(M);
612    ExecutionEngine * editdEngine = nullptr;
613
614    Type * mBitBlockType = iBuilder->getBitBlockType();
615    Type * const size_ty = iBuilder->getSizeTy();
616    Type * const voidTy = Type::getVoidTy(M->getContext());
617    Type * const inputType = PointerType::get(ArrayType::get(mBitBlockType, editDistance+1), 0);
618
619    ExternalFileBuffer MatchResults(iBuilder, iBuilder->getStreamSetTy( editDistance+1, 1));
620    kernel::editdScanKernel editdScanK(iBuilder, editDistance);
621    editdScanK.generateKernel({&MatchResults}, {});               
622   
623    Function * const main = cast<Function>(M->getOrInsertFunction("CPU_Main", voidTy, inputType, size_ty, nullptr));
624    main->setCallingConv(CallingConv::C);
625    Function::arg_iterator args = main->arg_begin();
626   
627    Value * const inputStream = &*(args++);
628    inputStream->setName("input");
629    Value * const fileSize = &*(args++);
630    fileSize->setName("fileSize");
631   
632    iBuilder->SetInsertPoint(BasicBlock::Create(M->getContext(), "entry", main,0));
633
634    MatchResults.setStreamSetBuffer(inputStream, fileSize);
635   
636    generatePipelineLoop(iBuilder, {&editdScanK});
637       
638    iBuilder->CreateRetVoid();
639
640    editdEngine = JIT_to_ExecutionEngine(M);
641   
642    editdEngine->finalizeObject();
643
644    return reinterpret_cast<editdFunctionType>(editdEngine->getPointerToFunction(main));
645}
646
647#endif
648
649int main(int argc, char *argv[]) {
650
651    cl::ParseCommandLineOptions(argc, argv);
652
653    int pattern_segs = 0;
654    int total_len = 0;
655
656    get_editd_pattern(pattern_segs, total_len);
657
658#ifdef CUDA_ENABLED
659    codegen::BlockSize = 64;
660#endif
661
662    preprocessFunctionType preprocess_ptr = preprocessCodeGen();
663    preprocess(preprocess_ptr);
664
665#ifdef CUDA_ENABLED 
666    setNVPTXOption();   
667    if(codegen::NVPTX){
668
669        std::ifstream t(PatternFilename);
670        if (!t.is_open()) {
671            std::cerr << "Error: cannot open " << PatternFilename << " for processing. Skipped.\n";
672            exit(-1);
673        } 
674        std::string patterns((std::istreambuf_iterator<char>(t)), std::istreambuf_iterator<char>());
675
676        editdGPUCodeGen(patterns.length()/GROUPTHREADS - 1);
677
678        mergeGPUCodeGen();
679
680        ulong * rslt = RunPTX(PTXFilename, chStream, size, patterns.c_str(), patterns.length(), editDistance);
681
682        editdFunctionType editd_ptr = editdScanCPUCodeGen();
683
684        editd(editd_ptr, (char*)rslt, size);
685       
686        run_second_filter(pattern_segs, total_len, 0.15);
687
688        return 0;
689    }
690#endif
691   
692    if(pattVector.size() == 1){
693        editdFunctionType editd_ptr = editdCodeGen(pattVector);
694        editd(editd_ptr, chStream, size);
695    }
696    else{
697        if (Threads == 1) {
698            for(unsigned i=0; i<pattGroups.size(); i++){
699                editdFunctionType editd_ptr = editdCodeGen(pattGroups[i]);
700                editd(editd_ptr, chStream, size);
701            }
702        }
703        else{
704            const unsigned numOfThreads = Threads;
705            pthread_t threads[numOfThreads];
706            groupCount = 0;
707
708            for(unsigned long i = 0; i < numOfThreads; ++i){
709                const int rc = pthread_create(&threads[i], NULL, DoEditd, (void *)i);
710                if (rc) {
711                    llvm::report_fatal_error("Failed to create thread: code " + std::to_string(rc));
712                }
713            }
714
715            for(unsigned i = 0; i < numOfThreads; ++i) {
716                void * status = nullptr;
717                const int rc = pthread_join(threads[i], &status);
718                if (rc) {
719                    llvm::report_fatal_error("Failed to join thread: code " + std::to_string(rc));
720                }
721            }
722
723        }
724        run_second_filter(pattern_segs, total_len, 0.15);
725    }
726
727    return 0;
728}
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
Note: See TracBrowser for help on using the repository browser.