source: icGREP/icgrep-devel/icgrep/cc/cc_compiler.h @ 5045

Last change on this file since 5045 was 5045, checked in by xuedongx, 3 years ago

Support over UTF-16 representation of Unicode

File size: 2.9 KB
Line 
1/*
2 *  Copyright (c) 2014 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#ifndef CC_COMPILER_H
8#define CC_COMPILER_H
9
10#include <re/re_cc.h>
11#include <pablo/builder.hpp>
12#include "utf_encoding.h"
13#include <string>
14
15
16namespace pablo {
17    class PabloFunction;
18}
19
20namespace cc {
21
22class CC_NameMap;
23
24class CC_Compiler{
25public:
26
27    using Vars = std::vector<pablo::Var *>;
28
29    CC_Compiler(pablo::PabloFunction & function, const Encoding & encoding, const std::string prefix = "basis");
30
31    pablo::Assign * compileCC(const re::CC *cc);
32
33    pablo::Assign * compileCC(const re::CC *cc, pablo::PabloBlock & block);
34
35    pablo::Assign * compileCC(const re::CC *cc, pablo::PabloBuilder & builder);
36
37    pablo::Assign * compileCC(const std::string && canonicalName, const re::CC *cc, pablo::PabloBlock & block);
38
39    pablo::Assign * compileCC(const std::string && canonicalName, const re::CC *cc, pablo::PabloBuilder & builder);
40
41    pablo::PabloBuilder & getBuilder();
42
43    const std::vector<pablo::Var *> & getBasisBits() {
44        return mBasisBit;
45    }
46
47        bool isUTF_16() {
48                return mEncoding.getBits() == 16;
49        }
50
51private:
52    pablo::Var * getBasisVar(const unsigned n) const;
53    template<typename PabloBlockOrBuilder>
54    pablo::PabloAST * bit_pattern_expr(const unsigned pattern, unsigned selected_bits, PabloBlockOrBuilder & pb);
55    template<typename PabloBlockOrBuilder>
56    pablo::PabloAST * char_test_expr(const re::codepoint_t ch, PabloBlockOrBuilder & pb);
57    template<typename PabloBlockOrBuilder>
58    pablo::PabloAST * make_range(const re::codepoint_t n1, const re::codepoint_t n2, PabloBlockOrBuilder & pb);
59    template<typename PabloBlockOrBuilder>
60    pablo::PabloAST * GE_Range(const unsigned N, const unsigned n, PabloBlockOrBuilder & pb);
61    template<typename PabloBlockOrBuilder>
62    pablo::PabloAST * LE_Range(const unsigned N, const unsigned n, PabloBlockOrBuilder & pb);
63    template<typename PabloBlockOrBuilder>
64    pablo::PabloAST * char_or_range_expr(const re::codepoint_t lo, const re::codepoint_t hi, PabloBlockOrBuilder & pb);
65    template<typename PabloBlockOrBuilder>
66    pablo::PabloAST * charset_expr(const re::CC *cc, PabloBlockOrBuilder & pb);
67private:   
68    pablo::PabloBuilder         mBuilder;
69    std::vector<pablo::Var *>   mBasisBit;
70    const Encoding &            mEncoding;
71};
72
73inline pablo::Assign * CC_Compiler::compileCC(const re::CC *cc) {
74    return compileCC(cc, mBuilder);
75}
76
77inline pablo::Assign * CC_Compiler::compileCC(const re::CC *cc, pablo::PabloBlock & block) {
78    return compileCC(std::move(cc->canonicalName(re::ByteClass)), cc, block);
79}
80
81inline pablo::Assign * CC_Compiler::compileCC(const re::CC *cc, pablo::PabloBuilder & builder) {
82    return compileCC(std::move(cc->canonicalName(re::ByteClass)), cc, builder);
83}
84
85inline pablo::PabloBuilder & CC_Compiler::getBuilder() {
86    return mBuilder;
87}
88
89
90}
91
92#endif // CC_COMPILER_H
93
94
Note: See TracBrowser for help on using the repository browser.