source: icGREP/icgrep-devel/icgrep/re/re_cc.h

Last change on this file was 5847, checked in by cameron, 3 weeks ago

Unify Parabix CC compiler and Direct CC compiler with a common superclass

File size: 4.6 KB
Line 
1/*
2 *  Copyright (c) 2018 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#ifndef RE_CC_H
8#define RE_CC_H
9
10#include "re_re.h"
11#include <UCD/unicode_set.h>
12#include <cc/alphabet.h>
13
14namespace re {
15
16using codepoint_t = UCD::codepoint_t;
17using interval_t = UCD::interval_t;
18
19enum class CC_type {UnicodeClass, ByteClass};
20
21class CC : public RE, public UCD::UnicodeSet {
22public:
23
24    static inline bool classof(const RE * re) {
25        return re->getClassTypeId() == ClassTypeId::CC;
26    }
27    static inline bool classof(const void *) {
28        return false;
29    }
30
31    const cc::Alphabet * getAlphabet() const { return mAlphabet;}
32
33    std::string canonicalName() const;
34
35    inline codepoint_t min_codepoint() const {
36        return front().first;
37    }
38
39    inline codepoint_t max_codepoint() const {
40        return back().second;
41    }
42
43    virtual ~CC() {}
44
45protected:
46    friend CC * makeCC(const cc::Alphabet * alphabet);
47    friend CC * makeCC(const codepoint_t codepoint, const cc::Alphabet * alphabet);
48    friend CC * makeCC(const codepoint_t lo, const codepoint_t hi, const cc::Alphabet * alphabet);
49    friend CC * makeCC(const CC * cc1, const CC * cc2);
50    friend CC * makeCC(std::initializer_list<interval_t> list, const cc::Alphabet * alphabet);
51    friend CC * makeCC(std::vector<interval_t> && list, const cc::Alphabet * alphabet);
52    friend CC * makeCC(UCD::UnicodeSet && set, const cc::Alphabet * alphabet);
53    friend bool intersects(const CC * a, const CC * b);
54    friend CC * subtractCC(const CC * a, const CC * b);
55    friend CC * intersectCC(const CC * a, const CC * b);
56    friend CC * makeByte(const codepoint_t codepoint);
57    friend CC * makeByte(const codepoint_t lo, const codepoint_t hi);
58
59    CC(const cc::Alphabet * alphabet);
60
61    CC(const CC & cc);
62
63    CC(const codepoint_t codepoint, const cc::Alphabet * alphabet);
64
65    explicit CC(const codepoint_t lo_codepoint, const codepoint_t hi_codepoint, const cc::Alphabet * alphabet);
66
67    explicit CC(const CC * cc1, const CC * cc2);
68
69    CC(const UCD::UnicodeSet && set, const cc::Alphabet * alphabet);
70
71    CC(std::initializer_list<interval_t>::iterator begin, std::initializer_list<interval_t>::iterator end, const cc::Alphabet * alphabet);
72
73    CC(const std::vector<interval_t>::iterator begin, const std::vector<interval_t>::iterator end, const cc::Alphabet * alphabet);
74private:
75    const cc::Alphabet * mAlphabet;
76   
77
78};
79
80inline static CC::iterator begin(const CC & cc) {
81    return cc.begin();
82}
83
84inline static CC::iterator end(const CC & cc) {
85    return cc.end();
86}
87
88inline codepoint_t lo_codepoint(const interval_t & i) {
89    return std::get<0>(i);
90}
91inline codepoint_t lo_codepoint(const CC::iterator i) {
92    return lo_codepoint(*i);
93}
94
95inline codepoint_t hi_codepoint(const interval_t & i) {
96    return std::get<1>(i);
97}
98inline codepoint_t hi_codepoint(const CC::iterator i) {
99    return hi_codepoint(*i);
100}
101
102/**
103 * @brief RE::makeCC
104 *
105 * Various factory constructors for the RE CC class
106 *
107 * @return a CC object
108 */
109
110inline CC * makeCC(const cc::Alphabet * alphabet = &cc::Unicode) {
111    return new CC(alphabet);
112}
113
114inline CC * makeCC(const codepoint_t codepoint, const cc::Alphabet * alphabet = &cc::Unicode) {
115    return new CC(codepoint, alphabet);
116}
117
118inline CC * makeCC(const codepoint_t lo, const codepoint_t hi, const cc::Alphabet * alphabet = &cc::Unicode) {
119    return new CC(lo, hi, alphabet);
120}
121
122inline CC * makeCC(const CC * cc1, const CC * cc2) {
123    return new CC(cc1, cc2);
124}
125
126inline CC * makeCC(std::initializer_list<interval_t> list, const cc::Alphabet * alphabet = &cc::Unicode) {
127    return new CC(list.begin(), list.end(), alphabet);
128}
129
130inline CC * makeCC(std::vector<interval_t> && list, const cc::Alphabet * alphabet = &cc::Unicode) {
131    return new CC(list.begin(), list.end(), alphabet);
132}
133
134inline CC * makeCC(UCD::UnicodeSet && set, const cc::Alphabet * alphabet = &cc::Unicode) {
135    return new CC(std::move(set), alphabet);
136}
137
138inline CC * subtractCC(const CC * a, const CC * b) {
139    //assert (a->getAlphabet() == b->getAlphabet());
140    return new CC(*a - *b, a->getAlphabet());
141}
142
143inline CC * intersectCC(const CC * a, const CC * b) {
144    //assert (a->getAlphabet() == b->getAlphabet());
145    return new CC(*a & *b, a->getAlphabet());
146}
147
148inline bool intersects(const CC * a, const CC * b) {
149    return (*a).intersects(*b);
150}
151
152inline CC * makeByte(const codepoint_t codepoint) {
153    return new CC(codepoint, &cc::Byte);
154}
155
156inline CC * makeByte(const codepoint_t lo, const codepoint_t hi) {
157    return new CC(lo, hi, &cc::Byte);
158}
159   
160}
161
162#endif // RE_CC_H
Note: See TracBrowser for help on using the repository browser.