source: icGREP/icgrep-devel/icgrep/re/re_cc.h

Last change on this file was 5742, checked in by nmedfort, 15 hours ago

Improvements to memory usage of CCs

File size: 3.2 KB
Line 
1/*
2 *  Copyright (c) 2014 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#ifndef RE_CC_H
8#define RE_CC_H
9
10#include "re_re.h"
11#include <UCD/unicode_set.h>
12
13namespace re {
14
15using codepoint_t = UCD::codepoint_t;
16using interval_t = UCD::UnicodeSet::interval_t;
17
18enum CC_type {UnicodeClass, ByteClass};
19
20class CC : public RE, public UCD::UnicodeSet {
21public:
22
23    static inline bool classof(const RE * re) {
24        return re->getClassTypeId() == ClassTypeId::CC;
25    }
26    static inline bool classof(const void *) {
27        return false;
28    }
29
30
31    std::string canonicalName(const CC_type type) const;
32
33    inline codepoint_t min_codepoint() const {
34        return front().first;
35    }
36
37    inline codepoint_t max_codepoint() const {
38        return back().second;
39    }
40
41    virtual ~CC() {}
42
43protected:
44    friend CC * makeCC();
45    friend CC * makeCC(const codepoint_t codepoint);
46    friend CC * makeCC(const codepoint_t lo, const codepoint_t hi);
47    friend CC * makeCC(const CC * cc1, const CC * cc2);
48    friend CC * makeCC(std::initializer_list<interval_t> list);
49    friend CC * makeCC(std::vector<interval_t> && list);
50    friend CC * makeCC(UCD::UnicodeSet && set);
51    friend CC * subtractCC(const CC * a, const CC * b);
52    friend CC * intersectCC(const CC * a, const CC * b);
53
54    CC();
55
56    CC(const CC & cc);
57
58    CC(const codepoint_t codepoint);
59
60    explicit CC(const codepoint_t lo_codepoint, const codepoint_t hi_codepoint);
61
62    explicit CC(const CC * cc1, const CC * cc2);
63
64    CC(UCD::UnicodeSet && set);
65
66    CC(std::initializer_list<interval_t>::iterator begin, std::initializer_list<interval_t>::iterator end);
67
68    CC(const std::vector<interval_t>::iterator begin, const std::vector<interval_t>::iterator end);
69
70};
71
72inline static CC::iterator begin(const CC & cc) {
73    return cc.begin();
74}
75
76inline static CC::iterator end(const CC & cc) {
77    return cc.end();
78}
79
80inline codepoint_t lo_codepoint(const interval_t & i) {
81    return std::get<0>(i);
82}
83inline codepoint_t lo_codepoint(const CC::iterator i) {
84    return lo_codepoint(*i);
85}
86
87inline codepoint_t hi_codepoint(const interval_t & i) {
88    return std::get<1>(i);
89}
90inline codepoint_t hi_codepoint(const CC::iterator i) {
91    return hi_codepoint(*i);
92}
93
94/**
95 * @brief RE::makeCC
96 *
97 * Various factory constructors for the RE CC class
98 *
99 * @return a CC object
100 */
101
102inline CC * makeCC() {
103    return new CC();
104}
105
106inline CC * makeCC(const codepoint_t codepoint) {
107    return new CC(codepoint);
108}
109
110inline CC * makeCC(const codepoint_t lo, const codepoint_t hi) {
111    return new CC(lo, hi);
112}
113
114inline CC * makeCC(const CC * cc1, const CC * cc2) {
115    return new CC(cc1, cc2);
116}
117
118inline CC * makeCC(std::initializer_list<interval_t> list) {
119    return new CC(list.begin(), list.end());
120}
121
122inline CC * makeCC(std::vector<interval_t> && list) {
123    return new CC(list.begin(), list.end());
124}
125
126inline CC * makeCC(UCD::UnicodeSet && set) {
127    return new CC(std::move(set));
128}
129
130inline CC * subtractCC(const CC * a, const CC * b) {
131    return new CC(*a - *b);
132}
133
134inline CC * intersectCC(const CC * a, const CC * b) {
135    return new CC(*a & *b);
136}
137
138CC * caseInsensitize(const CC * cc);
139
140}
141
142#endif // RE_CC_H
Note: See TracBrowser for help on using the repository browser.