source: icGREP/icgrep-devel/icgrep/re/re_name.h @ 4831

Last change on this file since 4831 was 4831, checked in by nmedfort, 4 years ago

First attempt at adding grapheme cluster mode to icgrep.

File size: 4.8 KB
Line 
1#ifndef RE_NAME_H
2#define RE_NAME_H
3
4#include <re/re_re.h>
5#include <re/re_cc.h>
6#include <string>
7
8namespace UCD {
9    class UnicodeSet;
10}
11
12namespace re {
13
14class Name : public RE {
15public:
16    static inline bool classof(const RE * re) {
17        return re->getClassTypeId() == ClassTypeId::Name;
18    }
19    static inline bool classof(const void *) {
20        return false;
21    }
22    using length_t = std::string::size_type;
23    enum class Type {
24        Byte
25        , Unicode
26        , UnicodeProperty
27        , Unknown
28    };
29    std::string getNamespace() const;
30    bool hasNamespace() const;
31    std::string getName() const;
32    Type getType() const;
33    RE * getDefinition() const;
34    bool operator<(const Name & other) const;
35    bool operator<(const CC & other) const;
36    bool operator>(const CC & other) const;
37    void setDefinition(RE * definition);
38    virtual ~Name() {}
39protected:
40    friend Name * makeName(const std::string & name, RE * cc);
41    friend Name * makeName(CC * const cc);
42    friend Name * makeName(const std::string &, const Type);
43    friend Name * makeName(const std::string &, const std::string &, const Type);
44    Name(const char * nameSpace, const length_t namespaceLength, const char * name, const length_t nameLength, const Type type, RE * defn)
45    : RE(ClassTypeId::Name)
46    , mNamespaceLength(namespaceLength)
47    , mNamespace(replicateString(nameSpace, namespaceLength))
48    , mNameLength(nameLength)
49    , mName(replicateString(name, nameLength))
50    , mType(type)
51    , mDefinition(defn)
52    {
53
54    }
55    inline const char * replicateString(const char * string, const length_t length) {
56        if (string) {
57            char * allocated = reinterpret_cast<char*>(mAllocator.allocate(length));
58            std::memcpy(allocated, string, length);
59            string = allocated;
60        }
61        return string;
62    }
63
64private:
65    const length_t      mNamespaceLength;
66    const char * const  mNamespace;
67    const length_t      mNameLength;
68    const char * const  mName;
69    const Type          mType;
70    RE *                mDefinition;
71};
72
73inline std::string Name::getNamespace() const {
74    return std::string(mNamespace, mNamespaceLength);
75}
76
77inline bool Name::hasNamespace() const {
78    return (mNamespaceLength != 0);
79}
80
81inline std::string Name::getName() const {
82    return std::string(mName, mNameLength);
83}
84   
85inline Name::Type Name::getType() const {
86    return mType;
87}
88
89inline RE * Name::getDefinition() const {
90    return mDefinition;
91}
92
93inline void Name::setDefinition(RE * definition) {
94    assert (definition != this);
95    mDefinition = definition;
96}
97
98inline bool Name::operator < (const Name & other) const {
99    if (LLVM_LIKELY(mDefinition && other.mDefinition && isa<CC>(mDefinition) && isa<CC>(other.mDefinition))) {
100        return *cast<CC>(mDefinition) < *cast<CC>(other.mDefinition);
101    } else if (mNamespaceLength < other.mNamespaceLength) {
102        return true;
103    } else if (mNamespaceLength > other.mNamespaceLength) {
104        return false;
105    } else if (mNameLength < other.mNameLength) {
106        return true;
107    } else if (mNameLength > other.mNameLength) {
108        return false;
109    }
110    const auto diff = std::memcmp(mNamespace, other.mNamespace, mNamespaceLength);
111    if (diff < 0) {
112        return true;
113    } else if (diff > 0) {
114        return false;
115    }
116    return (std::memcmp(mName, other.mName, mNameLength) < 0);
117}
118
119inline bool Name::operator < (const CC & other) const {
120    if (mDefinition && isa<CC>(mDefinition)) {
121        return *cast<CC>(mDefinition) < other;
122    }
123    return false;
124}
125
126inline bool Name::operator > (const CC & other) const {
127    if (mDefinition && isa<CC>(mDefinition)) {
128        return other < *cast<CC>(mDefinition);
129    }
130    return true;
131}
132
133inline Name * makeName(const std::string & name, const Name::Type type) {
134    return new Name(nullptr, 0, name.c_str(), name.length(), type, nullptr);
135}
136
137inline Name * makeName(const std::string & property, const std::string & value, const Name::Type type) {
138    return new Name(property.c_str(), property.length(), value.c_str(), value.length(),  type, nullptr);
139}
140
141inline Name * makeName(const std::string & name, RE * cc) {
142    if (isa<Name>(cc)) {
143        return cast<Name>(cc);
144    }
145    else if (isa<CC>(cc)) {
146        Name::Type ccType = cast<CC>(cc)->max_codepoint() <= 0x7F ? Name::Type::Byte : Name::Type::Unicode;
147        return new Name(nullptr, 0, name.c_str(), name.length(), ccType, cc);
148    }
149    else return new Name(nullptr, 0, name.c_str(), name.length(), Name::Type::Unknown, cc);
150}
151
152inline Name * makeName(CC * const cc) {
153    const bool ascii = cc->max_codepoint() <= 0x7F;
154    const std::string name = cc->canonicalName(ascii ? CC_type::ByteClass : CC_type::UnicodeClass);
155    return new Name(nullptr, 0, name.c_str(), name.length(), ascii ? Name::Type::Byte : Name::Type::Unicode, cc);
156}
157
158}
159
160#endif // RE_NAME_H
Note: See TracBrowser for help on using the repository browser.