source: icGREP/icgrep-devel/icgrep/re/re_name.h @ 5558

Last change on this file since 5558 was 5558, checked in by cameron, 2 years ago

Unix lines mode and support for 'Byte' character classes

File size: 5.9 KB
RevLine 
[3917]1#ifndef RE_NAME_H
2#define RE_NAME_H
3
[4246]4#include <re/re_re.h>
[4335]5#include <re/re_cc.h>
[5267]6#include <llvm/Support/Casting.h>
[3917]7
[4808]8namespace UCD {
9    class UnicodeSet;
10}
[4246]11
[4194]12namespace re {
13
14class Name : public RE {
[3917]15public:
[4194]16    static inline bool classof(const RE * re) {
17        return re->getClassTypeId() == ClassTypeId::Name;
18    }
19    static inline bool classof(const void *) {
20        return false;
21    }
[4516]22    using length_t = std::string::size_type;
[4194]23    enum class Type {
[4337]24        Byte
[4246]25        , Unicode
[4377]26        , UnicodeProperty
[5080]27        , Capture
28        , Reference
[5091]29        , ZeroWidth
[4335]30        , Unknown
[4194]31    };
[4516]32    std::string getNamespace() const;
[4809]33    bool hasNamespace() const;
[4516]34    std::string getName() const;
[4182]35    Type getType() const;
[4808]36    RE * getDefinition() const;
[4819]37    bool operator<(const Name & other) const;
38    bool operator<(const CC & other) const;
[4823]39    bool operator>(const CC & other) const;
[4818]40    void setDefinition(RE * definition);
[4194]41    virtual ~Name() {}
42protected:
[4823]43    friend Name * makeName(const std::string & name, RE * cc);
[5080]44    friend Name * makeCapture(const std::string & name, RE * captured);
45    friend Name * makeReference(const std::string & name, RE * captureName);
[5091]46    friend Name * makeZeroWidth(const std::string & name, RE * zerowidth);
[4823]47    friend Name * makeName(CC * const cc);
[5558]48    friend Name * makeByte(CC * const cc);
[5202]49    friend Name * makeName(const std::string &, Type);
50    friend Name * makeName(const std::string &, const std::string &, Type);
51    Name(const char * nameSpace, const length_t namespaceLength, const char * name, const length_t nameLength, Type type, RE * defn)
[4249]52    : RE(ClassTypeId::Name)
[4516]53    , mNamespaceLength(namespaceLength)
54    , mNamespace(replicateString(nameSpace, namespaceLength))
55    , mNameLength(nameLength)
56    , mName(replicateString(name, nameLength))
[4249]57    , mType(type)
[5234]58    , mDefinition(defn) {
[4249]59
60    }
[4516]61    inline const char * replicateString(const char * string, const length_t length) {
62        if (string) {
63            char * allocated = reinterpret_cast<char*>(mAllocator.allocate(length));
64            std::memcpy(allocated, string, length);
65            string = allocated;
66        }
67        return string;
68    }
[4249]69
[3917]70private:
[4660]71    const length_t      mNamespaceLength;
72    const char * const  mNamespace;
73    const length_t      mNameLength;
74    const char * const  mName;
[5233]75    Type                mType;
[4818]76    RE *                mDefinition;
[3917]77};
78
[4516]79inline std::string Name::getNamespace() const {
80    return std::string(mNamespace, mNamespaceLength);
[4377]81}
82
[4809]83inline bool Name::hasNamespace() const {
84    return (mNamespaceLength != 0);
85}
86
[4516]87inline std::string Name::getName() const {
88    return std::string(mName, mNameLength);
89}
[4380]90   
[4246]91inline Name::Type Name::getType() const {
92    return mType;
[4194]93}
94
[4336]95inline RE * Name::getDefinition() const {
[4818]96    return mDefinition;
[4194]97}
98
[4818]99inline void Name::setDefinition(RE * definition) {
100    assert (definition != this);
101    mDefinition = definition;
[4194]102}
103
[4819]104inline bool Name::operator < (const Name & other) const {
[5267]105    if (LLVM_LIKELY(mDefinition && other.mDefinition && llvm::isa<CC>(mDefinition) && llvm::isa<CC>(other.mDefinition))) {
106        return *llvm::cast<CC>(mDefinition) < *llvm::cast<CC>(other.mDefinition);
[4819]107    } else if (mNamespaceLength < other.mNamespaceLength) {
108        return true;
109    } else if (mNamespaceLength > other.mNamespaceLength) {
110        return false;
111    } else if (mNameLength < other.mNameLength) {
112        return true;
113    } else if (mNameLength > other.mNameLength) {
114        return false;
115    }
116    const auto diff = std::memcmp(mNamespace, other.mNamespace, mNamespaceLength);
117    if (diff < 0) {
118        return true;
119    } else if (diff > 0) {
120        return false;
121    }
122    return (std::memcmp(mName, other.mName, mNameLength) < 0);
123}
124
125inline bool Name::operator < (const CC & other) const {
[5267]126    if (mDefinition && llvm::isa<CC>(mDefinition)) {
127        return *llvm::cast<CC>(mDefinition) < other;
[4819]128    }
129    return false;
130}
131
[4823]132inline bool Name::operator > (const CC & other) const {
[5267]133    if (mDefinition && llvm::isa<CC>(mDefinition)) {
134        return other < *llvm::cast<CC>(mDefinition);
[4823]135    }
136    return true;
137}
138
[4660]139inline Name * makeName(const std::string & name, const Name::Type type) {
[4516]140    return new Name(nullptr, 0, name.c_str(), name.length(), type, nullptr);
[4194]141}
142
[4660]143inline Name * makeName(const std::string & property, const std::string & value, const Name::Type type) {
[4516]144    return new Name(property.c_str(), property.length(), value.c_str(), value.length(),  type, nullptr);
[4377]145}
146
[4516]147inline Name * makeName(const std::string & name, RE * cc) {
[5267]148    if (llvm::isa<Name>(cc)) {
149        return llvm::cast<Name>(cc);
[4249]150    }
[5267]151    else if (llvm::isa<CC>(cc)) {
152        Name::Type ccType = llvm::cast<CC>(cc)->max_codepoint() <= 0x7F ? Name::Type::Byte : Name::Type::Unicode;
[4516]153        return new Name(nullptr, 0, name.c_str(), name.length(), ccType, cc);
[4335]154    }
[4516]155    else return new Name(nullptr, 0, name.c_str(), name.length(), Name::Type::Unknown, cc);
[4194]156}
157
[4823]158inline Name * makeName(CC * const cc) {
159    const bool ascii = cc->max_codepoint() <= 0x7F;
160    const std::string name = cc->canonicalName(ascii ? CC_type::ByteClass : CC_type::UnicodeClass);
161    return new Name(nullptr, 0, name.c_str(), name.length(), ascii ? Name::Type::Byte : Name::Type::Unicode, cc);
[4194]162}
163
[5558]164inline Name * makeByte(CC * const cc) {
165    assert(cc->max_codepoint() <= 0xFF);
166    const std::string name = cc->canonicalName(CC_type::ByteClass);
167    return new Name(nullptr, 0, name.c_str(), name.length(), Name::Type::Byte, cc);
168}
169   
170    inline Name * makeCapture(const std::string & name, RE * captured) {
[5080]171    return new Name(nullptr, 0, name.c_str(), name.length(), Name::Type::Capture, captured);
[4823]172}
[5080]173   
174inline Name * makeReference(const std::string & name, RE * captureName) {
175    return new Name(nullptr, 0, name.c_str(), name.length(), Name::Type::Reference, captureName);
176}
[4823]177
[5091]178inline Name * makeZeroWidth(const std::string & name, RE * zerowidth = NULL) {
179    return new Name(nullptr, 0, name.c_str(), name.length(), Name::Type::ZeroWidth, zerowidth);
[5080]180}
[5091]181}
[5080]182
[3917]183#endif // RE_NAME_H
Note: See TracBrowser for help on using the repository browser.