source: icGREP/icgrep-devel/icgrep/re/re_seq.h @ 6138

Last change on this file since 6138 was 6138, checked in by cameron, 11 months ago

Unicode decomposition, casefolding: initial check-in

File size: 1.8 KB
Line 
1/*
2 *  Copyright (c) 2014 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#ifndef RE_SEQ_H
8#define RE_SEQ_H
9
10#include <string>
11#include <re/re_cc.h>
12#include <re/re_re.h>
13#include <UCD/unicode_set.h>
14#include <llvm/Support/Casting.h>
15
16namespace re {
17
18class Seq : public Vector {
19public:
20    static inline bool classof(const RE * re) {
21        return re->getClassTypeId() == ClassTypeId::Seq;
22    }
23    static inline bool classof(const void *) {
24        return false;
25    }
26    virtual ~Seq() {}
27protected:
28    friend Seq * makeSeq();
29    template<typename iterator> friend RE * makeSeq(const iterator, const iterator);
30    Seq()
31    : Vector(ClassTypeId::Seq) {
32
33    }
34    Seq(iterator begin, iterator end)
35    : Vector(ClassTypeId::Seq, begin, end) {
36
37    }
38};
39
40inline Seq * makeSeq() {
41    return new Seq();
42}
43
44template<typename iterator>
45inline RE * makeSeq(const iterator begin, const iterator end) {
46    Seq * seq = makeSeq();
47    for (auto i = begin; i != end; ++i) {
48        RE * const item = *i;
49        if (LLVM_UNLIKELY(llvm::isa<Seq>(item))) {
50            for (RE * const innerItem : *llvm::cast<Seq>(item)) {
51                seq->push_back(innerItem);
52            }
53        } else {
54            seq->push_back(item);
55        }
56    }
57    if (seq->size() == 1) {
58        return seq->front();
59    }
60    return seq;
61}
62
63inline RE * makeSeq(RE::InitializerList list) {
64    return makeSeq(list.begin(), list.end());
65}
66
67inline bool isEmptySeq(RE * s) {
68    return llvm::isa<Seq>(s) && llvm::cast<Seq>(s)->empty();
69}
70   
71inline RE * u32string2re(std::u32string s) {
72    std::vector<RE *> ccs;
73    for (auto c : s) {
74        ccs.push_back(makeCC(UCD::UnicodeSet(c)));
75    }
76    return makeSeq(ccs.begin(), ccs.end());
77}
78   
79}
80
81#endif // RE_SEQ_H
82
83
84
85
Note: See TracBrowser for help on using the repository browser.