source: icGREP/icgrep-devel/icgrep/re/printer_re.cpp @ 5786

Last change on this file since 5786 was 5786, checked in by cameron, 15 months ago

Decouple Unicode property support from re_compiler; initial support for (?-m) flag

File size: 4.6 KB
Line 
1/*
2 *  Copyright (c) 2014 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "printer_re.h"
8
9//Regular Expressions
10#include <re/re_re.h>
11#include <re/re_alt.h>
12#include <re/re_any.h>
13#include <re/re_cc.h>
14#include <re/re_name.h>
15#include <re/re_end.h>
16#include <re/re_rep.h>
17#include <re/re_seq.h>
18#include <re/re_start.h>
19#include <re/re_range.h>
20#include <re/re_diff.h>
21#include <re/re_intersect.h>
22#include <re/re_assertion.h>
23#include <re/re_group.h>
24
25using namespace re;
26using namespace llvm;
27
28const std::string Printer_RE::PrintRE(const RE * re) {
29    std::string retVal = "";
30
31    if (re == nullptr) {
32        retVal = "<NULL>";
33    } else if (const Alt* re_alt = dyn_cast<const Alt>(re)) {
34        retVal += "(Alt[";
35        bool comma = false;
36        for (const RE * re : *re_alt) {
37            if (comma) {
38                retVal += ',';
39            }
40            retVal += PrintRE(re);
41            comma = true;
42        }
43        retVal += "])";
44    } else if (const CC* re_cc = dyn_cast<const CC>(re)) {
45        retVal = "CC \"";
46        retVal += re_cc->canonicalName(CC_type::UnicodeClass);
47        retVal += "\" ";
48
49        for (const auto & i : *re_cc) {
50            retVal += "[";
51            retVal += std::to_string(lo_codepoint(i));
52            if (hi_codepoint(i) != lo_codepoint(i))
53                retVal += "-" + std::to_string(hi_codepoint(i));
54            retVal += "]";
55        }
56    } else if (const Name* re_name = dyn_cast<const Name>(re)) {
57        retVal = "Name \"";
58        if (re_name->hasNamespace()) {
59            retVal += re_name->getNamespace();
60            retVal += ":";
61        }
62        retVal += re_name->getName();
63        retVal += "\" ";
64        if (re_name->getType() == Name::Type::Capture) {
65            retVal += "=(" + PrintRE(re_name->getDefinition()) + ")";
66        }
67    } else if (const Range* rg = dyn_cast<const Range>(re)) {
68        retVal = "Range (";
69        retVal += PrintRE(rg->getLo());
70        retVal += " , ";
71        retVal += PrintRE(rg->getHi());
72        retVal += ") ";
73    } else if (const Assertion * a = dyn_cast<const Assertion>(re)) {
74        retVal = (a->getSense() == Assertion::Sense::Positive) ? "" : "Negative";
75        switch (a->getKind()) {
76            case Assertion::Kind::Lookahead:
77                retVal += "Lookahead";
78                break;
79            case Assertion::Kind::Lookbehind:
80                retVal += "Lookbehind";
81                break;
82            case Assertion::Kind::Boundary:
83                retVal += "Boundary";
84                break;
85        }
86        retVal += "Assertion(";
87        retVal += PrintRE(a->getAsserted());
88        retVal += ") ";
89    } else if (const Diff* diff = dyn_cast<const Diff>(re)) {
90        retVal = "Diff (";
91        retVal += PrintRE(diff->getLH());
92        retVal += " , ";
93        retVal += PrintRE(diff->getRH());
94        retVal += ") ";
95    } else if (const Intersect* x = dyn_cast<const Intersect>(re)) {
96        retVal = "Intersect (";
97        retVal += PrintRE(x->getLH());
98        retVal += " , ";
99        retVal += PrintRE(x->getRH());
100        retVal += ") ";
101    } else if (isa<const End>(re)) {
102        retVal = "End";
103    } else if (const Rep* re_rep = dyn_cast<const Rep>(re)) {
104        retVal = "Rep(";
105        retVal.append(PrintRE(re_rep->getRE()));
106        retVal.append(",");
107        retVal.append(std::to_string(re_rep->getLB()));
108        retVal.append(",");
109        if (re_rep->getUB() == Rep::UNBOUNDED_REP) {
110            retVal.append("Unbounded");
111        }
112        else {
113            retVal.append(std::to_string(re_rep->getUB()));
114        }
115        retVal.append(")");
116    } else if (const Seq* re_seq = dyn_cast<const Seq>(re)) {
117        retVal = "(Seq[";
118        bool comma = false;
119        for (const RE * re : *re_seq) {
120            if (comma) {
121                retVal.append(",");
122            }
123            retVal.append(PrintRE(re));
124            comma = true;
125        }
126        retVal.append("])");
127    } else if (const Group * g = dyn_cast<const Group>(re)) {
128        retVal = "Group(";
129        if (g->getMode() == Group::Mode::GraphemeMode) {
130            retVal.append((g->getSense() == Group::Sense::On) ? "+g:" : "-g:");
131        }
132        else if (g->getMode() == Group::Mode::CaseInsensitiveMode) {
133            retVal.append((g->getSense() == Group::Sense::On) ? "+i:" : "-i:");
134        }
135        retVal.append(PrintRE(g->getRE()));
136        retVal.append(")");
137    } else if (isa<const Start>(re)) {
138        retVal = "Start";
139    } else if (isa<const Any>(re)) {
140        retVal = "Any";
141    } else {
142        retVal = "???";
143    }
144    return retVal;
145}
Note: See TracBrowser for help on using the repository browser.