source: icGREP/icgrep-devel/icgrep/re/printer_re.cpp @ 5033

Last change on this file since 5033 was 4841, checked in by nmedfort, 4 years ago

Update for grapheme cluster mode and boundaries.

File size: 4.2 KB
Line 
1/*
2 *  Copyright (c) 2014 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "printer_re.h"
8
9//Regular Expressions
10#include <re/re_re.h>
11#include <re/re_alt.h>
12#include <re/re_any.h>
13#include <re/re_cc.h>
14#include <re/re_name.h>
15#include <re/re_end.h>
16#include <re/re_rep.h>
17#include <re/re_seq.h>
18#include <re/re_start.h>
19#include <re/re_diff.h>
20#include <re/re_intersect.h>
21#include <re/re_assertion.h>
22#include <re/re_grapheme_boundary.hpp>
23
24using namespace re;
25
26const std::string Printer_RE::PrintRE(const RE * re)
27{
28    std::string retVal = "";
29
30    if (re == nullptr) {
31        retVal = "<NULL>";
32    }
33    else if (const Alt* re_alt = dyn_cast<const Alt>(re))
34    {
35        retVal += "(Alt[";
36        bool comma = false;
37        for (const RE * re : *re_alt) {
38            if (comma) {
39                retVal += ',';
40            }
41            retVal += PrintRE(re);
42            comma = true;
43        }
44        retVal += "])";
45    }
46    else if (const CC* re_cc = dyn_cast<const CC>(re))
47    {
48        retVal = "CC \"";
49        retVal += re_cc->canonicalName(UnicodeClass);
50        retVal += "\" ";
51
52        for (const auto & i : *re_cc) {
53            retVal += "[";
54            retVal += std::to_string(lo_codepoint(i)) + ",";
55            retVal += std::to_string(hi_codepoint(i));
56            retVal += "]";
57        }
58    }
59    else if (const Name* re_name = dyn_cast<const Name>(re))
60    {
61        retVal = "Name \"";
62        retVal += re_name->getName();
63        retVal += "\" ";
64    }
65    else if (const Assertion * a = dyn_cast<const Assertion>(re)) {
66        retVal = (a->getSense() == Assertion::Sense::Positive) ? "" : "Negative";
67        retVal += (a->getKind() == Assertion::Kind::Lookahead) ? "Lookahead" : "Lookbehind";
68        retVal += "Assertion(";
69        retVal += PrintRE(a->getAsserted());
70        retVal += ") ";
71    }
72    else if (const Diff* diff = dyn_cast<const Diff>(re))
73    {
74        retVal = "Diff (";
75        retVal += PrintRE(diff->getLH());
76        retVal += " , ";
77        retVal += PrintRE(diff->getRH());
78        retVal += ") ";
79    }
80    else if (const Intersect* x = dyn_cast<const Intersect>(re))
81    {
82        retVal = "Intersect (";
83        retVal += PrintRE(x->getLH());
84        retVal += " , ";
85        retVal += PrintRE(x->getRH());
86        retVal += ") ";
87    }
88    else if (const GraphemeBoundary * g = dyn_cast<GraphemeBoundary>(re)) {
89        retVal = "Grapheme";
90        switch (g->getType()) {
91            case GraphemeBoundary::Type::ClusterBoundary:
92                retVal += "Cluster"; break;
93            case GraphemeBoundary::Type::LineBreakBoundary:
94                retVal += "LineBreak"; break;
95            case GraphemeBoundary::Type::SentenceBoundary:
96                retVal += "Sentence"; break;
97            case GraphemeBoundary::Type::WordBoundary:
98                retVal += "Word"; break;
99        }
100        retVal += "Boundary(";
101        if (g->getExpression()) {
102            retVal += PrintRE(g->getExpression());
103        }
104        retVal += ")";
105    }
106    else if (isa<const End>(re))
107    {
108        retVal = "End";
109    }
110    else if (const Rep* re_rep = dyn_cast<const Rep>(re))
111    {
112        retVal = "Rep(";
113        retVal.append(PrintRE(re_rep->getRE()));
114        retVal.append(",");
115        retVal.append(std::to_string(re_rep->getLB()));
116        retVal.append(",");
117        if (re_rep->getUB() == Rep::UNBOUNDED_REP) {
118            retVal.append("Unbounded");
119        }
120        else {
121            retVal.append(std::to_string(re_rep->getUB()));
122        }
123        retVal.append(")");
124    }
125    else if (const Seq* re_seq = dyn_cast<const Seq>(re))
126    {
127        retVal = "(Seq[";
128        bool comma = false;
129        for (const RE * re : *re_seq) {
130            if (comma) {
131                retVal.append(",");
132            }
133            retVal.append(PrintRE(re));
134            comma = true;
135        }
136        retVal.append("])");
137    }
138    else if (isa<const Start>(re))
139    {
140        retVal = "Start";
141    }
142    else if (isa<const Any>(re))
143    {
144        retVal = "Any";
145    }
146    else
147    {
148        retVal = "???";
149    }
150    return std::move(retVal);
151}
Note: See TracBrowser for help on using the repository browser.