source: icGREP/icgrep-devel/icgrep/re/printer_re.cpp @ 5810

Last change on this file since 5810 was 5786, checked in by cameron, 22 months ago

Decouple Unicode property support from re_compiler; initial support for (?-m) flag

File size: 4.6 KB
RevLine 
[3850]1/*
2 *  Copyright (c) 2014 International Characters.
3 *  This software is licensed to the public under the Open Software License 3.0.
4 *  icgrep is a trademark of International Characters.
5 */
6
7#include "printer_re.h"
8
[4187]9//Regular Expressions
[4255]10#include <re/re_re.h>
11#include <re/re_alt.h>
12#include <re/re_any.h>
13#include <re/re_cc.h>
14#include <re/re_name.h>
15#include <re/re_end.h>
16#include <re/re_rep.h>
17#include <re/re_seq.h>
18#include <re/re_start.h>
[5765]19#include <re/re_range.h>
[4255]20#include <re/re_diff.h>
[4298]21#include <re/re_intersect.h>
[4405]22#include <re/re_assertion.h>
[5765]23#include <re/re_group.h>
[3850]24
[4194]25using namespace re;
[5267]26using namespace llvm;
[4187]27
[5267]28const std::string Printer_RE::PrintRE(const RE * re) {
[3850]29    std::string retVal = "";
30
[4182]31    if (re == nullptr) {
[4255]32        retVal = "<NULL>";
[5267]33    } else if (const Alt* re_alt = dyn_cast<const Alt>(re)) {
[3850]34        retVal += "(Alt[";
[4187]35        bool comma = false;
36        for (const RE * re : *re_alt) {
37            if (comma) {
38                retVal += ',';
39            }
40            retVal += PrintRE(re);
41            comma = true;
[3850]42        }
43        retVal += "])";
[5267]44    } else if (const CC* re_cc = dyn_cast<const CC>(re)) {
[4187]45        retVal = "CC \"";
[5781]46        retVal += re_cc->canonicalName(CC_type::UnicodeClass);
[3850]47        retVal += "\" ";
48
[4614]49        for (const auto & i : *re_cc) {
[3850]50            retVal += "[";
[5765]51            retVal += std::to_string(lo_codepoint(i));
52            if (hi_codepoint(i) != lo_codepoint(i))
53                retVal += "-" + std::to_string(hi_codepoint(i));
[3850]54            retVal += "]";
55        }
[5267]56    } else if (const Name* re_name = dyn_cast<const Name>(re)) {
[4187]57        retVal = "Name \"";
[5663]58        if (re_name->hasNamespace()) {
59            retVal += re_name->getNamespace();
60            retVal += ":";
61        }
[3914]62        retVal += re_name->getName();
63        retVal += "\" ";
[5786]64        if (re_name->getType() == Name::Type::Capture) {
[5430]65            retVal += "=(" + PrintRE(re_name->getDefinition()) + ")";
[5786]66        }
[5765]67    } else if (const Range* rg = dyn_cast<const Range>(re)) {
68        retVal = "Range (";
69        retVal += PrintRE(rg->getLo());
70        retVal += " , ";
71        retVal += PrintRE(rg->getHi());
72        retVal += ") ";
[5267]73    } else if (const Assertion * a = dyn_cast<const Assertion>(re)) {
[4405]74        retVal = (a->getSense() == Assertion::Sense::Positive) ? "" : "Negative";
[5308]75        switch (a->getKind()) {
76            case Assertion::Kind::Lookahead:
77                retVal += "Lookahead";
78                break;
79            case Assertion::Kind::Lookbehind:
80                retVal += "Lookbehind";
81                break;
82            case Assertion::Kind::Boundary:
83                retVal += "Boundary";
84                break;
85        }
[4405]86        retVal += "Assertion(";
87        retVal += PrintRE(a->getAsserted());
88        retVal += ") ";
[5267]89    } else if (const Diff* diff = dyn_cast<const Diff>(re)) {
[4255]90        retVal = "Diff (";
91        retVal += PrintRE(diff->getLH());
92        retVal += " , ";
93        retVal += PrintRE(diff->getRH());
94        retVal += ") ";
[5267]95    } else if (const Intersect* x = dyn_cast<const Intersect>(re)) {
[4298]96        retVal = "Intersect (";
97        retVal += PrintRE(x->getLH());
98        retVal += " , ";
99        retVal += PrintRE(x->getRH());
100        retVal += ") ";
[5267]101    } else if (isa<const End>(re)) {
[4187]102        retVal = "End";
[5267]103    } else if (const Rep* re_rep = dyn_cast<const Rep>(re)) {
[4187]104        retVal = "Rep(";
105        retVal.append(PrintRE(re_rep->getRE()));
106        retVal.append(",");
107        retVal.append(std::to_string(re_rep->getLB()));
108        retVal.append(",");
109        if (re_rep->getUB() == Rep::UNBOUNDED_REP) {
110            retVal.append("Unbounded");
111        }
112        else {
[4405]113            retVal.append(std::to_string(re_rep->getUB()));
[4187]114        }
115        retVal.append(")");
[5267]116    } else if (const Seq* re_seq = dyn_cast<const Seq>(re)) {
[4187]117        retVal = "(Seq[";
118        bool comma = false;
119        for (const RE * re : *re_seq) {
120            if (comma) {
121                retVal.append(",");
122            }
123            retVal.append(PrintRE(re));
124            comma = true;
[3850]125        }
[4187]126        retVal.append("])");
[5765]127    } else if (const Group * g = dyn_cast<const Group>(re)) {
128        retVal = "Group(";
129        if (g->getMode() == Group::Mode::GraphemeMode) {
130            retVal.append((g->getSense() == Group::Sense::On) ? "+g:" : "-g:");
131        }
132        else if (g->getMode() == Group::Mode::CaseInsensitiveMode) {
133            retVal.append((g->getSense() == Group::Sense::On) ? "+i:" : "-i:");
134        }
135        retVal.append(PrintRE(g->getRE()));
136        retVal.append(")");
[5267]137    } else if (isa<const Start>(re)) {
[4187]138        retVal = "Start";
[5267]139    } else if (isa<const Any>(re)) {
[4245]140        retVal = "Any";
[5267]141    } else {
[4255]142        retVal = "???";
[3850]143    }
[5037]144    return retVal;
[3850]145}
Note: See TracBrowser for help on using the repository browser.