source: icGREP/icgrep-devel/icgrep/re/re_nullable.cpp @ 5147

Last change on this file since 5147 was 5147, checked in by xuedongx, 3 years ago

remove nullable assertion

File size: 7.7 KB
Line 
1#include "re_nullable.h"
2#include <re/re_cc.h>
3#include <re/re_start.h>
4#include <re/re_end.h>
5#include <re/re_alt.h>
6#include <re/re_rep.h>
7#include <re/re_any.h>
8#include <re/re_diff.h>
9#include <re/re_intersect.h>
10#include <re/re_assertion.h>
11#include <re/re_name.h>
12
13/*
14
15 A regular expression is nullable if it (a) matches the empty
16 string, and (b) applies everywhere.  Note that Start (^) and
17 End ($) match the empty string, but not everywhere).
18
19*/
20
21namespace re {
22
23RE * RE_Nullable::removeNullablePrefix(RE * re) {
24    if (Seq * seq = dyn_cast<Seq>(re)) {
25        std::vector<RE*> list;
26        for (auto i = seq->begin(); i != seq->end(); ++i) {
27            if (!isNullable(*i)) {
28                list.push_back(removeNullablePrefix(*i));
29                std::copy(++i, seq->end(), std::back_inserter(list));
30                break;
31            }
32        }
33        re = makeSeq(list.begin(), list.end());
34    } else if (Alt * alt = dyn_cast<Alt>(re)) {
35        std::vector<RE*> list;
36        for (auto i = alt->begin(); i != alt->end(); ++i) {
37            list.push_back(removeNullablePrefix(*i));
38        }
39        re = makeAlt(list.begin(), list.end());
40    } else if (Rep * rep = dyn_cast<Rep>(re)) {
41        if ((rep->getLB() == 0) || (isNullable(rep->getRE()))) {
42            re = makeSeq();
43        }
44        else if (hasNullablePrefix(rep->getRE())) {
45            re = makeSeq({removeNullablePrefix(rep->getRE()), makeRep(rep->getRE(), rep->getLB() - 1, rep->getLB() - 1)});
46        }
47        else {
48            re = makeRep(rep->getRE(), rep->getLB(), rep->getLB());
49        }
50    } else if (Name * name = dyn_cast<Name>(re)) {
51        if (name->getDefinition()) {
52            name->setDefinition(removeNullablePrefix(name->getDefinition()));
53        }
54    }
55    return re;
56}
57
58RE * RE_Nullable::removeNullableSuffix(RE * re) {
59    if (Seq * seq = dyn_cast<Seq>(re)) {
60        std::vector<RE*> list;
61        for (auto i = seq->rbegin(); i != seq->rend(); ++i) {
62            if (!isNullable(*i)) {
63                std::copy(seq->begin(), (i + 1).base(), std::back_inserter(list));
64                list.push_back(removeNullableSuffix(*i));
65                break;
66            }
67        }
68        re = makeSeq(list.begin(), list.end());
69    } else if (Alt* alt = dyn_cast<Alt>(re)) {
70        std::vector<RE*> list;
71        for (auto i = alt->begin(); i != alt->end(); ++i) {
72            list.push_back(removeNullableSuffix(*i));
73        }
74        re = makeAlt(list.begin(), list.end());
75    } else if (Rep * rep = dyn_cast<Rep>(re)) {
76        if ((rep->getLB() == 0) || (isNullable(rep->getRE()))) {
77            re = makeSeq();
78        }
79        else if (hasNullableSuffix(rep->getRE())) {
80            re = makeSeq({makeRep(rep->getRE(), rep->getLB() - 1, rep->getLB() - 1), removeNullableSuffix(rep->getRE())});
81        }
82        else {
83            re = makeRep(rep->getRE(), rep->getLB(), rep->getLB());
84        }
85    } else if (Name * name = dyn_cast<Name>(re)) {
86        if (name->getDefinition()) {
87            name->setDefinition(removeNullableSuffix(name->getDefinition()));
88        }
89    }
90    return re;
91}
92
93// Deal with case: R1 (Assertion R2) R3
94// If R2 is nullable, then R1 R3.
95RE * RE_Nullable::removeNullableAssertion(RE * re) {
96    if (Assertion * a = dyn_cast<Assertion>(re)) {
97        if (isNullable(a->getAsserted())) {
98            std::vector<RE *> seq;
99            return makeSeq(seq.begin(), seq.end());
100        } else {
101            return re;
102        }
103    } else if (Seq * seq = dyn_cast<Seq>(re)) {
104        std::vector<RE*> list;
105        for (auto i = seq->begin(); i != seq->end(); ++i) {
106            list.push_back(removeNullableAssertion(*i));
107        }
108        re = makeSeq(list.begin(), list.end());
109    } else if (Alt * alt = dyn_cast<Alt>(re)) {
110        std::vector<RE*> list;
111        for (auto i = alt->begin(); i != alt->end(); ++i) {
112            list.push_back(removeNullableAssertion(*i));
113        }
114        re = makeAlt(list.begin(), list.end());
115    } 
116    return re;
117}
118
119// Deal with case: R1 (Assertion R2) R3
120// If R3 is nullable, then R1 R2.
121RE * RE_Nullable::removeNullableAfterAssertion(RE * re) {
122    if (isNullableAfterAssertion(re)) {
123        re = removeNullableAfterAssertion_helper(re);
124    }
125    return re;
126}
127
128bool RE_Nullable::isNullableAfterAssertion(const RE * re) {
129    bool nullable = false;
130    if (const Seq * seq = dyn_cast<const Seq>(re)) {
131        nullable = isa<Assertion>(seq->back()) ? true : isNullableAfterAssertion(seq->back());
132    } else if (const Alt * alt = dyn_cast<const Alt>(re)) {
133        for (const RE * re : *alt) {
134            if (isNullableAfterAssertion(re)) {
135                nullable = true;
136                break;
137            }
138        }
139    }   
140    return nullable;
141}
142
143RE * RE_Nullable::removeNullableAfterAssertion_helper(RE * re) {
144    if (Assertion * a = dyn_cast<Assertion>(re)) {
145        if (a->getSense() == Assertion::Sense::Positive) {
146            return a->getAsserted();
147        } else {
148            return makeDiff(makeAny(), a->getAsserted());
149        }
150    } else if (Seq * seq = dyn_cast<Seq>(re)) {
151        std::vector<RE*> list;
152        auto i = seq->begin();
153        for (; i != seq->end() - 1; ++i) {
154            list.push_back(*i);
155        }
156        list.push_back(removeNullableAfterAssertion_helper(*i));
157        re = makeSeq(list.begin(), list.end());
158    } else if (Alt * alt = dyn_cast<Alt>(re)) {
159        std::vector<RE*> list;
160        for (auto i = alt->begin(); i != alt->end(); ++i) {
161            list.push_back(removeNullableAfterAssertion_helper(*i));
162        }
163        re = makeAlt(list.begin(), list.end());
164    } 
165    return re;
166}
167
168bool RE_Nullable::isNullable(const RE * re) {
169    if (const Seq * re_seq = dyn_cast<const Seq>(re)) {
170        for (const RE * re : *re_seq) {
171            if (!isNullable(re)) {
172                return false;
173            }
174        }
175        return true;
176    } else if (const Alt * re_alt = dyn_cast<const Alt>(re)) {
177        for (const RE * re : *re_alt) {
178            if (isNullable(re)) {
179                return true;
180            }
181        }
182    } else if (const Rep* re_rep = dyn_cast<const Rep>(re)) {
183        return re_rep->getLB() == 0 ? true : isNullable(re_rep->getRE());
184    } else if (const Diff * diff = dyn_cast<const Diff>(re)) {
185        return isNullable(diff->getLH()) && !isNullable(diff->getRH());
186    } else if (const Intersect * e = dyn_cast<const Intersect>(re)) {
187        return isNullable(e->getLH()) && isNullable(e->getRH());
188    } 
189    return false;
190}
191
192bool RE_Nullable::hasNullablePrefix(const RE * re) {
193    bool nullable = false;
194    if (const Seq * seq = dyn_cast<const Seq>(re)) {
195        nullable = isNullable(seq->front()) ? true : hasNullablePrefix(seq->front());
196    } else if (const Alt * alt = dyn_cast<const Alt>(re)) {
197        for (const RE * re : *alt) {
198            if (hasNullablePrefix(re)) {
199                nullable = true;
200                break;
201            }
202        }
203    } else if (const Rep * rep = dyn_cast<const Rep>(re)) {
204        nullable = true;
205        if (rep->getLB() == rep->getUB()) {
206            nullable = hasNullablePrefix(rep->getRE());
207        }
208    }
209    return nullable;
210}
211
212bool RE_Nullable::hasNullableSuffix(const RE * re) {
213    bool nullable = false;
214    if (const Seq * seq = dyn_cast<const Seq>(re)) {
215        nullable = isNullable(seq->back()) ? true : hasNullableSuffix(seq->back());
216    } else if (const Alt * alt = dyn_cast<const Alt>(re)) {
217        for (const RE * re : *alt) {
218            if (hasNullableSuffix(re)) {
219                nullable = true;
220                break;
221            }
222        }
223    } else if (const Rep * rep = dyn_cast<const Rep>(re)) {
224        nullable = true;
225        if (rep->getLB() == rep->getUB()) {
226            nullable = hasNullableSuffix(rep->getRE());
227        }
228    }
229    return nullable;
230}
231
232}
Note: See TracBrowser for help on using the repository browser.