source: proto/matchparens/parenmatch.py @ 3031

Last change on this file since 3031 was 3031, checked in by cameron, 6 years ago

More tightening of paren match prototypes

File size: 2.2 KB
Line 
1#
2# Recursive Parenthesis Matching
3#
4#
5# Robert D. Cameron
6# October 14, 2012
7#
8import sys
9import pablo
10
11class Basis_bits():     
12        bit_0 = 0
13        bit_1 = 0
14        bit_2 = 0
15        bit_3 = 0
16        bit_4 = 0
17        bit_5 = 0
18        bit_6 = 0
19        bit_7 = 0
20
21class Lex ():
22        LParen = 0
23        RParen = 0
24       
25class Matches() :
26        closed = {}
27        error = 0
28
29
30def Classify_bytes(basis_bits, lex): 
31        temp1 = (basis_bits.bit_0 | basis_bits.bit_1)
32        temp2 = (basis_bits.bit_2 &~ basis_bits.bit_3)
33        temp3 = (temp2 &~ temp1)
34        temp4 = (basis_bits.bit_4 &~ basis_bits.bit_5)
35        temp5 = (basis_bits.bit_6 | basis_bits.bit_7)
36        temp6 = (temp4 &~ temp5)
37        lex.LParen = (temp3 & temp6)
38        temp7 = (basis_bits.bit_7 &~ basis_bits.bit_6)
39        temp8 = (temp4 & temp7)
40        lex.RParen = (temp3 & temp8)
41       
42def Match_Parens(lex, matches):
43        parens = lex.LParen | lex.RParen
44        Lscan = {}
45        Rscan = {}
46        i = 0
47        Lscan[0] = pablo.AdvanceThenScanTo(lex.LParen, parens)
48        Rscan[0] = pablo.AdvanceThenScanTo(lex.RParen, parens)
49        matches.closed[0] = Lscan[0] & lex.RParen
50        matches.error = pablo.atEOF(Lscan[0])
51        unclosed = Lscan[i] & lex.LParen | Rscan[i] & lex.RParen
52        all_closed = matches.closed[i]
53        while unclosed:
54                i += 1
55                unclosedLParen = unclosed & lex.LParen
56                unclosedRParen = unclosed & lex.RParen
57                Lscan[i] = pablo.AdvanceThenScanTo(unclosedLParen, unclosed)
58                Rscan[i] = pablo.AdvanceThenScanTo(unclosedRParen, unclosed)
59                matches.closed[i] = Lscan[i] & lex.RParen
60                matches.error |= pablo.atEOF(Lscan[i])
61                unclosed = Lscan[i] & lex.LParen | Rscan[i] & lex.RParen
62                all_closed |= matches.closed[i]
63        #
64        # Any closing paren that was not actually used to close
65        # an opener is in error.
66        matches.error |= lex.RParen &~ all_closed
67
68
69
70basis_bits = Basis_bits()
71lex = Lex()
72matches = Matches()
73
74if __name__ == "__main__":
75        #print "Starting ..."
76        if len(sys.argv) > 1:
77                u8data = pablo.readfile(sys.argv[1]) 
78                pablo.EOF_mask = pablo.transpose_streams(u8data, basis_bits)
79                Classify_bytes(basis_bits, lex)
80                Match_Parens(lex, matches)
81                lgth = len(u8data)
82                print "data:" + " "*(16-5) + u8data
83                i = 0
84                while i in matches.closed.keys():
85                  f = "closed[%i]" % i
86                  print f + ("       ") + pablo.bitstream2string(matches.closed[i], lgth)
87                  i+=1
88                print "errors" + " "*(16-6) + pablo.bitstream2string(matches.error, lgth+1)
89               
90        else:
91                print("Usage: python parenmatch.py <file>")
92       
93
94
Note: See TracBrowser for help on using the repository browser.