source: proto/PDF/cb_pablo.py @ 2853

Last change on this file since 2853 was 2853, checked in by lindanl, 6 years ago

Content buffer prototype for PDF parsing

File size: 6.8 KB
RevLine 
[2853]1
2class Basis_bits():
3    bit_0 = 0
4    bit_1 = 0
5    bit_2 = 0
6    bit_3 = 0
7    bit_4 = 0
8    bit_5 = 0
9    bit_6 = 0
10    bit_7 = 0
11
12class Lex ():
13        pdf_mod_bit_1 = 0
14        pdf_mod_bit_2 = 0
15        pdf_mod_bit_3 = 0
16        pdf_mod_bit_4 = 0
17        pdf_mod_bit_5 = 0
18        pdf_mod_bit_6 = 0
19        pdf_mod_bit_7 = 0
20        LParen = 0
21        RParen = 0
22        Backslash = 0
23        Special = 0
24        Percent = 0
25        Period = 0
26        LAngle = 0
27        RAngle = 0
28        LBracket = 0
29        RBracket = 0
30        Slash = 0
31        EOL = 0
32        WS = 0
33        Digit = 0
34        Sign = 0
35        Hex = 0
36        Hash = 0
37        CR = 0
38        LF = 0
39        Oct = 0
40        Nonoct = 0
41       
42class Parity():
43        odd = 0
44        even = 0
45       
46class Escape_Callouts():
47    UELParen = 0
48    UERParen = 0
49    Oct1 = 0
50    Oct2 = 0
51    Oct3 = 0
52    Nonoct = 0
53
54
55class Out_Callouts():
56    delmask = 0
57    bit_0 = 0
58    bit_1 = 0
59    bit_2 = 0
60    bit_3 = 0
61    bit_4 = 0
62    bit_5 = 0
63    bit_6 = 0
64    bit_7 = 0
65   
66
67def Classify_bytes(basis_bits, lex):
68        temp1 = (basis_bits.bit_1 &~ basis_bits.bit_0)
69        temp2 = (basis_bits.bit_2 &~ basis_bits.bit_3)
70        temp3 = (temp1 & temp2)
71        temp4 = (basis_bits.bit_6 &~ basis_bits.bit_7)
72        temp5 = (basis_bits.bit_4 | basis_bits.bit_5)
73        temp6 = (basis_bits.bit_5 &~ basis_bits.bit_4)
74        temp7 = (temp5 &~ temp6)
75        temp8 = (basis_bits.bit_4 & basis_bits.bit_5)
76        temp9 = (temp7 &~ temp8)
77        temp10 = (temp4 &~ temp9)
78        temp11 = (temp3 & temp10)
79        temp12 = (basis_bits.bit_2 & basis_bits.bit_3)
80        temp13 = (temp1 & temp12)
81        temp14 = (temp4 &~ temp5)
82        temp15 = (temp13 & temp14)
83        temp16 = (temp11 | temp15)
84        temp17 = (basis_bits.bit_6 | basis_bits.bit_7)
85        temp18 = (temp6 &~ temp17)
86        temp19 = (temp13 & temp18)
87        lex.pdf_mod_bit_1 = (temp16 | temp19)
88        lex.pdf_mod_bit_2 = (temp16 | temp19)
89        temp20 = (temp14 | temp18)
90        lex.pdf_mod_bit_3 = (temp13 & temp20)
91        temp21 = (temp4 &~ temp7)
92        temp22 = (temp3 & temp21)
93        temp23 = (temp22 | temp15)
94        lex.pdf_mod_bit_4 = (temp23 | temp19)
95        temp24 = (temp8 & temp4)
96        temp25 = (temp3 & temp24)
97        temp26 = (temp25 | temp15)
98        lex.pdf_mod_bit_5 = (temp26 | temp19)
99        lex.pdf_mod_bit_6 = (temp22 | temp15)
100        lex.pdf_mod_bit_7 = (temp13 & temp20)
101        temp27 = (basis_bits.bit_0 | basis_bits.bit_1)
102        temp28 = (temp2 &~ temp27)
103        temp29 = (basis_bits.bit_4 &~ basis_bits.bit_5)
104        temp30 = (temp29 &~ temp17)
105        lex.LParen = (temp28 & temp30)
106        temp31 = (basis_bits.bit_7 &~ basis_bits.bit_6)
107        temp32 = (temp29 & temp31)
108        lex.RParen = (temp28 & temp32)
109        temp33 = (basis_bits.bit_3 &~ basis_bits.bit_2)
110        temp34 = (temp1 & temp33)
111        temp35 = (temp8 &~ temp17)
112        lex.Backslash = (temp34 & temp35)
113        temp36 = (temp17 &~ temp31)
114        temp37 = (temp29 &~ temp36)
115        temp38 = (temp28 & temp37)
116        temp39 = (temp12 &~ temp27)
117        temp40 = (temp39 & temp35)
118        temp41 = (temp38 | temp40)
119        temp42 = (temp39 & temp24)
120        temp43 = (temp41 | temp42)
121        temp44 = (basis_bits.bit_6 & basis_bits.bit_7)
122        temp45 = (temp29 & temp44)
123        temp46 = (temp34 & temp45)
124        temp47 = (temp43 | temp46)
125        temp48 = (temp8 & temp31)
126        temp49 = (temp34 & temp48)
127        temp50 = (temp47 | temp49)
128        temp51 = (temp13 & temp45)
129        temp52 = (temp50 | temp51)
130        temp53 = (temp13 & temp48)
131        temp54 = (temp52 | temp53)
132        temp55 = (temp6 & temp31)
133        temp56 = (temp28 & temp55)
134        temp57 = (temp54 | temp56)
135        temp58 = (temp8 & temp44)
136        temp59 = (temp28 & temp58)
137        lex.Special = (temp57 | temp59)
138        lex.Percent = (temp28 & temp55)
139        lex.Period = (temp28 & temp24)
140        lex.LAngle = (temp39 & temp35)
141        lex.RAngle = (temp39 & temp24)
142        lex.LBracket = (temp34 & temp45)
143        lex.RBracket = (temp34 & temp48)
144        lex.Slash = (temp28 & temp58)
145        temp60 = (basis_bits.bit_2 | basis_bits.bit_3)
146        temp61 = (temp27 | temp60)
147        temp62 = (temp29 & temp4)
148        temp63 = (temp48 | temp62)
149        lex.EOL = (temp63 &~ temp61)
150        temp64 = (temp5 | temp17)
151        temp65 = (temp61 | temp64)
152        temp66 = (temp35 &~ temp61)
153        temp67 = (temp65 &~ temp66)
154        temp68 = (temp48 &~ temp61)
155        temp69 = (temp67 &~ temp68)
156        temp70 = (temp62 &~ temp61)
157        temp71 = (temp69 &~ temp70)
158        temp72 = (temp32 &~ temp61)
159        temp73 = (temp71 &~ temp72)
160        temp74 = (temp28 &~ temp64)
161        temp75 = (temp73 &~ temp74)
162        lex.WS = (~temp75)
163        temp76 = (basis_bits.bit_5 | basis_bits.bit_6)
164        temp77 = (basis_bits.bit_4 & temp76)
165        lex.Digit = (temp39 &~ temp77)
166        temp78 = (temp48 | temp45)
167        lex.Sign = (temp28 & temp78)
168        temp79 = (temp1 &~ temp60)
169        temp80 = (temp79 &~ basis_bits.bit_4)
170        temp81 = (~temp44)
171        temp82 = ((basis_bits.bit_5 & temp81)|(~(basis_bits.bit_5) & temp17))
172        temp83 = (temp80 & temp82)
173        temp84 = (lex.Digit | temp83)
174        temp85 = (temp3 &~ basis_bits.bit_4)
175        temp86 = (temp85 & temp82)
176        lex.Hex = (temp84 | temp86)
177        temp87 = (temp44 &~ temp5)
178        lex.Hash = (temp28 & temp87)
179        lex.CR = (temp48 &~ temp61)
180        lex.LF = (temp62 &~ temp61)
181        lex.Oct = (temp39 &~ basis_bits.bit_4)
182        lex.Nonoct = (temp16 | temp19)
183
184       
185def Parse_Escaped(lex, parity, escape_Callouts, out_Callouts):
186
187        odd = parity.odd
188        even = parity.even
189
190        start = lex.Backslash &~ pablo.Advance(lex.Backslash)
191       
192        even_start = start & even       
193        even_final = pablo.ScanThru(even_start, lex.Backslash) 
194        escape = even_final & odd
195        escape_char = even & pablo.SpanUpTo(even_start, even_final)
196       
197        odd_start = start & odd
198        odd_final = pablo.ScanThru(odd_start, lex.Backslash)
199        escape = escape | (odd_final & even)
200        escape_char |= (odd & pablo.SpanUpTo(odd_start, odd_final))
201
202        escape_Callouts.UELParen = lex.LParen &~ escape
203        escape_Callouts.UERParen = lex.RParen &~ escape
204        escape_Callouts.Nonoct = lex.Nonoct & escape   
205        #escape_Callouts.Oct1 = lex.Oct & escape
206        #escape_Callouts.Oct2 = lex.Oct & pablo.Advance(escape_Callouts.Oct1)
207        #escape_Callouts.Oct3 = lex.Oct & pablo.Advance(escape_Callouts.Oct2)
208        out_Callouts.delmask = escape_char
209
210def Prepare_content_buffer(basis_bits, lex, escape_Callouts, out_Callouts):
211
212    out_Callouts.bit_1 = basis_bits.bit_1 ^ ( lex.pdf_mod_bit_1 & escape_Callouts.Nonoct)
213    out_Callouts.bit_2 = basis_bits.bit_2 ^ ( lex.pdf_mod_bit_2 & escape_Callouts.Nonoct)
214    out_Callouts.bit_3 = basis_bits.bit_3 ^ ( lex.pdf_mod_bit_3 & escape_Callouts.Nonoct)
215    out_Callouts.bit_4 = basis_bits.bit_4 ^ ( lex.pdf_mod_bit_4 & escape_Callouts.Nonoct)
216    out_Callouts.bit_5 = basis_bits.bit_5 ^ ( lex.pdf_mod_bit_5 & escape_Callouts.Nonoct)
217    out_Callouts.bit_6 = basis_bits.bit_6 ^ ( lex.pdf_mod_bit_6 & escape_Callouts.Nonoct)
218    out_Callouts.bit_7 = basis_bits.bit_7 ^ ( lex.pdf_mod_bit_7 & escape_Callouts.Nonoct)
219
220    out_Callouts.bit_0 = out_Callouts.bit_0 &~ out_Callouts.delmask
221    out_Callouts.bit_1 = out_Callouts.bit_1 &~ out_Callouts.delmask
222    out_Callouts.bit_2 = out_Callouts.bit_2 &~ out_Callouts.delmask
223    out_Callouts.bit_3 = out_Callouts.bit_3 &~ out_Callouts.delmask
224    out_Callouts.bit_4 = out_Callouts.bit_4 &~ out_Callouts.delmask
225    out_Callouts.bit_5 = out_Callouts.bit_5 &~ out_Callouts.delmask
226    out_Callouts.bit_6 = out_Callouts.bit_6 &~ out_Callouts.delmask
227    out_Callouts.bit_7 = out_Callouts.bit_7 &~ out_Callouts.delmask
228
229
230def Main(basis_bits, lex, escape_Callouts, out_Callouts):
231
232        Classify_bytes(basis_bits, lex)
233
234        Parse_Escaped(lex, parity, escape_Callouts, out_Callouts)
235
236        Prepare_content_buffer(basis_bits, lex, escape_Callouts, out_Callouts)
237
238
239
Note: See TracBrowser for help on using the repository browser.