source: proto/RE/performance/perf.py @ 3461

Last change on this file since 3461 was 3461, checked in by cameron, 6 years ago

Add escaping of quotes in pattern, some additional cases.

File size: 11.1 KB
Line 
1from subprocess import call, Popen
2from collections import *
3import csv
4import StringIO
5import os.path
6import sys
7import shutil
8
9
10def execute(execution):
11        if not os.path.exists(execution.file.file+'.11'):
12                file = open(execution.file.file,'r')
13                contents = file.read()
14                file.close()
15                file11 = open(execution.file.file+'.11','w')
16                for i in range(11):
17                        file11.write(contents)
18                file11.close
19        if not os.path.exists(execution.file.file+'.5'):
20                file = open(execution.file.file,'r')
21                contents = file.read()
22                file.close()
23                file5 = open(execution.file.file+'.5','w')
24                for i in range(5):
25                        file5.write(contents)
26                file5.close
27
28        #quick version
29        outputpath = 'output/'+execution.file.description+'/'+execution.expression.description+'/'+execution.program
30        if not os.path.exists(outputpath):
31                os.makedirs(outputpath)
32        one=execute_one(execution,1)
33        results_file = open(outputpath+'/'+execution.stat,'w')
34        results_file.write(str(one))
35        results_file.close()
36        return one,one,one,one
37
38        #slower version
39        #execute_one(execution,1)
40        #one=execute_one(execution,10)
41        #execution5=Execution(execution.stat, execution.program, File(execution.file.file+'.5',execution.file.description+'.5',execution.file.types), execution.expression)
42        #execute_one(execution5,1)
43        #five=execute_one(execution5,10)
44        #execution11=Execution(execution.stat, execution.program, File(execution.file.file+'.11',execution.file.description+'.11',execution.file.types), execution.expression)
45        #execute_one(execution11,1)
46        #eleven=execute_one(execution11,10)
47        #return (eleven-one)/10,one,five/5,eleven/11
48
49
50def escape_quotes(e):  return e.replace("'", "'\\''")
51
52
53def execute_one(execution, count):
54        outputpath = 'output/'+execution.file.description+'/'+execution.expression.description+'/'+execution.program
55        log_file = open('perflog.txt', 'a')
56        log_file.write('\nEXECUTION: '+execution.file.description+' '+ execution.expression.description+' '+ execution.program+' '+ execution.stat+'\n')
57        log_file.close()
58        redirectoutput= ' 2>&1 | tee '+outputpath+'/output.txt >> perflog.txt'
59        if execution.program=='bitstreams':             
60                re_home = '../'
61                re_input_file = open(re_home+'input/test/test1.re', 'w')
62                re_input_file.write(execution.expression.expression+'\n')
63                re_input_file.close()
64                call('make -C '+re_home + redirectoutput,shell=True)
65                call('make -C '+re_home+'output/' + redirectoutput,shell=True)
66                call('make -C '+re_home+'output/src/' + redirectoutput,shell=True)
67                shutil.copyfile(re_home+'output/re_pablo_cc.py', outputpath+'/re_pablo_cc.py')
68                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+re_home+'output/src/re -c '+ execution.file.file + redirectoutput]
69                p = Popen(cmd,shell=True)
70                p.wait()
71        if execution.program=='grep':
72                escaped_e = escape_quotes(execution.expression.expression)
73                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' grep -c -E \'' + escaped_e + '\' '+ execution.file.file + redirectoutput]
74                p = Popen(cmd,shell=True)
75                p.wait()
76        if execution.program=='nrgrep112':
77                nrgreplocation='nrgrep-1.1.2/nrgrep'
78                e = execution.expression.expression
79                if nrgrep_override.has_key(e): e = nrgrep_override[e]
80                e = escape_quotes(e)
81                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+nrgreplocation+' -c \'' + e + '\' '+ execution.file.file + redirectoutput]
82                p = Popen(cmd,shell=True)
83                p.wait()
84        if execution.program=='nrgrep':
85                nrgreplocation='nrgrep-1.0/nrgrep'
86                if nrgrep_override.has_key(e): e = nrgrep_override[e]
87                e = escape_quotes(e)
88                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+nrgreplocation+' -c \'' + e + '\' '+ execution.file.file + redirectoutput]
89                p = Popen(cmd,shell=True)
90                p.wait()
91        if execution.program=='pcregrep':
92                pcregreplocation='pcre-8.12/pcregrep'
93                e = escape_quotes(execution.expression.expression)
94                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+pcregreplocation+' -c  \'' + e + '\' '+ execution.file.file + redirectoutput]
95                p = Popen(cmd,shell=True)
96                p.wait()
97        if execution.program=='agrep':
98                agreplocation='agrep-3.41/agrep'
99                e = execution.expression.expression
100                if agrep_override.has_key(e): e = agrep_override[e]
101                e = escape_quotes(e)
102                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+agreplocation+' -0 -c \'' + e + '\' '+ execution.file.file + redirectoutput]
103                p = Popen(cmd,shell=True)
104                p.wait()
105        output_file = open('perfoutput', 'r')
106        output = output_file.read()
107        endpos = output.rfind(execution.stat)-1
108        startpos=endpos-1
109        while output[startpos-1].isdigit():
110                startpos-=1
111        return int(output[startpos:endpos])
112               
113
114
115Expression = namedtuple('Expression', ['expression', 'description', 'types'])
116expressions = []
117File = namedtuple('File',['file','description','types'])
118files = []
119executions = []
120Execution = namedtuple('Execution', ['stat', 'program', 'file', 'expression'])
121
122#http://sljit.sourceforge.net/regex_perf.html
123files.append(File('data/mark.txt','mark_twain',('regex_perf',)))
124expressions.append(Expression('Twain', 'Twain', ('regex_perf',)))
125expressions.append(Expression('^Twain', '^Twain', ('regex_perf',)))
126expressions.append(Expression('Twain$', 'Twain$', ('regex_perf',)))
127expressions.append(Expression('Huck[a-zA-Z]+|Finn[a-zA-Z]+', 'Huck_or_Finn_', ('regex_perf',)))
128expressions.append(Expression('a[^x]{20}b', 'a----b', ('regex_perf',)))
129expressions.append(Expression('Tom|Sawyer|Huckleberry|Finn', 'Tom_or_Huck', ('regex_perf',)))
130expressions.append(Expression('.{0,3}(Tom|Sawyer|Huckleberry|Finn)', '__Tom_or_Huck', ('regex_perf',)))
131expressions.append(Expression('[a-zA-Z]+ing', '___ing', ('regex_perf',)))
132expressions.append(Expression('^[a-zA-Z]{0,4}ing[^a-zA-Z]', '....ing_', ('regex_perf',)))
133expressions.append(Expression('[a-zA-Z]+ing$', '___ing$', ('regex_perf',)))
134expressions.append(Expression('^[a-zA-Z ]{5,}$', 'symline5+$', ('regex_perf',)))
135expressions.append(Expression('^.{16,20}$', 'line16-20', ('regex_perf',)))
136expressions.append(Expression('([a-f](.[d-m].){0,2}[h-n]){2}', 'af_hnaf_hn', ('regex_perf',)))
137expressions.append(Expression('([A-Za-z]awyer|[A-Za-z]inn)[^a-zA-Z]', '_awyer_or_inn', ('regex_perf',)))
138expressions.append(Expression('"[^"]{0,30}[?!.]"', 'quoted_sentence0-30', ('regex_perf',)))
139expressions.append(Expression('Tom.{10,25}river|river.{10,25}Tom', 'Tom_near_river', ('regex_perf',)))
140
141
142expressions.append(Expression('a[^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x]b', 'a----b', ('regex_perf2',)))
143expressions.append(Expression('.?.?.?(Tom|Sawyer|Huckleberry|Finn)', '__Tom_or_Huck', ('regex_perf2',)))
144expressions.append(Expression('^[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?ing[^a-zA-Z]', '....ing_', ('regex_perf2',)))
145expressions.append(Expression('^[a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ]*$', 'symline5+$', ('regex_perf2',)))
146expressions.append(Expression('^.................?.?.?.?$', 'line16-20', ('regex_perf2',)))
147expressions.append(Expression('([a-f](.[d-m].)?(.[d-m].)?[h-n])([a-f](.[d-m].)?(.[d-m].)?[h-n])', 'af_hnaf_hn', ('regex_perf2',)))
148expressions.append(Expression('"[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[?!.]"', 'quoted_sentence0-30', ('regex_perf2',)))
149expressions.append(Expression('Tom...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?river|river...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?Tom', 'Tom_near_river', ('regex_perf2',)))
150
151nrgrep_override = {}
152nrgrep_override['a[^x]{20}b'] = 'a[^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x]b'
153nrgrep_override['.{0,3}(Tom|Sawyer|Huckleberry|Finn)'] = '.?.?.?(Tom|Sawyer|Huckleberry|Finn)'
154nrgrep_override['^[a-zA-Z]{0,4}ing[^a-zA-Z]'] = '^[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?ing[^a-zA-Z]'
155nrgrep_override['^[a-zA-Z ]{5,}$'] = '^[a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ]*[\x0d]$'
156nrgrep_override['^.{16,20}$'] = '^................?.?.?.?[\x0d]$'
157nrgrep_override['([a-f](.[d-m].){0,2}[h-n]){2}'] = '[a-f](.[d-m].)?(.[d-m].)?[h-n][a-f](.[d-m].)?(.[d-m].)?[h-n]'
158nrgrep_override['"[^"]{0,30}[?!.]"'] = '"[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[?!.]"'
159nrgrep_override['Tom.{10,25}river|river.{10,25}Tom'] = 'Tom...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?river|river...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?Tom'
160
161agrep_override = nrgrep_override
162agrep_override['Huck[a-zA-Z]+|Finn[a-zA-Z]+'] = 'Huck[a-zA-Z][a-zA-Z]*|Finn[a-zA-Z][a-zA-Z]*'
163agrep_override['[a-zA-Z]+ing'] = '[a-zA-Z][a-zA-Z]*ing'
164agrep_override['[a-zA-Z]+ing$'] = '[a-zA-Z][a-zA-Z]*ing$'
165agrep_override['([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?'] = '([a-zA-Z][a-zA-Z0-9]*)://([^ /][^ /]*)(/[^ ]*)?'
166agrep_override['([^ @]+)@([^ @]+)'] = '([^ @][^ @]*)@([^ @][^ @]*)'
167agrep_override['([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?|([^ @]+)@([^ @]+)'] = '([a-zA-Z][a-zA-Z0-9]*)://([^ /][^ /]*)(/[^ ]*)?|([^ @][^ @]*)@([^ @][^ @]*)'
168agrep_override['[0-9]+[.][0-9]+, *[0-9]+[.][0-9]+'] = '[0-9][0-9]*[.][0-9][0-9]*\, *[0-9][0-9]*[.][0-9][0-9]*'
169
170
171#http://lh3lh3.users.sourceforge.net/reb.shtml
172files.append(File('data/howto','howto',('reb',)))
173expressions.append(Expression('([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?', 'URI', ('reb',)))
174expressions.append(Expression('([^ @]+)@([^ @]+)', 'Email', ('reb',)))
175expressions.append(Expression('([0-9][0-9]?)/([0-9][0-9]?)/([0-9][0-9]([0-9][0-9])?)', 'Date', ('reb',)))
176expressions.append(Expression('([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?|([^ @]+)@([^ @]+)', 'URIorEmail', ('reb',)))
177
178
179files.append(File('../../../trunk/QA/TD/roads-2.gml', 'roads', ('gml',)))
180expressions.append(Expression('<!--([^-]|-[^-])*-->', 'comment', ('gml',)))
181expressions.append(Expression('<[^!?][^>]*>', 'tag', ('gml',)))
182expressions.append(Expression('<gml:[^>]* xmlns:gml="[^"]*"[^>]*>', 'xmlns:gml', ('gml',)))
183expressions.append(Expression('[0-9]+[.][0-9]+, *[0-9]+[.][0-9]+', 'coord', ('gml',)))
184expressions.append(Expression(r"""["']|&quot;|&apos;|&#0*3[49];|&#x0*2[27];""", 'xquote', ('gml',)))
185
186
187expressions.append(Expression('(^|[^A-Z0-9:])([A-F0-9]{1,4}:){7}[A-F0-9]{1,4}($|[^A-Z0-9:])', 'IPv6', ('reb',)))
188
189programs = ['bitstreams','agrep', 'nrgrep112', 'grep', 'pcregrep']
190#programs = ['bitstreams','grep']
191#programs = ['bitstreams']
192
193#stats = ['cycles:u', 'instructions:u', 'cache-misses:u', 'L1-dcache-load-misses:u', 'L1-dcache-store-misses:u', 'L1-dcache-prefetch-misses:u', 'L1-icache-load-misses:u']
194stats = ['cycles:u']
195
196typeargument=False
197if len(sys.argv)>1:
198        type=sys.argv[1]
199        typeargument=True
200
201for file in files:
202        for expression in expressions:
203                match = False
204                for type1 in file.types:
205                        for type2 in expression.types:
206                                if type1 == type2:
207                                        if typeargument:
208                                                if type1==type:
209                                                        match = True
210                                        else:
211                                                match = True
212                if match:
213                        for program in programs:
214                                for stat in stats:
215                                        executions.append(Execution(stat, program, file, expression))
216csv_output = StringIO.StringIO()
217writer = csv.writer(csv_output)
218
219log_file = open('perflog.txt', 'w')
220log_file.close()
221
222for execution in executions:
223        calc,one,five,eleven = execute(execution)
224        writer.writerow((execution.file.description, execution.expression.description, execution.program, execution.stat, calc,one,five,eleven))
225
226print csv_output.getvalue()
Note: See TracBrowser for help on using the repository browser.