source: proto/RE/performance/perf.py @ 3470

Last change on this file since 3470 was 3470, checked in by bhull, 6 years ago

Perf script changes.

File size: 11.3 KB
Line 
1from subprocess import call, Popen
2from collections import *
3import csv
4import StringIO
5import os.path
6import sys
7import shutil
8
9
10def execute(execution):
11        if not os.path.exists(execution.file.file+'.11'):
12                file = open(execution.file.file,'r')
13                contents = file.read()
14                file.close()
15                file11 = open(execution.file.file+'.11','w')
16                for i in range(11):
17                        file11.write(contents)
18                file11.close
19        if not os.path.exists(execution.file.file+'.5'):
20                file = open(execution.file.file,'r')
21                contents = file.read()
22                file.close()
23                file5 = open(execution.file.file+'.5','w')
24                for i in range(5):
25                        file5.write(contents)
26                file5.close
27
28        #quick version
29        outputpath = 'output/'+execution.file.description+'/'+execution.expression.description+'/'+execution.program
30        if not os.path.exists(outputpath):
31                os.makedirs(outputpath)
32        if not os.path.exists(outputpath+'/'+execution.stat):           
33                one=execute_one(execution,1)
34                results_file = open(outputpath+'/'+execution.stat,'w')
35                results_file.write(str(one))
36                results_file.close()
37        else:
38                results_file = open(outputpath+'/'+execution.stat,'r')
39                one=int(results_file.read())
40                results_file.close()
41        return one,one,one,one
42
43        #slower version
44        #execute_one(execution,1)
45        #one=execute_one(execution,10)
46        #execution5=Execution(execution.stat, execution.program, File(execution.file.file+'.5',execution.file.description+'.5',execution.file.types), execution.expression)
47        #execute_one(execution5,1)
48        #five=execute_one(execution5,10)
49        #execution11=Execution(execution.stat, execution.program, File(execution.file.file+'.11',execution.file.description+'.11',execution.file.types), execution.expression)
50        #execute_one(execution11,1)
51        #eleven=execute_one(execution11,10)
52        #return (eleven-one)/10,one,five/5,eleven/11
53
54
55def escape_quotes(e):  return e.replace("'", "'\\''")
56
57
58def execute_one(execution, count):
59        outputpath = 'output/'+execution.file.description+'/'+execution.expression.description+'/'+execution.program
60        log_file = open('perflog.txt', 'a')
61        log_file.write('\nEXECUTION: '+execution.file.description+' '+ execution.expression.description+' '+ execution.program+' '+ execution.stat+'\n')
62        log_file.close()
63        redirectoutput= ' 2>&1 | tee '+outputpath+'/output.txt >> perflog.txt'
64        if execution.program=='bitstreams':             
65                re_home = '../'
66                re_input_file = open(re_home+'input/test/test1.re', 'w')
67                re_input_file.write(execution.expression.expression+'\n')
68                re_input_file.close()
69                call('make -C '+re_home + redirectoutput,shell=True)
70                call('make -C '+re_home+'output/' + redirectoutput,shell=True)
71                call('make -C '+re_home+'output/src/' + redirectoutput,shell=True)
72                shutil.copyfile(re_home+'output/re_pablo_cc.py', outputpath+'/re_pablo_cc.py')
73                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+re_home+'output/src/re -c '+ execution.file.file + redirectoutput]
74                p = Popen(cmd,shell=True)
75                p.wait()
76        if execution.program=='grep':
77                escaped_e = escape_quotes(execution.expression.expression)
78                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' grep -c -E \'' + escaped_e + '\' '+ execution.file.file + redirectoutput]
79                p = Popen(cmd,shell=True)
80                p.wait()
81        if execution.program=='nrgrep112':
82                nrgreplocation='nrgrep-1.1.2/nrgrep'
83                e = execution.expression.expression
84                if nrgrep_override.has_key(e): e = nrgrep_override[e]
85                e = escape_quotes(e)
86                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+nrgreplocation+' -c \'' + e + '\' '+ execution.file.file + redirectoutput]
87                p = Popen(cmd,shell=True)
88                p.wait()
89        if execution.program=='nrgrep':
90                nrgreplocation='nrgrep-1.0/nrgrep'
91                e = execution.expression.expression
92                if nrgrep_override.has_key(e): e = nrgrep_override[e]
93                e = escape_quotes(e)
94                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+nrgreplocation+' -c \'' + e + '\' '+ execution.file.file + redirectoutput]
95                p = Popen(cmd,shell=True)
96                p.wait()
97        if execution.program=='pcregrep':
98                pcregreplocation='pcre-8.12/pcregrep'
99                e = escape_quotes(execution.expression.expression)
100                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+pcregreplocation+' -c  \'' + e + '\' '+ execution.file.file + redirectoutput]
101                p = Popen(cmd,shell=True)
102                p.wait()
103        if execution.program=='agrep':
104                agreplocation='agrep-3.41/agrep'
105                e = execution.expression.expression
106                if agrep_override.has_key(e): e = agrep_override[e]
107                e = escape_quotes(e)
108                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+agreplocation+' -0 -c \'' + e + '\' '+ execution.file.file + redirectoutput]
109                p = Popen(cmd,shell=True)
110                p.wait()
111        output_file = open('perfoutput', 'r')
112        output = output_file.read()
113        endpos = output.rfind(execution.stat)-1
114        startpos=endpos-1
115        while output[startpos-1].isdigit():
116                startpos-=1
117        return int(output[startpos:endpos])
118               
119
120
121Expression = namedtuple('Expression', ['expression', 'description', 'types'])
122expressions = []
123File = namedtuple('File',['file','description','types'])
124files = []
125executions = []
126Execution = namedtuple('Execution', ['stat', 'program', 'file', 'expression'])
127
128#http://sljit.sourceforge.net/regex_perf.html
129files.append(File('data/mark.txt','mark_twain',('regex_perf',)))
130expressions.append(Expression('Twain', 'Twain', ('regex_perf',)))
131expressions.append(Expression('^Twain', '^Twain', ('regex_perf',)))
132expressions.append(Expression('Twain$', 'Twain$', ('regex_perf',)))
133expressions.append(Expression('Huck[a-zA-Z]+|Finn[a-zA-Z]+', 'Huck_or_Finn_', ('regex_perf',)))
134expressions.append(Expression('a[^x]{20}b', 'a----b', ('regex_perf',)))
135expressions.append(Expression('Tom|Sawyer|Huckleberry|Finn', 'Tom_or_Huck', ('regex_perf',)))
136expressions.append(Expression('.{0,3}(Tom|Sawyer|Huckleberry|Finn)', '__Tom_or_Huck', ('regex_perf',)))
137expressions.append(Expression('[a-zA-Z]+ing', '___ing', ('regex_perf',)))
138expressions.append(Expression('^[a-zA-Z]{0,4}ing[^a-zA-Z]', '....ing_', ('regex_perf',)))
139expressions.append(Expression('[a-zA-Z]+ing$', '___ing$', ('regex_perf',)))
140expressions.append(Expression('^[a-zA-Z ]{5,}$', 'symline5+$', ('regex_perf',)))
141expressions.append(Expression('^.{16,20}$', 'line16-20', ('regex_perf',)))
142expressions.append(Expression('([a-f](.[d-m].){0,2}[h-n]){2}', 'af_hnaf_hn', ('regex_perf',)))
143expressions.append(Expression('([A-Za-z]awyer|[A-Za-z]inn)[^a-zA-Z]', '_awyer_or_inn', ('regex_perf',)))
144expressions.append(Expression('"[^"]{0,30}[?!.]"', 'quoted_sentence0-30', ('regex_perf',)))
145expressions.append(Expression('Tom.{10,25}river|river.{10,25}Tom', 'Tom_near_river', ('regex_perf',)))
146
147
148expressions.append(Expression('a[^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x]b', 'a----b', ('regex_perf2',)))
149expressions.append(Expression('.?.?.?(Tom|Sawyer|Huckleberry|Finn)', '__Tom_or_Huck', ('regex_perf2',)))
150expressions.append(Expression('^[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?ing[^a-zA-Z]', '....ing_', ('regex_perf2',)))
151expressions.append(Expression('^[a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ]*$', 'symline5+$', ('regex_perf2',)))
152expressions.append(Expression('^.................?.?.?.?$', 'line16-20', ('regex_perf2',)))
153expressions.append(Expression('([a-f](.[d-m].)?(.[d-m].)?[h-n])([a-f](.[d-m].)?(.[d-m].)?[h-n])', 'af_hnaf_hn', ('regex_perf2',)))
154expressions.append(Expression('"[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[?!.]"', 'quoted_sentence0-30', ('regex_perf2',)))
155expressions.append(Expression('Tom...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?river|river...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?Tom', 'Tom_near_river', ('regex_perf2',)))
156
157nrgrep_override = {}
158nrgrep_override['a[^x]{20}b'] = 'a[^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x]b'
159nrgrep_override['.{0,3}(Tom|Sawyer|Huckleberry|Finn)'] = '.?.?.?(Tom|Sawyer|Huckleberry|Finn)'
160nrgrep_override['^[a-zA-Z]{0,4}ing[^a-zA-Z]'] = '^[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?ing[^a-zA-Z]'
161nrgrep_override['^[a-zA-Z ]{5,}$'] = '^[a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ]*[\x0d]$'
162nrgrep_override['^.{16,20}$'] = '^................?.?.?.?[\x0d]$'
163nrgrep_override['([a-f](.[d-m].){0,2}[h-n]){2}'] = '[a-f](.[d-m].)?(.[d-m].)?[h-n][a-f](.[d-m].)?(.[d-m].)?[h-n]'
164nrgrep_override['"[^"]{0,30}[?!.]"'] = '"[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[?!.]"'
165nrgrep_override['Tom.{10,25}river|river.{10,25}Tom'] = 'Tom...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?river|river...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?Tom'
166
167agrep_override = nrgrep_override
168agrep_override['Huck[a-zA-Z]+|Finn[a-zA-Z]+'] = 'Huck[a-zA-Z][a-zA-Z]*|Finn[a-zA-Z][a-zA-Z]*'
169agrep_override['[a-zA-Z]+ing'] = '[a-zA-Z][a-zA-Z]*ing'
170agrep_override['[a-zA-Z]+ing$'] = '[a-zA-Z][a-zA-Z]*ing$'
171agrep_override['([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?'] = '([a-zA-Z][a-zA-Z0-9]*)://([^ /][^ /]*)(/[^ ]*)?'
172agrep_override['([^ @]+)@([^ @]+)'] = '([^ @][^ @]*)@([^ @][^ @]*)'
173agrep_override['([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?|([^ @]+)@([^ @]+)'] = '([a-zA-Z][a-zA-Z0-9]*)://([^ /][^ /]*)(/[^ ]*)?|([^ @][^ @]*)@([^ @][^ @]*)'
174agrep_override['[0-9]+[.][0-9]+, *[0-9]+[.][0-9]+'] = '[0-9][0-9]*[.][0-9][0-9]*\, *[0-9][0-9]*[.][0-9][0-9]*'
175
176
177#http://lh3lh3.users.sourceforge.net/reb.shtml
178files.append(File('data/howto','howto',('reb',)))
179expressions.append(Expression('([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?', 'URI', ('reb',)))
180expressions.append(Expression('([^ @]+)@([^ @]+)', 'Email', ('reb',)))
181expressions.append(Expression('([0-9][0-9]?)/([0-9][0-9]?)/([0-9][0-9]([0-9][0-9])?)', 'Date', ('reb',)))
182expressions.append(Expression('([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?|([^ @]+)@([^ @]+)', 'URIorEmail', ('reb',)))
183
184
185files.append(File('../../../trunk/QA/TD/roads-2.gml', 'roads', ('gml',)))
186expressions.append(Expression('<!--([^-]|-[^-])*-->', 'comment', ('gml',)))
187expressions.append(Expression('<[^!?][^>]*>', 'tag', ('gml',)))
188expressions.append(Expression('<gml:[^>]* xmlns:gml="[^"]*"[^>]*>', 'xmlns:gml', ('gml',)))
189expressions.append(Expression('[0-9]+[.][0-9]+, *[0-9]+[.][0-9]+', 'coord', ('gml',)))
190expressions.append(Expression(r"""["']|&quot;|&apos;|&#0*3[49];|&#x0*2[27];""", 'xquote', ('gml',)))
191
192
193expressions.append(Expression('(^|[^A-Z0-9:])([A-F0-9]{1,4}:){7}[A-F0-9]{1,4}($|[^A-Z0-9:])', 'IPv6', ('reb',)))
194
195programs = ['bitstreams', 'agrep', 'nrgrep112', 'grep', 'pcregrep']
196#programs = ['bitstreams','grep']
197#programs = ['bitstreams']
198
199#stats = ['cycles:u', 'instructions:u', 'cache-misses:u', 'L1-dcache-load-misses:u', 'L1-dcache-store-misses:u', 'L1-dcache-prefetch-misses:u', 'L1-icache-load-misses:u']
200stats = ['cycles:u']
201
202
203typeargument=False
204if len(sys.argv)>1:
205        type=sys.argv[1]
206        typeargument=True
207
208for file in files:
209        for expression in expressions:
210                match = False
211                for type1 in file.types:
212                        for type2 in expression.types:
213                                if type1 == type2:
214                                        if typeargument:
215                                                if type1==type:
216                                                        match = True
217                                        else:
218                                                match = True
219                if match:
220                        for program in programs:
221                                for stat in stats:
222                                        executions.append(Execution(stat, program, file, expression))
223csv_output = StringIO.StringIO()
224writer = csv.writer(csv_output)
225
226log_file = open('perflog.txt', 'w')
227log_file.close()
228
229for execution in executions:
230        calc,one,five,eleven = execute(execution)
231        writer.writerow((execution.file.description, execution.expression.description, execution.program, execution.stat, calc,one,five,eleven))
232
233print csv_output.getvalue()
Note: See TracBrowser for help on using the repository browser.