source: proto/RE/performance/perf.py @ 3409

Last change on this file since 3409 was 3409, checked in by cameron, 6 years ago

Add overrides to automatically switch REs for nrgrep and agrep

File size: 10.2 KB
Line 
1from subprocess import call, Popen
2from collections import *
3import csv
4import StringIO
5import os.path
6import sys
7import shutil
8
9def execute(execution):
10        if not os.path.exists(execution.file.file+'.11'):
11                file = open(execution.file.file,'r')
12                contents = file.read()
13                file.close()
14                file11 = open(execution.file.file+'.11','w')
15                for i in range(11):
16                        file11.write(contents)
17                file11.close
18        if not os.path.exists(execution.file.file+'.5'):
19                file = open(execution.file.file,'r')
20                contents = file.read()
21                file.close()
22                file5 = open(execution.file.file+'.5','w')
23                for i in range(5):
24                        file5.write(contents)
25                file5.close
26
27        #quick version
28        outputpath = 'output/'+execution.file.description+'/'+execution.expression.description+'/'+execution.program
29        if not os.path.exists(outputpath):
30                os.makedirs(outputpath)
31        one=execute_one(execution,1)
32        results_file = open(outputpath+'/'+execution.stat,'w')
33        results_file.write(str(one))
34        results_file.close()
35        return one,one,one,one
36
37        #slower version
38        #execute_one(execution,1)
39        #one=execute_one(execution,10)
40        #execution5=Execution(execution.stat, execution.program, File(execution.file.file+'.5',execution.file.description+'.5',execution.file.types), execution.expression)
41        #execute_one(execution5,1)
42        #five=execute_one(execution5,10)
43        #execution11=Execution(execution.stat, execution.program, File(execution.file.file+'.11',execution.file.description+'.11',execution.file.types), execution.expression)
44        #execute_one(execution11,1)
45        #eleven=execute_one(execution11,10)
46        #return (eleven-one)/10,one,five/5,eleven/11
47
48
49
50
51def execute_one(execution, count):
52        outputpath = 'output/'+execution.file.description+'/'+execution.expression.description+'/'+execution.program
53        log_file = open('perflog.txt', 'a')
54        log_file.write('\nEXECUTION: '+execution.file.description+' '+ execution.expression.description+' '+ execution.program+' '+ execution.stat+'\n')
55        log_file.close()
56        redirectoutput= ' 2>&1 | tee '+outputpath+'/output.txt >> perflog.txt'
57        if execution.program=='bitstreams':
58               
59                re_home = '../'
60                re_input_file = open(re_home+'input/test/test1.re', 'w')
61                re_input_file.write(execution.expression.expression+'\n')
62                re_input_file.close()
63                call('make -C '+re_home + redirectoutput,shell=True)
64                call('make -C '+re_home+'output/' + redirectoutput,shell=True)
65                call('make -C '+re_home+'output/src/' + redirectoutput,shell=True)
66                shutil.copyfile(re_home+'output/re_pablo_cc.py', outputpath+'/re_pablo_cc.py')
67                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+re_home+'output/src/re -c '+ execution.file.file + redirectoutput]
68                p = Popen(cmd,shell=True)
69                p.wait()
70        if execution.program=='grep':
71                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' grep -c -E \'' + execution.expression.expression + '\' '+ execution.file.file + redirectoutput]
72                p = Popen(cmd,shell=True)
73                p.wait()
74        if execution.program=='nrgrep112':
75                nrgreplocation='nrgrep-1.1.2/nrgrep'
76                e = execution.expression.expression
77                if nrgrep_override.has_key(e): e = nrgrep_override[e]
78                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+nrgreplocation+' -c \'' + e + '\' '+ execution.file.file + redirectoutput]
79                p = Popen(cmd,shell=True)
80                p.wait()
81        if execution.program=='nrgrep':
82                nrgreplocation='nrgrep-1.0/nrgrep'
83                e = execution.expression.expression
84                if nrgrep_override.has_key(e): e = nrgrep_override[e]
85                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+nrgreplocation+' -c \'' + e + '\' '+ execution.file.file + redirectoutput]
86                p = Popen(cmd,shell=True)
87                p.wait()
88        if execution.program=='pcregrep':
89                pcregreplocation='pcre-8.12/pcregrep'
90                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+pcregreplocation+' -c  \'' + execution.expression.expression + '\' '+ execution.file.file + redirectoutput]
91                p = Popen(cmd,shell=True)
92                p.wait()
93        if execution.program=='agrep':
94                agreplocation='agrep-3.41/agrep'
95                e = execution.expression.expression
96                if agrep_override.has_key(e): e = agrep_override[e]
97                cmd = ['perf stat -x, -o perfoutput -r '+str(count)+' -e '+ execution.stat+ ' '+agreplocation+' -0 -c \'' + e + '\' '+ execution.file.file + redirectoutput]
98                p = Popen(cmd,shell=True)
99                p.wait()
100        output_file = open('perfoutput', 'r')
101        output = output_file.read()
102        endpos = output.rfind(execution.stat)-1
103        startpos=endpos-1
104        while output[startpos-1].isdigit():
105                startpos-=1
106        return int(output[startpos:endpos])
107               
108
109
110Expression = namedtuple('Expression', ['expression', 'description', 'types'])
111expressions = []
112File = namedtuple('File',['file','description','types'])
113files = []
114executions = []
115Execution = namedtuple('Execution', ['stat', 'program', 'file', 'expression'])
116
117
118
119
120
121
122#http://sljit.sourceforge.net/regex_perf.html
123files.append(File('data/mark.txt','mark_twain',('regex_perf',)))
124expressions.append(Expression('Twain', 'Twain', ('regex_perf',)))
125expressions.append(Expression('^Twain', '^Twain', ('regex_perf',)))
126expressions.append(Expression('Twain$', 'Twain$', ('regex_perf',)))
127expressions.append(Expression('Huck[a-zA-Z]+|Finn[a-zA-Z]+', 'Huck_or_Finn_', ('regex_perf',)))
128expressions.append(Expression('a[^x]{20}b', 'a----b', ('regex_perf',)))
129expressions.append(Expression('Tom|Sawyer|Huckleberry|Finn', 'Tom_or_Huck', ('regex_perf',)))
130expressions.append(Expression('.{0,3}(Tom|Sawyer|Huckleberry|Finn)', '__Tom_or_Huck', ('regex_perf',)))
131expressions.append(Expression('[a-zA-Z]+ing', '___ing', ('regex_perf',)))
132expressions.append(Expression('^[a-zA-Z]{0,4}ing[^a-zA-Z]', '....ing_', ('regex_perf',)))
133expressions.append(Expression('[a-zA-Z]+ing$', '___ing$', ('regex_perf',)))
134expressions.append(Expression('^[a-zA-Z ]{5,}$', 'symline5+$', ('regex_perf',)))
135expressions.append(Expression('^.{16,20}$', 'line16-20', ('regex_perf',)))
136expressions.append(Expression('([a-f](.[d-m].){0,2}[h-n]){2}', 'af_hnaf_hn', ('regex_perf',)))
137expressions.append(Expression('([A-Za-z]awyer|[A-Za-z]inn)[^a-zA-Z]', '_awyer_or_inn', ('regex_perf',)))
138expressions.append(Expression('"[^"]{0,30}[?!.]"', 'quoted_sentence0-30', ('regex_perf',)))
139expressions.append(Expression('Tom.{10,25}river|river.{10,25}Tom', 'Tom_near_river', ('regex_perf',)))
140
141
142expressions.append(Expression('a[^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x]b', 'a----b', ('regex_perf2',)))
143expressions.append(Expression('.?.?.?(Tom|Sawyer|Huckleberry|Finn)', '__Tom_or_Huck', ('regex_perf2',)))
144expressions.append(Expression('^[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?ing[^a-zA-Z]', '....ing_', ('regex_perf2',)))
145expressions.append(Expression('^[a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ]*$', 'symline5+$', ('regex_perf2',)))
146expressions.append(Expression('^.................?.?.?.?$', 'line16-20', ('regex_perf2',)))
147expressions.append(Expression('([a-f](.[d-m].)?(.[d-m].)?[h-n])([a-f](.[d-m].)?(.[d-m].)?[h-n])', 'af_hnaf_hn', ('regex_perf2',)))
148expressions.append(Expression('"[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[?!.]"', 'quoted_sentence0-30', ('regex_perf2',)))
149expressions.append(Expression('Tom...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?river|river...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?Tom', 'Tom_near_river', ('regex_perf2',)))
150
151nrgrep_override = {}
152nrgrep_override['a[^x]{20}b'] = 'a[^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x][^x]b'
153nrgrep_override['.{0,3}(Tom|Sawyer|Huckleberry|Finn)'] = '.?.?.?(Tom|Sawyer|Huckleberry|Finn)'
154nrgrep_override['^[a-zA-Z]{0,4}ing[^a-zA-Z]'] = '^[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?[a-zA-Z]?ing[^a-zA-Z]'
155nrgrep_override['^[a-zA-Z ]{5,}$'] = '^[a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ][a-zA-Z ]*[\x0d]$'
156nrgrep_override['^.{16,20}$'] = '^................?.?.?.?[\x0d]$'
157nrgrep_override['([a-f](.[d-m].){0,2}[h-n]){2}'] = '[a-f](.[d-m].)?(.[d-m].)?[h-n][a-f](.[d-m].)?(.[d-m].)?[h-n]'
158nrgrep_override['"[^"]{0,30}[?!.]"'] = '"[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[^"]?[?!.]"'
159nrgrep_override['Tom.{10,25}river|river.{10,25}Tom'] = 'Tom...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?river|river...........?.?.?.?.?.?.?.?.?.?.?.?.?.?.?Tom'
160
161agrep_override = nrgrep_override
162agrep_override['Huck[a-zA-Z]+|Finn[a-zA-Z]+'] = 'Huck[a-zA-Z][a-zA-Z]*|Finn[a-zA-Z][a-zA-Z]*'
163agrep_override['[a-zA-Z]+ing'] = '[a-zA-Z][a-zA-Z]*ing'
164agrep_override['[a-zA-Z]+ing$'] = '[a-zA-Z][a-zA-Z]*ing$'
165agrep_override['([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?'] = '([a-zA-Z][a-zA-Z0-9]*)://([^ /][^ /]*)(/[^ ]*)?'
166agrep_override['([^ @]+)@([^ @]+)'] = '([^ @][^ @]*)@([^ @][^ @]*)'
167agrep_override['([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?|([^ @]+)@([^ @]+)'] = '([a-zA-Z][a-zA-Z0-9]*)://([^ /][^ /]*)(/[^ ]*)?|([^ @][^ @]*)@([^ @][^ @]*)'
168
169
170#http://lh3lh3.users.sourceforge.net/reb.shtml
171files.append(File('data/howto','howto',('reb',)))
172expressions.append(Expression('([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?', 'URI', ('reb',)))
173expressions.append(Expression('([^ @]+)@([^ @]+)', 'Email', ('reb',)))
174expressions.append(Expression('([0-9][0-9]?)/([0-9][0-9]?)/([0-9][0-9]([0-9][0-9])?)', 'Date', ('reb',)))
175expressions.append(Expression('([a-zA-Z][a-zA-Z0-9]*)://([^ /]+)(/[^ ]*)?|([^ @]+)@([^ @]+)', 'URIorEmail', ('reb',)))
176
177
178programs = ['bitstreams','agrep', 'nrgrep112', 'grep', 'pcregrep']
179stats = ['cycles:u', 'instructions:u', 'cache-misses:u', 'L1-dcache-load-misses:u', 'L1-dcache-store-misses:u', 'L1-dcache-prefetch-misses:u', 'L1-icache-load-misses:u']
180
181typeargument=False
182if len(sys.argv)>1:
183        type=sys.argv[1]
184        typeargument=True
185
186for file in files:
187        for expression in expressions:
188                match = False
189                for type1 in file.types:
190                        for type2 in expression.types:
191                                if type1 == type2:
192                                        if typeargument:
193                                                if type1==type:
194                                                        match = True
195                                        else:
196                                                match = True
197                if match:
198                        for program in programs:
199                                for stat in stats:
200                                        executions.append(Execution(stat, program, file, expression))
201csv_output = StringIO.StringIO()
202writer = csv.writer(csv_output)
203
204log_file = open('perflog.txt', 'w')
205log_file.close()
206
207for execution in executions:
208        calc,one,five,eleven = execute(execution)
209        writer.writerow((execution.file.description, execution.expression.description, execution.program, execution.stat, calc,one,five,eleven))
210
211print csv_output.getvalue()
Note: See TracBrowser for help on using the repository browser.