source: trunk/lib_ir/xmlwf/perf.txt @ 4067

Last change on this file since 4067 was 3946, checked in by linmengl, 5 years ago

add perf results. 4 inserts version saves 100+ lines of asm, but hurt the whole performance

File size: 2.2 KB
Line 
1IDISA result:
2        dew.xml  &  jaw.xml  &  roads-2.gml  &  po.xml  & soap.xml
3xmlwf   & 4.602   & 6.519   & 7.458   & 5.783   & 9.623 \\ \hline
4
5============================================
6Debug mode:
7
8xmlwf_perf   &  54.773   &  64.743   &  69.457   &  66.621   &  84.507 \\ \hline
9
10===========================================
11Release mode:
12
13xmlwf_perf   &  16.54   & 17.055   &  17.493   &  17.734   &  26.195 \\ \hline
14
15===========================================
16Optimised ifh_1
17xmlwf_perf   &  13.411   &  15.692   &  17.006   &  14.482   &  22.651 \\ \hline
18
19(Select on v128i1)
20xmlwf_perf   &  13.308   &  14.883   &  14.268   &  14.5   &  22.786 \\ \hline
21
22===========================================
23Optimised packh_16 / packl_16
24xmlwf_perf   &  9.977   & 12.66   & 11.045   &  11.089   &  17.403 \\ \hline
25
26===========================================
27Optimised shiftings (Use IR inline for immediate shifting)
28xmlwf_perf   &  4.544   & 7.787   & 7.196   & 5.727   & 11.386 \\ \hline
29
30===========================================
31taskset 1 make perf_xmlwf (more stable results)
32xmlwf_perf   &  4.542   & 5.002   & 5.363   & 5.712   & 6.112 \\ \hline
33
34===========================================
35****    AVX2 BELOW
36===========================================
37IDISA result:
38g++ -O3 -std=gnu++0x -DBUFFER_PROFILING -DPERF_SCRIPT -DUSE_S2P_AVX2 -DCARRY64 -DBLOCK_SIZE=256 -o xmlwf xmlwf.cpp -I../util -I../lib -I../lib/cc-lib -march=core-avx2 -m64 -mavx2 -fabi-version=6
39
40xmlwf   &   2.541   &   2.785   &   3.464   &   3.293   &   3.841 \\ \hline
41
42===========================================
43only compiler flag changes (s2p_bytepack, block_size=128, idisa_sse2 backend, g++ with core-avx2 flag)
44xmlwf_perf   &  3.565   &   3.964   &   4.154   &   4.436   &   4.769 \\ \hline
45
46===========================================
47only compile s2p with avx2/bmi2. The rest is SSE2
48xmlwf_perf   &  3.807   &   4.241   &   4.452   &   4.762   &   5.078 \\ \hline
49
50===========================================
51use PEXT for packh_2/4/8
52xmlwf_perf   &  4.349   &   4.81   &    4.979   &   5.342   &   5.661 \\ \hline
53
54===========================================
55use PEXT, no shl/or, use truncate and build_vector of v4i32
56xmlwf_perf   &  4.804   &   5.262   &   5.431   &   5.779   &   6.112 \\ \hline
Note: See TracBrowser for help on using the repository browser.