Changes between Version 2 and Version 3 of IcGrep


Ignore:
Timestamp:
Jan 4, 2015, 10:31:15 AM (4 years ago)
Author:
cameron
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • IcGrep

    v2 v3  
    77units at a time with Intel's new AVX2 instructions).
    88
     9== Linux comparison: icGrep vs egrep ==
    910
     11Here's an interesting example of >100X speedup vs. egrep.
    1012
     13{{{
     14perf stat ./icgrep -c '[ ](0x)?([a-fA-F0-9][a-fA-F0-9])+[.:,?! ]' ../performance/data/howto
     15130243
    1116
     17 Performance counter stats for './icgrep -c [ ](0x)?([a-fA-F0-9][a-fA-F0-9])+[.:,?! ] ../performance/data/howto':
    1218
     19         33.084992 task-clock                #    0.989 CPUs utilized         
     20                 6 context-switches          #    0.000 M/sec                 
     21                 0 CPU-migrations            #    0.000 M/sec                 
     22            12,132 page-faults               #    0.367 M/sec                 
     23       120,678,424 cycles                    #    3.648 GHz                     [75.94%]
     24        47,567,214 stalled-cycles-frontend   #   39.42% frontend cycles idle    [84.44%]
     25        40,414,969 stalled-cycles-backend    #   33.49% backend  cycles idle    [75.91%]
     26       182,642,376 instructions              #    1.51  insns per cycle       
     27                                             #    0.26  stalled cycles per insn [87.96%]
     28        14,480,982 branches                  #  437.690 M/sec                   [87.99%]
     29           509,098 branch-misses             #    3.52% of all branches         [80.41%]
    1330
     31       0.033460665 seconds time elapsed
     32}}}
     33
     34{{{
     35perf stat egrep -c '[ ](0x)?([a-fA-F0-9][a-fA-F0-9])+[.:,?! ]' ../performance/data/howto
     36130243
     37
     38 Performance counter stats for 'egrep -c [ ](0x)?([a-fA-F0-9][a-fA-F0-9])+[.:,?! ] ../performance/data/howto':
     39
     40       4019.404953 task-clock                #    0.996 CPUs utilized         
     41               342 context-switches          #    0.000 M/sec                 
     42                 5 CPU-migrations            #    0.000 M/sec                 
     43               321 page-faults               #    0.000 M/sec                 
     44    14,845,377,498 cycles                    #    3.693 GHz                     [83.31%]
     45     2,246,155,037 stalled-cycles-frontend   #   15.13% frontend cycles idle    [83.34%]
     46       699,469,381 stalled-cycles-backend    #    4.71% backend  cycles idle    [66.69%]
     47    36,936,781,254 instructions              #    2.49  insns per cycle       
     48                                             #    0.06  stalled cycles per insn [83.34%]
     49     6,793,009,741 branches                  # 1690.054 M/sec                   [83.34%]
     50        20,084,331 branch-misses             #    0.30% of all branches         [83.34%]
     51
     52       4.034369628 seconds time elapsed
     53}}}
    1454
    1555Browse the [source:icGREP/icgrep-devel/ source] code!