Changeset 4840


Ignore:
Timestamp:
Oct 17, 2015, 1:26:27 PM (2 years ago)
Author:
cameron
Message:

Grapheme Boundary tests

File:
1 edited

Legend:

Unmodified
Added
Removed
  • icGREP/icgrep-devel/QA/greptest.xml

    r4836 r4840  
    569569<grepcase regexp="[a-z]{20}" datafile="4KiB-onepage" grepcount="77"/>
    570570<grepcase regexp="[a-z]{15}" datafile="4KiB-onepage" grepcount="78"/>
     571
     572
     573<!-- The following data file is produced from auxiliary/GraphemeBreakTest.txt by
     574(1) removing all comment lines and lines containing 0001, 000A, 000D or D800
     575(2) removing all end-of-line comment data beginning #
     576(3) embedding the codepoint hex values in XML hexadecimal character reference notation,
     577(4) and deleting the whitespace and × ÷ separators -->
     578<datafile id="graphemebreaktest">&#x0020;&#x0020;
     579&#x0020;&#x0308;&#x0020;
     580&#x0020;&#x0300;
     581&#x0020;&#x0308;&#x0300;
     582&#x0020;&#x0903;
     583&#x0020;&#x0308;&#x0903;
     584&#x0020;&#x1100;
     585&#x0020;&#x0308;&#x1100;
     586&#x0020;&#x1160;
     587&#x0020;&#x0308;&#x1160;
     588&#x0020;&#x11A8;
     589&#x0020;&#x0308;&#x11A8;
     590&#x0020;&#xAC00;
     591&#x0020;&#x0308;&#xAC00;
     592&#x0020;&#xAC01;
     593&#x0020;&#x0308;&#xAC01;
     594&#x0020;&#x1F1E6;
     595&#x0020;&#x0308;&#x1F1E6;
     596&#x0020;&#x0378;
     597&#x0020;&#x0308;&#x0378;
     598&#x0300;&#x0020;
     599&#x0300;&#x0308;&#x0020;
     600&#x0300;&#x0300;
     601&#x0300;&#x0308;&#x0300;
     602&#x0300;&#x0903;
     603&#x0300;&#x0308;&#x0903;
     604&#x0300;&#x1100;
     605&#x0300;&#x0308;&#x1100;
     606&#x0300;&#x1160;
     607&#x0300;&#x0308;&#x1160;
     608&#x0300;&#x11A8;
     609&#x0300;&#x0308;&#x11A8;
     610&#x0300;&#xAC00;
     611&#x0300;&#x0308;&#xAC00;
     612&#x0300;&#xAC01;
     613&#x0300;&#x0308;&#xAC01;
     614&#x0300;&#x1F1E6;
     615&#x0300;&#x0308;&#x1F1E6;
     616&#x0300;&#x0378;
     617&#x0300;&#x0308;&#x0378;
     618&#x0903;&#x0020;
     619&#x0903;&#x0308;&#x0020;
     620&#x0903;&#x0300;
     621&#x0903;&#x0308;&#x0300;
     622&#x0903;&#x0903;
     623&#x0903;&#x0308;&#x0903;
     624&#x0903;&#x1100;
     625&#x0903;&#x0308;&#x1100;
     626&#x0903;&#x1160;
     627&#x0903;&#x0308;&#x1160;
     628&#x0903;&#x11A8;
     629&#x0903;&#x0308;&#x11A8;
     630&#x0903;&#xAC00;
     631&#x0903;&#x0308;&#xAC00;
     632&#x0903;&#xAC01;
     633&#x0903;&#x0308;&#xAC01;
     634&#x0903;&#x1F1E6;
     635&#x0903;&#x0308;&#x1F1E6;
     636&#x0903;&#x0378;
     637&#x0903;&#x0308;&#x0378;
     638&#x1100;&#x0020;
     639&#x1100;&#x0308;&#x0020;
     640&#x1100;&#x0300;
     641&#x1100;&#x0308;&#x0300;
     642&#x1100;&#x0903;
     643&#x1100;&#x0308;&#x0903;
     644&#x1100;&#x1100;
     645&#x1100;&#x0308;&#x1100;
     646&#x1100;&#x1160;
     647&#x1100;&#x0308;&#x1160;
     648&#x1100;&#x11A8;
     649&#x1100;&#x0308;&#x11A8;
     650&#x1100;&#xAC00;
     651&#x1100;&#x0308;&#xAC00;
     652&#x1100;&#xAC01;
     653&#x1100;&#x0308;&#xAC01;
     654&#x1100;&#x1F1E6;
     655&#x1100;&#x0308;&#x1F1E6;
     656&#x1100;&#x0378;
     657&#x1100;&#x0308;&#x0378;
     658&#x1160;&#x0020;
     659&#x1160;&#x0308;&#x0020;
     660&#x1160;&#x0300;
     661&#x1160;&#x0308;&#x0300;
     662&#x1160;&#x0903;
     663&#x1160;&#x0308;&#x0903;
     664&#x1160;&#x1100;
     665&#x1160;&#x0308;&#x1100;
     666&#x1160;&#x1160;
     667&#x1160;&#x0308;&#x1160;
     668&#x1160;&#x11A8;
     669&#x1160;&#x0308;&#x11A8;
     670&#x1160;&#xAC00;
     671&#x1160;&#x0308;&#xAC00;
     672&#x1160;&#xAC01;
     673&#x1160;&#x0308;&#xAC01;
     674&#x1160;&#x1F1E6;
     675&#x1160;&#x0308;&#x1F1E6;
     676&#x1160;&#x0378;
     677&#x1160;&#x0308;&#x0378;
     678&#x11A8;&#x0020;
     679&#x11A8;&#x0308;&#x0020;
     680&#x11A8;&#x0300;
     681&#x11A8;&#x0308;&#x0300;
     682&#x11A8;&#x0903;
     683&#x11A8;&#x0308;&#x0903;
     684&#x11A8;&#x1100;
     685&#x11A8;&#x0308;&#x1100;
     686&#x11A8;&#x1160;
     687&#x11A8;&#x0308;&#x1160;
     688&#x11A8;&#x11A8;
     689&#x11A8;&#x0308;&#x11A8;
     690&#x11A8;&#xAC00;
     691&#x11A8;&#x0308;&#xAC00;
     692&#x11A8;&#xAC01;
     693&#x11A8;&#x0308;&#xAC01;
     694&#x11A8;&#x1F1E6;
     695&#x11A8;&#x0308;&#x1F1E6;
     696&#x11A8;&#x0378;
     697&#x11A8;&#x0308;&#x0378;
     698&#xAC00;&#x0020;
     699&#xAC00;&#x0308;&#x0020;
     700&#xAC00;&#x0300;
     701&#xAC00;&#x0308;&#x0300;
     702&#xAC00;&#x0903;
     703&#xAC00;&#x0308;&#x0903;
     704&#xAC00;&#x1100;
     705&#xAC00;&#x0308;&#x1100;
     706&#xAC00;&#x1160;
     707&#xAC00;&#x0308;&#x1160;
     708&#xAC00;&#x11A8;
     709&#xAC00;&#x0308;&#x11A8;
     710&#xAC00;&#xAC00;
     711&#xAC00;&#x0308;&#xAC00;
     712&#xAC00;&#xAC01;
     713&#xAC00;&#x0308;&#xAC01;
     714&#xAC00;&#x1F1E6;
     715&#xAC00;&#x0308;&#x1F1E6;
     716&#xAC00;&#x0378;
     717&#xAC00;&#x0308;&#x0378;
     718&#xAC01;&#x0020;
     719&#xAC01;&#x0308;&#x0020;
     720&#xAC01;&#x0300;
     721&#xAC01;&#x0308;&#x0300;
     722&#xAC01;&#x0903;
     723&#xAC01;&#x0308;&#x0903;
     724&#xAC01;&#x1100;
     725&#xAC01;&#x0308;&#x1100;
     726&#xAC01;&#x1160;
     727&#xAC01;&#x0308;&#x1160;
     728&#xAC01;&#x11A8;
     729&#xAC01;&#x0308;&#x11A8;
     730&#xAC01;&#xAC00;
     731&#xAC01;&#x0308;&#xAC00;
     732&#xAC01;&#xAC01;
     733&#xAC01;&#x0308;&#xAC01;
     734&#xAC01;&#x1F1E6;
     735&#xAC01;&#x0308;&#x1F1E6;
     736&#xAC01;&#x0378;
     737&#xAC01;&#x0308;&#x0378;
     738&#x1F1E6;&#x0020;
     739&#x1F1E6;&#x0308;&#x0020;
     740&#x1F1E6;&#x0300;
     741&#x1F1E6;&#x0308;&#x0300;
     742&#x1F1E6;&#x0903;
     743&#x1F1E6;&#x0308;&#x0903;
     744&#x1F1E6;&#x1100;
     745&#x1F1E6;&#x0308;&#x1100;
     746&#x1F1E6;&#x1160;
     747&#x1F1E6;&#x0308;&#x1160;
     748&#x1F1E6;&#x11A8;
     749&#x1F1E6;&#x0308;&#x11A8;
     750&#x1F1E6;&#xAC00;
     751&#x1F1E6;&#x0308;&#xAC00;
     752&#x1F1E6;&#xAC01;
     753&#x1F1E6;&#x0308;&#xAC01;
     754&#x1F1E6;&#x1F1E6;
     755&#x1F1E6;&#x0308;&#x1F1E6;
     756&#x1F1E6;&#x0378;
     757&#x1F1E6;&#x0308;&#x0378;
     758&#x0378;&#x0020;
     759&#x0378;&#x0308;&#x0020;
     760&#x0378;&#x0300;
     761&#x0378;&#x0308;&#x0300;
     762&#x0378;&#x0903;
     763&#x0378;&#x0308;&#x0903;
     764&#x0378;&#x1100;
     765&#x0378;&#x0308;&#x1100;
     766&#x0378;&#x1160;
     767&#x0378;&#x0308;&#x1160;
     768&#x0378;&#x11A8;
     769&#x0378;&#x0308;&#x11A8;
     770&#x0378;&#xAC00;
     771&#x0378;&#x0308;&#xAC00;
     772&#x0378;&#xAC01;
     773&#x0378;&#x0308;&#xAC01;
     774&#x0378;&#x1F1E6;
     775&#x0378;&#x0308;&#x1F1E6;
     776&#x0378;&#x0378;
     777&#x0378;&#x0308;&#x0378;
     778&#x0061;&#x1F1E6;&#x0062;
     779&#x1F1F7;&#x1F1FA;
     780&#x1F1F7;&#x1F1FA;&#x1F1F8;
     781&#x1F1F7;&#x1F1FA;&#x1F1F8;&#x1F1EA;
     782&#x1F1F7;&#x1F1FA;&#x200B;&#x1F1F8;&#x1F1EA;
     783&#x1F1E6;&#x1F1E7;&#x1F1E8;
     784&#x1F1E6;&#x200D;&#x1F1E7;&#x1F1E8;
     785&#x1F1E6;&#x1F1E7;&#x200D;&#x1F1E8;
     786&#x0020;&#x200D;&#x0646;
     787&#x0646;&#x200D;&#x0020;
     788</datafile>
     789<grepcase regexp="^\X$" datafile="graphemebreaktest" grepcount="55"/>
     790<grepcase regexp="^\X\X$" datafile="graphemebreaktest" grepcount="153"/>
     791<grepcase regexp="^\X{3}$" datafile="graphemebreaktest" grepcount="2"/>
     792<grepcase regexp="^\X{4,}$" datafile="graphemebreaktest" grepcount="0"/>
     793<grepcase regexp=" \b{g}" datafile="graphemebreaktest" grepcount="28"/>
     794<grepcase regexp=" \B{g}" datafile="graphemebreaktest" grepcount="14"/>
     795<grepcase regexp="\x{1160}\b{g}" datafile="graphemebreaktest" grepcount="26"/>
     796<grepcase regexp="\x{1160}\B{g}" datafile="graphemebreaktest" grepcount="14"/>
     797<grepcase regexp="\b{g}\x{308}" datafile="graphemebreaktest" grepcount="0"/>
     798<grepcase regexp="\B{g}\x{308}" datafile="graphemebreaktest" grepcount="100"/>
    571799</greptest>
Note: See TracChangeset for help on using the changeset viewer.