Changeset 4621 for icGREP


Ignore:
Timestamp:
Jun 28, 2015, 3:55:39 PM (4 years ago)
Author:
nmedfort
Message:

Bug fix for CC insert_range and UnicodeSet? iterator.

Location:
icGREP/icgrep-devel/icgrep
Files:
13 edited

Legend:

Unmodified
Added
Removed
  • icGREP/icgrep-devel/icgrep/UCD/Blocks.h

    r4618 r4621  
    1717    const UnicodeSet aegean_numbers_Set
    1818      {{{Empty, 2056}, {Full, 2}, {Empty, 32758}},
    19        {}}
    20 ;
     19       {}};
    2120    const UnicodeSet alchemical_Set
    2221      {{{Empty, 4024}, {Full, 4}, {Empty, 30788}},
    23        {}}
    24 ;
     22       {}};
    2523    const UnicodeSet alphabetic_pf_Set
    2624      {{{Empty, 2008}, {Full, 2}, {Mixed, 1}, {Empty, 32805}},
    27        {0x0000ffff}}
    28 ;
     25       {0x0000ffff}};
    2926    const UnicodeSet ancient_greek_music_Set
    3027      {{{Empty, 3728}, {Full, 2}, {Mixed, 1}, {Empty, 31085}},
    31        {0x0000ffff}}
    32 ;
     28       {0x0000ffff}};
    3329    const UnicodeSet ancient_greek_numbers_Set
    3430      {{{Empty, 2058}, {Full, 2}, {Mixed, 1}, {Empty, 32755}},
    35        {0x0000ffff}}
    36 ;
     31       {0x0000ffff}};
    3732    const UnicodeSet ancient_symbols_Set
    3833      {{{Empty, 2060}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 32753}},
    39        {0xffff0000, 0x0000ffff}}
    40 ;
     34       {0xffff0000, 0x0000ffff}};
    4135    const UnicodeSet arabic_Set
    4236      {{{Empty, 48}, {Full, 8}, {Empty, 34760}},
    43        {}}
    44 ;
     37       {}};
    4538    const UnicodeSet arabic_ext_a_Set
    4639      {{{Empty, 69}, {Full, 3}, {Empty, 34744}},
    47        {}}
    48 ;
     40       {}};
    4941    const UnicodeSet arabic_math_Set
    5042      {{{Empty, 3952}, {Full, 8}, {Empty, 30856}},
    51        {}}
    52 ;
     43       {}};
    5344    const UnicodeSet arabic_pf_a_Set
    5445      {{{Empty, 2010}, {Mixed, 1}, {Full, 21}, {Empty, 32784}},
    55        {0xffff0000}}
    56 ;
     46       {0xffff0000}};
    5747    const UnicodeSet arabic_pf_b_Set
    5848      {{{Empty, 2035}, {Mixed, 1}, {Full, 4}, {Empty, 32776}},
    59        {0xffff0000}}
    60 ;
     49       {0xffff0000}};
    6150    const UnicodeSet arabic_sup_Set
    6251      {{{Empty, 58}, {Mixed, 1}, {Full, 1}, {Empty, 34756}},
    63        {0xffff0000}}
    64 ;
     52       {0xffff0000}};
    6553    const UnicodeSet armenian_Set
    6654      {{{Empty, 41}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Empty, 34771}},
    67        {0xffff0000, 0x0000ffff}}
    68 ;
     55       {0xffff0000, 0x0000ffff}};
    6956    const UnicodeSet arrows_Set
    7057      {{{Empty, 268}, {Mixed, 1}, {Full, 3}, {Empty, 34544}},
    71        {0xffff0000}}
    72 ;
     58       {0xffff0000}};
    7359    const UnicodeSet ascii_Set
    7460      {{{Full, 4}, {Empty, 34812}},
    75        {}}
    76 ;
     61       {}};
    7762    const UnicodeSet avestan_Set
    7863      {{{Empty, 2136}, {Full, 2}, {Empty, 32678}},
    79        {}}
    80 ;
     64       {}};
    8165    const UnicodeSet balinese_Set
    8266      {{{Empty, 216}, {Full, 4}, {Empty, 34596}},
    83        {}}
    84 ;
     67       {}};
    8568    const UnicodeSet bamum_Set
    8669      {{{Empty, 1333}, {Full, 3}, {Empty, 33480}},
    87        {}}
    88 ;
     70       {}};
    8971    const UnicodeSet bamum_sup_Set
    9072      {{{Empty, 2880}, {Full, 18}, {Empty, 31918}},
    91        {}}
    92 ;
     73       {}};
    9374    const UnicodeSet bassa_vah_Set
    9475      {{{Empty, 2902}, {Mixed, 1}, {Full, 1}, {Empty, 31912}},
    95        {0xffff0000}}
    96 ;
     76       {0xffff0000}};
    9777    const UnicodeSet batak_Set
    9878      {{{Empty, 222}, {Full, 2}, {Empty, 34592}},
    99        {}}
    100 ;
     79       {}};
    10180    const UnicodeSet bengali_Set
    10281      {{{Empty, 76}, {Full, 4}, {Empty, 34736}},
    103        {}}
    104 ;
     82       {}};
    10583    const UnicodeSet block_elements_Set
    10684      {{{Empty, 300}, {Full, 1}, {Empty, 34515}},
    107        {}}
    108 ;
     85       {}};
    10986    const UnicodeSet bopomofo_Set
    11087      {{{Empty, 392}, {Full, 1}, {Mixed, 1}, {Empty, 34422}},
    111        {0x0000ffff}}
    112 ;
     88       {0x0000ffff}};
    11389    const UnicodeSet bopomofo_ext_Set
    11490      {{{Empty, 397}, {Full, 1}, {Empty, 34418}},
    115        {}}
    116 ;
     91       {}};
    11792    const UnicodeSet box_drawing_Set
    11893      {{{Empty, 296}, {Full, 4}, {Empty, 34516}},
    119        {}}
    120 ;
     94       {}};
    12195    const UnicodeSet brahmi_Set
    12296      {{{Empty, 2176}, {Full, 4}, {Empty, 32636}},
    123        {}}
    124 ;
     97       {}};
    12598    const UnicodeSet braille_Set
    12699      {{{Empty, 320}, {Full, 8}, {Empty, 34488}},
    127        {}}
    128 ;
     100       {}};
    129101    const UnicodeSet buginese_Set
    130102      {{{Empty, 208}, {Full, 1}, {Empty, 34607}},
    131        {}}
    132 ;
     103       {}};
    133104    const UnicodeSet buhid_Set
    134105      {{{Empty, 186}, {Full, 1}, {Empty, 34629}},
    135        {}}
    136 ;
     106       {}};
    137107    const UnicodeSet byzantine_music_Set
    138108      {{{Empty, 3712}, {Full, 8}, {Empty, 31096}},
    139        {}}
    140 ;
     109       {}};
    141110    const UnicodeSet carian_Set
    142111      {{{Empty, 2069}, {Full, 2}, {Empty, 32745}},
    143        {}}
    144 ;
     112       {}};
    145113    const UnicodeSet caucasian_albanian_Set
    146114      {{{Empty, 2089}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 32724}},
    147        {0xffff0000, 0x0000ffff}}
    148 ;
     115       {0xffff0000, 0x0000ffff}};
    149116    const UnicodeSet chakma_Set
    150117      {{{Empty, 2184}, {Full, 2}, {Mixed, 1}, {Empty, 32629}},
    151        {0x0000ffff}}
    152 ;
     118       {0x0000ffff}};
    153119    const UnicodeSet cham_Set
    154120      {{{Empty, 1360}, {Full, 3}, {Empty, 33453}},
    155        {}}
    156 ;
     121       {}};
    157122    const UnicodeSet cherokee_Set
    158123      {{{Empty, 157}, {Full, 3}, {Empty, 34656}},
    159        {}}
    160 ;
     124       {}};
    161125    const UnicodeSet cjk_Set
    162126      {{{Empty, 624}, {Full, 656}, {Empty, 33536}},
    163        {}}
    164 ;
     127       {}};
    165128    const UnicodeSet cjk_compat_Set
    166129      {{{Empty, 408}, {Full, 8}, {Empty, 34400}},
    167        {}}
    168 ;
     130       {}};
    169131    const UnicodeSet cjk_compat_forms_Set
    170132      {{{Empty, 2033}, {Mixed, 2}, {Empty, 32781}},
    171        {0xffff0000, 0x0000ffff}}
    172 ;
     133       {0xffff0000, 0x0000ffff}};
    173134    const UnicodeSet cjk_compat_ideographs_Set
    174135      {{{Empty, 1992}, {Full, 16}, {Empty, 32808}},
    175        {}}
    176 ;
     136       {}};
    177137    const UnicodeSet cjk_compat_ideographs_sup_Set
    178138      {{{Empty, 6080}, {Full, 17}, {Empty, 28719}},
    179        {}}
    180 ;
     139       {}};
    181140    const UnicodeSet cjk_ext_a_Set
    182141      {{{Empty, 416}, {Full, 206}, {Empty, 34194}},
    183        {}}
    184 ;
     142       {}};
    185143    const UnicodeSet cjk_ext_b_Set
    186144      {{{Empty, 4096}, {Full, 1335}, {Empty, 29385}},
    187        {}}
    188 ;
     145       {}};
    189146    const UnicodeSet cjk_ext_c_Set
    190147      {{{Empty, 5432}, {Full, 130}, {Empty, 29254}},
    191        {}}
    192 ;
     148       {}};
    193149    const UnicodeSet cjk_ext_d_Set
    194150      {{{Empty, 5562}, {Full, 7}, {Empty, 29247}},
    195        {}}
    196 ;
     151       {}};
    197152    const UnicodeSet cjk_radicals_sup_Set
    198153      {{{Empty, 372}, {Full, 4}, {Empty, 34440}},
    199        {}}
    200 ;
     154       {}};
    201155    const UnicodeSet cjk_strokes_Set
    202156      {{{Empty, 398}, {Full, 1}, {Mixed, 1}, {Empty, 34416}},
    203        {0x0000ffff}}
    204 ;
     157       {0x0000ffff}};
    205158    const UnicodeSet cjk_symbols_Set
    206159      {{{Empty, 384}, {Full, 2}, {Empty, 34430}},
    207        {}}
    208 ;
     160       {}};
    209161    const UnicodeSet compat_jamo_Set
    210162      {{{Empty, 393}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Empty, 34419}},
    211        {0xffff0000, 0x0000ffff}}
    212 ;
     163       {0xffff0000, 0x0000ffff}};
    213164    const UnicodeSet control_pictures_Set
    214165      {{{Empty, 288}, {Full, 2}, {Empty, 34526}},
    215        {}}
    216 ;
     166       {}};
    217167    const UnicodeSet coptic_Set
    218168      {{{Empty, 356}, {Full, 4}, {Empty, 34456}},
    219        {}}
    220 ;
     169       {}};
    221170    const UnicodeSet coptic_epact_numbers_Set
    222171      {{{Empty, 2071}, {Full, 1}, {Empty, 32744}},
    223        {}}
    224 ;
     172       {}};
    225173    const UnicodeSet counting_rod_Set
    226174      {{{Empty, 3739}, {Full, 1}, {Empty, 31076}},
    227        {}}
    228 ;
     175       {}};
    229176    const UnicodeSet cuneiform_Set
    230177      {{{Empty, 2304}, {Full, 32}, {Empty, 32480}},
    231        {}}
    232 ;
     178       {}};
    233179    const UnicodeSet cuneiform_numbers_Set
    234180      {{{Empty, 2336}, {Full, 4}, {Empty, 32476}},
    235        {}}
    236 ;
     181       {}};
    237182    const UnicodeSet currency_symbols_Set
    238183      {{{Empty, 261}, {Full, 1}, {Mixed, 1}, {Empty, 34553}},
    239        {0x0000ffff}}
    240 ;
     184       {0x0000ffff}};
    241185    const UnicodeSet cypriot_syllabary_Set
    242186      {{{Empty, 2112}, {Full, 2}, {Empty, 32702}},
    243        {}}
    244 ;
     187       {}};
    245188    const UnicodeSet cyrillic_Set
    246189      {{{Empty, 32}, {Full, 8}, {Empty, 34776}},
    247        {}}
    248 ;
     190       {}};
    249191    const UnicodeSet cyrillic_ext_a_Set
    250192      {{{Empty, 367}, {Full, 1}, {Empty, 34448}},
    251        {}}
    252 ;
     193       {}};
    253194    const UnicodeSet cyrillic_ext_b_Set
    254195      {{{Empty, 1330}, {Full, 3}, {Empty, 33483}},
    255        {}}
    256 ;
     196       {}};
    257197    const UnicodeSet cyrillic_sup_Set
    258198      {{{Empty, 40}, {Full, 1}, {Mixed, 1}, {Empty, 34774}},
    259        {0x0000ffff}}
    260 ;
     199       {0x0000ffff}};
    261200    const UnicodeSet deseret_Set
    262201      {{{Empty, 2080}, {Full, 2}, {Mixed, 1}, {Empty, 32733}},
    263        {0x0000ffff}}
    264 ;
     202       {0x0000ffff}};
    265203    const UnicodeSet devanagari_Set
    266204      {{{Empty, 72}, {Full, 4}, {Empty, 34740}},
    267        {}}
    268 ;
     205       {}};
    269206    const UnicodeSet devanagari_ext_Set
    270207      {{{Empty, 1351}, {Full, 1}, {Empty, 33464}},
    271        {}}
    272 ;
     208       {}};
    273209    const UnicodeSet diacriticals_Set
    274210      {{{Empty, 24}, {Full, 3}, {Mixed, 1}, {Empty, 34788}},
    275        {0x0000ffff}}
    276 ;
     211       {0x0000ffff}};
    277212    const UnicodeSet diacriticals_ext_Set
    278213      {{{Empty, 213}, {Mixed, 1}, {Full, 2}, {Empty, 34600}},
    279        {0xffff0000}}
    280 ;
     214       {0xffff0000}};
    281215    const UnicodeSet diacriticals_for_symbols_Set
    282216      {{{Empty, 262}, {Mixed, 1}, {Full, 1}, {Empty, 34552}},
    283        {0xffff0000}}
    284 ;
     217       {0xffff0000}};
    285218    const UnicodeSet diacriticals_sup_Set
    286219      {{{Empty, 238}, {Full, 2}, {Empty, 34576}},
    287        {}}
    288 ;
     220       {}};
    289221    const UnicodeSet dingbats_Set
    290222      {{{Empty, 312}, {Full, 6}, {Empty, 34498}},
    291        {}}
    292 ;
     223       {}};
    293224    const UnicodeSet domino_Set
    294225      {{{Empty, 3969}, {Mixed, 1}, {Full, 3}, {Empty, 30843}},
    295        {0xffff0000}}
    296 ;
     226       {0xffff0000}};
    297227    const UnicodeSet duployan_Set
    298228      {{{Empty, 3552}, {Full, 5}, {Empty, 31259}},
    299        {}}
    300 ;
     229       {}};
    301230    const UnicodeSet egyptian_hieroglyphs_Set
    302231      {{{Empty, 2432}, {Full, 33}, {Mixed, 1}, {Empty, 32350}},
    303        {0x0000ffff}}
    304 ;
     232       {0x0000ffff}};
    305233    const UnicodeSet elbasan_Set
    306234      {{{Empty, 2088}, {Full, 1}, {Mixed, 1}, {Empty, 32726}},
    307        {0x0000ffff}}
    308 ;
     235       {0x0000ffff}};
    309236    const UnicodeSet emoticons_Set
    310237      {{{Empty, 4016}, {Full, 2}, {Mixed, 1}, {Empty, 30797}},
    311        {0x0000ffff}}
    312 ;
     238       {0x0000ffff}};
    313239    const UnicodeSet enclosed_alphanum_Set
    314240      {{{Empty, 291}, {Full, 5}, {Empty, 34520}},
    315        {}}
    316 ;
     241       {}};
    317242    const UnicodeSet enclosed_alphanum_sup_Set
    318243      {{{Empty, 3976}, {Full, 8}, {Empty, 30832}},
    319        {}}
    320 ;
     244       {}};
    321245    const UnicodeSet enclosed_cjk_Set
    322246      {{{Empty, 400}, {Full, 8}, {Empty, 34408}},
    323        {}}
    324 ;
     247       {}};
    325248    const UnicodeSet enclosed_ideographic_sup_Set
    326249      {{{Empty, 3984}, {Full, 8}, {Empty, 30824}},
    327        {}}
    328 ;
     250       {}};
    329251    const UnicodeSet ethiopic_Set
    330252      {{{Empty, 144}, {Full, 12}, {Empty, 34660}},
    331        {}}
    332 ;
     253       {}};
    333254    const UnicodeSet ethiopic_ext_Set
    334255      {{{Empty, 364}, {Full, 3}, {Empty, 34449}},
    335        {}}
    336 ;
     256       {}};
    337257    const UnicodeSet ethiopic_ext_a_Set
    338258      {{{Empty, 1368}, {Full, 1}, {Mixed, 1}, {Empty, 33446}},
    339        {0x0000ffff}}
    340 ;
     259       {0x0000ffff}};
    341260    const UnicodeSet ethiopic_sup_Set
    342261      {{{Empty, 156}, {Full, 1}, {Empty, 34659}},
    343        {}}
    344 ;
     262       {}};
    345263    const UnicodeSet geometric_shapes_Set
    346264      {{{Empty, 301}, {Full, 3}, {Empty, 34512}},
    347        {}}
    348 ;
     265       {}};
    349266    const UnicodeSet geometric_shapes_ext_Set
    350267      {{{Empty, 4028}, {Full, 4}, {Empty, 30784}},
    351        {}}
    352 ;
     268       {}};
    353269    const UnicodeSet georgian_Set
    354270      {{{Empty, 133}, {Full, 3}, {Empty, 34680}},
    355        {}}
    356 ;
     271       {}};
    357272    const UnicodeSet georgian_sup_Set
    358273      {{{Empty, 360}, {Full, 1}, {Mixed, 1}, {Empty, 34454}},
    359        {0x0000ffff}}
    360 ;
     274       {0x0000ffff}};
    361275    const UnicodeSet glagolitic_Set
    362276      {{{Empty, 352}, {Full, 3}, {Empty, 34461}},
    363        {}}
    364 ;
     277       {}};
    365278    const UnicodeSet gothic_Set
    366279      {{{Empty, 2073}, {Mixed, 2}, {Empty, 32741}},
    367        {0xffff0000, 0x0000ffff}}
    368 ;
     280       {0xffff0000, 0x0000ffff}};
    369281    const UnicodeSet grantha_Set
    370282      {{{Empty, 2200}, {Full, 4}, {Empty, 32612}},
    371        {}}
    372 ;
     283       {}};
    373284    const UnicodeSet greek_Set
    374285      {{{Empty, 27}, {Mixed, 1}, {Full, 4}, {Empty, 34784}},
    375        {0xffff0000}}
    376 ;
     286       {0xffff0000}};
    377287    const UnicodeSet greek_ext_Set
    378288      {{{Empty, 248}, {Full, 8}, {Empty, 34560}},
    379        {}}
    380 ;
     289       {}};
    381290    const UnicodeSet gujarati_Set
    382291      {{{Empty, 84}, {Full, 4}, {Empty, 34728}},
    383        {}}
    384 ;
     292       {}};
    385293    const UnicodeSet gurmukhi_Set
    386294      {{{Empty, 80}, {Full, 4}, {Empty, 34732}},
    387        {}}
    388 ;
     295       {}};
    389296    const UnicodeSet half_and_full_forms_Set
    390297      {{{Empty, 2040}, {Full, 7}, {Mixed, 1}, {Empty, 32768}},
    391        {0x0000ffff}}
    392 ;
     298       {0x0000ffff}};
    393299    const UnicodeSet half_marks_Set
    394300      {{{Empty, 2033}, {Mixed, 1}, {Empty, 32782}},
    395        {0x0000ffff}}
    396 ;
     301       {0x0000ffff}};
    397302    const UnicodeSet hangul_Set
    398303      {{{Empty, 1376}, {Full, 349}, {Mixed, 1}, {Empty, 33090}},
    399        {0x0000ffff}}
    400 ;
     304       {0x0000ffff}};
    401305    const UnicodeSet hanunoo_Set
    402306      {{{Empty, 185}, {Full, 1}, {Empty, 34630}},
    403        {}}
    404 ;
     307       {}};
    405308    const UnicodeSet hebrew_Set
    406309      {{{Empty, 44}, {Mixed, 1}, {Full, 3}, {Empty, 34768}},
    407        {0xffff0000}}
    408 ;
     310       {0xffff0000}};
    409311    const UnicodeSet high_pu_surrogates_Set
    410312      {{{Empty, 1756}, {Full, 4}, {Empty, 33056}},
    411        {}}
    412 ;
     313       {}};
    413314    const UnicodeSet high_surrogates_Set
    414315      {{{Empty, 1728}, {Full, 28}, {Empty, 33060}},
    415        {}}
    416 ;
     316       {}};
    417317    const UnicodeSet hiragana_Set
    418318      {{{Empty, 386}, {Full, 3}, {Empty, 34427}},
    419        {}}
    420 ;
     319       {}};
    421320    const UnicodeSet idc_Set
    422321      {{{Empty, 383}, {Mixed, 1}, {Empty, 34432}},
    423        {0xffff0000}}
    424 ;
     322       {0xffff0000}};
    425323    const UnicodeSet imperial_aramaic_Set
    426324      {{{Empty, 2114}, {Full, 1}, {Empty, 32701}},
    427        {}}
    428 ;
     325       {}};
    429326    const UnicodeSet indic_number_forms_Set
    430327      {{{Empty, 1345}, {Mixed, 1}, {Empty, 33470}},
    431        {0xffff0000}}
    432 ;
     328       {0xffff0000}};
    433329    const UnicodeSet inscriptional_pahlavi_Set
    434330      {{{Empty, 2139}, {Full, 1}, {Empty, 32676}},
    435        {}}
    436 ;
     331       {}};
    437332    const UnicodeSet inscriptional_parthian_Set
    438333      {{{Empty, 2138}, {Full, 1}, {Empty, 32677}},
    439        {}}
    440 ;
     334       {}};
    441335    const UnicodeSet ipa_ext_Set
    442336      {{{Empty, 18}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Empty, 34794}},
    443        {0xffff0000, 0x0000ffff}}
    444 ;
     337       {0xffff0000, 0x0000ffff}};
    445338    const UnicodeSet jamo_Set
    446339      {{{Empty, 136}, {Full, 8}, {Empty, 34672}},
    447        {}}
    448 ;
     340       {}};
    449341    const UnicodeSet jamo_ext_a_Set
    450342      {{{Empty, 1355}, {Full, 1}, {Empty, 33460}},
    451        {}}
    452 ;
     343       {}};
    453344    const UnicodeSet jamo_ext_b_Set
    454345      {{{Empty, 1725}, {Mixed, 1}, {Full, 2}, {Empty, 33088}},
    455        {0xffff0000}}
    456 ;
     346       {0xffff0000}};
    457347    const UnicodeSet javanese_Set
    458348      {{{Empty, 1356}, {Full, 3}, {Empty, 33457}},
    459        {}}
    460 ;
     349       {}};
    461350    const UnicodeSet kaithi_Set
    462351      {{{Empty, 2180}, {Full, 2}, {Mixed, 1}, {Empty, 32633}},
    463        {0x0000ffff}}
    464 ;
     352       {0x0000ffff}};
    465353    const UnicodeSet kana_sup_Set
    466354      {{{Empty, 3456}, {Full, 8}, {Empty, 31352}},
    467        {}}
    468 ;
     355       {}};
    469356    const UnicodeSet kanbun_Set
    470357      {{{Empty, 396}, {Mixed, 1}, {Empty, 34419}},
    471        {0xffff0000}}
    472 ;
     358       {0xffff0000}};
    473359    const UnicodeSet kangxi_Set
    474360      {{{Empty, 376}, {Full, 7}, {Empty, 34433}},
    475        {}}
    476 ;
     361       {}};
    477362    const UnicodeSet kannada_Set
    478363      {{{Empty, 100}, {Full, 4}, {Empty, 34712}},
    479        {}}
    480 ;
     364       {}};
    481365    const UnicodeSet katakana_Set
    482366      {{{Empty, 389}, {Full, 3}, {Empty, 34424}},
    483        {}}
    484 ;
     367       {}};
    485368    const UnicodeSet katakana_ext_Set
    486369      {{{Empty, 399}, {Mixed, 1}, {Empty, 34416}},
    487        {0xffff0000}}
    488 ;
     370       {0xffff0000}};
    489371    const UnicodeSet kayah_li_Set
    490372      {{{Empty, 1352}, {Full, 1}, {Mixed, 1}, {Empty, 33462}},
    491        {0x0000ffff}}
    492 ;
     373       {0x0000ffff}};
    493374    const UnicodeSet kharoshthi_Set
    494375      {{{Empty, 2128}, {Full, 3}, {Empty, 32685}},
    495        {}}
    496 ;
     376       {}};
    497377    const UnicodeSet khmer_Set
    498378      {{{Empty, 188}, {Full, 4}, {Empty, 34624}},
    499        {}}
    500 ;
     379       {}};
    501380    const UnicodeSet khmer_symbols_Set
    502381      {{{Empty, 207}, {Full, 1}, {Empty, 34608}},
    503        {}}
    504 ;
     382       {}};
    505383    const UnicodeSet khojki_Set
    506384      {{{Empty, 2192}, {Full, 2}, {Mixed, 1}, {Empty, 32621}},
    507        {0x0000ffff}}
    508 ;
     385       {0x0000ffff}};
    509386    const UnicodeSet khudawadi_Set
    510387      {{{Empty, 2197}, {Mixed, 1}, {Full, 2}, {Empty, 32616}},
    511        {0xffff0000}}
    512 ;
     388       {0xffff0000}};
    513389    const UnicodeSet lao_Set
    514390      {{{Empty, 116}, {Full, 4}, {Empty, 34696}},
    515        {}}
    516 ;
     391       {}};
    517392    const UnicodeSet latin_1_sup_Set
    518393      {{{Empty, 4}, {Full, 4}, {Empty, 34808}},
    519        {}}
    520 ;
     394       {}};
    521395    const UnicodeSet latin_ext_a_Set
    522396      {{{Empty, 8}, {Full, 4}, {Empty, 34804}},
    523        {}}
    524 ;
     397       {}};
    525398    const UnicodeSet latin_ext_additional_Set
    526399      {{{Empty, 240}, {Full, 8}, {Empty, 34568}},
    527        {}}
    528 ;
     400       {}};
    529401    const UnicodeSet latin_ext_b_Set
    530402      {{{Empty, 12}, {Full, 6}, {Mixed, 1}, {Empty, 34797}},
    531        {0x0000ffff}}
    532 ;
     403       {0x0000ffff}};
    533404    const UnicodeSet latin_ext_c_Set
    534405      {{{Empty, 355}, {Full, 1}, {Empty, 34460}},
    535        {}}
    536 ;
     406       {}};
    537407    const UnicodeSet latin_ext_d_Set
    538408      {{{Empty, 1337}, {Full, 7}, {Empty, 33472}},
    539        {}}
    540 ;
     409       {}};
    541410    const UnicodeSet latin_ext_e_Set
    542411      {{{Empty, 1369}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 33444}},
    543        {0xffff0000, 0x0000ffff}}
    544 ;
     412       {0xffff0000, 0x0000ffff}};
    545413    const UnicodeSet lepcha_Set
    546414      {{{Empty, 224}, {Full, 2}, {Mixed, 1}, {Empty, 34589}},
    547        {0x0000ffff}}
    548 ;
     415       {0x0000ffff}};
    549416    const UnicodeSet letterlike_symbols_Set
    550417      {{{Empty, 264}, {Full, 2}, {Mixed, 1}, {Empty, 34549}},
    551        {0x0000ffff}}
    552 ;
     418       {0x0000ffff}};
    553419    const UnicodeSet limbu_Set
    554420      {{{Empty, 200}, {Full, 2}, {Mixed, 1}, {Empty, 34613}},
    555        {0x0000ffff}}
    556 ;
     421       {0x0000ffff}};
    557422    const UnicodeSet linear_a_Set
    558423      {{{Empty, 2096}, {Full, 12}, {Empty, 32708}},
    559        {}}
    560 ;
     424       {}};
    561425    const UnicodeSet linear_b_ideograms_Set
    562426      {{{Empty, 2052}, {Full, 4}, {Empty, 32760}},
    563        {}}
    564 ;
     427       {}};
    565428    const UnicodeSet linear_b_syllabary_Set
    566429      {{{Empty, 2048}, {Full, 4}, {Empty, 32764}},
    567        {}}
    568 ;
     430       {}};
    569431    const UnicodeSet lisu_Set
    570432      {{{Empty, 1318}, {Mixed, 1}, {Full, 1}, {Empty, 33496}},
    571        {0xffff0000}}
    572 ;
     433       {0xffff0000}};
    573434    const UnicodeSet low_surrogates_Set
    574435      {{{Empty, 1760}, {Full, 32}, {Empty, 33024}},
    575        {}}
    576 ;
     436       {}};
    577437    const UnicodeSet lycian_Set
    578438      {{{Empty, 2068}, {Full, 1}, {Empty, 32747}},
    579        {}}
    580 ;
     439       {}};
    581440    const UnicodeSet lydian_Set
    582441      {{{Empty, 2121}, {Full, 1}, {Empty, 32694}},
    583        {}}
    584 ;
     442       {}};
    585443    const UnicodeSet mahajani_Set
    586444      {{{Empty, 2186}, {Mixed, 1}, {Full, 1}, {Empty, 32628}},
    587        {0xffff0000}}
    588 ;
     445       {0xffff0000}};
    589446    const UnicodeSet mahjong_Set
    590447      {{{Empty, 3968}, {Full, 1}, {Mixed, 1}, {Empty, 30846}},
    591        {0x0000ffff}}
    592 ;
     448       {0x0000ffff}};
    593449    const UnicodeSet malayalam_Set
    594450      {{{Empty, 104}, {Full, 4}, {Empty, 34708}},
    595        {}}
    596 ;
     451       {}};
    597452    const UnicodeSet mandaic_Set
    598453      {{{Empty, 66}, {Full, 1}, {Empty, 34749}},
    599        {}}
    600 ;
     454       {}};
    601455    const UnicodeSet manichaean_Set
    602456      {{{Empty, 2134}, {Full, 2}, {Empty, 32680}},
    603        {}}
    604 ;
     457       {}};
    605458    const UnicodeSet math_alphanum_Set
    606459      {{{Empty, 3744}, {Full, 32}, {Empty, 31040}},
    607        {}}
    608 ;
     460       {}};
    609461    const UnicodeSet math_operators_Set
    610462      {{{Empty, 272}, {Full, 8}, {Empty, 34536}},
    611        {}}
    612 ;
     463       {}};
    613464    const UnicodeSet meetei_mayek_Set
    614465      {{{Empty, 1374}, {Full, 2}, {Empty, 33440}},
    615        {}}
    616 ;
     466       {}};
    617467    const UnicodeSet meetei_mayek_ext_Set
    618468      {{{Empty, 1367}, {Full, 1}, {Empty, 33448}},
    619        {}}
    620 ;
     469       {}};
    621470    const UnicodeSet mende_kikakui_Set
    622471      {{{Empty, 3904}, {Full, 7}, {Empty, 30905}},
    623        {}}
    624 ;
     472       {}};
    625473    const UnicodeSet meroitic_cursive_Set
    626474      {{{Empty, 2125}, {Full, 3}, {Empty, 32688}},
    627        {}}
    628 ;
     475       {}};
    629476    const UnicodeSet meroitic_hieroglyphs_Set
    630477      {{{Empty, 2124}, {Full, 1}, {Empty, 32691}},
    631        {}}
    632 ;
     478       {}};
    633479    const UnicodeSet miao_Set
    634480      {{{Empty, 2936}, {Full, 5}, {Empty, 31875}},
    635        {}}
    636 ;
     481       {}};
    637482    const UnicodeSet misc_arrows_Set
    638483      {{{Empty, 344}, {Full, 8}, {Empty, 34464}},
    639        {}}
    640 ;
     484       {}};
    641485    const UnicodeSet misc_math_symbols_a_Set
    642486      {{{Empty, 318}, {Full, 1}, {Mixed, 1}, {Empty, 34496}},
    643        {0x0000ffff}}
    644 ;
     487       {0x0000ffff}};
    645488    const UnicodeSet misc_math_symbols_b_Set
    646489      {{{Empty, 332}, {Full, 4}, {Empty, 34480}},
    647        {}}
    648 ;
     490       {}};
    649491    const UnicodeSet misc_pictographs_Set
    650492      {{{Empty, 3992}, {Full, 24}, {Empty, 30800}},
    651        {}}
    652 ;
     493       {}};
    653494    const UnicodeSet misc_symbols_Set
    654495      {{{Empty, 304}, {Full, 8}, {Empty, 34504}},
    655        {}}
    656 ;
     496       {}};
    657497    const UnicodeSet misc_technical_Set
    658498      {{{Empty, 280}, {Full, 8}, {Empty, 34528}},
    659        {}}
    660 ;
     499       {}};
    661500    const UnicodeSet modi_Set
    662501      {{{Empty, 2224}, {Full, 3}, {Empty, 32589}},
    663        {}}
    664 ;
     502       {}};
    665503    const UnicodeSet modifier_letters_Set
    666504      {{{Empty, 21}, {Mixed, 1}, {Full, 2}, {Empty, 34792}},
    667        {0xffff0000}}
    668 ;
     505       {0xffff0000}};
    669506    const UnicodeSet modifier_tone_letters_Set
    670507      {{{Empty, 1336}, {Full, 1}, {Empty, 33479}},
    671        {}}
    672 ;
     508       {}};
    673509    const UnicodeSet mongolian_Set
    674510      {{{Empty, 192}, {Full, 5}, {Mixed, 1}, {Empty, 34618}},
    675        {0x0000ffff}}
    676 ;
     511       {0x0000ffff}};
    677512    const UnicodeSet mro_Set
    678513      {{{Empty, 2898}, {Full, 1}, {Mixed, 1}, {Empty, 31916}},
    679        {0x0000ffff}}
    680 ;
     514       {0x0000ffff}};
    681515    const UnicodeSet music_Set
    682516      {{{Empty, 3720}, {Full, 8}, {Empty, 31088}},
    683        {}}
    684 ;
     517       {}};
    685518    const UnicodeSet myanmar_Set
    686519      {{{Empty, 128}, {Full, 5}, {Empty, 34683}},
    687        {}}
    688 ;
     520       {}};
    689521    const UnicodeSet myanmar_ext_a_Set
    690522      {{{Empty, 1363}, {Full, 1}, {Empty, 33452}},
    691        {}}
    692 ;
     523       {}};
    693524    const UnicodeSet myanmar_ext_b_Set
    694525      {{{Empty, 1359}, {Full, 1}, {Empty, 33456}},
    695        {}}
    696 ;
     526       {}};
    697527    const UnicodeSet nabataean_Set
    698528      {{{Empty, 2116}, {Full, 1}, {Mixed, 1}, {Empty, 32698}},
    699        {0x0000ffff}}
    700 ;
     529       {0x0000ffff}};
    701530    const UnicodeSet nb_Set
    702531      {{{Empty, 67}, {Full, 2}, {Empty, 159}, {Full, 2}, {Empty, 153},
     
    722551        0xffff0000, 0xffff0000, 0xffff0000, 0x0000ffff, 0xffff0000,
    723552        0xffff0000, 0xffff0000, 0x0000ffff, 0xffff0000, 0xffff0000,
    724         0xffff0000, 0xffff0000}}
    725 ;
     553        0xffff0000, 0xffff0000}};
    726554    const UnicodeSet new_tai_lue_Set
    727555      {{{Empty, 204}, {Full, 3}, {Empty, 34609}},
    728        {}}
    729 ;
     556       {}};
    730557    const UnicodeSet nko_Set
    731558      {{{Empty, 62}, {Full, 2}, {Empty, 34752}},
    732        {}}
    733 ;
     559       {}};
    734560    const UnicodeSet number_forms_Set
    735561      {{{Empty, 266}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 34547}},
    736        {0xffff0000, 0x0000ffff}}
    737 ;
     562       {0xffff0000, 0x0000ffff}};
    738563    const UnicodeSet ocr_Set
    739564      {{{Empty, 290}, {Full, 1}, {Empty, 34525}},
    740        {}}
    741 ;
     565       {}};
    742566    const UnicodeSet ogham_Set
    743567      {{{Empty, 180}, {Full, 1}, {Empty, 34635}},
    744        {}}
    745 ;
     568       {}};
    746569    const UnicodeSet ol_chiki_Set
    747570      {{{Empty, 226}, {Mixed, 1}, {Full, 1}, {Empty, 34588}},
    748        {0xffff0000}}
    749 ;
     571       {0xffff0000}};
    750572    const UnicodeSet old_italic_Set
    751573      {{{Empty, 2072}, {Full, 1}, {Mixed, 1}, {Empty, 32742}},
    752        {0x0000ffff}}
    753 ;
     574       {0x0000ffff}};
    754575    const UnicodeSet old_north_arabian_Set
    755576      {{{Empty, 2132}, {Full, 1}, {Empty, 32683}},
    756        {}}
    757 ;
     577       {}};
    758578    const UnicodeSet old_permic_Set
    759579      {{{Empty, 2074}, {Mixed, 1}, {Full, 1}, {Empty, 32740}},
    760        {0xffff0000}}
    761 ;
     580       {0xffff0000}};
    762581    const UnicodeSet old_persian_Set
    763582      {{{Empty, 2077}, {Full, 2}, {Empty, 32737}},
    764        {}}
    765 ;
     583       {}};
    766584    const UnicodeSet old_south_arabian_Set
    767585      {{{Empty, 2131}, {Full, 1}, {Empty, 32684}},
    768        {}}
    769 ;
     586       {}};
    770587    const UnicodeSet old_turkic_Set
    771588      {{{Empty, 2144}, {Full, 2}, {Mixed, 1}, {Empty, 32669}},
    772        {0x0000ffff}}
    773 ;
     589       {0x0000ffff}};
    774590    const UnicodeSet oriya_Set
    775591      {{{Empty, 88}, {Full, 4}, {Empty, 34724}},
    776        {}}
    777 ;
     592       {}};
    778593    const UnicodeSet ornamental_dingbats_Set
    779594      {{{Empty, 4018}, {Mixed, 1}, {Full, 1}, {Empty, 30796}},
    780        {0xffff0000}}
    781 ;
     595       {0xffff0000}};
    782596    const UnicodeSet osmanya_Set
    783597      {{{Empty, 2084}, {Full, 1}, {Mixed, 1}, {Empty, 32730}},
    784        {0x0000ffff}}
    785 ;
     598       {0x0000ffff}};
    786599    const UnicodeSet pahawh_hmong_Set
    787600      {{{Empty, 2904}, {Full, 4}, {Mixed, 1}, {Empty, 31907}},
    788        {0x0000ffff}}
    789 ;
     601       {0x0000ffff}};
    790602    const UnicodeSet palmyrene_Set
    791603      {{{Empty, 2115}, {Full, 1}, {Empty, 32700}},
    792        {}}
    793 ;
     604       {}};
    794605    const UnicodeSet pau_cin_hau_Set
    795606      {{{Empty, 2262}, {Full, 2}, {Empty, 32552}},
    796        {}}
    797 ;
     607       {}};
    798608    const UnicodeSet phags_pa_Set
    799609      {{{Empty, 1346}, {Full, 2}, {Empty, 33468}},
    800        {}}
    801 ;
     610       {}};
    802611    const UnicodeSet phaistos_Set
    803612      {{{Empty, 2062}, {Mixed, 1}, {Full, 1}, {Empty, 32752}},
    804        {0xffff0000}}
    805 ;
     613       {0xffff0000}};
    806614    const UnicodeSet phoenician_Set
    807615      {{{Empty, 2120}, {Full, 1}, {Empty, 32695}},
    808        {}}
    809 ;
     616       {}};
    810617    const UnicodeSet phonetic_ext_Set
    811618      {{{Empty, 232}, {Full, 4}, {Empty, 34580}},
    812        {}}
    813 ;
     619       {}};
    814620    const UnicodeSet phonetic_ext_sup_Set
    815621      {{{Empty, 236}, {Full, 2}, {Empty, 34578}},
    816        {}}
    817 ;
     622       {}};
    818623    const UnicodeSet playing_cards_Set
    819624      {{{Empty, 3973}, {Full, 3}, {Empty, 30840}},
    820        {}}
    821 ;
     625       {}};
    822626    const UnicodeSet psalter_pahlavi_Set
    823627      {{{Empty, 2140}, {Full, 1}, {Mixed, 1}, {Empty, 32674}},
    824        {0x0000ffff}}
    825 ;
     628       {0x0000ffff}};
    826629    const UnicodeSet pua_Set
    827630      {{{Empty, 1792}, {Full, 200}, {Empty, 32824}},
    828        {}}
    829 ;
     631       {}};
    830632    const UnicodeSet punctuation_Set
    831633      {{{Empty, 256}, {Full, 3}, {Mixed, 1}, {Empty, 34556}},
    832        {0x0000ffff}}
    833 ;
     634       {0x0000ffff}};
    834635    const UnicodeSet rejang_Set
    835636      {{{Empty, 1353}, {Mixed, 1}, {Full, 1}, {Empty, 33461}},
    836        {0xffff0000}}
    837 ;
     637       {0xffff0000}};
    838638    const UnicodeSet rumi_Set
    839639      {{{Empty, 2163}, {Full, 1}, {Empty, 32652}},
    840        {}}
    841 ;
     640       {}};
    842641    const UnicodeSet runic_Set
    843642      {{{Empty, 181}, {Full, 3}, {Empty, 34632}},
    844        {}}
    845 ;
     643       {}};
    846644    const UnicodeSet samaritan_Set
    847645      {{{Empty, 64}, {Full, 2}, {Empty, 34750}},
    848        {}}
    849 ;
     646       {}};
    850647    const UnicodeSet saurashtra_Set
    851648      {{{Empty, 1348}, {Full, 3}, {Empty, 33465}},
    852        {}}
    853 ;
     649       {}};
    854650    const UnicodeSet sharada_Set
    855651      {{{Empty, 2188}, {Full, 3}, {Empty, 32625}},
    856        {}}
    857 ;
     652       {}};
    858653    const UnicodeSet shavian_Set
    859654      {{{Empty, 2082}, {Mixed, 1}, {Full, 1}, {Empty, 32732}},
    860        {0xffff0000}}
    861 ;
     655       {0xffff0000}};
    862656    const UnicodeSet shorthand_format_controls_Set
    863657      {{{Empty, 3557}, {Mixed, 1}, {Empty, 31258}},
    864        {0x0000ffff}}
    865 ;
     658       {0x0000ffff}};
    866659    const UnicodeSet siddham_Set
    867660      {{{Empty, 2220}, {Full, 4}, {Empty, 32592}},
    868        {}}
    869 ;
     661       {}};
    870662    const UnicodeSet sinhala_Set
    871663      {{{Empty, 108}, {Full, 4}, {Empty, 34704}},
    872        {}}
    873 ;
     664       {}};
    874665    const UnicodeSet sinhala_archaic_numbers_Set
    875666      {{{Empty, 2191}, {Full, 1}, {Empty, 32624}},
    876        {}}
    877 ;
     667       {}};
    878668    const UnicodeSet small_forms_Set
    879669      {{{Empty, 2034}, {Mixed, 2}, {Empty, 32780}},
    880        {0xffff0000, 0x0000ffff}}
    881 ;
     670       {0xffff0000, 0x0000ffff}};
    882671    const UnicodeSet sora_sompeng_Set
    883672      {{{Empty, 2182}, {Mixed, 1}, {Full, 1}, {Empty, 32632}},
    884        {0xffff0000}}
    885 ;
     673       {0xffff0000}};
    886674    const UnicodeSet specials_Set
    887675      {{{Empty, 2047}, {Mixed, 1}, {Empty, 32768}},
    888        {0xffff0000}}
    889 ;
     676       {0xffff0000}};
    890677    const UnicodeSet sundanese_Set
    891678      {{{Empty, 220}, {Full, 2}, {Empty, 34594}},
    892        {}}
    893 ;
     679       {}};
    894680    const UnicodeSet sundanese_sup_Set
    895681      {{{Empty, 230}, {Mixed, 1}, {Empty, 34585}},
    896        {0x0000ffff}}
    897 ;
     682       {0x0000ffff}};
    898683    const UnicodeSet sup_arrows_a_Set
    899684      {{{Empty, 319}, {Mixed, 1}, {Empty, 34496}},
    900        {0xffff0000}}
    901 ;
     685       {0xffff0000}};
    902686    const UnicodeSet sup_arrows_b_Set
    903687      {{{Empty, 328}, {Full, 4}, {Empty, 34484}},
    904        {}}
    905 ;
     688       {}};
    906689    const UnicodeSet sup_arrows_c_Set
    907690      {{{Empty, 4032}, {Full, 8}, {Empty, 30776}},
    908        {}}
    909 ;
     691       {}};
    910692    const UnicodeSet sup_math_operators_Set
    911693      {{{Empty, 336}, {Full, 8}, {Empty, 34472}},
    912        {}}
    913 ;
     694       {}};
    914695    const UnicodeSet sup_pua_a_Set
    915696      {{{Empty, 30720}, {Full, 2048}, {Empty, 2048}},
    916        {}}
    917 ;
     697       {}};
    918698    const UnicodeSet sup_pua_b_Set
    919699      {{{Empty, 32768}, {Full, 2048}},
    920        {}}
    921 ;
     700       {}};
    922701    const UnicodeSet sup_punctuation_Set
    923702      {{{Empty, 368}, {Full, 4}, {Empty, 34444}},
    924        {}}
    925 ;
     703       {}};
    926704    const UnicodeSet super_and_sub_Set
    927705      {{{Empty, 259}, {Mixed, 1}, {Full, 1}, {Empty, 34555}},
    928        {0xffff0000}}
    929 ;
     706       {0xffff0000}};
    930707    const UnicodeSet syloti_nagri_Set
    931708      {{{Empty, 1344}, {Full, 1}, {Mixed, 1}, {Empty, 33470}},
    932        {0x0000ffff}}
    933 ;
     709       {0x0000ffff}};
    934710    const UnicodeSet syriac_Set
    935711      {{{Empty, 56}, {Full, 2}, {Mixed, 1}, {Empty, 34757}},
    936        {0x0000ffff}}
    937 ;
     712       {0x0000ffff}};
    938713    const UnicodeSet tagalog_Set
    939714      {{{Empty, 184}, {Full, 1}, {Empty, 34631}},
    940        {}}
    941 ;
     715       {}};
    942716    const UnicodeSet tagbanwa_Set
    943717      {{{Empty, 187}, {Full, 1}, {Empty, 34628}},
    944        {}}
    945 ;
     718       {}};
    946719    const UnicodeSet tags_Set
    947720      {{{Empty, 28672}, {Full, 4}, {Empty, 6140}},
    948        {}}
    949 ;
     721       {}};
    950722    const UnicodeSet tai_le_Set
    951723      {{{Empty, 202}, {Mixed, 1}, {Full, 1}, {Empty, 34612}},
    952        {0xffff0000}}
    953 ;
     724       {0xffff0000}};
    954725    const UnicodeSet tai_tham_Set
    955726      {{{Empty, 209}, {Full, 4}, {Mixed, 1}, {Empty, 34602}},
    956        {0x0000ffff}}
    957 ;
     727       {0x0000ffff}};
    958728    const UnicodeSet tai_viet_Set
    959729      {{{Empty, 1364}, {Full, 3}, {Empty, 33449}},
    960        {}}
    961 ;
     730       {}};
    962731    const UnicodeSet tai_xuan_jing_Set
    963732      {{{Empty, 3736}, {Full, 3}, {Empty, 31077}},
    964        {}}
    965 ;
     733       {}};
    966734    const UnicodeSet takri_Set
    967735      {{{Empty, 2228}, {Full, 2}, {Mixed, 1}, {Empty, 32585}},
    968        {0x0000ffff}}
    969 ;
     736       {0x0000ffff}};
    970737    const UnicodeSet tamil_Set
    971738      {{{Empty, 92}, {Full, 4}, {Empty, 34720}},
    972        {}}
    973 ;
     739       {}};
    974740    const UnicodeSet telugu_Set
    975741      {{{Empty, 96}, {Full, 4}, {Empty, 34716}},
    976        {}}
    977 ;
     742       {}};
    978743    const UnicodeSet thaana_Set
    979744      {{{Empty, 60}, {Full, 2}, {Empty, 34754}},
    980        {}}
    981 ;
     745       {}};
    982746    const UnicodeSet thai_Set
    983747      {{{Empty, 112}, {Full, 4}, {Empty, 34700}},
    984        {}}
    985 ;
     748       {}};
    986749    const UnicodeSet tibetan_Set
    987750      {{{Empty, 120}, {Full, 8}, {Empty, 34688}},
    988        {}}
    989 ;
     751       {}};
    990752    const UnicodeSet tifinagh_Set
    991753      {{{Empty, 361}, {Mixed, 1}, {Full, 2}, {Empty, 34452}},
    992        {0xffff0000}}
    993 ;
     754       {0xffff0000}};
    994755    const UnicodeSet tirhuta_Set
    995756      {{{Empty, 2212}, {Full, 3}, {Empty, 32601}},
    996        {}}
    997 ;
     757       {}};
    998758    const UnicodeSet transport_and_map_Set
    999759      {{{Empty, 4020}, {Full, 4}, {Empty, 30792}},
    1000        {}}
    1001 ;
     760       {}};
    1002761    const UnicodeSet ucas_Set
    1003762      {{{Empty, 160}, {Full, 20}, {Empty, 34636}},
    1004        {}}
    1005 ;
     763       {}};
    1006764    const UnicodeSet ucas_ext_Set
    1007765      {{{Empty, 197}, {Mixed, 1}, {Full, 2}, {Empty, 34616}},
    1008        {0xffff0000}}
    1009 ;
     766       {0xffff0000}};
    1010767    const UnicodeSet ugaritic_Set
    1011768      {{{Empty, 2076}, {Full, 1}, {Empty, 32739}},
    1012        {}}
    1013 ;
     769       {}};
    1014770    const UnicodeSet vai_Set
    1015771      {{{Empty, 1320}, {Full, 10}, {Empty, 33486}},
    1016        {}}
    1017 ;
     772       {}};
    1018773    const UnicodeSet vedic_ext_Set
    1019774      {{{Empty, 230}, {Mixed, 1}, {Full, 1}, {Empty, 34584}},
    1020        {0xffff0000}}
    1021 ;
     775       {0xffff0000}};
    1022776    const UnicodeSet vertical_forms_Set
    1023777      {{{Empty, 2032}, {Mixed, 1}, {Empty, 32783}},
    1024        {0xffff0000}}
    1025 ;
     778       {0xffff0000}};
    1026779    const UnicodeSet vs_Set
    1027780      {{{Empty, 2032}, {Mixed, 1}, {Empty, 32783}},
    1028        {0x0000ffff}}
    1029 ;
     781       {0x0000ffff}};
    1030782    const UnicodeSet vs_sup_Set
    1031783      {{{Empty, 28680}, {Full, 7}, {Mixed, 1}, {Empty, 6128}},
    1032        {0x0000ffff}}
    1033 ;
     784       {0x0000ffff}};
    1034785    const UnicodeSet warang_citi_Set
    1035786      {{{Empty, 2245}, {Full, 3}, {Empty, 32568}},
    1036        {}}
    1037 ;
     787       {}};
    1038788    const UnicodeSet yi_radicals_Set
    1039789      {{{Empty, 1316}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 33497}},
    1040        {0xffff0000, 0x0000ffff}}
    1041 ;
     790       {0xffff0000, 0x0000ffff}};
    1042791    const UnicodeSet yi_syllables_Set
    1043792      {{{Empty, 1280}, {Full, 36}, {Mixed, 1}, {Empty, 33499}},
    1044        {0x0000ffff}}
    1045 ;
     793       {0x0000ffff}};
    1046794    const UnicodeSet yijing_Set
    1047795      {{{Empty, 622}, {Full, 2}, {Empty, 34192}},
    1048        {}}
    1049 ;
     796       {}};
    1050797    static EnumeratedPropertyObject property_object
    1051798      {blk,
  • icGREP/icgrep-devel/icgrep/UCD/DerivedCoreProperties.h

    r4618 r4621  
    144144        0xffffffef, 0x0af7fe96, 0xaa96ea84, 0x5ef7f796, 0x0ffffbff,
    145145        0x0ffffbee, 0xffff0000, 0xffff03ff, 0xffff03ff, 0x000003ff,
    146         0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}}
    147 ;
     146        0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}};
    148147    static BinaryPropertyObject property_object{Alpha, codepoint_set};
    149148  }
     
    230229        0x001f0000, 0x007f0000, 0x0000000f, 0xffff8000, 0x60000000,
    231230        0x0000000f, 0xfff80380, 0x00000fe7, 0x00003c00, 0x0000001c,
    232         0x007f0000, 0x00000002, 0x0000ffff}}
    233 ;
     231        0x007f0000, 0x00000002, 0x0000ffff}};
    234232    static BinaryPropertyObject property_object{CI, codepoint_set};
    235233  }
     
    259257        0x55555555, 0x00042805, 0x55555555, 0x00001555, 0x05555555,
    260258        0x55545554, 0x55555555, 0x6a005555, 0x55452855, 0x00033d55,
    261         0x00f8007f, 0x07fffffe, 0x000000ff}}
    262 ;
     259        0x00f8007f, 0x07fffffe, 0x000000ff}};
    263260    static BinaryPropertyObject property_object{CWCF, codepoint_set};
    264261  }
     
    288285        0xc06dffff, 0x000c780f, 0x000020bf, 0x00003fff, 0x0fffffff,
    289286        0xfffcfffc, 0xfe00ffff, 0xffcf38ff, 0x00033fff, 0x00f8007f,
    290         0x07fffffe, 0x07fffffe, 0x0000ffff}}
    291 ;
     287        0x07fffffe, 0x07fffffe, 0x0000ffff}};
    292288    static BinaryPropertyObject property_object{CWCM, codepoint_set};
    293289  }
     
    314310        0xc025ea9d, 0x55555555, 0x55555555, 0x55555555, 0x00042805,
    315311        0x55555555, 0x00001555, 0x05555555, 0x55545554, 0x55555555,
    316         0x6a005555, 0x55452855, 0x00033d55, 0x07fffffe, 0x000000ff}}
    317 ;
     312        0x6a005555, 0x55452855, 0x00033d55, 0x07fffffe, 0x000000ff}};
    318313    static BinaryPropertyObject property_object{CWL, codepoint_set};
    319314  }
     
    342337        0xaaaaaaaa, 0x0008500a, 0x000020bf, 0xaaaaaaaa, 0x00002aaa,
    343338        0x0aaaaaaa, 0xaaa8aaa8, 0xaaaaaaaa, 0x9400aaaa, 0xaa8a10aa,
    344         0x000002aa, 0x00f8007f, 0x07fffffe, 0xffffff00, 0x0000ffff}}
    345 ;
     339        0x000002aa, 0x00f8007f, 0x07fffffe, 0xffffff00, 0x0000ffff}};
    346340    static BinaryPropertyObject property_object{CWT, codepoint_set};
    347341  }
     
    370364        0x0008500a, 0x000020bf, 0xaaaaaaaa, 0x00002aaa, 0x0aaaaaaa,
    371365        0xaaa8aaa8, 0xaaaaaaaa, 0x9400aaaa, 0xaa8a10aa, 0x000002aa,
    372         0x00f8007f, 0x07fffffe, 0xffffff00, 0x0000ffff}}
    373 ;
     366        0x00f8007f, 0x07fffffe, 0xffffff00, 0x0000ffff}};
    374367    static BinaryPropertyObject property_object{CWU, codepoint_set};
    375368  }
     
    405398        0xffffff3f, 0xf7fffffd, 0xf7ffffff, 0xffdfffff, 0xffdfffff,
    406399        0xffff7fff, 0xffff7fff, 0xfffffdff, 0xfffffdff, 0x00000ff7,
    407         0xffff0000, 0xffff03ff, 0xffff03ff, 0x000003ff}}
    408 ;
     400        0xffff0000, 0xffff03ff, 0xffff03ff, 0x000003ff}};
    409401    static BinaryPropertyObject property_object{Cased, codepoint_set};
    410402  }
     
    421413        0x00300000, 0x00007800, 0x0000f800, 0x00007c00, 0x0000ffff,
    422414        0x00000010, 0x0000ffff, 0x80000000, 0x00000001, 0x01ff0000,
    423         0x0000000f, 0x07f80000}}
    424 ;
     415        0x0000000f, 0x07f80000}};
    425416    static BinaryPropertyObject property_object{DI, codepoint_set};
    426417  }
     
    569560        0xffffffef, 0xffffffe7, 0x0000ffff, 0x000f1fff, 0x000fffff,
    570561        0x001fffff, 0xffff0fff, 0x03ff00ff, 0xffff00ff, 0x00003fff,
    571         0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}}
    572 ;
     562        0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}};
    573563    static BinaryPropertyObject property_object{Gr_Base, codepoint_set};
    574564  }
     
    637627        0xb03c8000, 0x00000001, 0xa7f80000, 0x00000001, 0x00bf2800,
    638628        0x001f0000, 0x007f0000, 0x00078000, 0x60000000, 0xf807c3a0,
    639         0x00000fe7, 0x00003c00, 0x0000001c, 0x007f0000, 0x0000ffff}}
    640 ;
     629        0x00000fe7, 0x00003c00, 0x0000001c, 0x007f0000, 0x0000ffff}};
    641630    static BinaryPropertyObject property_object{Gr_Ext, codepoint_set};
    642631  }
     
    666655        0x00400000, 0x00002000, 0x80000000, 0x00000040, 0x80000000,
    667656        0x02000000, 0x00180000, 0x00000001, 0x00200000, 0x00000400,
    668         0x00002000, 0x00000004, 0x80000000, 0x80000000, 0x00400000}}
    669 ;
     657        0x00002000, 0x00000004, 0x80000000, 0x80000000, 0x00400000}};
    670658    static BinaryPropertyObject property_object{Gr_Link, codepoint_set};
    671659  }
     
    799787        0xfffffdff, 0xfffffdff, 0xffffcff7, 0x007f001f, 0xffffffef,
    800788        0x0af7fe96, 0xaa96ea84, 0x5ef7f796, 0x0ffffbff, 0x0ffffbee,
    801         0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff, 0x0000ffff}}
    802 ;
     789        0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff, 0x0000ffff}};
    803790    static BinaryPropertyObject property_object{IDC, codepoint_set};
    804791  }
     
    930917        0xfffffdff, 0x00000ff7, 0x0000001f, 0xffffffef, 0x0af7fe96,
    931918        0xaa96ea84, 0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x007fffff,
    932         0x001fffff, 0x3fffffff, 0x3fffffff}}
    933 ;
     919        0x001fffff, 0x3fffffff, 0x3fffffff}};
    934920    static BinaryPropertyObject property_object{IDS, codepoint_set};
    935921  }
     
    968954        0x000000ff, 0x0ffffffc, 0xffc00000, 0x0000ffff, 0xfffffc00,
    969955        0x0000003f, 0xf7fffffc, 0xf0000003, 0x0fdfffff, 0xffc00000,
    970         0x003f7fff, 0xffff0000, 0x0000fdff, 0xfffffc00, 0x00000bf7}}
    971 ;
     956        0x003f7fff, 0xffff0000, 0x0000fdff, 0xfffffc00, 0x00000bf7}};
    972957    static BinaryPropertyObject property_object{Lower, codepoint_set};
    973958  }
     
    996981        0xdfffffff, 0xebffde64, 0xffffffef, 0xdfdfe7bf, 0x7bffffff,
    997982        0xfffdfc5f, 0xffffff3f, 0xffffcfff, 0xffffffef, 0x0af7fe96,
    998         0xaa96ea84, 0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x00030000}}
    999 ;
     983        0xaa96ea84, 0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x00030000}};
    1000984    static BinaryPropertyObject property_object{Math, codepoint_set};
    1001985  }
     
    10311015        0xf0000000, 0x001fffff, 0xffc00000, 0x00007fff, 0xffff0000,
    10321016        0x000001ff, 0x00000400, 0xffff0000, 0xffff03ff, 0xffff03ff,
    1033         0x000003ff}}
    1034 ;
     1017        0x000003ff}};
    10351018    static BinaryPropertyObject property_object{Upper, codepoint_set};
    10361019  }
     
    11661149        0x007f001f, 0xffffffef, 0x0af7fe96, 0xaa96ea84, 0x5ef7f796,
    11671150        0x0ffffbff, 0x0ffffbee, 0x007fffff, 0x001fffff, 0x3fffffff,
    1168         0x3fffffff, 0x0000ffff}}
    1169 ;
     1151        0x3fffffff, 0x0000ffff}};
    11701152    static BinaryPropertyObject property_object{XIDC, codepoint_set};
    11711153  }
     
    12981280        0x0000001f, 0xffffffef, 0x0af7fe96, 0xaa96ea84, 0x5ef7f796,
    12991281        0x0ffffbff, 0x0ffffbee, 0x007fffff, 0x001fffff, 0x3fffffff,
    1300         0x3fffffff}}
    1301 ;
     1282        0x3fffffff}};
    13021283    static BinaryPropertyObject property_object{XIDS, codepoint_set};
    13031284  }
  • icGREP/icgrep-devel/icgrep/UCD/DerivedGeneralCategory.h

    r4618 r4621  
    159159        0xfff00000, 0xffe00000, 0x0000f000, 0xfc00ff00, 0x0000ff00,
    160160        0xffffc000, 0xff800000, 0xffe00000, 0xc0000000, 0xc0000000,
    161         0xffff0000}}
    162 ;
     161        0xffff0000}};
    163162    const UnicodeSet cc_Set
    164163      {{{Full, 1}, {Empty, 2}, {Mixed, 1}, {Full, 1}, {Empty, 34811}},
    165        {0x80000000}}
    166 ;
     164       {0x80000000}};
    167165    const UnicodeSet cf_Set
    168166      {{{Empty, 5}, {Mixed, 1}, {Empty, 42}, {Mixed, 1}, {Empty, 5},
     
    174172       {0x00002000, 0x1000003f, 0x20000000, 0x00008000, 0x00004000,
    175173        0x0000f800, 0x00007c00, 0x0000ffdf, 0x80000000, 0x0e000000,
    176         0x20000000, 0x0000000f, 0x07f80000, 0x00000002}}
    177 ;
     174        0x20000000, 0x0000000f, 0x07f80000, 0x00000002}};
    178175    const UnicodeSet cn_Set
    179176      {{{Empty, 27}, {Mixed, 3}, {Empty, 11}, {Mixed, 4}, {Empty, 1},
     
    318315        0xffe00000, 0x0000f000, 0xfc00ff00, 0x0000ff00, 0xffffc000,
    319316        0xff800000, 0xffe00000, 0xc0000000, 0xc0000000, 0xfffffffd,
    320         0xffff0000, 0xc0000000, 0xc0000000}}
    321 ;
     317        0xffff0000, 0xc0000000, 0xc0000000}};
    322318    const UnicodeSet co_Set
    323319      {{{Empty, 1792}, {Full, 200}, {Empty, 28728}, {Full, 2047},
    324320        {Mixed, 1}, {Full, 2047}, {Mixed, 1}},
    325        {0x3fffffff, 0x3fffffff}}
    326 ;
     321       {0x3fffffff, 0x3fffffff}};
    327322    const UnicodeSet cs_Set
    328323      {{{Empty, 1728}, {Full, 64}, {Empty, 33024}},
    329        {}}
    330 ;
     324       {}};
    331325    const UnicodeSet l_Set
    332326      {{{Empty, 2}, {Mixed, 2}, {Empty, 1}, {Mixed, 3}, {Full, 14},
     
    454448        0x00000ff7, 0x0000001f, 0xffffffef, 0x0af7fe96, 0xaa96ea84,
    455449        0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x007fffff, 0x001fffff,
    456         0x3fffffff, 0x3fffffff}}
    457 ;
     450        0x3fffffff, 0x3fffffff}};
    458451    const UnicodeSet lc_Set
    459452      {{{Empty, 2}, {Mixed, 2}, {Empty, 1}, {Mixed, 3}, {Full, 5},
     
    484477        0xdfdfe7bf, 0x7bffffff, 0xfffdfc5f, 0xffffff3f, 0xf7fffffd,
    485478        0xf7ffffff, 0xffdfffff, 0xffdfffff, 0xffff7fff, 0xffff7fff,
    486         0xfffffdff, 0xfffffdff, 0x00000ff7}}
    487 ;
     479        0xfffffdff, 0xfffffdff, 0x00000ff7}};
    488480    const UnicodeSet ll_Set
    489481      {{{Empty, 3}, {Mixed, 1}, {Empty, 1}, {Mixed, 14}, {Full, 1},
     
    518510        0x000000ff, 0x0ffffffc, 0xffc00000, 0x0000ffff, 0xfffffc00,
    519511        0x0000003f, 0xf7fffffc, 0xf0000003, 0x0fdfffff, 0xffc00000,
    520         0x003f7fff, 0xffff0000, 0x0000fdff, 0xfffffc00, 0x00000bf7}}
    521 ;
     512        0x003f7fff, 0xffff0000, 0x0000fdff, 0xfffffc00, 0x00000bf7}};
    522513    const UnicodeSet lm_Set
    523514      {{{Empty, 21}, {Mixed, 3}, {Empty, 3}, {Mixed, 1}, {Empty, 14},
     
    546537        0xff800000, 0x00010000, 0x00000100, 0x03000000, 0x00008000,
    547538        0x00000040, 0x00010000, 0x20000000, 0x00180000, 0xf0000000,
    548         0x00010000, 0xc0000000, 0x0000000f, 0xfff80000}}
    549 ;
     539        0x00010000, 0xc0000000, 0x0000000f, 0xfff80000}};
    550540    const UnicodeSet lo_Set
    551541      {{{Empty, 5}, {Mixed, 1}, {Empty, 7}, {Mixed, 2}, {Empty, 5},
     
    655645        0x1fff07ff, 0x03ff01ff, 0x0000001f, 0xffffffef, 0x0af7fe96,
    656646        0xaa96ea84, 0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x007fffff,
    657         0x001fffff, 0x3fffffff, 0x3fffffff}}
    658 ;
     647        0x001fffff, 0x3fffffff, 0x3fffffff}};
    659648    const UnicodeSet lt_Set
    660649      {{{Empty, 14}, {Mixed, 2}, {Empty, 236}, {Mixed, 4}, {Empty, 34560}},
    661650       {0x00000920, 0x00040000, 0xff00ff00, 0x1000ff00, 0x00001000,
    662         0x10000000}}
    663 ;
     651        0x10000000}};
    664652    const UnicodeSet lu_Set
    665653      {{{Empty, 2}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 1},
     
    690678        0xf0000003, 0x003fffff, 0xffff0000, 0x000003ff, 0xffffff00,
    691679        0x00000001, 0x07fffffc, 0xf0000000, 0x001fffff, 0xffc00000,
    692         0x00007fff, 0xffff0000, 0x000001ff, 0x00000400}}
    693 ;
     680        0x00007fff, 0xffff0000, 0x000001ff, 0x00000400}};
    694681    const UnicodeSet m_Set
    695682      {{{Empty, 24}, {Full, 3}, {Mixed, 1}, {Empty, 8}, {Mixed, 1},
     
    756743        0x00fff800, 0x001f0000, 0x007f0000, 0xfffe0000, 0x7fffffff,
    757744        0x00078000, 0x60000000, 0xf807e3e0, 0x00000fe7, 0x00003c00,
    758         0x0000001c, 0x007f0000, 0x0000ffff}}
    759 ;
     745        0x0000001c, 0x007f0000, 0x0000ffff}};
    760746    const UnicodeSet mc_Set
    761747      {{{Empty, 72}, {Mixed, 3}, {Empty, 1}, {Mixed, 3}, {Empty, 1},
     
    794780        0x00000001, 0x002c7000, 0x00000007, 0x0000000c, 0xc0000000,
    795781        0x0080399e, 0x0000000c, 0x7a070000, 0x00000002, 0x4f038000,
    796         0x58070000, 0x0040d000, 0xfffe0000, 0x7fffffff, 0x0007e060}}
    797 ;
     782        0x58070000, 0x0040d000, 0xfffe0000, 0x7fffffff, 0x0007e060}};
    798783    const UnicodeSet me_Set
    799784      {{{Empty, 36}, {Mixed, 1}, {Empty, 176}, {Mixed, 1}, {Empty, 48},
    800785        {Mixed, 2}, {Empty, 1067}, {Mixed, 1}, {Empty, 33484}},
    801        {0x00000300, 0x40000000, 0xe0000000, 0x0000001d, 0x00070000}}
    802 ;
     786       {0x00000300, 0x40000000, 0xe0000000, 0x0000001d, 0x00070000}};
    803787    const UnicodeSet mn_Set
    804788      {{{Empty, 24}, {Full, 3}, {Mixed, 1}, {Empty, 8}, {Mixed, 1},
     
    864848        0x00bf2800, 0x001f0000, 0x007f0000, 0x00078000, 0x60000000,
    865849        0xf8000380, 0x00000fe7, 0x00003c00, 0x0000001c, 0x007f0000,
    866         0x0000ffff}}
    867 ;
     850        0x0000ffff}};
    868851    const UnicodeSet n_Set
    869852      {{{Empty, 1}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 45},
     
    919902        0x03ff0000, 0x000003ff, 0x0007ffff, 0x00007fff, 0x000003ff,
    920903        0xfbff0000, 0x00000003, 0x0003ffff, 0xffffc000, 0x0000ff80,
    921         0x00001fff}}
    922 ;
     904        0x00001fff}};
    923905    const UnicodeSet nd_Set
    924906      {{{Empty, 1}, {Mixed, 1}, {Empty, 49}, {Mixed, 1}, {Empty, 3},
     
    950932        0x000003ff, 0x0000ffc0, 0x03ff0000, 0xffc00000, 0x03ff0000,
    951933        0x03ff0000, 0x03ff0000, 0x03ff0000, 0x000003ff, 0x000003ff,
    952         0x000003ff, 0x03ff0000, 0xffffc000}}
    953 ;
     934        0x000003ff, 0x03ff0000, 0xffffc000}};
    954935    const UnicodeSet nl_Set
    955936      {{{Empty, 183}, {Mixed, 1}, {Empty, 83}, {Full, 1}, {Mixed, 1},
     
    958939        {Mixed, 1}, {Empty, 257}, {Full, 3}, {Mixed, 1}, {Empty, 32476}},
    959940       {0x0001c000, 0x000001e7, 0x00000080, 0x070003fe, 0x0000ffc0,
    960         0x001fffff, 0x00000402, 0x003e0000, 0x00007fff}}
    961 ;
     941        0x001fffff, 0x00000402, 0x003e0000, 0x00007fff}};
    962942    const UnicodeSet no_Set
    963943      {{{Empty, 5}, {Mixed, 1}, {Empty, 73}, {Mixed, 1}, {Empty, 11},
     
    988968        0xff000000, 0x0000fe00, 0x7fffffff, 0xfffc0000, 0x0000003f,
    989969        0x001ffffe, 0x0007fc00, 0xf8000000, 0x00000003, 0x0003ffff,
    990         0x0000ff80, 0x00001fff}}
    991 ;
     970        0x0000ff80, 0x00001fff}};
    992971    const UnicodeSet p_Set
    993972      {{{Empty, 1}, {Mixed, 3}, {Empty, 1}, {Mixed, 1}, {Empty, 21},
     
    10481027        0x00300000, 0x000021e0, 0x3f000000, 0x00000040, 0x000003fe,
    10491028        0x0000000e, 0x001f0000, 0x0000c000, 0x00200000, 0x0f800000,
    1050         0x00000010, 0x80000000}}
    1051 ;
     1029        0x00000010, 0x80000000}};
    10521030    const UnicodeSet pc_Set
    10531031      {{{Empty, 2}, {Mixed, 1}, {Empty, 254}, {Mixed, 2}, {Empty, 1774},
    10541032        {Mixed, 2}, {Empty, 6}, {Mixed, 1}, {Empty, 32774}},
    10551033       {0x80000000, 0x80000000, 0x00100001, 0x00180000, 0x0000e000,
    1056         0x80000000}}
    1057 ;
     1034        0x80000000}};
    10581035    const UnicodeSet pd_Set
    10591036      {{{Empty, 1}, {Mixed, 1}, {Empty, 42}, {Mixed, 2}, {Empty, 114},
     
    10651042        0x003f0000, 0x04800000, 0x0c000000, 0x00000001, 0x10000000,
    10661043        0x00010000, 0x00000001, 0x00060000, 0x01000000, 0x00000008,
    1067         0x00002000}}
    1068 ;
     1044        0x00002000}};
    10691045    const UnicodeSet pe_Set
    10701046      {{{Empty, 1}, {Mixed, 3}, {Empty, 117}, {Mixed, 1}, {Empty, 58},
     
    10791055        0x20000000, 0x000002a8, 0xcaa2aa00, 0x40000000, 0x01000000,
    10801056        0x55400000, 0x54000115, 0x00000200, 0x20000000, 0x20000000,
    1081         0x00000009}}
    1082 ;
     1057        0x00000009}};
    10831058    const UnicodeSet pf_Set
    10841059      {{{Empty, 5}, {Mixed, 1}, {Empty, 250}, {Mixed, 2}, {Empty, 110},
    10851060        {Mixed, 2}, {Empty, 34446}},
    1086        {0x08000000, 0x22000000, 0x04000000, 0x20002428, 0x00000002}}
    1087 ;
     1061       {0x08000000, 0x22000000, 0x04000000, 0x20002428, 0x00000002}};
    10881062    const UnicodeSet pi_Set
    10891063      {{{Empty, 5}, {Mixed, 1}, {Empty, 250}, {Mixed, 2}, {Empty, 110},
    10901064        {Mixed, 2}, {Empty, 34446}},
    1091        {0x00000800, 0x99000000, 0x02000000, 0x10001214, 0x00000001}}
    1092 ;
     1065       {0x00000800, 0x99000000, 0x02000000, 0x10001214, 0x00000001}};
    10931066    const UnicodeSet po_Set
    10941067      {{{Empty, 1}, {Mixed, 2}, {Empty, 2}, {Mixed, 1}, {Empty, 21},
     
    11421115        0xd8000000, 0x00000003, 0x0000000f, 0x00300000, 0x000021e0,
    11431116        0x3f000000, 0x00000040, 0x000003fe, 0x0000000e, 0x001f0000,
    1144         0x0000c000, 0x00200000, 0x0f800000, 0x00000010, 0x80000000}}
    1145 ;
     1117        0x0000c000, 0x00200000, 0x0f800000, 0x00000010, 0x80000000}};
    11461118    const UnicodeSet ps_Set
    11471119      {{{Empty, 1}, {Mixed, 3}, {Empty, 117}, {Mixed, 1}, {Empty, 58},
     
    11571129        0x05000000, 0x10000000, 0x00000154, 0x00000004, 0x25515500,
    11581130        0x80000000, 0x00800000, 0xaaa00000, 0x2a00008a, 0x00000100,
    1159         0x08000000, 0x88000000, 0x00000004}}
    1160 ;
     1131        0x08000000, 0x88000000, 0x00000004}};
    11611132    const UnicodeSet s_Set
    11621133      {{{Empty, 1}, {Mixed, 3}, {Empty, 1}, {Mixed, 3}, {Empty, 14},
     
    12281199        0xfff07fff, 0x00ffffff, 0x7fffffff, 0xffff07ff, 0xfbffffff,
    12291200        0xffffffef, 0xffffffe7, 0x0000ffff, 0x000f1fff, 0x000fffff,
    1230         0x001fffff, 0xffff0fff, 0x03ff00ff, 0xffff00ff, 0x00003fff}}
    1231 ;
     1201        0x001fffff, 0xffff0fff, 0x03ff00ff, 0xffff00ff, 0x00003fff}};
    12321202    const UnicodeSet sc_Set
    12331203      {{{Empty, 1}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 38},
     
    12401210       {0x00000010, 0x0000003c, 0x00008000, 0x00000800, 0x080c0000,
    12411211        0x00020000, 0x02000000, 0x80000000, 0x08000000, 0x3fffffff,
    1242         0x01000000, 0x10000000, 0x00000200, 0x00000010, 0x00000063}}
    1243 ;
     1212        0x01000000, 0x10000000, 0x00000200, 0x00000010, 0x00000063}};
    12441213    const UnicodeSet sk_Set
    12451214      {{{Empty, 2}, {Mixed, 2}, {Empty, 1}, {Mixed, 1}, {Empty, 16},
     
    12511220        0x00200000, 0x00000030, 0xa0000000, 0xe000e003, 0x6000e000,
    12521221        0x18000000, 0x007fffff, 0x00000003, 0x00000600, 0x08000000,
    1253         0xfffc0000, 0x00000003, 0x40000000, 0x00000001, 0x00000008}}
    1254 ;
     1222        0xfffc0000, 0x00000003, 0x40000000, 0x00000001, 0x00000008}};
    12551223    const UnicodeSet sm_Set
    12561224      {{{Empty, 1}, {Mixed, 1}, {Empty, 1}, {Mixed, 1}, {Empty, 1},
     
    12741242        0x70000800, 0x50000000, 0x00001e04, 0x08000002, 0x08000000,
    12751243        0x00200000, 0x00200000, 0x00008000, 0x00008000, 0x00000200,
    1276         0x00000200, 0x00000008, 0x00030000}}
    1277 ;
     1244        0x00000200, 0x00000008, 0x00030000}};
    12781245    const UnicodeSet so_Set
    12791246      {{{Empty, 5}, {Mixed, 1}, {Empty, 30}, {Mixed, 1}, {Empty, 7},
     
    13321299        0xfbffffff, 0xffffffef, 0xffffffe7, 0x0000ffff, 0x000f1fff,
    13331300        0x000fffff, 0x001fffff, 0xffff0fff, 0x03ff00ff, 0xffff00ff,
    1334         0x00003fff}}
    1335 ;
     1301        0x00003fff}};
    13361302    const UnicodeSet z_Set
    13371303      {{{Empty, 1}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 174},
     
    13391305        {Empty, 34431}},
    13401306       {0x00000001, 0x00000001, 0x00000001, 0x000007ff, 0x00008300,
    1341         0x80000000, 0x00000001}}
    1342 ;
     1307        0x80000000, 0x00000001}};
    13431308    const UnicodeSet zl_Set
    13441309      {{{Empty, 257}, {Mixed, 1}, {Empty, 34558}},
    1345        {0x00000100}}
    1346 ;
     1310       {0x00000100}};
    13471311    const UnicodeSet zp_Set
    13481312      {{{Empty, 257}, {Mixed, 1}, {Empty, 34558}},
    1349        {0x00000200}}
    1350 ;
     1313       {0x00000200}};
    13511314    const UnicodeSet zs_Set
    13521315      {{{Empty, 1}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 174},
     
    13541317        {Empty, 34431}},
    13551318       {0x00000001, 0x00000001, 0x00000001, 0x000007ff, 0x00008000,
    1356         0x80000000, 0x00000001}}
    1357 ;
     1319        0x80000000, 0x00000001}};
    13581320    static EnumeratedPropertyObject property_object
    13591321      {gc,
  • icGREP/icgrep-devel/icgrep/UCD/EastAsianWidth.h

    r4618 r4621  
    3939        0xffffff0b, 0x20000000, 0x00800000, 0xffc00000, 0x03e00000,
    4040        0x0000ff00, 0x0000ffff, 0x20000000, 0xffff07ff, 0xffff3fff,
    41         0xffff03ff, 0x07ffffff, 0x0000ffff, 0x3fffffff, 0x3fffffff}}
    42 ;
     41        0xffff03ff, 0x07ffffff, 0x0000ffff, 0x3fffffff, 0x3fffffff}};
    4342    const UnicodeSet f_Set
    4443      {{{Empty, 384}, {Mixed, 1}, {Empty, 1655}, {Mixed, 1}, {Full, 2},
    4544        {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 32768}},
    46        {0x00000001, 0xfffffffe, 0x00000001, 0x0000007f}}
    47 ;
     45       {0x00000001, 0xfffffffe, 0x00000001, 0x0000007f}};
    4846    const UnicodeSet h_Set
    4947      {{{Empty, 261}, {Mixed, 1}, {Empty, 1781}, {Mixed, 1}, {Full, 1},
    5048        {Mixed, 3}, {Empty, 32768}},
    51        {0x00000200, 0xfffffffe, 0x7fffffff, 0x1cfcfcfc, 0x00007f00}}
    52 ;
     49       {0x00000200, 0xfffffffe, 0x7fffffff, 0x1cfcfcfc, 0x00007f00}};
    5350    const UnicodeSet n_Set
    5451      {{{Full, 1}, {Empty, 2}, {Mixed, 1}, {Full, 1}, {Mixed, 7}, {Full, 2},
     
    9188        0xfffffffc, 0x0000f800, 0x0000c000, 0x0000fc00, 0xf8000000,
    9289        0x0000fff8, 0xf8000000, 0xfffcfe00, 0xc0000000, 0xc0000000,
    93         0xffff0000, 0xc0000000, 0xc0000000}}
    94 ;
     90        0xffff0000, 0xc0000000, 0xc0000000}};
    9591    const UnicodeSet na_Set
    9692      {{{Empty, 1}, {Full, 2}, {Mixed, 1}, {Empty, 1}, {Mixed, 1},
    9793        {Empty, 313}, {Mixed, 1}, {Empty, 12}, {Mixed, 1}, {Empty, 34483}},
    98        {0x7fffffff, 0x0000906c, 0x00003fc0, 0x00000060}}
    99 ;
     94       {0x7fffffff, 0x0000906c, 0x00003fc0, 0x00000060}};
    10095    const UnicodeSet w_Set
    10196      {{{Empty, 136}, {Full, 3}, {Empty, 142}, {Mixed, 1}, {Empty, 90},
     
    114109        0x0000000f, 0x03ff0000, 0xffff0000, 0xfff7ffff, 0x00000f7f,
    115110        0x00000003, 0xffff0007, 0x07ffffff, 0x000301ff, 0x3fffffff,
    116         0x3fffffff}}
    117 ;
     111        0x3fffffff}};
    118112    static EnumeratedPropertyObject property_object
    119113      {ea,
  • icGREP/icgrep-devel/icgrep/UCD/HangulSyllableType.h

    r4618 r4621  
    1717    const UnicodeSet l_Set
    1818      {{{Empty, 136}, {Full, 3}, {Empty, 1216}, {Mixed, 1}, {Empty, 33460}},
    19        {0x1fffffff}}
    20 ;
     19       {0x1fffffff}};
    2120    const UnicodeSet lv_Set
    2221      {{{Empty, 1376}, {Mixed, 349}, {Empty, 33091}},
     
    9089        0x00000010, 0x10000001, 0x01000000, 0x00100000, 0x00010000,
    9190        0x00001000, 0x00000100, 0x00000010, 0x10000001, 0x01000000,
    92         0x00100000, 0x00010000, 0x00001000, 0x00000100}}
    93 ;
     91        0x00100000, 0x00010000, 0x00001000, 0x00000100}};
    9492    const UnicodeSet lvt_Set
    9593      {{{Empty, 1376}, {Mixed, 350}, {Empty, 33090}},
     
    163161        0xffffffef, 0xeffffffe, 0xfeffffff, 0xffefffff, 0xfffeffff,
    164162        0xffffefff, 0xfffffeff, 0xffffffef, 0xeffffffe, 0xfeffffff,
    165         0xffefffff, 0xfffeffff, 0xffffefff, 0xfffffeff, 0x0000000f}}
    166 ;
     163        0xffefffff, 0xfffeffff, 0xffffefff, 0xfffffeff, 0x0000000f}};
    167164    const UnicodeSet na_Set
    168165      {{{Full, 136}, {Empty, 8}, {Full, 1211}, {Mixed, 1}, {Full, 20},
    169166        {Empty, 349}, {Mixed, 3}, {Full, 33088}},
    170        {0xe0000000, 0x0000fff0, 0x00000780, 0xf0000000}}
    171 ;
     167       {0xe0000000, 0x0000fff0, 0x00000780, 0xf0000000}};
    172168    const UnicodeSet t_Set
    173169      {{{Empty, 141}, {Mixed, 1}, {Full, 2}, {Empty, 1582}, {Mixed, 2},
    174170        {Empty, 33088}},
    175        {0xffffff00, 0xfffff800, 0x0fffffff}}
    176 ;
     171       {0xffffff00, 0xfffff800, 0x0fffffff}};
    177172    const UnicodeSet v_Set
    178173      {{{Empty, 139}, {Full, 2}, {Mixed, 1}, {Empty, 1583}, {Mixed, 2},
    179174        {Empty, 33089}},
    180        {0x000000ff, 0xffff0000, 0x0000007f}}
    181 ;
     175       {0x000000ff, 0xffff0000, 0x0000007f}};
    182176    static EnumeratedPropertyObject property_object
    183177      {hst,
  • icGREP/icgrep-devel/icgrep/UCD/LineBreak.h

    r4618 r4621  
    3232        0x0000b6bb, 0xc0000000, 0x6ce41e00, 0x1841fb08, 0x00800000,
    3333        0xffc00000, 0x000fffff, 0x03e00000, 0x0000ff00, 0x20000000,
    34         0xffff1fff, 0xffff3fff, 0xffff03ff, 0x07ffffff}}
    35 ;
     34        0xffff1fff, 0xffff3fff, 0xffff03ff, 0x07ffffff}};
    3635    const UnicodeSet al_Set
    3736      {{{Empty, 1}, {Mixed, 3}, {Empty, 1}, {Mixed, 3}, {Full, 14},
     
    171170        0xff80007f, 0xfffc001f, 0x000003ff, 0x0ff00000, 0x03f00000,
    172171        0xffff0000, 0xf03fffff, 0x000fffff, 0x001fffff, 0xffff0fff,
    173         0x03ff00ff, 0xffff00ff, 0x00003fff}}
    174 ;
     172        0x03ff00ff, 0xffff00ff, 0x00003fff}};
    175173    const UnicodeSet b2_Set
    176174      {{{Empty, 256}, {Mixed, 1}, {Empty, 112}, {Mixed, 1}, {Empty, 34446}},
    177        {0x00100000, 0x0c000000}}
    178 ;
     175       {0x00100000, 0x0c000000}};
    179176    const UnicodeSet ba_Set
    180177      {{{Mixed, 1}, {Empty, 2}, {Mixed, 1}, {Empty, 1}, {Mixed, 1},
     
    212209        0xfe000000, 0x00000180, 0xc0000000, 0x00000003, 0x0000000f,
    213210        0x00000160, 0x1b000000, 0x0000020c, 0x00000006, 0x001f0000,
    214         0x0000c000, 0x00200000, 0x03800000, 0x00000010, 0x80000000}}
    215 ;
     211        0x0000c000, 0x00200000, 0x03800000, 0x00000010, 0x80000000}};
    216212    const UnicodeSet bb_Set
    217213      {{{Empty, 5}, {Mixed, 1}, {Empty, 16}, {Mixed, 1}, {Empty, 97},
     
    220216        {Mixed, 1}, {Empty, 34}, {Mixed, 1}, {Empty, 32593}},
    221217       {0x00100000, 0x80001100, 0x000006de, 0x000b0000, 0x00000040,
    222         0x20000000, 0x00300000, 0x00200000, 0x00000002}}
    223 ;
     218        0x20000000, 0x00300000, 0x00200000, 0x00000002}};
    224219    const UnicodeSet bk_Set
    225220      {{{Mixed, 1}, {Empty, 256}, {Mixed, 1}, {Empty, 34558}},
    226        {0x00001800, 0x00000300}}
    227 ;
     221       {0x00001800, 0x00000300}};
    228222    const UnicodeSet cb_Set
    229223      {{{Empty, 2047}, {Mixed, 1}, {Empty, 32768}},
    230        {0x10000000}}
    231 ;
     224       {0x10000000}};
    232225    const UnicodeSet cj_Set
    233226      {{{Empty, 386}, {Mixed, 6}, {Empty, 7}, {Mixed, 1}, {Empty, 1643},
    234227        {Mixed, 1}, {Empty, 32772}},
    235228       {0x000002aa, 0x00000008, 0x006040a8, 0x000002aa, 0x00000008,
    236         0x106040a8, 0xffff0000, 0x0001ff80}}
    237 ;
     229        0x106040a8, 0xffff0000, 0x0001ff80}};
    238230    const UnicodeSet cl_Set
    239231      {{{Empty, 3}, {Mixed, 1}, {Empty, 117}, {Mixed, 1}, {Empty, 58},
     
    249241        0xcaa2aa06, 0x40000000, 0x01060000, 0x55400000, 0x54050115,
    250242        0x00005200, 0x20000000, 0x20000000, 0x0000001b, 0x38000000,
    251         0x00000284, 0x0c000000}}
    252 ;
     243        0x00000284, 0x0c000000}};
    253244    const UnicodeSet cm_Set
    254245      {{{Mixed, 1}, {Empty, 2}, {Mixed, 2}, {Empty, 19}, {Full, 2},
     
    315306        0x7fffffff, 0x00078000, 0x60000000, 0x0000000f, 0xffffe3e0,
    316307        0x00000fe7, 0x00003c00, 0x0000001c, 0x007f0000, 0x00000002,
    317         0x0000ffff}}
    318 ;
     308        0x0000ffff}};
    319309    const UnicodeSet cp_Set
    320310      {{{Empty, 1}, {Mixed, 2}, {Empty, 34813}},
    321        {0x00000200, 0x20000000}}
    322 ;
     311       {0x00000200, 0x20000000}};
    323312    const UnicodeSet cr_Set
    324313      {{{Mixed, 1}, {Empty, 34815}},
    325        {0x00002000}}
    326 ;
     314       {0x00002000}};
    327315    const UnicodeSet ex_Set
    328316      {{{Empty, 1}, {Mixed, 1}, {Empty, 44}, {Mixed, 1}, {Empty, 1},
     
    336324        0x0013e000, 0x0000030c, 0x00000030, 0x0000000c, 0x42000000,
    337325        0x00004000, 0x00004000, 0x00c00000, 0x00600000, 0x00c00000,
    338         0x80000002, 0x00000030}}
    339 ;
     326        0x80000002, 0x00000030}};
    340327    const UnicodeSet gl_Set
    341328      {{{Empty, 5}, {Mixed, 1}, {Empty, 20}, {Mixed, 2}, {Empty, 92},
     
    343330        {Empty, 63}, {Mixed, 2}, {Empty, 34558}},
    344331       {0x00000001, 0xf0008000, 0x00000007, 0x00041100, 0x06000000,
    345         0x00004000, 0x00020080, 0x00008000}}
    346 ;
     332        0x00004000, 0x00020080, 0x00008000}};
    347333    const UnicodeSet h2_Set
    348334      {{{Empty, 1376}, {Mixed, 349}, {Empty, 33091}},
     
    416402        0x00000010, 0x10000001, 0x01000000, 0x00100000, 0x00010000,
    417403        0x00001000, 0x00000100, 0x00000010, 0x10000001, 0x01000000,
    418         0x00100000, 0x00010000, 0x00001000, 0x00000100}}
    419 ;
     404        0x00100000, 0x00010000, 0x00001000, 0x00000100}};
    420405    const UnicodeSet h3_Set
    421406      {{{Empty, 1376}, {Mixed, 350}, {Empty, 33090}},
     
    489474        0xffffffef, 0xeffffffe, 0xfeffffff, 0xffefffff, 0xfffeffff,
    490475        0xffffefff, 0xfffffeff, 0xffffffef, 0xeffffffe, 0xfeffffff,
    491         0xffefffff, 0xfffeffff, 0xffffefff, 0xfffffeff, 0x0000000f}}
    492 ;
     476        0xffefffff, 0xfffeffff, 0xffffefff, 0xfffffeff, 0x0000000f}};
    493477    const UnicodeSet hl_Set
    494478      {{{Empty, 46}, {Mixed, 2}, {Empty, 1960}, {Mixed, 3}, {Empty, 32805}},
    495        {0xffff0000, 0x000707ff, 0xa0000000, 0x5f7ffdff, 0x0000ffdb}}
    496 ;
     479       {0xffff0000, 0x000707ff, 0xa0000000, 0x5f7ffdff, 0x0000ffdb}};
    497480    const UnicodeSet hy_Set
    498481      {{{Empty, 1}, {Mixed, 1}, {Empty, 34814}},
    499        {0x00002000}}
    500 ;
     482       {0x00002000}};
    501483    const UnicodeSet id_Set
    502484      {{{Empty, 280}, {Mixed, 1}, {Empty, 6}, {Mixed, 1}, {Empty, 16},
     
    527509        0x7fffffff, 0x007fff80, 0x0003ffe0, 0xffff0400, 0xfbffffff,
    528510        0xffffffef, 0xf00fffff, 0xfc0fffff, 0x0000ffe7, 0x0000ffff,
    529         0x000f1fff, 0x3fffffff, 0x3fffffff}}
    530 ;
     511        0x000f1fff, 0x3fffffff, 0x3fffffff}};
    531512    const UnicodeSet in_Set
    532513      {{{Empty, 257}, {Mixed, 1}, {Empty, 1774}, {Mixed, 1}, {Empty, 102},
    533514        {Mixed, 1}, {Empty, 32680}},
    534        {0x00000070, 0x02000000, 0x00400000}}
    535 ;
     515       {0x00000070, 0x02000000, 0x00400000}};
    536516    const UnicodeSet is_Set
    537517      {{{Empty, 1}, {Mixed, 1}, {Empty, 25}, {Mixed, 1}, {Empty, 16},
     
    539519        {Empty, 194}, {Mixed, 1}, {Empty, 1773}, {Mixed, 1}, {Empty, 32783}},
    540520       {0x0c005000, 0x40000000, 0x00000200, 0x00003000, 0x01000000,
    541         0x00000010, 0x00190000}}
    542 ;
     521        0x00000010, 0x00190000}};
    543522    const UnicodeSet jl_Set
    544523      {{{Empty, 136}, {Full, 3}, {Empty, 1216}, {Mixed, 1}, {Empty, 33460}},
    545        {0x1fffffff}}
    546 ;
     524       {0x1fffffff}};
    547525    const UnicodeSet jt_Set
    548526      {{{Empty, 141}, {Mixed, 1}, {Full, 2}, {Empty, 1582}, {Mixed, 2},
    549527        {Empty, 33088}},
    550        {0xffffff00, 0xfffff800, 0x0fffffff}}
    551 ;
     528       {0xffffff00, 0xfffff800, 0x0fffffff}};
    552529    const UnicodeSet jv_Set
    553530      {{{Empty, 139}, {Full, 2}, {Mixed, 1}, {Empty, 1583}, {Mixed, 2},
    554531        {Empty, 33089}},
    555        {0x000000ff, 0xffff0000, 0x0000007f}}
    556 ;
     532       {0x000000ff, 0xffff0000, 0x0000007f}};
    557533    const UnicodeSet lf_Set
    558534      {{{Mixed, 1}, {Empty, 34815}},
    559        {0x00000400}}
    560 ;
     535       {0x00000400}};
    561536    const UnicodeSet nl_Set
    562537      {{{Empty, 4}, {Mixed, 1}, {Empty, 34811}},
    563        {0x00000020}}
    564 ;
     538       {0x00000020}};
    565539    const UnicodeSet ns_Set
    566540      {{{Empty, 190}, {Mixed, 1}, {Empty, 66}, {Mixed, 2}, {Empty, 125},
     
    571545       {0x00400000, 0x30000000, 0x00000380, 0x10000020, 0x18000000,
    572546        0x78000000, 0x00000001, 0x68000000, 0x00200000, 0x00300000,
    573         0x0c000000, 0x00000020, 0xc0000000, 0x0e000000}}
    574 ;
     547        0x0c000000, 0x00000020, 0xc0000000, 0x0e000000}};
    575548    const UnicodeSet nu_Set
    576549      {{{Empty, 1}, {Mixed, 1}, {Empty, 49}, {Mixed, 1}, {Empty, 3},
     
    602575        0x0000ffc0, 0x03ff0000, 0xffc00000, 0x03ff0000, 0x03ff0000,
    603576        0x03ff0000, 0x03ff0000, 0x000003ff, 0x000003ff, 0x000003ff,
    604         0x03ff0000, 0xffffc000}}
    605 ;
     577        0x03ff0000, 0xffffc000}};
    606578    const UnicodeSet op_Set
    607579      {{{Empty, 1}, {Mixed, 3}, {Empty, 1}, {Mixed, 1}, {Empty, 115},
     
    619591        0x00000004, 0x25515500, 0x80000000, 0x00800000, 0xaaa00000,
    620592        0x2a00008a, 0x00000100, 0x08000000, 0x88000000, 0x00000004,
    621         0x07000000, 0x00000140, 0x02000000}}
    622 ;
     593        0x07000000, 0x00000140, 0x02000000}};
    623594    const UnicodeSet po_Set
    624595      {{{Empty, 1}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 42},
     
    630601       {0x00000020, 0x00010004, 0x00000e00, 0x00000400, 0x020c0000,
    631602        0x02000000, 0x00ff0000, 0x08400080, 0x00000208, 0x01000000,
    632         0x10000000, 0x00000400, 0x00000020, 0x00000001}}
    633 ;
     603        0x10000000, 0x00000400, 0x00000020, 0x00000001}};
    634604    const UnicodeSet pr_Set
    635605      {{{Empty, 1}, {Mixed, 2}, {Empty, 2}, {Mixed, 1}, {Empty, 38},
     
    642612        0x00020000, 0x02000000, 0x80000000, 0x08000000, 0xf7bfff7f,
    643613        0x0000ffff, 0x00400000, 0x000c0000, 0x00000200, 0x00000010,
    644         0x00000062}}
    645 ;
     614        0x00000062}};
    646615    const UnicodeSet qu_Set
    647616      {{{Empty, 1}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 250},
     
    649618        {Empty, 3649}, {Mixed, 1}, {Empty, 30796}},
    650619       {0x00000084, 0x08000800, 0xbb000000, 0x06000000, 0xf8000000,
    651         0x00000001, 0x30003fff, 0x00000003, 0x01c00000}}
    652 ;
     620        0x00000001, 0x30003fff, 0x00000003, 0x01c00000}};
    653621    const UnicodeSet ri_Set
    654622      {{{Empty, 3983}, {Mixed, 1}, {Empty, 30832}},
    655        {0xffffffc0}}
    656 ;
     623       {0xffffffc0}};
    657624    const UnicodeSet sa_Set
    658625      {{{Empty, 112}, {Mixed, 3}, {Empty, 1}, {Mixed, 3}, {Empty, 9},
     
    665632        0xf0003f5f, 0xffff0000, 0xfc00ffff, 0x308fffff, 0xffff0000,
    666633        0x001f3fff, 0xffff0fff, 0xc40003ff, 0x7fffffff, 0x1fffffff,
    667         0x00003fff, 0x7c00ffff, 0xf8000007}}
    668 ;
     634        0x00003fff, 0x7c00ffff, 0xf8000007}};
    669635    const UnicodeSet sg_Set
    670636      {{{Empty, 1728}, {Full, 64}, {Empty, 33024}},
    671        {}}
    672 ;
     637       {}};
    673638    const UnicodeSet sp_Set
    674639      {{{Empty, 1}, {Mixed, 1}, {Empty, 34814}},
    675        {0x00000001}}
    676 ;
     640       {0x00000001}};
    677641    const UnicodeSet sy_Set
    678642      {{{Empty, 1}, {Mixed, 1}, {Empty, 34814}},
    679        {0x00008000}}
    680 ;
     643       {0x00008000}};
    681644    const UnicodeSet wj_Set
    682645      {{{Empty, 259}, {Mixed, 1}, {Empty, 1779}, {Mixed, 1}, {Empty, 32776}},
    683        {0x00000001, 0x80000000}}
    684 ;
     646       {0x00000001, 0x80000000}};
    685647    const UnicodeSet xx_Set
    686648      {{{Empty, 27}, {Mixed, 3}, {Empty, 11}, {Mixed, 4}, {Empty, 1},
     
    820782        0x00000018, 0xffff0000, 0xfff0e000, 0xfff00000, 0xffe00000,
    821783        0x0000f000, 0xfc00ff00, 0x0000ff00, 0xffffc000, 0xc0000000,
    822         0xc0000000, 0xfffffffd, 0xffff0000}}
    823 ;
     784        0xc0000000, 0xfffffffd, 0xffff0000}};
    824785    const UnicodeSet zw_Set
    825786      {{{Empty, 256}, {Mixed, 1}, {Empty, 34559}},
    826        {0x00000800}}
    827 ;
     787       {0x00000800}};
    828788    static EnumeratedPropertyObject property_object
    829789      {lb,
  • icGREP/icgrep-devel/icgrep/UCD/PropList.h

    r4618 r4621  
    1717    const UnicodeSet codepoint_set
    1818      {{{Empty, 1}, {Mixed, 3}, {Empty, 34812}},
    19        {0x03ff0000, 0x0000007e, 0x0000007e}}
    20 ;
     19       {0x03ff0000, 0x0000007e, 0x0000007e}};
    2120    static BinaryPropertyObject property_object{AHex, codepoint_set};
    2221  }
     
    2524      {{{Empty, 48}, {Mixed, 1}, {Empty, 207}, {Mixed, 2}, {Empty, 1},
    2625        {Mixed, 1}, {Empty, 34556}},
    27        {0x10000000, 0x0000c000, 0x00007c00, 0x000003c0}}
    28 ;
     26       {0x10000000, 0x0000c000, 0x00007c00, 0x000003c0}};
    2927    static BinaryPropertyObject property_object{Bidi_C, codepoint_set};
    3028  }
     
    3937        0x003f0000, 0x00080000, 0x08000000, 0x00000800, 0x00040000,
    4038        0x04800000, 0x0c000000, 0x00000001, 0x10000000, 0x00010000,
    41         0x00000001, 0x00060000, 0x01000000, 0x00000008, 0x00002000}}
    42 ;
     39        0x00000001, 0x00060000, 0x01000000, 0x00000008, 0x00002000}};
    4340    static BinaryPropertyObject property_object{Dash, codepoint_set};
    4441  }
     
    5047        {Empty, 6140}},
    5148       {0x00000200, 0x00080000, 0x02800000, 0x00000018, 0x0000fc00,
    52         0x00000600, 0x00000002}}
    53 ;
     49        0x00000600, 0x00000002}};
    5450    static BinaryPropertyObject property_object{Dep, codepoint_set};
    5551  }
     
    112108        0x10000000, 0x00002000, 0x001f1fc0, 0x0000000c, 0x80000000,
    113109        0x00000001, 0x80000000, 0x00c00000, 0x001f0000, 0xffff8000,
    114         0xf807e380, 0x00000fe7, 0x00003c00, 0x007f0000}}
    115 ;
     110        0xf807e380, 0x00000fe7, 0x00003c00, 0x007f0000}};
    116111    static BinaryPropertyObject property_object{Dia, codepoint_set};
    117112  }
     
    133128        0x00200000, 0x00001000, 0x00008000, 0x00000040, 0x00010000,
    134129        0x20000000, 0x00180000, 0x00010000, 0x20000000, 0x000001c0,
    135         0x0000000c}}
    136 ;
     130        0x0000000c}};
    137131    static BinaryPropertyObject property_object{Ext, codepoint_set};
    138132  }
     
    141135      {{{Empty, 1}, {Mixed, 3}, {Empty, 2036}, {Mixed, 3}, {Empty, 32773}},
    142136       {0x03ff0000, 0x0000007e, 0x0000007e, 0x03ff0000, 0x0000007e,
    143         0x0000007e}}
    144 ;
     137        0x0000007e}};
    145138    static BinaryPropertyObject property_object{Hex, codepoint_set};
    146139  }
     
    153146        {Empty, 32772}},
    154147       {0x00002000, 0x00002000, 0x00000400, 0x00000040, 0x00030000,
    155         0x00800000, 0x08000000, 0x00000008, 0x00002000, 0x00000020}}
    156 ;
     148        0x00800000, 0x08000000, 0x00000008, 0x00002000, 0x00000020}};
    157149    static BinaryPropertyObject property_object{Hyphen, codepoint_set};
    158150  }
     
    160152    const UnicodeSet codepoint_set
    161153      {{{Empty, 383}, {Mixed, 1}, {Empty, 34432}},
    162        {0x0ff30000}}
    163 ;
     154       {0x0ff30000}};
    164155    static BinaryPropertyObject property_object{IDSB, codepoint_set};
    165156  }
     
    167158    const UnicodeSet codepoint_set
    168159      {{{Empty, 383}, {Mixed, 1}, {Empty, 34432}},
    169        {0x000c0000}}
    170 ;
     160       {0x000c0000}};
    171161    static BinaryPropertyObject property_object{IDST, codepoint_set};
    172162  }
     
    179169        {Mixed, 1}, {Empty, 511}, {Full, 16}, {Mixed, 1}, {Empty, 28719}},
    180170       {0x000000c0, 0x070003fe, 0x003fffff, 0x00001fff, 0xffff3fff,
    181         0x03ffffff, 0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}}
    182 ;
     171        0x03ffffff, 0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}};
    183172    static BinaryPropertyObject property_object{Ideo, codepoint_set};
    184173  }
     
    186175    const UnicodeSet codepoint_set
    187176      {{{Empty, 256}, {Mixed, 1}, {Empty, 34559}},
    188        {0x00003000}}
    189 ;
     177       {0x00003000}};
    190178    static BinaryPropertyObject property_object{Join_C, codepoint_set};
    191179  }
     
    194182      {{{Empty, 114}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 1246},
    195183        {Mixed, 1}, {Empty, 33450}},
    196        {0x0000001f, 0x0000001f, 0x1a600000}}
    197 ;
     184       {0x0000001f, 0x0000001f, 0x1a600000}};
    198185    static BinaryPropertyObject property_object{LOE, codepoint_set};
    199186  }
     
    211198        0xc0000000, 0xc0000000, 0xc0000000, 0xc0000000, 0xc0000000,
    212199        0xc0000000, 0xc0000000, 0xc0000000, 0xc0000000, 0xc0000000,
    213         0xc0000000, 0xc0000000, 0xc0000000, 0xc0000000}}
    214 ;
     200        0xc0000000, 0xc0000000, 0xc0000000, 0xc0000000}};
    215201    static BinaryPropertyObject property_object{NChar, codepoint_set};
    216202  }
     
    267253        0x7fff0000, 0x00000001, 0x003ff800, 0x007f0000, 0xfffe0000,
    268254        0x7fffffff, 0x40000000, 0xffff0000, 0xffff03ff, 0xffff03ff,
    269         0x000003ff}}
    270 ;
     255        0x000003ff}};
    271256    static BinaryPropertyObject property_object{OAlpha, codepoint_set};
    272257  }
     
    279264        {Full, 112}, {Empty, 6016}},
    280265       {0x00008000, 0x80000000, 0x00000001, 0x00300000, 0x00000020,
    281         0x00000010, 0x00000001, 0x01ff0000, 0xfffffffd, 0xffff0000}}
    282 ;
     266        0x00000010, 0x00000001, 0x01ff0000, 0xfffffffd, 0xffff0000}};
    283267    static BinaryPropertyObject property_object{ODI, codepoint_set};
    284268  }
     
    294278        0x00800000, 0x00600004, 0x40000000, 0x00800000, 0x80008000,
    295279        0x00003000, 0x0000c000, 0xc0000000, 0x40000000, 0x00800000,
    296         0x20010000, 0x00008000, 0x0007c020}}
    297 ;
     280        0x20010000, 0x00008000, 0x0007c020}};
    298281    static BinaryPropertyObject property_object{OGr_Ext, codepoint_set};
    299282  }
     
    302285      {{{Empty, 5}, {Mixed, 1}, {Empty, 22}, {Mixed, 1}, {Empty, 126},
    303286        {Mixed, 1}, {Empty, 50}, {Mixed, 1}, {Empty, 34609}},
    304        {0x00800000, 0x00000080, 0x0003fe00, 0x04000000}}
    305 ;
     287       {0x00800000, 0x00000080, 0x0003fe00, 0x04000000}};
    306288    static BinaryPropertyObject property_object{OIDC, codepoint_set};
    307289  }
     
    309291    const UnicodeSet codepoint_set
    310292      {{{Empty, 264}, {Mixed, 2}, {Empty, 122}, {Mixed, 1}, {Empty, 34427}},
    311        {0x01000000, 0x00004000, 0x18000000}}
    312 ;
     293       {0x01000000, 0x00004000, 0x18000000}};
    313294    static BinaryPropertyObject property_object{OIDS, codepoint_set};
    314295  }
     
    324305        0x04000000, 0xfffff000, 0x010007ff, 0xf8000000, 0x80020000,
    325306        0x1fff0000, 0xffff0000, 0xffff0000, 0x000003ff, 0x30000000,
    326         0x30000000, 0x00010000, 0x03000000, 0xf0000000}}
    327 ;
     307        0x30000000, 0x00010000, 0x03000000, 0xf0000000}};
    328308    static BinaryPropertyObject property_object{OLower, codepoint_set};
    329309  }
     
    350330        0xffdfffff, 0xffff7fff, 0xffff7fff, 0xfffffdff, 0xfffffdff,
    351331        0xffffcff7, 0xffffffef, 0x0af7fe96, 0xaa96ea84, 0x5ef7f796,
    352         0x0ffffbff, 0x0ffffbee}}
    353 ;
     332        0x0ffffbff, 0x0ffffbee}};
    354333    static BinaryPropertyObject property_object{OMath, codepoint_set};
    355334  }
     
    359338        {Mixed, 4}, {Empty, 30835}},
    360339       {0x0000ffff, 0xffc00000, 0x0000ffff, 0xffff0000, 0xffff03ff,
    361         0xffff03ff, 0x000003ff}}
    362 ;
     340        0xffff03ff, 0x000003ff}};
    363341    static BinaryPropertyObject property_object{OUpper, codepoint_set};
    364342  }
     
    373351        0x00800000, 0xffff0000, 0x7fff00ff, 0x7feffffe, 0xffff0000,
    374352        0x003fffff, 0xfff00000, 0xffffff0e, 0x00010001, 0xc0000000,
    375         0x00000060}}
    376 ;
     353        0x00000060}};
    377354    static BinaryPropertyObject property_object{Pat_Syn, codepoint_set};
    378355  }
     
    381358      {{{Mixed, 2}, {Empty, 2}, {Mixed, 1}, {Empty, 251}, {Mixed, 2},
    382359        {Empty, 34558}},
    383        {0x00003e00, 0x00000001, 0x00000020, 0x0000c000, 0x00000300}}
    384 ;
     360       {0x00003e00, 0x00000001, 0x00000020, 0x0000c000, 0x00000300}};
    385361    static BinaryPropertyObject property_object{Pat_WS, codepoint_set};
    386362  }
     
    392368        {Mixed, 1}, {Empty, 32772}},
    393369       {0x00000084, 0x08000800, 0xff000000, 0x06000000, 0x00000004,
    394         0xe000f000, 0x0000001e, 0x00000084, 0x0000000c}}
    395 ;
     370        0xe000f000, 0x0000001e, 0x00000084, 0x0000000c}};
    396371    static BinaryPropertyObject property_object{QMark, codepoint_set};
    397372  }
     
    400375      {{{Empty, 372}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Full, 6},
    401376        {Mixed, 1}, {Empty, 34433}},
    402        {0xfbffffff, 0x000fffff, 0x003fffff}}
    403 ;
     377       {0xfbffffff, 0x000fffff, 0x003fffff}};
    404378    static BinaryPropertyObject property_object{Radical, codepoint_set};
    405379  }
     
    419393        0x10000000, 0x0000000c, 0x00c00000, 0x00000c00, 0xc0000000,
    420394        0x000c0000, 0x000000c0, 0x0c000000, 0x0000c000, 0x0000000c,
    421         0x00c00000, 0x00000c00, 0xc0000000, 0x000c0000}}
    422 ;
     395        0x00c00000, 0x00000c00, 0xc0000000, 0x000c0000}};
    423396    static BinaryPropertyObject property_object{SD, codepoint_set};
    424397  }
     
    453426        0x00000180, 0xc0000000, 0x00000003, 0x0000000e, 0x00002060,
    454427        0x1b000000, 0x0000020c, 0x00000006, 0x0000c000, 0x00200000,
    455         0x01800000, 0x00000010, 0x80000000}}
    456 ;
     428        0x01800000, 0x00000010, 0x80000000}};
    457429    static BinaryPropertyObject property_object{STerm, codepoint_set};
    458430  }
     
    497469        0x00000003, 0x0000000e, 0x00002060, 0x1f000000, 0x0000023c,
    498470        0x00000006, 0x001f0000, 0x0000c000, 0x00200000, 0x03800000,
    499         0x00000010, 0x80000000}}
    500 ;
     471        0x00000010, 0x80000000}};
    501472    static BinaryPropertyObject property_object{Term, codepoint_set};
    502473  }
     
    508479        {Mixed, 1}, {Empty, 29247}},
    509480       {0x003fffff, 0x00001fff, 0x801ac000, 0x0000039a, 0x007fffff,
    510         0x001fffff, 0x3fffffff}}
    511 ;
     481        0x001fffff, 0x3fffffff}};
    512482    static BinaryPropertyObject property_object{UIdeo, codepoint_set};
    513483  }
     
    516486      {{{Empty, 192}, {Mixed, 1}, {Empty, 1839}, {Mixed, 1}, {Empty, 26647},
    517487        {Full, 7}, {Mixed, 1}, {Empty, 6128}},
    518        {0x00003800, 0x0000ffff, 0x0000ffff}}
    519 ;
     488       {0x00003800, 0x0000ffff, 0x0000ffff}};
    520489    static BinaryPropertyObject property_object{VS, codepoint_set};
    521490  }
     
    525494        {Empty, 75}, {Mixed, 3}, {Empty, 125}, {Mixed, 1}, {Empty, 34431}},
    526495       {0x00003e00, 0x00000001, 0x00000020, 0x00000001, 0x00000001,
    527         0x000007ff, 0x00008300, 0x80000000, 0x00000001}}
    528 ;
     496        0x000007ff, 0x00008300, 0x80000000, 0x00000001}};
    529497    static BinaryPropertyObject property_object{WSpace, codepoint_set};
    530498  }
  • icGREP/icgrep-devel/icgrep/UCD/ScriptExtensions.h

    r4618 r4621  
    1717    const UnicodeSet aghb_Ext
    1818      {{{Empty, 2089}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 32724}},
    19        {0xffff0000, 0x0000800f}}
    20 ;
     19       {0xffff0000, 0x0000800f}};
    2120    const UnicodeSet arab_Ext
    2221      {{{Empty, 48}, {Mixed, 1}, {Full, 5}, {Mixed, 1}, {Full, 1},
     
    3130        0x000000ff, 0x3fff0000, 0xffdf0000, 0x1fffffff, 0x0fffffff,
    3231        0x7fffffff, 0xffffffef, 0x0af7fe96, 0xaa96ea84, 0x5ef7f796,
    33         0x0ffffbff, 0x0ffffbee, 0x00030000}}
    34 ;
     32        0x0ffffbff, 0x0ffffbee, 0x00030000}};
    3533    const UnicodeSet armi_Ext
    3634      {{{Empty, 2114}, {Mixed, 1}, {Empty, 32701}},
    37        {0xffbfffff}}
    38 ;
     35       {0xffbfffff}};
    3936    const UnicodeSet armn_Ext
    4037      {{{Empty, 41}, {Mixed, 4}, {Empty, 1963}, {Mixed, 1}, {Empty, 32807}},
    41        {0xfffe0000, 0xfe7fffff, 0xfffffffe, 0x0000e6ff, 0x00f80000}}
    42 ;
     38       {0xfffe0000, 0xfe7fffff, 0xfffffffe, 0x0000e6ff, 0x00f80000}};
    4339    const UnicodeSet avst_Ext
    4440      {{{Empty, 2136}, {Full, 1}, {Mixed, 1}, {Empty, 32678}},
    45        {0xfe3fffff}}
    46 ;
     41       {0xfe3fffff}};
    4742    const UnicodeSet bali_Ext
    4843      {{{Empty, 216}, {Full, 2}, {Mixed, 2}, {Empty, 34596}},
    49        {0xffff0fff, 0x1fffffff}}
    50 ;
     44       {0xffff0fff, 0x1fffffff}};
    5145    const UnicodeSet bamu_Ext
    5246      {{{Empty, 1333}, {Full, 2}, {Mixed, 1}, {Empty, 1544}, {Full, 17},
    5347        {Mixed, 1}, {Empty, 31918}},
    54        {0x00ffffff, 0x01ffffff}}
    55 ;
     48       {0x00ffffff, 0x01ffffff}};
    5649    const UnicodeSet bass_Ext
    5750      {{{Empty, 2902}, {Mixed, 2}, {Empty, 31912}},
    58        {0xffff0000, 0x003f3fff}}
    59 ;
     51       {0xffff0000, 0x003f3fff}};
    6052    const UnicodeSet batk_Ext
    6153      {{{Empty, 222}, {Full, 1}, {Mixed, 1}, {Empty, 34592}},
    62        {0xf00fffff}}
    63 ;
     54       {0xf00fffff}};
    6455    const UnicodeSet beng_Ext
    6556      {{{Empty, 75}, {Mixed, 5}, {Empty, 34736}},
    66        {0x00000030, 0xfff99fef, 0xf3c5fdff, 0xb080799f, 0x0fffffcf}}
    67 ;
     57       {0x00000030, 0xfff99fef, 0xf3c5fdff, 0xb080799f, 0x0fffffcf}};
    6858    const UnicodeSet bopo_Ext
    6959      {{{Empty, 23}, {Mixed, 1}, {Empty, 360}, {Mixed, 2}, {Empty, 5},
     
    7565        0x00003fff, 0x07ffffff, 0x0000000f, 0x0000000f, 0x0001ffff,
    7666        0x00000fff, 0xff000000, 0xf801ffff, 0x7fffffff, 0x00000060,
    77         0x0000003e}}
    78 ;
     67        0x0000003e}};
    7968    const UnicodeSet brah_Ext
    8069      {{{Empty, 2176}, {Full, 2}, {Mixed, 2}, {Empty, 32636}},
    81        {0xfffc3fff, 0x8000ffff}}
    82 ;
     70       {0xfffc3fff, 0x8000ffff}};
    8371    const UnicodeSet brai_Ext
    8472      {{{Empty, 320}, {Full, 8}, {Empty, 34488}},
    85        {}}
    86 ;
     73       {}};
    8774    const UnicodeSet bugi_Ext
    8875      {{{Empty, 208}, {Mixed, 1}, {Empty, 1149}, {Mixed, 1}, {Empty, 33457}},
    89        {0xcfffffff, 0x00008000}}
    90 ;
     76       {0xcfffffff, 0x00008000}};
    9177    const UnicodeSet buhd_Ext
    9278      {{{Empty, 185}, {Mixed, 2}, {Empty, 34629}},
    93        {0x00600000, 0x000fffff}}
    94 ;
     79       {0x00600000, 0x000fffff}};
    9580    const UnicodeSet cakm_Ext
    9681      {{{Empty, 79}, {Mixed, 1}, {Empty, 50}, {Mixed, 1}, {Empty, 2053},
    9782        {Full, 1}, {Mixed, 2}, {Empty, 32629}},
    98        {0x0000ffc0, 0x000003ff, 0xffdfffff, 0x0000000f}}
    99 ;
     83       {0x0000ffc0, 0x000003ff, 0xffdfffff, 0x0000000f}};
    10084    const UnicodeSet cans_Ext
    10185      {{{Empty, 160}, {Full, 20}, {Empty, 17}, {Mixed, 1}, {Full, 1},
    10286        {Mixed, 1}, {Empty, 34616}},
    103        {0xffff0000, 0x003fffff}}
    104 ;
     87       {0xffff0000, 0x003fffff}};
    10588    const UnicodeSet cari_Ext
    10689      {{{Empty, 2069}, {Full, 1}, {Mixed, 1}, {Empty, 32745}},
    107        {0x0001ffff}}
    108 ;
     90       {0x0001ffff}};
    10991    const UnicodeSet cham_Ext
    11092      {{{Empty, 1360}, {Full, 1}, {Mixed, 2}, {Empty, 33453}},
    111        {0x007fffff, 0xf3ff3fff}}
    112 ;
     93       {0x007fffff, 0xf3ff3fff}};
    11394    const UnicodeSet cher_Ext
    11495      {{{Empty, 157}, {Full, 2}, {Mixed, 1}, {Empty, 34656}},
    115        {0x001fffff}}
    116 ;
     96       {0x001fffff}};
    11797    const UnicodeSet copt_Ext
    11898      {{{Empty, 31}, {Mixed, 1}, {Empty, 324}, {Full, 3}, {Mixed, 1},
    11999        {Empty, 1711}, {Mixed, 1}, {Empty, 32744}},
    120        {0x0000fffc, 0xfe0fffff, 0x0fffffff}}
    121 ;
     100       {0x0000fffc, 0xfe0fffff, 0x0fffffff}};
    122101    const UnicodeSet cprt_Ext
    123102      {{{Empty, 2056}, {Mixed, 2}, {Empty, 54}, {Mixed, 2}, {Empty, 32702}},
    124        {0xffffff87, 0xff8fffff, 0xfffffd3f, 0x91bfffff}}
    125 ;
     103       {0xffffff87, 0xff8fffff, 0xfffffd3f, 0x91bfffff}};
    126104    const UnicodeSet cyrl_Ext
    127105      {{{Empty, 32}, {Full, 9}, {Mixed, 1}, {Empty, 191}, {Mixed, 1},
    128106        {Empty, 1}, {Mixed, 1}, {Empty, 131}, {Full, 1}, {Empty, 962},
    129107        {Full, 2}, {Mixed, 1}, {Empty, 33483}},
    130        {0x0000ffff, 0x00000800, 0x01000000, 0xbfffffff}}
    131 ;
     108       {0x0000ffff, 0x00000800, 0x01000000, 0xbfffffff}};
    132109    const UnicodeSet deva_Ext
    133110      {{{Empty, 72}, {Full, 4}, {Empty, 154}, {Mixed, 2}, {Empty, 1113},
    134111        {Mixed, 1}, {Empty, 5}, {Mixed, 1}, {Empty, 33464}},
    135        {0xfff70000, 0x031c21ff, 0x03ff0000, 0x0fffffff}}
    136 ;
     112       {0xfff70000, 0x031c21ff, 0x03ff0000, 0x0fffffff}};
    137113    const UnicodeSet dsrt_Ext
    138114      {{{Empty, 2080}, {Full, 2}, {Mixed, 1}, {Empty, 32733}},
    139        {0x0000ffff}}
    140 ;
     115       {0x0000ffff}};
    141116    const UnicodeSet dupl_Ext
    142117      {{{Empty, 3552}, {Full, 3}, {Mixed, 3}, {Empty, 31258}},
    143        {0x1fff07ff, 0xf3ff01ff, 0x0000000f}}
    144 ;
     118       {0x1fff07ff, 0xf3ff01ff, 0x0000000f}};
    145119    const UnicodeSet egyp_Ext
    146120      {{{Empty, 2432}, {Full, 33}, {Mixed, 1}, {Empty, 32350}},
    147        {0x00007fff}}
    148 ;
     121       {0x00007fff}};
    149122    const UnicodeSet elba_Ext
    150123      {{{Empty, 2088}, {Full, 1}, {Mixed, 1}, {Empty, 32726}},
    151        {0x000000ff}}
    152 ;
     124       {0x000000ff}};
    153125    const UnicodeSet ethi_Ext
    154126      {{{Empty, 144}, {Full, 2}, {Mixed, 1}, {Full, 1}, {Mixed, 3},
     
    157129       {0x3d7f3dff, 0xffff3dff, 0x7f3dffff, 0xff7fff3d, 0xff3dffff,
    158130        0xe7ffffff, 0x1fffffff, 0x03ffffff, 0x007fffff, 0x7f7f7f7f,
    159         0x7f7f7f7f, 0x007e7e7e, 0x00007f7f}}
    160 ;
     131        0x7f7f7f7f, 0x007e7e7e, 0x00007f7f}};
    161132    const UnicodeSet geor_Ext
    162133      {{{Empty, 44}, {Mixed, 1}, {Empty, 88}, {Full, 1}, {Mixed, 2},
    163134        {Empty, 224}, {Full, 1}, {Mixed, 1}, {Empty, 34454}},
    164        {0x00000200, 0xffff20bf, 0xf7ffffff, 0x000020bf}}
    165 ;
     135       {0x00000200, 0xffff20bf, 0xf7ffffff, 0x000020bf}};
    166136    const UnicodeSet glag_Ext
    167137      {{{Empty, 352}, {Full, 1}, {Mixed, 2}, {Empty, 34461}},
    168        {0xffff7fff, 0x7fffffff}}
    169 ;
     138       {0xffff7fff, 0x7fffffff}};
    170139    const UnicodeSet goth_Ext
    171140      {{{Empty, 2073}, {Mixed, 2}, {Empty, 32741}},
    172        {0xffff0000, 0x000007ff}}
    173 ;
     141       {0xffff0000, 0x000007ff}};
    174142    const UnicodeSet gran_Ext
    175143      {{{Empty, 75}, {Mixed, 1}, {Empty, 2124}, {Mixed, 4}, {Empty, 32612}},
    176        {0x00000030, 0xfff99fee, 0xf3edfdff, 0xe080399f, 0x001f1fcf}}
    177 ;
     144       {0x00000030, 0xfff99fee, 0xf3edfdff, 0xe080399f, 0x001f1fcf}};
    178145    const UnicodeSet grek_Ext
    179146      {{{Empty, 26}, {Mixed, 4}, {Full, 1}, {Mixed, 1}, {Empty, 201},
     
    186153        0x3f3fffff, 0xaaff3f3f, 0x3fffffff, 0xffdfffff, 0xefcfffdf,
    187154        0x7fdcffff, 0x00000040, 0x00000020, 0x00001fff, 0x00000001,
    188         0x0000003f}}
    189 ;
     155        0x0000003f}};
    190156    const UnicodeSet gujr_Ext
    191157      {{{Empty, 75}, {Mixed, 1}, {Empty, 8}, {Mixed, 4}, {Empty, 1257},
    192158        {Mixed, 1}, {Empty, 33470}},
    193159       {0x00000030, 0xfffbbfee, 0xf3edfdff, 0x00013bbf, 0x0003ffcf,
    194         0x03ff0000}}
    195 ;
     160        0x03ff0000}};
    196161    const UnicodeSet guru_Ext
    197162      {{{Empty, 75}, {Mixed, 1}, {Empty, 4}, {Mixed, 4}, {Empty, 1261},
    198163        {Mixed, 1}, {Empty, 33470}},
    199164       {0x00000030, 0xfff987ee, 0xd36dfdff, 0x5e023987, 0x003fffc0,
    200         0x03ff0000}}
    201 ;
     165        0x03ff0000}};
    202166    const UnicodeSet hang_Ext
    203167      {{{Empty, 136}, {Full, 8}, {Empty, 240}, {Mixed, 2}, {Empty, 5},
     
    212176        0x00000fff, 0xff000000, 0xf801ffff, 0x7fffffff, 0x1fffffff,
    213177        0xffff000f, 0xfffff87f, 0x0fffffff, 0x00000060, 0x0000003e,
    214         0x7fffffff, 0x1cfcfcfc}}
    215 ;
     178        0x7fffffff, 0x1cfcfcfc}};
    216179    const UnicodeSet hani_Ext
    217180      {{{Empty, 372}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Full, 6},
     
    230193        0x00000fff, 0xff000000, 0xf801ffff, 0x7fffffff, 0x003fffff,
    231194        0x00001fff, 0xffff3fff, 0x03ffffff, 0x00000060, 0x0000003e,
    232         0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}}
    233 ;
     195        0x007fffff, 0x001fffff, 0x3fffffff, 0x3fffffff}};
    234196    const UnicodeSet hano_Ext
    235197      {{{Empty, 185}, {Mixed, 1}, {Empty, 34630}},
    236        {0x007fffff}}
    237 ;
     198       {0x007fffff}};
    238199    const UnicodeSet hebr_Ext
    239200      {{{Empty, 44}, {Mixed, 1}, {Full, 1}, {Mixed, 2}, {Empty, 1960},
    240201        {Mixed, 3}, {Empty, 32805}},
    241202       {0xfffe0000, 0xffff00ff, 0x001f07ff, 0xe0000000, 0x5f7fffff,
    242         0x0000ffdb}}
    243 ;
     203        0x0000ffdb}};
    244204    const UnicodeSet hira_Ext
    245205      {{{Empty, 384}, {Mixed, 3}, {Full, 1}, {Mixed, 2}, {Empty, 1},
     
    252212        0x18000000, 0xffff0000, 0x0000000f, 0x0000000f, 0x0001ffff,
    253213        0x00000fff, 0xff000000, 0xf801ffff, 0x7fffffff, 0x00000060,
    254         0x0001003e, 0xc0000000, 0x00000002, 0x00000001}}
    255 ;
     214        0x0001003e, 0xc0000000, 0x00000002, 0x00000001}};
    256215    const UnicodeSet hmng_Ext
    257216      {{{Empty, 2904}, {Full, 2}, {Mixed, 3}, {Empty, 31907}},
    258        {0xfbff003f, 0xe0fffffb, 0x0000ffff}}
    259 ;
     217       {0xfbff003f, 0xe0fffffb, 0x0000ffff}};
    260218    const UnicodeSet hrkt_Ext
    261219      {{{Empty, 34816}},
    262        {}}
    263 ;
     220       {}};
    264221    const UnicodeSet ital_Ext
    265222      {{{Empty, 2072}, {Full, 1}, {Mixed, 1}, {Empty, 32742}},
    266        {0x0000000f}}
    267 ;
     223       {0x0000000f}};
    268224    const UnicodeSet java_Ext
    269225      {{{Empty, 1356}, {Full, 2}, {Mixed, 1}, {Empty, 33457}},
    270        {0xc3ffbfff}}
    271 ;
     226       {0xc3ffbfff}};
    272227    const UnicodeSet kali_Ext
    273228      {{{Empty, 1352}, {Full, 1}, {Mixed, 1}, {Empty, 33462}},
    274        {0x0000ffff}}
    275 ;
     229       {0x0000ffff}};
    276230    const UnicodeSet kana_Ext
    277231      {{{Empty, 384}, {Mixed, 2}, {Empty, 2}, {Mixed, 1}, {Full, 3},
     
    283237       {0xfffbff4e, 0xf0bf0000, 0x1e000000, 0xffff0000, 0xffff000f,
    284238        0x0000000f, 0x0001ffff, 0xffff0fff, 0x7fffffff, 0xf801ffff,
    285         0x7fffffff, 0x00000060, 0xfffffffe, 0x00000001}}
    286 ;
     239        0x7fffffff, 0x00000060, 0xfffffffe, 0x00000001}};
    287240    const UnicodeSet khar_Ext
    288241      {{{Empty, 2128}, {Mixed, 3}, {Empty, 32685}},
    289        {0xfeeff06f, 0x870fffff, 0x01ff00ff}}
    290 ;
     242       {0xfeeff06f, 0x870fffff, 0x01ff00ff}};
    291243    const UnicodeSet khmr_Ext
    292244      {{{Empty, 188}, {Full, 2}, {Mixed, 2}, {Empty, 15}, {Full, 1},
    293245        {Empty, 34608}},
    294        {0x3fffffff, 0x03ff03ff}}
    295 ;
     246       {0x3fffffff, 0x03ff03ff}};
    296247    const UnicodeSet khoj_Ext
    297248      {{{Empty, 87}, {Mixed, 1}, {Empty, 2104}, {Mixed, 2}, {Empty, 32622}},
    298        {0x0000ffc0, 0xfffbffff, 0x3fffffff}}
    299 ;
     249       {0x0000ffc0, 0xfffbffff, 0x3fffffff}};
    300250    const UnicodeSet knda_Ext
    301251      {{{Empty, 75}, {Mixed, 1}, {Empty, 24}, {Mixed, 4}, {Empty, 34712}},
    302        {0x00000030, 0xfffddfee, 0xf3effdff, 0x40603ddf, 0x0006ffcf}}
    303 ;
     252       {0x00000030, 0xfffddfee, 0xf3effdff, 0x40603ddf, 0x0006ffcf}};
    304253    const UnicodeSet kthi_Ext
    305254      {{{Empty, 75}, {Mixed, 1}, {Empty, 1269}, {Mixed, 1}, {Empty, 834},
    306255        {Full, 2}, {Mixed, 1}, {Empty, 32633}},
    307        {0x0000ffc0, 0x03ff0000, 0x00000003}}
    308 ;
     256       {0x0000ffc0, 0x03ff0000, 0x00000003}};
    309257    const UnicodeSet lana_Ext
    310258      {{{Empty, 209}, {Full, 1}, {Mixed, 4}, {Empty, 34602}},
    311        {0x7fffffff, 0x9fffffff, 0x03ff03ff, 0x00003fff}}
    312 ;
     259       {0x7fffffff, 0x9fffffff, 0x03ff03ff, 0x00003fff}};
    313260    const UnicodeSet laoo_Ext
    314261      {{{Empty, 116}, {Mixed, 3}, {Empty, 34697}},
    315        {0xfef02596, 0x3bffecae, 0xf3ff3f5f}}
    316 ;
     262       {0xfef02596, 0x3bffecae, 0xf3ff3f5f}};
    317263    const UnicodeSet latn_Ext
    318264      {{{Empty, 2}, {Mixed, 2}, {Empty, 1}, {Mixed, 3}, {Full, 13},
     
    330276        0x1fff0000, 0x00040c00, 0x00004000, 0x000001ff, 0xfffffffc,
    331277        0xffff78ff, 0x00033fff, 0xff800000, 0x00004000, 0xffff0000,
    332         0xf7ffffff, 0x00000010, 0x0000007f, 0x07fffffe, 0x07fffffe}}
    333 ;
     278        0xf7ffffff, 0x00000010, 0x0000007f, 0x07fffffe, 0x07fffffe}};
    334279    const UnicodeSet lepc_Ext
    335280      {{{Empty, 224}, {Full, 1}, {Mixed, 2}, {Empty, 34589}},
    336        {0xf8ffffff, 0x0000e3ff}}
    337 ;
     281       {0xf8ffffff, 0x0000e3ff}};
    338282    const UnicodeSet limb_Ext
    339283      {{{Empty, 75}, {Mixed, 1}, {Empty, 124}, {Mixed, 3}, {Empty, 34613}},
    340        {0x00000020, 0x7fffffff, 0x0fff0fff, 0x0000fff1}}
    341 ;
     284       {0x00000020, 0x7fffffff, 0x0fff0fff, 0x0000fff1}};
    342285    const UnicodeSet lina_Ext
    343286      {{{Empty, 2096}, {Full, 9}, {Mixed, 3}, {Empty, 32708}},
    344        {0x007fffff, 0x003fffff, 0x000000ff}}
    345 ;
     287       {0x007fffff, 0x003fffff, 0x000000ff}};
    346288    const UnicodeSet linb_Ext
    347289      {{{Empty, 2048}, {Mixed, 3}, {Empty, 1}, {Full, 3}, {Mixed, 3},
    348290        {Empty, 32758}},
    349291       {0xffffefff, 0xb7ffff7f, 0x3fff3fff, 0x07ffffff, 0xffffff87,
    350         0xff8fffff}}
    351 ;
     292        0xff8fffff}};
    352293    const UnicodeSet lisu_Ext
    353294      {{{Empty, 1318}, {Mixed, 1}, {Full, 1}, {Empty, 33496}},
    354        {0xffff0000}}
    355 ;
     295       {0xffff0000}};
    356296    const UnicodeSet lyci_Ext
    357297      {{{Empty, 2068}, {Mixed, 1}, {Empty, 32747}},
    358        {0x1fffffff}}
    359 ;
     298       {0x1fffffff}};
    360299    const UnicodeSet lydi_Ext
    361300      {{{Empty, 2121}, {Mixed, 1}, {Empty, 32694}},
    362        {0x83ffffff}}
    363 ;
     301       {0x83ffffff}};
    364302    const UnicodeSet mahj_Ext
    365303      {{{Empty, 75}, {Mixed, 1}, {Empty, 1269}, {Mixed, 1}, {Empty, 840},
    366304        {Mixed, 2}, {Empty, 32628}},
    367        {0x0000fff0, 0x03ff0000, 0xffff0000, 0x007fffff}}
    368 ;
     305       {0x0000fff0, 0x03ff0000, 0xffff0000, 0x007fffff}};
    369306    const UnicodeSet mand_Ext
    370307      {{{Empty, 50}, {Mixed, 1}, {Empty, 15}, {Mixed, 1}, {Empty, 34749}},
    371        {0x00000001, 0x4fffffff}}
    372 ;
     308       {0x00000001, 0x4fffffff}};
    373309    const UnicodeSet mani_Ext
    374310      {{{Empty, 50}, {Mixed, 1}, {Empty, 2083}, {Full, 1}, {Mixed, 1},
    375311        {Empty, 32680}},
    376        {0x00000001, 0x007ff87f}}
    377 ;
     312       {0x00000001, 0x007ff87f}};
    378313    const UnicodeSet mend_Ext
    379314      {{{Empty, 3904}, {Full, 6}, {Mixed, 1}, {Empty, 30905}},
    380        {0x007fff9f}}
    381 ;
     315       {0x007fff9f}};
    382316    const UnicodeSet merc_Ext
    383317      {{{Empty, 2125}, {Mixed, 1}, {Empty, 32690}},
    384        {0xc0ffffff}}
    385 ;
     318       {0xc0ffffff}};
    386319    const UnicodeSet mero_Ext
    387320      {{{Empty, 2124}, {Full, 1}, {Empty, 32691}},
    388        {}}
    389 ;
     321       {}};
    390322    const UnicodeSet mlym_Ext
    391323      {{{Empty, 75}, {Mixed, 1}, {Empty, 28}, {Mixed, 4}, {Empty, 34708}},
    392        {0x00000030, 0xfffddfee, 0xe7ffffff, 0x00807ddf, 0xfe3fffcf}}
    393 ;
     324       {0x00000030, 0xfffddfee, 0xe7ffffff, 0x00807ddf, 0xfe3fffcf}};
    394325    const UnicodeSet modi_Ext
    395326      {{{Empty, 1345}, {Mixed, 1}, {Empty, 878}, {Full, 2}, {Mixed, 1},
    396327        {Empty, 32589}},
    397        {0x03ff0000, 0x03ff001f}}
    398 ;
     328       {0x03ff0000, 0x03ff001f}};
    399329    const UnicodeSet mong_Ext
    400330      {{{Empty, 192}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Full, 1},
    401331        {Mixed, 1}, {Empty, 34618}},
    402        {0x03ff7fff, 0x00ffffff, 0x000007ff}}
    403 ;
     332       {0x03ff7fff, 0x00ffffff, 0x000007ff}};
    404333    const UnicodeSet mroo_Ext
    405334      {{{Empty, 2898}, {Mixed, 2}, {Empty, 31916}},
    406        {0x7fffffff, 0x0000c3ff}}
    407 ;
     335       {0x7fffffff, 0x0000c3ff}};
    408336    const UnicodeSet mtei_Ext
    409337      {{{Empty, 1367}, {Mixed, 1}, {Empty, 6}, {Full, 1}, {Mixed, 1},
    410338        {Empty, 33440}},
    411        {0x007fffff, 0x03ff3fff}}
    412 ;
     339       {0x007fffff, 0x03ff3fff}};
    413340    const UnicodeSet mymr_Ext
    414341      {{{Empty, 128}, {Full, 5}, {Empty, 1220}, {Mixed, 1}, {Empty, 5},
    415342        {Mixed, 1}, {Empty, 3}, {Full, 1}, {Empty, 33452}},
    416        {0x00004000, 0x7fffffff}}
    417 ;
     343       {0x00004000, 0x7fffffff}};
    418344    const UnicodeSet narb_Ext
    419345      {{{Empty, 2132}, {Full, 1}, {Empty, 32683}},
    420        {}}
    421 ;
     346       {}};
    422347    const UnicodeSet nbat_Ext
    423348      {{{Empty, 2116}, {Mixed, 2}, {Empty, 32698}},
    424        {0x7fffffff, 0x0000ff80}}
    425 ;
     349       {0x7fffffff, 0x0000ff80}};
    426350    const UnicodeSet nkoo_Ext
    427351      {{{Empty, 62}, {Full, 1}, {Mixed, 1}, {Empty, 34752}},
    428        {0x07ffffff}}
    429 ;
     352       {0x07ffffff}};
    430353    const UnicodeSet ogam_Ext
    431354      {{{Empty, 180}, {Mixed, 1}, {Empty, 34635}},
    432        {0x1fffffff}}
    433 ;
     355       {0x1fffffff}};
    434356    const UnicodeSet olck_Ext
    435357      {{{Empty, 226}, {Mixed, 1}, {Full, 1}, {Empty, 34588}},
    436        {0xffff0000}}
    437 ;
     358       {0xffff0000}};
    438359    const UnicodeSet orkh_Ext
    439360      {{{Empty, 2144}, {Full, 2}, {Mixed, 1}, {Empty, 32669}},
    440        {0x000001ff}}
    441 ;
     361       {0x000001ff}};
    442362    const UnicodeSet orya_Ext
    443363      {{{Empty, 75}, {Mixed, 1}, {Empty, 12}, {Mixed, 4}, {Empty, 34724}},
    444        {0x00000030, 0xfff99fee, 0xf3edfdff, 0xb0c0399f, 0x00ffffcf}}
    445 ;
     364       {0x00000030, 0xfff99fee, 0xf3edfdff, 0xb0c0399f, 0x00ffffcf}};
    446365    const UnicodeSet osma_Ext
    447366      {{{Empty, 2084}, {Mixed, 2}, {Empty, 32730}},
    448        {0x3fffffff, 0x000003ff}}
    449 ;
     367       {0x3fffffff, 0x000003ff}};
    450368    const UnicodeSet palm_Ext
    451369      {{{Empty, 2115}, {Full, 1}, {Empty, 32700}},
    452        {}}
    453 ;
     370       {}};
    454371    const UnicodeSet pauc_Ext
    455372      {{{Empty, 2262}, {Full, 1}, {Mixed, 1}, {Empty, 32552}},
    456        {0x01ffffff}}
    457 ;
     373       {0x01ffffff}};
    458374    const UnicodeSet perm_Ext
    459375      {{{Empty, 2074}, {Mixed, 2}, {Empty, 32740}},
    460        {0xffff0000, 0x07ffffff}}
    461 ;
     376       {0xffff0000, 0x07ffffff}};
    462377    const UnicodeSet phag_Ext
    463378      {{{Empty, 192}, {Mixed, 1}, {Empty, 1153}, {Full, 1}, {Mixed, 1},
    464379        {Empty, 33468}},
    465        {0x0000002c, 0x00ffffff}}
    466 ;
     380       {0x0000002c, 0x00ffffff}};
    467381    const UnicodeSet phli_Ext
    468382      {{{Empty, 2139}, {Mixed, 1}, {Empty, 32676}},
    469        {0xff07ffff}}
    470 ;
     383       {0xff07ffff}};
    471384    const UnicodeSet phlp_Ext
    472385      {{{Empty, 50}, {Mixed, 1}, {Empty, 2089}, {Mixed, 2}, {Empty, 32674}},
    473        {0x00000001, 0x1e03ffff, 0x0000fe00}}
    474 ;
     386       {0x00000001, 0x1e03ffff, 0x0000fe00}};
    475387    const UnicodeSet phnx_Ext
    476388      {{{Empty, 2120}, {Mixed, 1}, {Empty, 32695}},
    477        {0x8fffffff}}
    478 ;
     389       {0x8fffffff}};
    479390    const UnicodeSet plrd_Ext
    480391      {{{Empty, 2936}, {Full, 2}, {Mixed, 3}, {Empty, 31875}},
    481        {0xffff001f, 0x7fffffff, 0xffff8000}}
    482 ;
     392       {0xffff001f, 0x7fffffff, 0xffff8000}};
    483393    const UnicodeSet prti_Ext
    484394      {{{Empty, 2138}, {Mixed, 1}, {Empty, 32677}},
    485        {0xff3fffff}}
    486 ;
     395       {0xff3fffff}};
    487396    const UnicodeSet rjng_Ext
    488397      {{{Empty, 1353}, {Mixed, 2}, {Empty, 33461}},
    489        {0xffff0000, 0x800fffff}}
    490 ;
     398       {0xffff0000, 0x800fffff}};
    491399    const UnicodeSet runr_Ext
    492400      {{{Empty, 181}, {Full, 2}, {Mixed, 1}, {Empty, 34632}},
    493        {0x01ffc7ff}}
    494 ;
     401       {0x01ffc7ff}};
    495402    const UnicodeSet samr_Ext
    496403      {{{Empty, 64}, {Full, 1}, {Mixed, 1}, {Empty, 34750}},
    497        {0x7fff3fff}}
    498 ;
     404       {0x7fff3fff}};
    499405    const UnicodeSet sarb_Ext
    500406      {{{Empty, 2131}, {Full, 1}, {Empty, 32684}},
    501        {}}
    502 ;
     407       {}};
    503408    const UnicodeSet saur_Ext
    504409      {{{Empty, 1348}, {Full, 2}, {Mixed, 1}, {Empty, 33465}},
    505        {0x03ffc01f}}
    506 ;
     410       {0x03ffc01f}};
    507411    const UnicodeSet shaw_Ext
    508412      {{{Empty, 2082}, {Mixed, 1}, {Full, 1}, {Empty, 32732}},
    509        {0xffff0000}}
    510 ;
     413       {0xffff0000}};
    511414    const UnicodeSet shrd_Ext
    512415      {{{Empty, 2188}, {Full, 2}, {Mixed, 1}, {Empty, 32625}},
    513        {0x07ff21ff}}
    514 ;
     416       {0x07ff21ff}};
    515417    const UnicodeSet sidd_Ext
    516418      {{{Empty, 2220}, {Full, 1}, {Mixed, 2}, {Empty, 32593}},
    517        {0xff3fffff, 0x000003ff}}
    518 ;
     419       {0xff3fffff, 0x000003ff}};
    519420    const UnicodeSet sind_Ext
    520421      {{{Empty, 75}, {Mixed, 1}, {Empty, 1269}, {Mixed, 1}, {Empty, 851},
    521422        {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 32616}},
    522        {0x00000030, 0x03ff0000, 0xffff0000, 0x03ff07ff}}
    523 ;
     423       {0x00000030, 0x03ff0000, 0xffff0000, 0x03ff07ff}};
    524424    const UnicodeSet sinh_Ext
    525425      {{{Empty, 75}, {Mixed, 1}, {Empty, 32}, {Mixed, 4}, {Empty, 2079},
    526426        {Mixed, 1}, {Empty, 32624}},
    527427       {0x00000030, 0xfc7fffec, 0x2ffbffff, 0xff5f847f, 0x001cffc0,
    528         0x001ffffe}}
    529 ;
     428        0x001ffffe}};
    530429    const UnicodeSet sora_Ext
    531430      {{{Empty, 2182}, {Mixed, 2}, {Empty, 32632}},
    532        {0xffff0000, 0x03ff01ff}}
    533 ;
     431       {0xffff0000, 0x03ff01ff}};
    534432    const UnicodeSet sund_Ext
    535433      {{{Empty, 220}, {Full, 2}, {Empty, 8}, {Mixed, 1}, {Empty, 34585}},
    536        {0x000000ff}}
    537 ;
     434       {0x000000ff}};
    538435    const UnicodeSet sylo_Ext
    539436      {{{Empty, 75}, {Mixed, 1}, {Empty, 3}, {Mixed, 1}, {Empty, 1264},
    540437        {Full, 1}, {Mixed, 1}, {Empty, 33470}},
    541        {0x00000030, 0x0000ffc0, 0x00000fff}}
    542 ;
     438       {0x00000030, 0x0000ffc0, 0x00000fff}};
    543439    const UnicodeSet syrc_Ext
    544440      {{{Empty, 48}, {Mixed, 1}, {Empty, 1}, {Mixed, 2}, {Empty, 4},
    545441        {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 34757}},
    546        {0x88001000, 0x003ff801, 0x00010000, 0xffffbfff, 0x0000e7ff}}
    547 ;
     442       {0x88001000, 0x003ff801, 0x00010000, 0xffffbfff, 0x0000e7ff}};
    548443    const UnicodeSet tagb_Ext
    549444      {{{Empty, 185}, {Mixed, 1}, {Empty, 1}, {Mixed, 1}, {Empty, 34628}},
    550        {0x00600000, 0x000ddfff}}
    551 ;
     445       {0x00600000, 0x000ddfff}};
    552446    const UnicodeSet takr_Ext
    553447      {{{Empty, 75}, {Mixed, 1}, {Empty, 1269}, {Mixed, 1}, {Empty, 882},
    554448        {Full, 1}, {Mixed, 2}, {Empty, 32585}},
    555        {0x00000030, 0x03ff0000, 0x00ffffff, 0x000003ff}}
    556 ;
     449       {0x00000030, 0x03ff0000, 0x00ffffff, 0x000003ff}};
    557450    const UnicodeSet tale_Ext
    558451      {{{Empty, 130}, {Mixed, 1}, {Empty, 71}, {Mixed, 2}, {Empty, 34612}},
    559        {0x000003ff, 0xffff0000, 0x001f3fff}}
    560 ;
     452       {0x000003ff, 0xffff0000, 0x001f3fff}};
    561453    const UnicodeSet talu_Ext
    562454      {{{Empty, 204}, {Full, 1}, {Mixed, 2}, {Empty, 34609}},
    563        {0xffff0fff, 0xc7ff03ff}}
    564 ;
     455       {0xffff0fff, 0xc7ff03ff}};
    565456    const UnicodeSet taml_Ext
    566457      {{{Empty, 75}, {Mixed, 1}, {Empty, 16}, {Mixed, 4}, {Empty, 34720}},
    567        {0x00000030, 0xd63dc7ec, 0xc3ffc718, 0x00813dc7, 0x07ffffc0}}
    568 ;
     458       {0x00000030, 0xd63dc7ec, 0xc3ffc718, 0x00813dc7, 0x07ffffc0}};
    569459    const UnicodeSet tavt_Ext
    570460      {{{Empty, 1364}, {Full, 2}, {Mixed, 1}, {Empty, 33449}},
    571        {0xf8000007}}
    572 ;
     461       {0xf8000007}};
    573462    const UnicodeSet telu_Ext
    574463      {{{Empty, 75}, {Mixed, 1}, {Empty, 20}, {Mixed, 4}, {Empty, 34716}},
    575        {0x00000030, 0xfffddfef, 0xe3fffdff, 0x03603ddf, 0xff00ffcf}}
    576 ;
     464       {0x00000030, 0xfffddfef, 0xe3fffdff, 0x03603ddf, 0xff00ffcf}};
    577465    const UnicodeSet tfng_Ext
    578466      {{{Empty, 361}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 34452}},
    579        {0xffff0000, 0x800180ff}}
    580 ;
     467       {0xffff0000, 0x800180ff}};
    581468    const UnicodeSet tglg_Ext
    582469      {{{Empty, 184}, {Mixed, 2}, {Empty, 34630}},
    583        {0x001fdfff, 0x00600000}}
    584 ;
     470       {0x001fdfff, 0x00600000}};
    585471    const UnicodeSet thaa_Ext
    586472      {{{Empty, 48}, {Mixed, 1}, {Empty, 2}, {Mixed, 1}, {Empty, 8},
    587473        {Full, 1}, {Mixed, 1}, {Empty, 1969}, {Mixed, 1}, {Empty, 32784}},
    588        {0x88001000, 0x000003ff, 0x0003ffff, 0x20040000}}
    589 ;
     474       {0x88001000, 0x000003ff, 0x0003ffff, 0x20040000}};
    590475    const UnicodeSet thai_Ext
    591476      {{{Empty, 112}, {Mixed, 3}, {Empty, 34701}},
    592        {0xfffffffe, 0x07ffffff, 0x0fffffff}}
    593 ;
     477       {0xfffffffe, 0x07ffffff, 0x0fffffff}};
    594478    const UnicodeSet tibt_Ext
    595479      {{{Empty, 120}, {Full, 2}, {Mixed, 5}, {Empty, 34689}},
    596        {0xfffffeff, 0xfffe1fff, 0xfeffffff, 0xdfffffff, 0x061fdfff}}
    597 ;
     480       {0xfffffeff, 0xfffe1fff, 0xfeffffff, 0xdfffffff, 0x061fdfff}};
    598481    const UnicodeSet tirh_Ext
    599482      {{{Empty, 75}, {Mixed, 1}, {Empty, 1269}, {Mixed, 1}, {Empty, 866},
    600483        {Full, 2}, {Mixed, 1}, {Empty, 32601}},
    601        {0x00000030, 0x03ff0000, 0x03ff00ff}}
    602 ;
     484       {0x00000030, 0x03ff0000, 0x03ff00ff}};
    603485    const UnicodeSet ugar_Ext
    604486      {{{Empty, 2076}, {Mixed, 1}, {Empty, 32739}},
    605        {0xbfffffff}}
    606 ;
     487       {0xbfffffff}};
    607488    const UnicodeSet vaii_Ext
    608489      {{{Empty, 1320}, {Full, 9}, {Mixed, 1}, {Empty, 33486}},
    609        {0x00000fff}}
    610 ;
     490       {0x00000fff}};
    611491    const UnicodeSet wara_Ext
    612492      {{{Empty, 2245}, {Full, 2}, {Mixed, 1}, {Empty, 32568}},
    613        {0x8007ffff}}
    614 ;
     493       {0x8007ffff}};
    615494    const UnicodeSet xpeo_Ext
    616495      {{{Empty, 2077}, {Full, 1}, {Mixed, 1}, {Empty, 32737}},
    617        {0x003fff0f}}
    618 ;
     496       {0x003fff0f}};
    619497    const UnicodeSet xsux_Ext
    620498      {{{Empty, 2304}, {Full, 28}, {Mixed, 1}, {Empty, 3}, {Full, 3},
    621499        {Mixed, 1}, {Empty, 32476}},
    622        {0x01ffffff, 0x001f7fff}}
    623 ;
     500       {0x01ffffff, 0x001f7fff}};
    624501    const UnicodeSet yiii_Ext
    625502      {{{Empty, 384}, {Mixed, 1}, {Empty, 6}, {Mixed, 1}, {Empty, 888},
    626503        {Full, 36}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 724},
    627504        {Mixed, 1}, {Empty, 32772}},
    628        {0x0ff3ff06, 0x08000000, 0xffff1fff, 0x0000007f, 0x0000003e}}
    629 ;
     505       {0x0ff3ff06, 0x08000000, 0xffff1fff, 0x0000007f, 0x0000003e}};
    630506    const UnicodeSet zinh_Ext
    631507      {{{Empty, 24}, {Full, 3}, {Mixed, 1}, {Empty, 8}, {Mixed, 1},
     
    641517        0xffff0000, 0x0001ffff, 0x00003c00, 0x06000000, 0x0000ffff,
    642518        0x00003fff, 0x20000000, 0x00000001, 0xf8000380, 0x00000fe7,
    643         0x00003c00, 0x0000ffff}}
    644 ;
     519        0x00003c00, 0x0000ffff}};
    645520    const UnicodeSet zyyy_Ext
    646521      {{{Full, 2}, {Mixed, 2}, {Full, 1}, {Mixed, 3}, {Empty, 13},
     
    701576        0xfbffffff, 0xffffffef, 0xffffffe7, 0x0000ffff, 0x000f1fff,
    702577        0x000fffff, 0x001fffff, 0xffff0fff, 0x03ff00ff, 0xffff00ff,
    703         0x00003fff, 0x00000002}}
    704 ;
     578        0x00003fff, 0x00000002}};
    705579    const UnicodeSet zzzz_Ext
    706580      {{{Empty, 27}, {Mixed, 3}, {Empty, 11}, {Mixed, 4}, {Empty, 1},
     
    845719        0xffe00000, 0x0000f000, 0xfc00ff00, 0x0000ff00, 0xffffc000,
    846720        0xff800000, 0xffe00000, 0xc0000000, 0xc0000000, 0xfffffffd,
    847         0xffff0000}}
    848 ;
     721        0xffff0000}};
    849722    static EnumeratedPropertyObject property_object
    850723      {scx,
  • icGREP/icgrep-devel/icgrep/UCD/Scripts.h

    r4618 r4621  
    1717    const UnicodeSet aghb_Set
    1818      {{{Empty, 2089}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 32724}},
    19        {0xffff0000, 0x0000800f}}
    20 ;
     19       {0xffff0000, 0x0000800f}};
    2120    const UnicodeSet arab_Set
    2221      {{{Empty, 48}, {Mixed, 1}, {Full, 1}, {Mixed, 2}, {Full, 2},
     
    3130        0xffff0000, 0xfffcffff, 0x000000ff, 0x3fff0000, 0xffdf0000,
    3231        0x1fffffff, 0x7fffffff, 0xffffffef, 0x0af7fe96, 0xaa96ea84,
    33         0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x00030000}}
    34 ;
     32        0x5ef7f796, 0x0ffffbff, 0x0ffffbee, 0x00030000}};
    3533    const UnicodeSet armi_Set
    3634      {{{Empty, 2114}, {Mixed, 1}, {Empty, 32701}},
    37        {0xffbfffff}}
    38 ;
     35       {0xffbfffff}};
    3936    const UnicodeSet armn_Set
    4037      {{{Empty, 41}, {Mixed, 4}, {Empty, 1963}, {Mixed, 1}, {Empty, 32807}},
    41        {0xfffe0000, 0xfe7fffff, 0xfffffffe, 0x0000e4ff, 0x00f80000}}
    42 ;
     38       {0xfffe0000, 0xfe7fffff, 0xfffffffe, 0x0000e4ff, 0x00f80000}};
    4339    const UnicodeSet avst_Set
    4440      {{{Empty, 2136}, {Full, 1}, {Mixed, 1}, {Empty, 32678}},
    45        {0xfe3fffff}}
    46 ;
     41       {0xfe3fffff}};
    4742    const UnicodeSet bali_Set
    4843      {{{Empty, 216}, {Full, 2}, {Mixed, 2}, {Empty, 34596}},
    49        {0xffff0fff, 0x1fffffff}}
    50 ;
     44       {0xffff0fff, 0x1fffffff}};
    5145    const UnicodeSet bamu_Set
    5246      {{{Empty, 1333}, {Full, 2}, {Mixed, 1}, {Empty, 1544}, {Full, 17},
    5347        {Mixed, 1}, {Empty, 31918}},
    54        {0x00ffffff, 0x01ffffff}}
    55 ;
     48       {0x00ffffff, 0x01ffffff}};
    5649    const UnicodeSet bass_Set
    5750      {{{Empty, 2902}, {Mixed, 2}, {Empty, 31912}},
    58        {0xffff0000, 0x003f3fff}}
    59 ;
     51       {0xffff0000, 0x003f3fff}};
    6052    const UnicodeSet batk_Set
    6153      {{{Empty, 222}, {Full, 1}, {Mixed, 1}, {Empty, 34592}},
    62        {0xf00fffff}}
    63 ;
     54       {0xf00fffff}};
    6455    const UnicodeSet beng_Set
    6556      {{{Empty, 76}, {Mixed, 4}, {Empty, 34736}},
    66        {0xfff99fef, 0xf3c5fdff, 0xb080799f, 0x0fffffcf}}
    67 ;
     57       {0xfff99fef, 0xf3c5fdff, 0xb080799f, 0x0fffffcf}};
    6858    const UnicodeSet bopo_Set
    6959      {{{Empty, 23}, {Mixed, 1}, {Empty, 368}, {Mixed, 2}, {Empty, 3},
    7060        {Mixed, 1}, {Empty, 34418}},
    71        {0x00000c00, 0xffffffe0, 0x00003fff, 0x07ffffff}}
    72 ;
     61       {0x00000c00, 0xffffffe0, 0x00003fff, 0x07ffffff}};
    7362    const UnicodeSet brah_Set
    7463      {{{Empty, 2176}, {Full, 2}, {Mixed, 2}, {Empty, 32636}},
    75        {0xfffc3fff, 0x8000ffff}}
    76 ;
     64       {0xfffc3fff, 0x8000ffff}};
    7765    const UnicodeSet brai_Set
    7866      {{{Empty, 320}, {Full, 8}, {Empty, 34488}},
    79        {}}
    80 ;
     67       {}};
    8168    const UnicodeSet bugi_Set
    8269      {{{Empty, 208}, {Mixed, 1}, {Empty, 34607}},
    83        {0xcfffffff}}
    84 ;
     70       {0xcfffffff}};
    8571    const UnicodeSet buhd_Set
    8672      {{{Empty, 186}, {Mixed, 1}, {Empty, 34629}},
    87        {0x000fffff}}
    88 ;
     73       {0x000fffff}};
    8974    const UnicodeSet cakm_Set
    9075      {{{Empty, 2184}, {Full, 1}, {Mixed, 2}, {Empty, 32629}},
    91        {0xffdfffff, 0x0000000f}}
    92 ;
     76       {0xffdfffff, 0x0000000f}};
    9377    const UnicodeSet cans_Set
    9478      {{{Empty, 160}, {Full, 20}, {Empty, 17}, {Mixed, 1}, {Full, 1},
    9579        {Mixed, 1}, {Empty, 34616}},
    96        {0xffff0000, 0x003fffff}}
    97 ;
     80       {0xffff0000, 0x003fffff}};
    9881    const UnicodeSet cari_Set
    9982      {{{Empty, 2069}, {Full, 1}, {Mixed, 1}, {Empty, 32745}},
    100        {0x0001ffff}}
    101 ;
     83       {0x0001ffff}};
    10284    const UnicodeSet cham_Set
    10385      {{{Empty, 1360}, {Full, 1}, {Mixed, 2}, {Empty, 33453}},
    104        {0x007fffff, 0xf3ff3fff}}
    105 ;
     86       {0x007fffff, 0xf3ff3fff}};
    10687    const UnicodeSet cher_Set
    10788      {{{Empty, 157}, {Full, 2}, {Mixed, 1}, {Empty, 34656}},
    108        {0x001fffff}}
    109 ;
     89       {0x001fffff}};
    11090    const UnicodeSet copt_Set
    11191      {{{Empty, 31}, {Mixed, 1}, {Empty, 324}, {Full, 3}, {Mixed, 1},
    11292        {Empty, 34456}},
    113        {0x0000fffc, 0xfe0fffff}}
    114 ;
     93       {0x0000fffc, 0xfe0fffff}};
    11594    const UnicodeSet cprt_Set
    11695      {{{Empty, 2112}, {Mixed, 2}, {Empty, 32702}},
    117        {0xfffffd3f, 0x91bfffff}}
    118 ;
     96       {0xfffffd3f, 0x91bfffff}};
    11997    const UnicodeSet cyrl_Set
    12098      {{{Empty, 32}, {Full, 4}, {Mixed, 1}, {Full, 4}, {Mixed, 1},
    12199        {Empty, 191}, {Mixed, 1}, {Empty, 1}, {Mixed, 1}, {Empty, 131},
    122100        {Full, 1}, {Empty, 962}, {Full, 2}, {Mixed, 1}, {Empty, 33483}},
    123        {0xffffff9f, 0x0000ffff, 0x00000800, 0x01000000, 0xbfffffff}}
    124 ;
     101       {0xffffff9f, 0x0000ffff, 0x00000800, 0x01000000, 0xbfffffff}};
    125102    const UnicodeSet deva_Set
    126103      {{{Empty, 72}, {Full, 2}, {Mixed, 2}, {Empty, 1275}, {Mixed, 1},
    127104        {Empty, 33464}},
    128        {0xfff9ffff, 0xffffffcf, 0x0fffffff}}
    129 ;
     105       {0xfff9ffff, 0xffffffcf, 0x0fffffff}};
    130106    const UnicodeSet dsrt_Set
    131107      {{{Empty, 2080}, {Full, 2}, {Mixed, 1}, {Empty, 32733}},
    132        {0x0000ffff}}
    133 ;
     108       {0x0000ffff}};
    134109    const UnicodeSet dupl_Set
    135110      {{{Empty, 3552}, {Full, 3}, {Mixed, 2}, {Empty, 31259}},
    136        {0x1fff07ff, 0xf3ff01ff}}
    137 ;
     111       {0x1fff07ff, 0xf3ff01ff}};
    138112    const UnicodeSet egyp_Set
    139113      {{{Empty, 2432}, {Full, 33}, {Mixed, 1}, {Empty, 32350}},
    140        {0x00007fff}}
    141 ;
     114       {0x00007fff}};
    142115    const UnicodeSet elba_Set
    143116      {{{Empty, 2088}, {Full, 1}, {Mixed, 1}, {Empty, 32726}},
    144        {0x000000ff}}
    145 ;
     117       {0x000000ff}};
    146118    const UnicodeSet ethi_Set
    147119      {{{Empty, 144}, {Full, 2}, {Mixed, 1}, {Full, 1}, {Mixed, 3},
     
    150122       {0x3d7f3dff, 0xffff3dff, 0x7f3dffff, 0xff7fff3d, 0xff3dffff,
    151123        0xe7ffffff, 0x1fffffff, 0x03ffffff, 0x007fffff, 0x7f7f7f7f,
    152         0x7f7f7f7f, 0x007e7e7e, 0x00007f7f}}
    153 ;
     124        0x7f7f7f7f, 0x007e7e7e, 0x00007f7f}};
    154125    const UnicodeSet geor_Set
    155126      {{{Empty, 133}, {Full, 1}, {Mixed, 2}, {Empty, 224}, {Full, 1},
    156127        {Mixed, 1}, {Empty, 34454}},
    157        {0xffff20bf, 0xf7ffffff, 0x000020bf}}
    158 ;
     128       {0xffff20bf, 0xf7ffffff, 0x000020bf}};
    159129    const UnicodeSet glag_Set
    160130      {{{Empty, 352}, {Full, 1}, {Mixed, 2}, {Empty, 34461}},
    161        {0xffff7fff, 0x7fffffff}}
    162 ;
     131       {0xffff7fff, 0x7fffffff}};
    163132    const UnicodeSet goth_Set
    164133      {{{Empty, 2073}, {Mixed, 2}, {Empty, 32741}},
    165        {0xffff0000, 0x000007ff}}
    166 ;
     134       {0xffff0000, 0x000007ff}};
    167135    const UnicodeSet gran_Set
    168136      {{{Empty, 2200}, {Mixed, 4}, {Empty, 32612}},
    169        {0xfff99fee, 0xf3edfdff, 0xe080399f, 0x001f1fcf}}
    170 ;
     137       {0xfff99fee, 0xf3edfdff, 0xe080399f, 0x001f1fcf}};
    171138    const UnicodeSet grek_Set
    172139      {{{Empty, 27}, {Mixed, 3}, {Full, 1}, {Mixed, 1}, {Empty, 201},
     
    178145        0xe0000000, 0x000007c3, 0x80000000, 0x3f3fffff, 0xaaff3f3f,
    179146        0x3fffffff, 0xffdfffff, 0xefcfffdf, 0x7fdcffff, 0x00000040,
    180         0x00000020, 0x00001fff, 0x00000001, 0x0000003f}}
    181 ;
     147        0x00000020, 0x00001fff, 0x00000001, 0x0000003f}};
    182148    const UnicodeSet gujr_Set
    183149      {{{Empty, 84}, {Mixed, 4}, {Empty, 34728}},
    184        {0xfffbbfee, 0xf3edfdff, 0x00013bbf, 0x0003ffcf}}
    185 ;
     150       {0xfffbbfee, 0xf3edfdff, 0x00013bbf, 0x0003ffcf}};
    186151    const UnicodeSet guru_Set
    187152      {{{Empty, 80}, {Mixed, 4}, {Empty, 34732}},
    188        {0xfff987ee, 0xd36dfdff, 0x5e023987, 0x003fffc0}}
    189 ;
     153       {0xfff987ee, 0xd36dfdff, 0x5e023987, 0x003fffc0}};
    190154    const UnicodeSet hang_Set
    191155      {{{Empty, 136}, {Full, 8}, {Empty, 241}, {Mixed, 1}, {Empty, 7},
     
    195159       {0x0000c000, 0xfffe0000, 0x00007fff, 0x7fffffff, 0x7fffffff,
    196160        0x1fffffff, 0xffff000f, 0xfffff87f, 0x0fffffff, 0x7fffffff,
    197         0x1cfcfcfc}}
    198 ;
     161        0x1cfcfcfc}};
    199162    const UnicodeSet hani_Set
    200163      {{{Empty, 372}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Full, 6},
     
    207170       {0xfbffffff, 0x000fffff, 0x003fffff, 0x000000a0, 0x0f0003fe,
    208171        0x003fffff, 0x00001fff, 0xffff3fff, 0x03ffffff, 0x007fffff,
    209         0x001fffff, 0x3fffffff, 0x3fffffff}}
    210 ;
     172        0x001fffff, 0x3fffffff, 0x3fffffff}};
    211173    const UnicodeSet hano_Set
    212174      {{{Empty, 185}, {Mixed, 1}, {Empty, 34630}},
    213        {0x001fffff}}
    214 ;
     175       {0x001fffff}};
    215176    const UnicodeSet hebr_Set
    216177      {{{Empty, 44}, {Mixed, 1}, {Full, 1}, {Mixed, 2}, {Empty, 1960},
    217178        {Mixed, 3}, {Empty, 32805}},
    218179       {0xfffe0000, 0xffff00ff, 0x001f07ff, 0xe0000000, 0x5f7fffff,
    219         0x0000ffdb}}
    220 ;
     180        0x0000ffdb}};
    221181    const UnicodeSet hira_Set
    222182      {{{Empty, 386}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 3067},
    223183        {Mixed, 1}, {Empty, 527}, {Mixed, 1}, {Empty, 30831}},
    224        {0xfffffffe, 0xe07fffff, 0x00000002, 0x00000001}}
    225 ;
     184       {0xfffffffe, 0xe07fffff, 0x00000002, 0x00000001}};
    226185    const UnicodeSet hmng_Set
    227186      {{{Empty, 2904}, {Full, 2}, {Mixed, 3}, {Empty, 31907}},
    228        {0xfbff003f, 0xe0fffffb, 0x0000ffff}}
    229 ;
     187       {0xfbff003f, 0xe0fffffb, 0x0000ffff}};
    230188    const UnicodeSet hrkt_Set
    231189      {{{Empty, 34816}},
    232        {}}
    233 ;
     190       {}};
    234191    const UnicodeSet ital_Set
    235192      {{{Empty, 2072}, {Full, 1}, {Mixed, 1}, {Empty, 32742}},
    236        {0x0000000f}}
    237 ;
     193       {0x0000000f}};
    238194    const UnicodeSet java_Set
    239195      {{{Empty, 1356}, {Full, 2}, {Mixed, 1}, {Empty, 33457}},
    240        {0xc3ff3fff}}
    241 ;
     196       {0xc3ff3fff}};
    242197    const UnicodeSet kali_Set
    243198      {{{Empty, 1352}, {Full, 1}, {Mixed, 1}, {Empty, 33462}},
    244        {0x0000bfff}}
    245 ;
     199       {0x0000bfff}};
    246200    const UnicodeSet kana_Set
    247201      {{{Empty, 389}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 7},
     
    250204        {Empty, 31359}},
    251205       {0xfffffffe, 0xe7ffffff, 0xffff0000, 0xffff0000, 0x7fffffff,
    252         0x00ffffff, 0xfffeffc0, 0x3fffffff, 0x00000001}}
    253 ;
     206        0x00ffffff, 0xfffeffc0, 0x3fffffff, 0x00000001}};
    254207    const UnicodeSet khar_Set
    255208      {{{Empty, 2128}, {Mixed, 3}, {Empty, 32685}},
    256        {0xfeeff06f, 0x870fffff, 0x01ff00ff}}
    257 ;
     209       {0xfeeff06f, 0x870fffff, 0x01ff00ff}};
    258210    const UnicodeSet khmr_Set
    259211      {{{Empty, 188}, {Full, 2}, {Mixed, 2}, {Empty, 15}, {Full, 1},
    260212        {Empty, 34608}},
    261        {0x3fffffff, 0x03ff03ff}}
    262 ;
     213       {0x3fffffff, 0x03ff03ff}};
    263214    const UnicodeSet khoj_Set
    264215      {{{Empty, 2192}, {Mixed, 2}, {Empty, 32622}},
    265        {0xfffbffff, 0x3fffffff}}
    266 ;
     216       {0xfffbffff, 0x3fffffff}};
    267217    const UnicodeSet knda_Set
    268218      {{{Empty, 100}, {Mixed, 4}, {Empty, 34712}},
    269        {0xfffddfee, 0xf3effdff, 0x40603ddf, 0x0006ffcf}}
    270 ;
     219       {0xfffddfee, 0xf3effdff, 0x40603ddf, 0x0006ffcf}};
    271220    const UnicodeSet kthi_Set
    272221      {{{Empty, 2180}, {Full, 2}, {Mixed, 1}, {Empty, 32633}},
    273        {0x00000003}}
    274 ;
     222       {0x00000003}};
    275223    const UnicodeSet lana_Set
    276224      {{{Empty, 209}, {Full, 1}, {Mixed, 4}, {Empty, 34602}},
    277        {0x7fffffff, 0x9fffffff, 0x03ff03ff, 0x00003fff}}
    278 ;
     225       {0x7fffffff, 0x9fffffff, 0x03ff03ff, 0x00003fff}};
    279226    const UnicodeSet laoo_Set
    280227      {{{Empty, 116}, {Mixed, 3}, {Empty, 34697}},
    281        {0xfef02596, 0x3bffecae, 0xf3ff3f5f}}
    282 ;
     228       {0xfef02596, 0x3bffecae, 0xf3ff3f5f}};
    283229    const UnicodeSet latn_Set
    284230      {{{Empty, 2}, {Mixed, 2}, {Empty, 1}, {Mixed, 3}, {Full, 13},
     
    295241        0x000001ff, 0xfffffffc, 0xffff78ff, 0x00033fff, 0xff800000,
    296242        0xffff0000, 0xf7ffffff, 0x00000010, 0x0000007f, 0x07fffffe,
    297         0x07fffffe}}
    298 ;
     243        0x07fffffe}};
    299244    const UnicodeSet lepc_Set
    300245      {{{Empty, 224}, {Full, 1}, {Mixed, 2}, {Empty, 34589}},
    301        {0xf8ffffff, 0x0000e3ff}}
    302 ;
     246       {0xf8ffffff, 0x0000e3ff}};
    303247    const UnicodeSet limb_Set
    304248      {{{Empty, 200}, {Mixed, 3}, {Empty, 34613}},
    305        {0x7fffffff, 0x0fff0fff, 0x0000fff1}}
    306 ;
     249       {0x7fffffff, 0x0fff0fff, 0x0000fff1}};
    307250    const UnicodeSet lina_Set
    308251      {{{Empty, 2096}, {Full, 9}, {Mixed, 3}, {Empty, 32708}},
    309        {0x007fffff, 0x003fffff, 0x000000ff}}
    310 ;
     252       {0x007fffff, 0x003fffff, 0x000000ff}};
    311253    const UnicodeSet linb_Set
    312254      {{{Empty, 2048}, {Mixed, 3}, {Empty, 1}, {Full, 3}, {Mixed, 1},
    313255        {Empty, 32760}},
    314        {0xffffefff, 0xb7ffff7f, 0x3fff3fff, 0x07ffffff}}
    315 ;
     256       {0xffffefff, 0xb7ffff7f, 0x3fff3fff, 0x07ffffff}};
    316257    const UnicodeSet lisu_Set
    317258      {{{Empty, 1318}, {Mixed, 1}, {Full, 1}, {Empty, 33496}},
    318        {0xffff0000}}
    319 ;
     259       {0xffff0000}};
    320260    const UnicodeSet lyci_Set
    321261      {{{Empty, 2068}, {Mixed, 1}, {Empty, 32747}},
    322        {0x1fffffff}}
    323 ;
     262       {0x1fffffff}};
    324263    const UnicodeSet lydi_Set
    325264      {{{Empty, 2121}, {Mixed, 1}, {Empty, 32694}},
    326        {0x83ffffff}}
    327 ;
     265       {0x83ffffff}};
    328266    const UnicodeSet mahj_Set
    329267      {{{Empty, 2186}, {Mixed, 2}, {Empty, 32628}},
    330        {0xffff0000, 0x007fffff}}
    331 ;
     268       {0xffff0000, 0x007fffff}};
    332269    const UnicodeSet mand_Set
    333270      {{{Empty, 66}, {Mixed, 1}, {Empty, 34749}},
    334        {0x4fffffff}}
    335 ;
     271       {0x4fffffff}};
    336272    const UnicodeSet mani_Set
    337273      {{{Empty, 2134}, {Full, 1}, {Mixed, 1}, {Empty, 32680}},
    338        {0x007ff87f}}
    339 ;
     274       {0x007ff87f}};
    340275    const UnicodeSet mend_Set
    341276      {{{Empty, 3904}, {Full, 6}, {Mixed, 1}, {Empty, 30905}},
    342        {0x007fff9f}}
    343 ;
     277       {0x007fff9f}};
    344278    const UnicodeSet merc_Set
    345279      {{{Empty, 2125}, {Mixed, 1}, {Empty, 32690}},
    346        {0xc0ffffff}}
    347 ;
     280       {0xc0ffffff}};
    348281    const UnicodeSet mero_Set
    349282      {{{Empty, 2124}, {Full, 1}, {Empty, 32691}},
    350        {}}
    351 ;
     283       {}};
    352284    const UnicodeSet mlym_Set
    353285      {{{Empty, 104}, {Mixed, 4}, {Empty, 34708}},
    354        {0xfffddfee, 0xe7ffffff, 0x00807ddf, 0xfe3fffcf}}
    355 ;
     286       {0xfffddfee, 0xe7ffffff, 0x00807ddf, 0xfe3fffcf}};
    356287    const UnicodeSet modi_Set
    357288      {{{Empty, 2224}, {Full, 2}, {Mixed, 1}, {Empty, 32589}},
    358        {0x03ff001f}}
    359 ;
     289       {0x03ff001f}};
    360290    const UnicodeSet mong_Set
    361291      {{{Empty, 192}, {Mixed, 1}, {Full, 2}, {Mixed, 1}, {Full, 1},
    362292        {Mixed, 1}, {Empty, 34618}},
    363        {0x03ff7fd3, 0x00ffffff, 0x000007ff}}
    364 ;
     293       {0x03ff7fd3, 0x00ffffff, 0x000007ff}};
    365294    const UnicodeSet mroo_Set
    366295      {{{Empty, 2898}, {Mixed, 2}, {Empty, 31916}},
    367        {0x7fffffff, 0x0000c3ff}}
    368 ;
     296       {0x7fffffff, 0x0000c3ff}};
    369297    const UnicodeSet mtei_Set
    370298      {{{Empty, 1367}, {Mixed, 1}, {Empty, 6}, {Full, 1}, {Mixed, 1},
    371299        {Empty, 33440}},
    372        {0x007fffff, 0x03ff3fff}}
    373 ;
     300       {0x007fffff, 0x03ff3fff}};
    374301    const UnicodeSet mymr_Set
    375302      {{{Empty, 128}, {Full, 5}, {Empty, 1226}, {Mixed, 1}, {Empty, 3},
    376303        {Full, 1}, {Empty, 33452}},
    377        {0x7fffffff}}
    378 ;
     304       {0x7fffffff}};
    379305    const UnicodeSet narb_Set
    380306      {{{Empty, 2132}, {Full, 1}, {Empty, 32683}},
    381        {}}
    382 ;
     307       {}};
    383308    const UnicodeSet nbat_Set
    384309      {{{Empty, 2116}, {Mixed, 2}, {Empty, 32698}},
    385        {0x7fffffff, 0x0000ff80}}
    386 ;
     310       {0x7fffffff, 0x0000ff80}};
    387311    const UnicodeSet nkoo_Set
    388312      {{{Empty, 62}, {Full, 1}, {Mixed, 1}, {Empty, 34752}},
    389        {0x07ffffff}}
    390 ;
     313       {0x07ffffff}};
    391314    const UnicodeSet ogam_Set
    392315      {{{Empty, 180}, {Mixed, 1}, {Empty, 34635}},
    393        {0x1fffffff}}
    394 ;
     316       {0x1fffffff}};
    395317    const UnicodeSet olck_Set
    396318      {{{Empty, 226}, {Mixed, 1}, {Full, 1}, {Empty, 34588}},
    397        {0xffff0000}}
    398 ;
     319       {0xffff0000}};
    399320    const UnicodeSet orkh_Set
    400321      {{{Empty, 2144}, {Full, 2}, {Mixed, 1}, {Empty, 32669}},
    401        {0x000001ff}}
    402 ;
     322       {0x000001ff}};
    403323    const UnicodeSet orya_Set
    404324      {{{Empty, 88}, {Mixed, 4}, {Empty, 34724}},
    405        {0xfff99fee, 0xf3edfdff, 0xb0c0399f, 0x00ffffcf}}
    406 ;
     325       {0xfff99fee, 0xf3edfdff, 0xb0c0399f, 0x00ffffcf}};
    407326    const UnicodeSet osma_Set
    408327      {{{Empty, 2084}, {Mixed, 2}, {Empty, 32730}},
    409        {0x3fffffff, 0x000003ff}}
    410 ;
     328       {0x3fffffff, 0x000003ff}};
    411329    const UnicodeSet palm_Set
    412330      {{{Empty, 2115}, {Full, 1}, {Empty, 32700}},
    413        {}}
    414 ;
     331       {}};
    415332    const UnicodeSet pauc_Set
    416333      {{{Empty, 2262}, {Full, 1}, {Mixed, 1}, {Empty, 32552}},
    417        {0x01ffffff}}
    418 ;
     334       {0x01ffffff}};
    419335    const UnicodeSet perm_Set
    420336      {{{Empty, 2074}, {Mixed, 2}, {Empty, 32740}},
    421        {0xffff0000, 0x07ffffff}}
    422 ;
     337       {0xffff0000, 0x07ffffff}};
    423338    const UnicodeSet phag_Set
    424339      {{{Empty, 1346}, {Full, 1}, {Mixed, 1}, {Empty, 33468}},
    425        {0x00ffffff}}
    426 ;
     340       {0x00ffffff}};
    427341    const UnicodeSet phli_Set
    428342      {{{Empty, 2139}, {Mixed, 1}, {Empty, 32676}},
    429        {0xff07ffff}}
    430 ;
     343       {0xff07ffff}};
    431344    const UnicodeSet phlp_Set
    432345      {{{Empty, 2140}, {Mixed, 2}, {Empty, 32674}},
    433        {0x1e03ffff, 0x0000fe00}}
    434 ;
     346       {0x1e03ffff, 0x0000fe00}};
    435347    const UnicodeSet phnx_Set
    436348      {{{Empty, 2120}, {Mixed, 1}, {Empty, 32695}},
    437        {0x8fffffff}}
    438 ;
     349       {0x8fffffff}};
    439350    const UnicodeSet plrd_Set
    440351      {{{Empty, 2936}, {Full, 2}, {Mixed, 3}, {Empty, 31875}},
    441        {0xffff001f, 0x7fffffff, 0xffff8000}}
    442 ;
     352       {0xffff001f, 0x7fffffff, 0xffff8000}};
    443353    const UnicodeSet prti_Set
    444354      {{{Empty, 2138}, {Mixed, 1}, {Empty, 32677}},
    445        {0xff3fffff}}
    446 ;
     355       {0xff3fffff}};
    447356    const UnicodeSet rjng_Set
    448357      {{{Empty, 1353}, {Mixed, 2}, {Empty, 33461}},
    449        {0xffff0000, 0x800fffff}}
    450 ;
     358       {0xffff0000, 0x800fffff}};
    451359    const UnicodeSet runr_Set
    452360      {{{Empty, 181}, {Full, 2}, {Mixed, 1}, {Empty, 34632}},
    453        {0x01ffc7ff}}
    454 ;
     361       {0x01ffc7ff}};
    455362    const UnicodeSet samr_Set
    456363      {{{Empty, 64}, {Full, 1}, {Mixed, 1}, {Empty, 34750}},
    457        {0x7fff3fff}}
    458 ;
     364       {0x7fff3fff}};
    459365    const UnicodeSet sarb_Set
    460366      {{{Empty, 2131}, {Full, 1}, {Empty, 32684}},
    461        {}}
    462 ;
     367       {}};
    463368    const UnicodeSet saur_Set
    464369      {{{Empty, 1348}, {Full, 2}, {Mixed, 1}, {Empty, 33465}},
    465        {0x03ffc01f}}
    466 ;
     370       {0x03ffc01f}};
    467371    const UnicodeSet shaw_Set
    468372      {{{Empty, 2082}, {Mixed, 1}, {Full, 1}, {Empty, 32732}},
    469        {0xffff0000}}
    470 ;
     373       {0xffff0000}};
    471374    const UnicodeSet shrd_Set
    472375      {{{Empty, 2188}, {Full, 2}, {Mixed, 1}, {Empty, 32625}},
    473        {0x07ff21ff}}
    474 ;
     376       {0x07ff21ff}};
    475377    const UnicodeSet sidd_Set
    476378      {{{Empty, 2220}, {Full, 1}, {Mixed, 2}, {Empty, 32593}},
    477        {0xff3fffff, 0x000003ff}}
    478 ;
     379       {0xff3fffff, 0x000003ff}};
    479380    const UnicodeSet sind_Set
    480381      {{{Empty, 2197}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 32616}},
    481        {0xffff0000, 0x03ff07ff}}
    482 ;
     382       {0xffff0000, 0x03ff07ff}};
    483383    const UnicodeSet sinh_Set
    484384      {{{Empty, 108}, {Mixed, 4}, {Empty, 2079}, {Mixed, 1}, {Empty, 32624}},
    485        {0xfc7fffec, 0x2ffbffff, 0xff5f847f, 0x001cffc0, 0x001ffffe}}
    486 ;
     385       {0xfc7fffec, 0x2ffbffff, 0xff5f847f, 0x001cffc0, 0x001ffffe}};
    487386    const UnicodeSet sora_Set
    488387      {{{Empty, 2182}, {Mixed, 2}, {Empty, 32632}},
    489        {0xffff0000, 0x03ff01ff}}
    490 ;
     388       {0xffff0000, 0x03ff01ff}};
    491389    const UnicodeSet sund_Set
    492390      {{{Empty, 220}, {Full, 2}, {Empty, 8}, {Mixed, 1}, {Empty, 34585}},
    493        {0x000000ff}}
    494 ;
     391       {0x000000ff}};
    495392    const UnicodeSet sylo_Set
    496393      {{{Empty, 1344}, {Full, 1}, {Mixed, 1}, {Empty, 33470}},
    497        {0x00000fff}}
    498 ;
     394       {0x00000fff}};
    499395    const UnicodeSet syrc_Set
    500396      {{{Empty, 56}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 34757}},
    501        {0xffffbfff, 0x0000e7ff}}
    502 ;
     397       {0xffffbfff, 0x0000e7ff}};
    503398    const UnicodeSet tagb_Set
    504399      {{{Empty, 187}, {Mixed, 1}, {Empty, 34628}},
    505        {0x000ddfff}}
    506 ;
     400       {0x000ddfff}};
    507401    const UnicodeSet takr_Set
    508402      {{{Empty, 2228}, {Full, 1}, {Mixed, 2}, {Empty, 32585}},
    509        {0x00ffffff, 0x000003ff}}
    510 ;
     403       {0x00ffffff, 0x000003ff}};
    511404    const UnicodeSet tale_Set
    512405      {{{Empty, 202}, {Mixed, 2}, {Empty, 34612}},
    513        {0xffff0000, 0x001f3fff}}
    514 ;
     406       {0xffff0000, 0x001f3fff}};
    515407    const UnicodeSet talu_Set
    516408      {{{Empty, 204}, {Full, 1}, {Mixed, 2}, {Empty, 34609}},
    517        {0xffff0fff, 0xc7ff03ff}}
    518 ;
     409       {0xffff0fff, 0xc7ff03ff}};
    519410    const UnicodeSet taml_Set
    520411      {{{Empty, 92}, {Mixed, 4}, {Empty, 34720}},
    521        {0xd63dc7ec, 0xc3ffc718, 0x00813dc7, 0x07ffffc0}}
    522 ;
     412       {0xd63dc7ec, 0xc3ffc718, 0x00813dc7, 0x07ffffc0}};
    523413    const UnicodeSet tavt_Set
    524414      {{{Empty, 1364}, {Full, 2}, {Mixed, 1}, {Empty, 33449}},
    525        {0xf8000007}}
    526 ;
     415       {0xf8000007}};
    527416    const UnicodeSet telu_Set
    528417      {{{Empty, 96}, {Mixed, 4}, {Empty, 34716}},
    529        {0xfffddfef, 0xe3fffdff, 0x03603ddf, 0xff00ffcf}}
    530 ;
     418       {0xfffddfef, 0xe3fffdff, 0x03603ddf, 0xff00ffcf}};
    531419    const UnicodeSet tfng_Set
    532420      {{{Empty, 361}, {Mixed, 1}, {Full, 1}, {Mixed, 1}, {Empty, 34452}},
    533        {0xffff0000, 0x800180ff}}
    534 ;
     421       {0xffff0000, 0x800180ff}};
    535422    const UnicodeSet tglg_Set
    536423      {{{Empty, 184}, {Mixed, 1}, {Empty, 34631}},
    537        {0x001fdfff}}
    538 ;
     424       {0x001fdfff}};
    539425    const UnicodeSet thaa_Set
    540426      {{{Empty, 60}, {Full, 1}, {Mixed, 1}, {Empty, 34754}},
    541        {0x0003ffff}}
    542 ;
     427       {0x0003ffff}};
    543428    const UnicodeSet thai_Set
    544429      {{{Empty, 112}, {Mixed, 3}, {Empty, 34701}},
    545        {0xfffffffe, 0x07ffffff, 0x0fffffff}}
    546 ;
     430       {0xfffffffe, 0x07ffffff, 0x0fffffff}};
    547431    const UnicodeSet tibt_Set
    548432      {{{Empty, 120}, {Full, 2}, {Mixed, 5}, {Empty, 34689}},
    549        {0xfffffeff, 0xfffe1fff, 0xfeffffff, 0xdfffffff, 0x061fdfff}}
    550 ;
     433       {0xfffffeff, 0xfffe1fff, 0xfeffffff, 0xdfffffff, 0x061fdfff}};
    551434    const UnicodeSet tirh_Set
    552435      {{{Empty, 2212}, {Full, 2}, {Mixed, 1}, {Empty, 32601}},
    553        {0x03ff00ff}}
    554 ;
     436       {0x03ff00ff}};
    555437    const UnicodeSet ugar_Set
    556438      {{{Empty, 2076}, {Mixed, 1}, {Empty, 32739}},
    557        {0xbfffffff}}
    558 ;
     439       {0xbfffffff}};
    559440    const UnicodeSet vaii_Set
    560441      {{{Empty, 1320}, {Full, 9}, {Mixed, 1}, {Empty, 33486}},
    561        {0x00000fff}}
    562 ;
     442       {0x00000fff}};
    563443    const UnicodeSet wara_Set
    564444      {{{Empty, 2245}, {Full, 2}, {Mixed, 1}, {Empty, 32568}},
    565        {0x8007ffff}}
    566 ;
     445       {0x8007ffff}};
    567446    const UnicodeSet xpeo_Set
    568447      {{{Empty, 2077}, {Full, 1}, {Mixed, 1}, {Empty, 32737}},
    569        {0x003fff0f}}
    570 ;
     448       {0x003fff0f}};
    571449    const UnicodeSet xsux_Set
    572450      {{{Empty, 2304}, {Full, 28}, {Mixed, 1}, {Empty, 3}, {Full, 3},
    573451        {Mixed, 1}, {Empty, 32476}},
    574        {0x01ffffff, 0x001f7fff}}
    575 ;
     452       {0x01ffffff, 0x001f7fff}};
    576453    const UnicodeSet yiii_Set
    577454      {{{Empty, 1280}, {Full, 36}, {Mixed, 1}, {Full, 1}, {Mixed, 1},
    578455        {Empty, 33497}},
    579        {0xffff1fff, 0x0000007f}}
    580 ;
     456       {0xffff1fff, 0x0000007f}};
    581457    const UnicodeSet zinh_Set
    582458      {{{Empty, 24}, {Full, 3}, {Mixed, 1}, {Empty, 8}, {Mixed, 1},
     
    592468        0xffff0000, 0x0001ffff, 0x00003c00, 0x06000000, 0x0000ffff,
    593469        0x00003fff, 0x20000000, 0x00000001, 0xf8000380, 0x00000fe7,
    594         0x00003c00, 0x0000ffff}}
    595 ;
     470        0x00003c00, 0x0000ffff}};
    596471    const UnicodeSet zyyy_Set
    597472      {{{Full, 2}, {Mixed, 2}, {Full, 1}, {Mixed, 3}, {Empty, 13},
     
    652527        0xfbffffff, 0xffffffef, 0xffffffe7, 0x0000ffff, 0x000f1fff,
    653528        0x000fffff, 0x001fffff, 0xffff0fff, 0x03ff00ff, 0xffff00ff,
    654         0x00003fff, 0x00000002}}
    655 ;
     529        0x00003fff, 0x00000002}};
    656530    const UnicodeSet zzzz_Set
    657531      {{{Empty, 27}, {Mixed, 3}, {Empty, 11}, {Mixed, 4}, {Empty, 1},
     
    796670        0xffe00000, 0x0000f000, 0xfc00ff00, 0x0000ff00, 0xffffc000,
    797671        0xff800000, 0xffe00000, 0xc0000000, 0xc0000000, 0xfffffffd,
    798         0xffff0000}}
    799 ;
     672        0xffff0000}};
    800673    static EnumeratedPropertyObject property_object
    801674      {sc,
  • icGREP/icgrep-devel/icgrep/UCD/unicode_set.cpp

    r4620 r4621  
    2525#include <include/simd-lib/builtins.hpp>
    2626#include <iostream>
    27 #include <iomanip>
     27
     28using namespace re;
     29
     30namespace UCD {
     31
     32using bitquad_t = UnicodeSet::bitquad_t;
     33using run_t = UnicodeSet::run_t;
     34using RunVector = UnicodeSet::RunVector;
     35using QuadVector = UnicodeSet::QuadVector;
    2836
    2937const size_t QUAD_BITS = (8 * sizeof(bitquad_t));
    3038const size_t MOD_QUAD_BIT_MASK = QUAD_BITS - 1;
    31 const size_t UNICODE_QUAD_COUNT = 0x110000 / QUAD_BITS;
     39const size_t UNICODE_QUAD_COUNT = (CC::UNICODE_MAX + 1) / QUAD_BITS;
    3240const bitquad_t FULL_QUAD_MASK = -1;
    3341
    34 std::string run_type_name(const run_type_t type) {
    35     if (type == Empty) {
    36         return "Empty";
    37     }
    38     if (type == Full) {
    39         return "Full";
    40     }
    41     if (type == Mixed) {
    42         return "Mixed";
    43     }
    44     return "???";
    45 }
    46 
    47 using RunVector = UnicodeSet::RunVector;
    48 using QuadVector = UnicodeSet::QuadVector;
     42inline run_type_t typeOf(const run_t & run) {
     43    return std::get<0>(run);
     44}
     45
     46inline UnicodeSet::length_t lengthOf(const run_t & run) {
     47    return std::get<1>(run);
     48}
    4949
    5050/** ------------------------------------------------------------------------------------------------------------- *
     
    5555        return;
    5656    }
    57     else if (!runs.empty() && runs.back().mType == type) {
    58         runs.back().mRunLength += length;
     57    else if (!runs.empty() && typeOf(runs.back()) == type) {
     58        std::get<1>(runs.back()) += length;
    5959        return;
    6060    }
     
    8181
    8282/** ------------------------------------------------------------------------------------------------------------- *
     83 * @brief runLengthSumsUpToUnicodeQuadCount
     84 *
     85 * Sanity check for each function that constructs a new UnicodeSet
     86 ** ------------------------------------------------------------------------------------------------------------- */
     87inline bool runLengthSumsUpToUnicodeQuadCount(const RunVector & runs) {
     88    unsigned sum = 0;
     89    for (auto & run : runs) {
     90        sum += lengthOf(run);
     91    }
     92    return sum == UNICODE_QUAD_COUNT;
     93}
     94
     95/** ------------------------------------------------------------------------------------------------------------- *
    8396 * @brief dump
    8497 ** ------------------------------------------------------------------------------------------------------------- */
    8598void UnicodeSet::dump(llvm::raw_ostream & out) const {
    8699    auto qi = mQuads.cbegin();
    87     for (const RunStructure & run : mRuns) {
    88         if (run.mType == Empty) {
    89             out << "Empty(" << run.mRunLength << ")\n";
    90         }
    91         else if (run.mType == Full) {
    92             out << "Full(" << run.mRunLength << ")\n";
     100    for (const run_t & run : mRuns) {
     101        if (typeOf(run) == Empty) {
     102            out << "Empty(" << lengthOf(run) << ")\n";
     103        }
     104        else if (typeOf(run) == Full) {
     105            out << "Full(" << lengthOf(run) << ")\n";
    93106        }
    94107        else {
    95             for (const auto qi_end = qi + run.mRunLength; qi != qi_end; ++qi) {
     108            for (const auto qi_end = qi + lengthOf(run); qi != qi_end; ++qi) {
    96109                assert (qi != mQuads.cend());
    97110                out << "Mixed(" << llvm::format("%08x", *qi) << ")\n";
     
    105118 * @brief complement
    106119 ** ------------------------------------------------------------------------------------------------------------- */
    107 UnicodeSet UnicodeSet::complement() const {
     120UnicodeSet UnicodeSet::operator~() const {
    108121    RunVector runs;
    109122    QuadVector quads;
     
    111124    quads.reserve(mQuads.size());
    112125    auto qi = quads.cbegin();
    113     for (const RunStructure & run : mRuns) {
    114         if (run.mType == Empty) {
    115             append_run(Full, run.mRunLength, runs);
    116         }
    117         else if (run.mType == Full) {
    118             append_run(Empty, run.mRunLength, runs);
     126    for (const run_t & run : mRuns) {
     127        if (typeOf(run) == Empty) {
     128            append_run(Full, lengthOf(run), runs);
     129        }
     130        else if (typeOf(run) == Full) {
     131            append_run(Empty, lengthOf(run), runs);
    119132        }
    120133        else {
    121             for (const auto qi_end = qi + run.mRunLength; qi != qi_end; ++qi) {
     134            for (const auto qi_end = qi + lengthOf(run); qi != qi_end; ++qi) {
    122135                assert (qi != quads.cend());
    123136                append_quad(FULL_QUAD_MASK ^ *qi, quads, runs);
     
    125138        }
    126139    }
     140    assert (runLengthSumsUpToUnicodeQuadCount(runs));
    127141    return UnicodeSet(std::move(runs), std::move(quads));
    128142}
     
    139153        const auto run1 = i1.getRun();
    140154        const auto run2 = i2.getRun();
    141         const auto n = std::min(run1.mRunLength, run2.mRunLength);
    142         if (run1.mType == run2.mType && run1.mType != Mixed) {
    143             append_run(run1.mType, n, runs);
    144             i1 += n;
    145             i2 += n;
    146         }
    147         else if (run1.mType == Full) {
     155        const auto n = std::min(lengthOf(run1), lengthOf(run2));
     156        if (typeOf(run1) == typeOf(run2) && typeOf(run1) != Mixed) {
     157            append_run(typeOf(run1), n, runs);
     158            i1 += n;
     159            i2 += n;
     160        }
     161        else if (typeOf(run1) == Full) {
    148162            for (unsigned i = 0; i != n; ++i, ++i2) {
    149163                append_quad(i2.getQuad(), quads, runs);
     
    151165            i1 += n;
    152166        }
    153         else if (run2.mType == Full) {
     167        else if (typeOf(run2) == Full) {
    154168            for (unsigned i = 0; i != n; ++i, ++i1) {
    155169                append_quad(i1.getQuad(), quads, runs);
     
    163177        }
    164178    }
     179    assert (runLengthSumsUpToUnicodeQuadCount(runs));
    165180    return UnicodeSet(std::move(runs), std::move(quads));
    166181}
     
    174189    const auto e1 = quad_end();
    175190    const auto e2 = other.quad_end();
    176     for (auto i1 = quad_begin(), i2 = other.quad_begin(); i1 != e1 && i2 != e2; ) {
     191    auto i1 = quad_begin(), i2 = other.quad_begin();
     192    for (; i1 != e1 && i2 != e2; ) {
    177193        const auto run1 = i1.getRun();
    178194        const auto run2 = i2.getRun();
    179 
    180         const auto n = std::min(run1.mRunLength, run2.mRunLength);
    181         if ((run1.mType == Empty) && (run2.mType == Empty)) {
     195        const auto n = std::min(lengthOf(run1), lengthOf(run2));
     196        if ((typeOf(run1) == Empty) && (typeOf(run2) == Empty)) {
    182197            append_run(Empty, n, runs);
    183198            i1 += n;
    184199            i2 += n;
    185200        }
    186         else if ((run1.mType == Full) || (run2.mType == Full)) {
     201        else if ((typeOf(run1) == Full) || (typeOf(run2) == Full)) {
    187202            append_run(Full, n, runs);
    188203            i1 += n;
    189204            i2 += n;
    190205        }
    191         else if (run1.mType == Empty) {
     206        else if (typeOf(run1) == Empty) {
    192207            for (unsigned i = 0; i != n; ++i, ++i2) {
    193208                append_quad(i2.getQuad(), quads, runs);
     
    195210            i1 += n;
    196211        }
    197         else if (run2.mType == Empty) {
     212        else if (typeOf(run2) == Empty) {
    198213            for (unsigned i = 0; i != n; ++i, ++i1) {
    199214                append_quad(i1.getQuad(), quads, runs);
     
    207222        }
    208223    }
     224    assert (runLengthSumsUpToUnicodeQuadCount(runs));
    209225    return UnicodeSet(std::move(runs), std::move(quads));
    210226}
     
    221237        const auto run1 = i1.getRun();
    222238        const auto run2 = i2.getRun();
    223         unsigned n = std::min(run1.mRunLength, run2.mRunLength);
    224         if ((run1.mType == Empty) || (run2.mType == Full) || (run1.mType == Full && run2.mType == Empty)) {
    225             append_run(run1.mType, n, runs);
    226             i1 += n;
    227             i2 += n;
    228         }
    229         else if (run1.mType == Full) {
     239        unsigned n = std::min(lengthOf(run1), lengthOf(run2));
     240        if ((typeOf(run1) == Empty) || (typeOf(run2) == Full) || (typeOf(run1) == Full && typeOf(run2) == Empty)) {
     241            append_run(typeOf(run1), n, runs);
     242            i1 += n;
     243            i2 += n;
     244        }
     245        else if (typeOf(run1) == Full) {
    230246            for (unsigned i = 0; i != n; ++i, ++i2) {
    231247                append_quad(FULL_QUAD_MASK ^ i2.getQuad(), quads, runs);
     
    233249            i1 += n;
    234250        }
    235         else if (run2.mType == Empty) {
     251        else if (typeOf(run2) == Empty) {
    236252            for (unsigned i = 0; i != n; ++i, ++i1) {
    237253                append_quad(i1.getQuad(), quads, runs);
     
    245261        }
    246262    }
     263    assert (runLengthSumsUpToUnicodeQuadCount(runs));
    247264    return UnicodeSet(std::move(runs), std::move(quads));
    248265}
     
    259276        const auto run1 = i1.getRun();
    260277        const auto run2 = i2.getRun();
    261         unsigned n = std::min(run1.mRunLength, run2.mRunLength);
    262         if (run1.mType != Mixed && run2.mType != Mixed) {
    263             append_run(run1.mType == run2.mType ? Empty : Full, n, runs);
    264             i1 += n;
    265             i2 += n;
    266         }
    267         else if (run1.mType == Empty) {
     278        unsigned n = std::min(lengthOf(run1), lengthOf(run2));
     279        if (typeOf(run1) != Mixed && typeOf(run2) != Mixed) {
     280            append_run(typeOf(run1) == typeOf(run2) ? Empty : Full, n, runs);
     281            i1 += n;
     282            i2 += n;
     283        }
     284        else if (typeOf(run1) == Empty) {
    268285            for (unsigned i = 0; i < n; ++i, ++i2) {
    269286                append_quad(i2.getQuad(), quads, runs);
     
    271288            i1 += n;
    272289        }
    273         else if (run2.mType == Empty) {
     290        else if (typeOf(run2) == Empty) {
    274291            for (unsigned i = 0; i < n; ++i, ++i1) {
    275292                append_quad(i1.getQuad(), quads, runs);
     
    277294            i2 += n;
    278295        }
    279         else if (run1.mType == Full) {
     296        else if (typeOf(run1) == Full) {
    280297            for (unsigned i = 0; i < n; ++i, ++i2) {
    281298                append_quad(FULL_QUAD_MASK ^ i2.getQuad(), quads, runs);
     
    283300            i1 += n;
    284301        }
    285         else if (run2.mType == Empty) {
     302        else if (typeOf(run2) == Empty) {
    286303            for (unsigned i = 0; i < n; ++i, ++i1) {
    287304                append_quad(FULL_QUAD_MASK ^ i1.getQuad(), quads, runs);
     
    295312        }
    296313    }
     314    assert (runLengthSumsUpToUnicodeQuadCount(runs));
    297315    return UnicodeSet(std::move(runs), std::move(quads));
    298316}
     317
     318/** ------------------------------------------------------------------------------------------------------------- *
     319 * @brief equality
     320 ** ------------------------------------------------------------------------------------------------------------- */
     321UnicodeSet UnicodeSet::operator==(const UnicodeSet & other) const {
     322    if (mRuns.size() != other.mRuns.size() || mQuads.size() != other.mQuads.size()) {
     323        return false;
     324    }
     325    for (auto i = mQuads.begin(), j = other.mQuads.begin(); i != mQuads.end(); ++i, ++j) {
     326        if (*i != *j) return false;
     327    }
     328    for (auto i = mRuns.begin(), j = other.mRuns.begin(); i != mRuns.end(); ++i, ++j) {
     329        if (*i != *j) return false;
     330    }
     331    return true;
     332}
     333
    299334
    300335/** ------------------------------------------------------------------------------------------------------------- *
     
    305340 ** ------------------------------------------------------------------------------------------------------------- */
    306341bool UnicodeSet::contains(const codepoint_t codepoint) const {
    307 
    308342    auto n = codepoint / QUAD_BITS;
    309     unsigned runIndex = 0;
    310     unsigned quadIndex = 0;
    311 
    312     for (;;) {
    313         const RunStructure & t = mRuns[runIndex];
    314         if (t.mRunLength >= n) {
    315             if (t.mType == Mixed) {
    316                 return (mQuads[quadIndex + n - 1] & (static_cast<bitquad_t>(1) << (codepoint & MOD_QUAD_BIT_MASK))) != 0;
    317             }
    318             return (t.mType == Full);
    319         }
    320         if (t.mType == Mixed) {
    321             quadIndex += n;
    322         }
    323         ++runIndex;
    324         n -= t.mRunLength;
    325     }
    326 
     343    QuadVector::const_iterator qi = mQuads.cbegin();
     344    for (const auto & r : mRuns) {
     345        if (lengthOf(r) >= n) {
     346            if (typeOf(r) == Mixed) {
     347                qi += n - 1;
     348                return (*qi & (static_cast<bitquad_t>(1) << (codepoint & MOD_QUAD_BIT_MASK))) != 0;
     349            }
     350            return (typeOf(r) == Full);
     351        }
     352        if (typeOf(r) == Mixed) {
     353            qi += n;
     354        }       
     355        n -= lengthOf(r);
     356    }
     357    return false;
    327358}
    328359
     
    332363void UnicodeSet::quad_iterator::advance(unsigned n) {
    333364    while (n > 0) {
    334         const unsigned remain = mRunIterator->mRunLength - mOffset;
     365        const unsigned remain = lengthOf(*mRunIterator) - mOffset;
    335366        if (remain > n) {
    336             if (mRunIterator->mType == Mixed) {
     367            if (typeOf(*mRunIterator) == Mixed) {
    337368                mQuadIterator += n;
    338369            }
     
    340371            break;
    341372        }
    342         if (mRunIterator->mType == Mixed) {
     373        if (typeOf(*mRunIterator) == Mixed) {
    343374            mQuadIterator += remain;
    344375        }
     
    354385void UnicodeSet::iterator::advance(const unsigned n) {
    355386
    356     assert (n == 1);
     387    assert (n == 1);   
    357388
    358389    // Find the start of our interval
    359     for ( ; mBaseCodePoint <= re::CC::UNICODE_MAX; ++mRunIterator) {
     390    for ( ; mBaseCodePoint < CC::UNICODE_MAX; ++mRunIterator) {
    360391        // Find the first non-empty block
    361         const RunStructure & run = *mRunIterator;
    362         if (run.mType != Mixed) {
    363             mMinCodePoint = mBaseCodePoint;
    364             mBaseCodePoint += run.mRunLength * QUAD_BITS;
     392        if (typeOf(*mRunIterator) != Mixed) {
     393            mBaseCodePoint += lengthOf(*mRunIterator) * QUAD_BITS;
    365394            mQuadOffset = 0;
    366             mQuadPosition = 0;
    367             if (run.mType == Full) {
     395            mMixedRunIndex = 0;
     396            // If we found a full run, this must be the start of our interval.
     397            // Otherwise it must be empty.
     398            if (typeOf(*mRunIterator) == Full) {
     399                mMinCodePoint = mBaseCodePoint;
    368400                break;
    369401            }
    370402        }
    371         else { // if (left.mType == Mixed)
    372             while (mQuadPosition != run.mRunLength) {
    373                 const bitquad_t q = *mQuadIterator;
    374                 const bitquad_t M = (FULL_QUAD_MASK << mQuadOffset);
    375                 const bitquad_t m = q & M;
    376                 // Nothing left in this quad to add; skip to the next one.
    377                 if (m == 0) {
    378                     mBaseCodePoint += QUAD_BITS;
    379                     ++mQuadPosition;
    380                     ++mQuadIterator;
    381                     continue;
     403        else { // if (leftypeOf(t) == Mixed)
     404            bool found = false;
     405            while (mMixedRunIndex != lengthOf(*mRunIterator)) {
     406                const bitquad_t m = (*mQuadIterator) & (FULL_QUAD_MASK << mQuadOffset);
     407                // If we found a marker in m, it marks the beginning of our current interval.
     408                // Find it and break out of the loop.
     409                if (m) {
     410                    mQuadOffset = scan_forward_zeroes(m);
     411                    mMinCodePoint = mBaseCodePoint + mQuadOffset;
     412                    found = true;
     413                    break;
    382414                }
    383                 mQuadOffset = scan_forward_zeroes(m);
    384                 mMinCodePoint = mBaseCodePoint + mQuadOffset;
     415                mBaseCodePoint += QUAD_BITS;
     416                ++mMixedRunIndex;
     417                ++mQuadIterator;
     418                mQuadOffset = 0;
     419            }
     420            // If we found nothing in the quad, restart the loop.
     421            if (found) {
     422                // std::cerr << "Min: " << mMinCodePoint << " = " << mBaseCodePoint << " + " << mQuadOffset << std::endl;
    385423                break;
    386424            }
     425        }
     426    }
     427
     428    // Find the end of our interval
     429    for ( ; mBaseCodePoint < CC::UNICODE_MAX; ++mRunIterator) {
     430        // If this run is Empty, the max code point is the last computed base code point - 1.
     431        if (typeOf(*mRunIterator) == Empty) {
     432            mMaxCodePoint = mBaseCodePoint - 1;
     433            break;
     434        }
     435        // If this run is Full, increment the base code point; we need to check whether
     436        // the next run is Empty or Mixed to know if we've found the max code point of
     437        // the current interval.
     438        else if (typeOf(*mRunIterator) == Full) {
     439            mBaseCodePoint += lengthOf(*mRunIterator) * QUAD_BITS;
     440            mQuadOffset = 0;
     441            mMixedRunIndex = 0;
     442            continue;
     443        }
     444        else { // if (leftypeOf(t) == Mixed)
     445            bool found = false;
     446            while (mMixedRunIndex != lengthOf(*mRunIterator)) {
     447                const bitquad_t m = (~(*mQuadIterator)) & (FULL_QUAD_MASK << mQuadOffset);
     448                // If we found a marker in m, it marks the end of our current interval.
     449                // Find it and break out of the loop.
     450                if (m) {
     451                    mQuadOffset = scan_forward_zeroes(m);
     452                    mMaxCodePoint = mBaseCodePoint + mQuadOffset - 1;
     453                    found = true;
     454                    break;
     455                }
     456                mBaseCodePoint += QUAD_BITS;
     457                ++mMixedRunIndex;
     458                ++mQuadIterator;
     459                mQuadOffset = 0;
     460            }
    387461            // If we found nothing in the quad, restart the loop.
    388             if (mQuadPosition != run.mRunLength) {
    389                 break;
    390             }
    391         }
    392     }
    393 
    394     // Find the end of our interval
    395     for ( ; mBaseCodePoint <= re::CC::UNICODE_MAX; ++mRunIterator) {
    396         const RunStructure & run = *mRunIterator;
    397         // If the next run is empty, we already know the max code point.
    398         if (run.mType == Empty) {
    399             mMaxCodePoint = mBaseCodePoint;
    400             break;
    401         }
    402         // If the next run is Full, increment the base code point.
    403         else if (run.mType == Full) {
    404             mBaseCodePoint += run.mRunLength * QUAD_BITS;
    405             mMaxCodePoint = mBaseCodePoint;
    406             mQuadOffset = 0;
    407             mQuadPosition = 0;
    408             continue;
    409         }
    410         else { // if (left.mType == Mixed)
    411             while (mQuadPosition != run.mRunLength) {
    412 
    413                 const bitquad_t q = *mQuadIterator;
    414                 const bitquad_t M = (FULL_QUAD_MASK << mQuadOffset);
    415                 const bitquad_t m = ~q & M;
    416 
    417                 // Nothing left in this quad to add; skip to the next one.
    418                 if (m == 0) {
    419                     mBaseCodePoint += QUAD_BITS;
    420                     mMaxCodePoint = mBaseCodePoint;
    421                     ++mQuadPosition;
    422                     ++mQuadIterator;
    423                     continue;
    424                 }
    425 
    426                 mQuadOffset = scan_forward_zeroes(m);
    427                 mMaxCodePoint = mBaseCodePoint + mQuadOffset - 1;
    428                 break;
    429             }
    430             // If we found nothing in the quad, restart the loop.
    431             if (mQuadPosition != run.mRunLength) {
     462            if (found) {
     463                // std::cerr << "Max: " << mMinCodePoint << " = " << mBaseCodePoint << " + " << mQuadOffset << std::endl;
    432464                break;
    433465            }
     
    448480UnicodeSet::UnicodeSet(const codepoint_t codepoint) {
    449481    const codepoint_t quad_no = codepoint / QUAD_BITS;
    450     append_run(Empty, quad_no, mRuns);
     482    if (quad_no > 0) {
     483        append_run(Empty, quad_no, mRuns);
     484    }
    451485    append_quad(static_cast<bitquad_t>(1) << (codepoint & MOD_QUAD_BIT_MASK), mQuads, mRuns);
    452     append_run(Empty, UNICODE_QUAD_COUNT - (quad_no + 1), mRuns);
     486    if (quad_no < UNICODE_QUAD_COUNT - 1) {
     487        append_run(Empty, UNICODE_QUAD_COUNT - (quad_no + 1), mRuns);
     488    }
     489    assert (runLengthSumsUpToUnicodeQuadCount(mRuns));
    453490}
    454491
     
    472509        append_quad(hi_quad, mQuads, mRuns);
    473510    }
    474     append_run(Empty, UNICODE_QUAD_COUNT - (hi_quad_no + 1), mRuns);
    475 }
    476 
     511    if (hi_quad_no < UNICODE_QUAD_COUNT - 1) {
     512        append_run(Empty, UNICODE_QUAD_COUNT - (hi_quad_no + 1), mRuns);
     513    }
     514    assert (runLengthSumsUpToUnicodeQuadCount(mRuns));
     515}
     516
     517}
  • icGREP/icgrep-devel/icgrep/UCD/unicode_set.h

    r4620 r4621  
    3434}
    3535
    36 typedef uint32_t bitquad_t;
     36namespace UCD {
    3737
    38 // The representation for runs
    3938enum run_type_t : uint16_t {Empty, Mixed, Full};
    40 
    41 struct RunStructure {
    42   RunStructure(run_type_t r, uint16_t lgth) : mType(r), mRunLength(lgth) {}
    43   run_type_t mType;
    44   uint16_t mRunLength;
    45 };
    4639
    4740class UnicodeSet {
    4841public:
    4942
     43    using bitquad_t = uint32_t;
     44    using length_t = uint16_t;
     45    using run_t = std::pair<run_type_t, length_t>;
     46
    5047    using codepoint_t = re::codepoint_t;
    5148    using interval_t = re::interval_t;
    52     using RunVector = std::vector<RunStructure>;
     49    using RunVector = std::vector<run_t>;
    5350    using QuadVector = std::vector<bitquad_t>;
    5451
     
    5956        iterator(RunVector::const_iterator runIterator, QuadVector::const_iterator quadIterator)
    6057        : mRunIterator(runIterator), mQuadIterator(quadIterator)
    61         , mQuadOffset(0), mQuadPosition(0), mBaseCodePoint(0), mMinCodePoint(0), mMaxCodePoint(0)
     58        , mMixedRunIndex(0), mQuadOffset(0), mBaseCodePoint(0), mMinCodePoint(0), mMaxCodePoint(0)
    6259        {
    6360
     
    7572
    7673        inline bool equal(iterator const & other) const {
    77             return (mRunIterator == other.mRunIterator) && (mQuadIterator == other.mQuadIterator);
     74            return (mRunIterator == other.mRunIterator) && (mQuadIterator == other.mQuadIterator) &&
     75                   (mMixedRunIndex == other.mMixedRunIndex) && (mQuadOffset == other.mQuadOffset);
    7876        }
    7977    private:
    80         RunVector::const_iterator           mRunIterator;
    81         const RunVector::const_iterator     mRunEnd;
    82         QuadVector::const_iterator          mQuadIterator;
    83 
    84 
    85         bitquad_t                   mQuadOffset;
    86         unsigned                    mQuadPosition;
    87         unsigned                    mBaseCodePoint;
    88         re::codepoint_t             mMinCodePoint;
    89         re::codepoint_t             mMaxCodePoint;
     78        RunVector::const_iterator   mRunIterator;
     79        QuadVector::const_iterator  mQuadIterator;
     80        unsigned                    mMixedRunIndex;
     81        bitquad_t                   mQuadOffset;       
     82        codepoint_t                 mBaseCodePoint;
     83        codepoint_t                 mMinCodePoint;
     84        codepoint_t                 mMaxCodePoint;
    9085    };
    9186
     
    9994    }
    10095
    101     class quad_iterator : public boost::iterator_facade<quad_iterator, std::pair<RunStructure, bitquad_t>, boost::random_access_traversal_tag> {
     96    class quad_iterator : public boost::iterator_facade<quad_iterator, std::pair<run_t, bitquad_t>, boost::random_access_traversal_tag> {
    10297        friend class UnicodeSet;
    10398        friend class boost::iterator_core_access;
     
    108103        void advance(unsigned n);
    109104
    110         inline const std::pair<RunStructure, bitquad_t> dereference() const {
     105        inline const std::pair<run_t, bitquad_t> dereference() const {
    111106            return std::make_pair(getRun(), getQuad());
    112107        }
     
    116111        }
    117112
    118         inline RunStructure getRun() const {
     113        inline run_t getRun() const {
    119114            const auto & t = *mRunIterator;
    120             return RunStructure(t.mType, t.mRunLength - mOffset);
     115            return std::make_pair(std::get<0>(t), std::get<1>(t) - mOffset);
    121116        }
    122117
     
    147142    void dump(llvm::raw_ostream & out) const;
    148143
    149     UnicodeSet complement() const;
    150     UnicodeSet operator & (const UnicodeSet & other) const;
    151     UnicodeSet operator + (const UnicodeSet & other) const;
    152     UnicodeSet operator - (const UnicodeSet & other) const;
    153     UnicodeSet operator ^ (const UnicodeSet & other) const;
     144    UnicodeSet operator~() const;
     145    UnicodeSet operator&(const UnicodeSet & other) const;
     146    UnicodeSet operator+(const UnicodeSet & other) const;
     147    UnicodeSet operator-(const UnicodeSet & other) const;
     148    UnicodeSet operator^(const UnicodeSet & other) const;
     149    UnicodeSet operator==(const UnicodeSet & other) const;
    154150
    155151    UnicodeSet();
    156152    UnicodeSet(const codepoint_t codepoint);
    157153    UnicodeSet(const codepoint_t lo_codepoint, const codepoint_t hi_codepoint);
    158     UnicodeSet(std::initializer_list<RunStructure> r, std::initializer_list<bitquad_t> q) : mRuns(r), mQuads(q) {}
    159     UnicodeSet(std::vector<RunStructure> && r, std::vector<bitquad_t> && q) : mRuns(r), mQuads(q) {}
     154    UnicodeSet(std::initializer_list<run_t> r, std::initializer_list<bitquad_t> q) : mRuns(r), mQuads(q) {}
     155    UnicodeSet(std::vector<run_t> && r, std::vector<bitquad_t> && q) : mRuns(r), mQuads(q) {}
     156
     157    inline void swap(UnicodeSet & other);
     158    inline void swap(UnicodeSet && other);
    160159
    161160private:
    162161
    163     std::vector<RunStructure>   mRuns;
     162    std::vector<run_t>   mRuns;
    164163    std::vector<bitquad_t>      mQuads;
    165164};
    166165
     166inline void UnicodeSet::swap(UnicodeSet & other) {
     167    mRuns.swap(other.mRuns);
     168    mQuads.swap(other.mQuads);
     169}
     170
     171inline void UnicodeSet::swap(UnicodeSet && other) {
     172    mRuns.swap(other.mRuns);
     173    mQuads.swap(other.mQuads);
     174}
     175
    167176inline UnicodeSet uset_complement(const UnicodeSet & s) {
    168     return s.complement();
     177    return ~s;
    169178}
    170179
     
    185194}
    186195
     196}
     197
    187198#endif
    188199
  • icGREP/icgrep-devel/icgrep/re/re_cc.cpp

    r4617 r4621  
    6060        }
    6161        else {
    62             // ranges overlap; expand the range to include the prior one and
    63             // remove the old one from the list
     62            // ranges overlap; expand the range to include the overlapp
    6463            lo_codepoint(i) = std::min(lo_codepoint(i), lo);
    6564            hi_codepoint(i) = std::max(hi_codepoint(i), hi);
     65            // Test whether the new hi code point of this range touches the subsequent
     66            // interval. If so extend it over that one and remove it from the list.
     67            for (auto j = i + 1; j != mSparseCharSet.end(); ) {
     68                if (LLVM_LIKELY(hi_codepoint(i) + 1 < lo_codepoint(j))) {
     69                    break;
     70                }
     71                hi_codepoint(i) = std::max(hi_codepoint(i), hi_codepoint(j));
     72                j = mSparseCharSet.erase(j);
     73            }
    6674            return;
    6775        }
  • icGREP/icgrep-devel/icgrep/re/re_cc.h

    r4617 r4621  
    202202    mSparseCharSet.resize(std::distance(begin, end));
    203203    for (auto i = begin; i != end; ++i) {
    204         assert (i == begin || lo_codepoint(i) > max_codepoint());
     204        assert (i == begin || lo_codepoint(*i) > max_codepoint());
    205205        mSparseCharSet[std::distance(begin, i)] = *i;
    206206    }
Note: See TracChangeset for help on using the changeset viewer.