Changeset 283 for docs/Balisage09


Ignore:
Timestamp:
Aug 27, 2009, 3:05:15 PM (10 years ago)
Author:
ksherdy
Message:

Update Deletion Streams, Error Streams, Lexical Items Streams, other minor changes. Requires table generation.

File:
1 edited

Legend:

Unmodified
Added
Removed
  • docs/Balisage09/Bal2009came0601.xml

    r281 r283  
    2727         </personname>
    2828         <personblurb>
    29                  <para>Dr. Rob Cameron is Professor and Director of Computing Science
    30                          at Simon Fraser University.   With a broad spectrum of research
    31                          interests related to programming languages, software engineering and
    32                          sociotechnical design of public computing infrastructure, he has
    33                          recently been focusing on high performance text processing using
    34                          parallel bit stream technology and its applications to XML.
    35                          He is also a patentleft evangelist, advocating university-based
    36                          technology transfer models dedicated to free use in open source.
    37                  </para>
     29            <para>Dr. Rob Cameron is Professor and Director of Computing Science at Simon Fraser
     30               University. With a broad spectrum of research interests related to programming
     31               languages, software engineering and sociotechnical design of public computing
     32               infrastructure, he has recently been focusing on high performance text processing
     33               using parallel bit stream technology and its applications to XML. He is also a
     34               patentleft evangelist, advocating university-based technology transfer models
     35               dedicated to free use in open source. </para>
    3836
    3937         </personblurb>
     
    5048         </personname>
    5149         <personblurb>
    52                  <para>
    53                          Ken Herdy completed an Advanced Diploma of Technology in Geographical
    54                          Information Systems at the British Columbia Institute of Technology in 2003
    55                          and earned a Bachelor of Science in Computing Science with a Certificate in
    56                          Spatial Information Systems at Simon Fraser University in 2005.
    57                  </para>
    58                  <para>
    59                          Ken is currently pursuing graduate studies in Computing Science at Simon
    60                          Fraser University with industrial scholarship support from the Natural
    61                          Sciences and Engineering Research Council of Canada, the Mathematics of
    62                          Information Technology and Complex Systems NCE, and the BC Innovation
    63                          Council. His research focus is an analysis of the principal techniques that
    64                          may be used to improve XML processing performance in the context of the
    65                          Geography Markup Language (GML).
    66                  </para>
     50            <para> Ken Herdy completed an Advanced Diploma of Technology in Geographical Information
     51               Systems at the British Columbia Institute of Technology in 2003 and earned a Bachelor
     52               of Science in Computing Science with a Certificate in Spatial Information Systems at
     53               Simon Fraser University in 2005. </para>
     54            <para> Ken is currently pursuing graduate studies in Computing Science at Simon Fraser
     55               University with industrial scholarship support from the Natural Sciences and
     56               Engineering Research Council of Canada, the Mathematics of Information Technology and
     57               Complex Systems NCE, and the BC Innovation Council. His research focus is an analysis
     58               of the principal techniques that may be used to improve XML processing performance in
     59               the context of the Geography Markup Language (GML). </para>
    6760
    6861         </personblurb>
     
    7972         </personname>
    8073         <personblurb>
    81                  <para>Ehsan Amiri is a PhD student of Computer Science at Simon Fraser University. Before that he studied at Sharif University of Technology, Tehran, Iran. While his graduate research has been focused on theoretical problems like fingerprinting, Ehsan has worked on some software projects like development of a multi-node firewall as well. More recently he has been developing compiler technology for automatic generation of bit stream processing code. </para>
     74            <para>Ehsan Amiri is a PhD student of Computer Science at Simon Fraser University.
     75               Before that he studied at Sharif University of Technology, Tehran, Iran. While his
     76               graduate research has been focused on theoretical problems like fingerprinting, Ehsan
     77               has worked on some software projects like development of a multi-node firewall as
     78               well. More recently he has been developing compiler technology for automatic
     79               generation of bit stream processing code. </para>
    8280
    8381         </personblurb>
     
    9088      <legalnotice>
    9189         <para>Copyright &#x000A9; 2009 Robert D. Cameron, Kenneth S. Herdy and Ehsan Amiri.
    92                  This work is licensed under a Creative Commons Attribution-Noncommercial-No Derivative Works 2.5 Canada License.</para>
     90            This work is licensed under a Creative Commons Attribution-Noncommercial-No Derivative
     91            Works 2.5 Canada License.</para>
    9392      </legalnotice>
    9493      <keywordset role="author">
     
    212211                  <para>XML Character Stream Transposition.</para>
    213212               </caption>
    214                <colgroup><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /></colgroup>
    215                <tbody>  <tr valign="top"><td>XML</td><td><code>&lt;</code></td><td><code>t</code></td><td><code>a</code></td><td><code>g</code></td><td><code>/</code></td><td><code>&gt;</code></td></tr>
    216                   <tr valign="top"><td>ASCII</td><td><code>00111100</code></td><td><code>01110100</code></td><td><code>01100001</code></td><td><code>01100111</code></td><td><code>00101111</code></td><td><code>00111110</code></td></tr>
    217                   <tr valign="top"><td>Bit0</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td></tr>
    218                   <tr valign="top"><td>Bit1</td><td><code>0</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td></tr>
    219                   <tr valign="top"><td>Bit2</td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td></tr>
    220                   <tr valign="top"><td>Bit3</td><td><code>1</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td></tr>
    221                   <tr valign="top"><td>Bit4</td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>1</code></td></tr>
    222                   <tr valign="top"><td>Bit5</td><td><code>1</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td></tr>
    223                   <tr valign="top"><td>Bit6</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td></tr>
    224                   <tr valign="top"><td>Bit7</td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>0</code></td></tr>
     213               <colgroup>
     214                  <col align="left" valign="top"/>
     215                  <col align="left" valign="top"/>
     216                  <col align="left" valign="top"/>
     217                  <col align="left" valign="top"/>
     218                  <col align="left" valign="top"/>
     219                  <col align="left" valign="top"/>
     220               </colgroup>
     221               <tbody>
     222                  <tr valign="top">
     223                     <td>XML</td>
     224                     <td>
     225                        <code>&lt;</code>
     226                     </td>
     227                     <td>
     228                        <code>t</code>
     229                     </td>
     230                     <td>
     231                        <code>a</code>
     232                     </td>
     233                     <td>
     234                        <code>g</code>
     235                     </td>
     236                     <td>
     237                        <code>/</code>
     238                     </td>
     239                     <td>
     240                        <code>&gt;</code>
     241                     </td>
     242                  </tr>
     243                  <tr valign="top">
     244                     <td>ASCII</td>
     245                     <td>
     246                        <code>00111100</code>
     247                     </td>
     248                     <td>
     249                        <code>01110100</code>
     250                     </td>
     251                     <td>
     252                        <code>01100001</code>
     253                     </td>
     254                     <td>
     255                        <code>01100111</code>
     256                     </td>
     257                     <td>
     258                        <code>00101111</code>
     259                     </td>
     260                     <td>
     261                        <code>00111110</code>
     262                     </td>
     263                  </tr>
     264                  <tr valign="top">
     265                     <td>Bit0</td>
     266                     <td>
     267                        <code>0</code>
     268                     </td>
     269                     <td>
     270                        <code>0</code>
     271                     </td>
     272                     <td>
     273                        <code>0</code>
     274                     </td>
     275                     <td>
     276                        <code>0</code>
     277                     </td>
     278                     <td>
     279                        <code>0</code>
     280                     </td>
     281                     <td>
     282                        <code>0</code>
     283                     </td>
     284                  </tr>
     285                  <tr valign="top">
     286                     <td>Bit1</td>
     287                     <td>
     288                        <code>0</code>
     289                     </td>
     290                     <td>
     291                        <code>1</code>
     292                     </td>
     293                     <td>
     294                        <code>1</code>
     295                     </td>
     296                     <td>
     297                        <code>1</code>
     298                     </td>
     299                     <td>
     300                        <code>0</code>
     301                     </td>
     302                     <td>
     303                        <code>0</code>
     304                     </td>
     305                  </tr>
     306                  <tr valign="top">
     307                     <td>Bit2</td>
     308                     <td>
     309                        <code>1</code>
     310                     </td>
     311                     <td>
     312                        <code>1</code>
     313                     </td>
     314                     <td>
     315                        <code>1</code>
     316                     </td>
     317                     <td>
     318                        <code>1</code>
     319                     </td>
     320                     <td>
     321                        <code>1</code>
     322                     </td>
     323                     <td>
     324                        <code>1</code>
     325                     </td>
     326                  </tr>
     327                  <tr valign="top">
     328                     <td>Bit3</td>
     329                     <td>
     330                        <code>1</code>
     331                     </td>
     332                     <td>
     333                        <code>1</code>
     334                     </td>
     335                     <td>
     336                        <code>0</code>
     337                     </td>
     338                     <td>
     339                        <code>0</code>
     340                     </td>
     341                     <td>
     342                        <code>0</code>
     343                     </td>
     344                     <td>
     345                        <code>1</code>
     346                     </td>
     347                  </tr>
     348                  <tr valign="top">
     349                     <td>Bit4</td>
     350                     <td>
     351                        <code>1</code>
     352                     </td>
     353                     <td>
     354                        <code>0</code>
     355                     </td>
     356                     <td>
     357                        <code>0</code>
     358                     </td>
     359                     <td>
     360                        <code>0</code>
     361                     </td>
     362                     <td>
     363                        <code>1</code>
     364                     </td>
     365                     <td>
     366                        <code>1</code>
     367                     </td>
     368                  </tr>
     369                  <tr valign="top">
     370                     <td>Bit5</td>
     371                     <td>
     372                        <code>1</code>
     373                     </td>
     374                     <td>
     375                        <code>1</code>
     376                     </td>
     377                     <td>
     378                        <code>0</code>
     379                     </td>
     380                     <td>
     381                        <code>1</code>
     382                     </td>
     383                     <td>
     384                        <code>1</code>
     385                     </td>
     386                     <td>
     387                        <code>1</code>
     388                     </td>
     389                  </tr>
     390                  <tr valign="top">
     391                     <td>Bit6</td>
     392                     <td>
     393                        <code>0</code>
     394                     </td>
     395                     <td>
     396                        <code>0</code>
     397                     </td>
     398                     <td>
     399                        <code>0</code>
     400                     </td>
     401                     <td>
     402                        <code>1</code>
     403                     </td>
     404                     <td>
     405                        <code>1</code>
     406                     </td>
     407                     <td>
     408                        <code>1</code>
     409                     </td>
     410                  </tr>
     411                  <tr valign="top">
     412                     <td>Bit7</td>
     413                     <td>
     414                        <code>0</code>
     415                     </td>
     416                     <td>
     417                        <code>0</code>
     418                     </td>
     419                     <td>
     420                        <code>1</code>
     421                     </td>
     422                     <td>
     423                        <code>1</code>
     424                     </td>
     425                     <td>
     426                        <code>1</code>
     427                     </td>
     428                     <td>
     429                        <code>0</code>
     430                     </td>
     431                  </tr>
    225432               </tbody>
    226433            </table>
    227            
    228434         </para>
    229435         <para> Depending on the features of a particular processor architecture, there are a number
     
    249455      <section>
    250456         <title>General Streams</title>
    251 
    252          <section>
    253             <title>Error Flag Streams</title>
    254             <para>The error flag stream indicates the character code unit positions of errors. XML
    255                processing examples which benefit from the marking error positions include UTF-8
    256                character sequence validation and XML parsing [<xref linkend="u8u16"/>].</para>
    257             <para>The following table provides an example of predefined entity reference parsing. <table>
    258                <caption>
    259                   <para>Parsing Entity Refereces</para>
    260                </caption>
    261                <colgroup><col align="left" valign="top" /></colgroup>
    262                <tbody>  <tr valign="top"><td>XML</td><td><code>Well Formed &amp;lt; Erroneous &amp;gt!</code></td></tr>
    263                   <tr valign="top"><td>RefStart</td><td><code>------------1--------------1---</code></td></tr>
    264                   <tr valign="top"><td>RefEnd</td><td><code>---------------1---------------</code></td></tr>
    265                   <tr valign="top"><td>RefError</td><td><code>------------------------------1</code></td></tr>
    266                </tbody>
    267             </table>
    268             </para>
    269 
    270          </section>
     457         <para>This section describes the bit streams which support operations that are common to
     458            many XML processing tasks.</para>
     459
    271460         <section>
    272461            <title>Deletion Mask Streams</title>
    273             <para>The marking and subsequent deletion of source stream character code unit positions
    274                represents a core XML processing operation. The delmask (deletion mask) stream marks
    275                character code unit positions for deletion. Several cases arise commonly in XML
    276                processing. Examples include, UTF-8 to UTF-16 transcoding, XML end-of-line handling,
    277                predefined entity replacement, and CDATA section delimeters. Several algorithms to
    278                delete bits at positions marked by delmask are possible [<xref linkend="u8u16"/>]. A
    279                bitwise ORing of any number of deletion masks implies that a single invocation of a
    280                SIMD based parallel deletion may perform deletions accumulated across a number of XML
    281                processing stages. </para>
     462            <para>The DelMask (deletion mask) streams marks character code unit positions for
     463               deletion. Since the deletion operation arises in many stages of XML processing,
     464               positions are initially marked for deletion, and then subsequently deleted in
     465               parallel, using a bitwise ORing of a number of deletion masks. A single invocation of
     466               a SIMD based parallel deletion algorithm may perform deletions accumulated across a
     467               number of XML processing stages. Several algorithms to delete bits at positions
     468               marked by DelMask are possible [<xref linkend="u8u16"/>]. </para>
     469            <para> As an example, deletion arises in the replacement of predefined entities, such as
     470               in the replacement of the &amp;amp; entity, with the &amp; character. Further
     471               deletion masks, such as masks resulting from UTF-8 to UTF-16 transcoding, XML
     472               end-of-line handling, and CDATA section delimeter processing may then be ORd for
     473               accumulation with the predefined entity deletion mask.</para>
     474            <para>The following table provides an example of generating a DelMask in the context of
     475               bit stream based parsing of well-formed character references and predefined entities.
     476               Character reference and predefined entity bit stream definitions are provided below.<!-- PARABIX2_1  -->
     477               <!--
     478            <table>
     479               <caption>
     480                  <para>DelMask Stream Generation</para>
     481               </caption>
     482            </table>
     483            -->
     484            </para>
     485         </section>
     486
     487         <section>
     488            <title>Error Flag Streams </title>
     489            <para>Error flag streams indicates the character code unit positions of syntactical
     490               errors. XML processing examples which benefit from the marking error positions
     491               include UTF-8 character sequence validation and XML parsing [<xref linkend="u8u16"
     492               />].</para>
     493            <para>The following table provides an example of using bit streams to parse character
     494               references and predefined entities which fail to meet the XML 1.0 well-formedness
     495               constraints. This results in the generation of a error flag stream.<!-- PARABIX2_2  -->
     496               <!-- REPLACE
     497               <table>
     498               <caption>
     499                  <para>Error Flag Stream Generation</para>
     500                  </caption>
     501                  <colgroup>
     502                     <col align="left" valign="top"/>
     503                  </colgroup>
     504                  <tbody>
     505                     <tr valign="top">
     506                        <td>XML</td>
     507                        <td>
     508                           <code>Well Formed &amp;lt; Erroneous &amp;gt!</code>
     509                        </td>
     510                     </tr>
     511                     <tr valign="top">
     512                        <td>RefStart</td>
     513                        <td>
     514                           <code></code>
     515                        </td>
     516                     </tr>
     517                     <tr valign="top">
     518                        <td>RefEnd</td>
     519                        <td>
     520                           <code></code>
     521                        </td>
     522                     </tr>
     523                     <tr valign="top">
     524                        <td>RefError</td>
     525                        <td>
     526                           <code></code>
     527                        </td>
     528                     </tr>
     529                  </tbody>
     530               </table>
     531               -->
     532            </para>
     533
    282534         </section>
    283535
     
    287539         <title>Lexical Item Streams</title>
    288540         <para>Lexical item streams differ from traditional streams of tokens in that they are bit
    289             streams that mark the positions of tokens, whitespace or delimiters. Differentiation
     541            streams that mark the positions of tokens, whitespace or delimiters. Additional bit
     542            streams, such as the reference streams and callout streams, are subsequently constructed
     543            based on the information held within the set of lexical items streams. Differentiation
    290544            between the actual tokens that may occur at a particular point (e.g., the different XML
    291545            tokens that begin “&lt;”) may be performed using multicharacter recognizers on the
    292             bytestream representation [<xref linkend="CASCON08"/>]. </para>
     546            bytestream representation [<xref linkend="CASCON08"/>].</para>
    293547         <para>A key role of lexical item streams in XML parsing is to facilitate fast scanning
    294548            operations. For example, a LeftAngle lexical item stream may be formed to identify those
     
    302556            time using 128-bit SSE registers on Intel Core2 processors [<xref linkend="CASCON08"/>].
    303557            The following table describes the core lexical item streams defined by the Parabix XML
    304             parser. </para>
     558            parser.</para>
    305559         <para>
    306560            <table>
     
    310564               <tbody>
    311565                  <tr>
    312                      <td align="left">
    313                         NonWS
    314                      </td>
    315                      <td align="left">
    316                         Marks the position any non-whitespace character.
    317                      </td>
    318                   </tr>
    319                   <tr>
    320                      <td align="left">
    321                         MarkupStart
    322                      </td>
    323                      <td align="left">
    324                         Marks the position of the start of XML markup.
    325                      </td>
    326                   </tr>
    327                   <tr>
    328                      <td align="left">
    329                         CDATAEnd
    330                      </td>
    331                      <td align="left">
    332                         Marks the position of the end of any CDATA section and identifies
    333                            positions where " ]]&gt; " appears in XML.
    334                         .
    335                      </td>
    336                   </tr>
    337                   <tr>
    338                      <td align="left">
    339                         Hyphen
    340                      </td>
    341                      <td align="left">
    342                         Marks the position of any hyphen character.
    343                      </td>
    344                   </tr>
    345                   <tr>
    346                      <td align="left">
    347                         QMark
    348                      </td>
    349                      <td align="left">
    350                         Marks the position of any question mark character.
    351                      </td>
    352                   </tr>
    353                   <tr>
    354                      <td align="left">
    355                         Quote
    356                      </td>
    357                      <td align="left">
    358                         Marks the position of any single or double quote character.
    359                      </td>
    360                   </tr>
    361                   <tr>
    362                      <td align="left">
    363                         NameFollow
    364                      </td>
    365                      <td align="left">
    366                         Marks the position of any character that can follow an XML name in a
    367                            well-formed XML document.
    368                      </td>
     566                     <td align="left"> LAngle </td>
     567                     <td align="left"> Marks the position of any left angle bracket character.</td>
     568                  </tr>
     569                  <tr>
     570                     <td align="left"> RAngle </td>
     571                     <td align="left"> Marks the position of any right angle bracket character.</td>
     572                  </tr>
     573                  <tr>
     574                     <td align="left"> LBracket </td>
     575                     <td align="left"> Marks the position of any left square bracker character.</td>
     576                  </tr>
     577                  <tr>
     578                     <td align="left"> RBracket </td>
     579                     <td align="left"> Marks the position of any right square bracket
     580                     character.</td>
     581                  </tr>
     582                  <tr>
     583                     <td align="left"> Exclam </td>
     584                     <td align="left"> Marks the position of any exclamation mark character.</td>
     585                  </tr>
     586                  <tr>
     587                     <td align="left"> QMark </td>
     588                     <td align="left"> Marks the position of any question mark character.</td>
     589                  </tr>
     590                  <tr>
     591                     <td align="left"> Hyphen </td>
     592                     <td align="left"> Marks the position of any hyphen character.</td>
     593                  </tr>
     594                  <tr>
     595                     <td align="left"> Equals </td>
     596                     <td align="left"> Marks the position of any equal sign character.</td>
     597                  </tr>
     598                  <tr>
     599                     <td align="left"> SQuote </td>
     600                     <td align="left"> Marks the position of any single quote character.</td>
     601                  </tr>
     602                  <tr>
     603                     <td align="left"> DQuote </td>
     604                     <td align="left"> Marks the position of any double quote character.</td>
     605                  </tr>
     606                  <tr>
     607                     <td align="left"> Slash </td>
     608                     <td align="left"> Marks the position of any forward slash character</td>
     609                  </tr>
     610                  <tr>
     611                     <td align="left"> NameScan </td>
     612                     <td align="left"> Marks the position of any XML name character.</td>
     613                  </tr>
     614                  <tr>
     615                     <td align="left"> WS </td>
     616                     <td align="left"> Marks the position of any XML 1.0 whitespace character.</td>
     617                  </tr>
     618                  <tr>
     619                     <td align="left"> PI_start </td>
     620                     <td align="left"> Marks the position of the start of any processing instruction
     621                        at the '?' character position.</td>
     622                  </tr>
     623                  <tr>
     624                     <td align="left"> PI_end </td>
     625                     <td align="left"> Marks the position of any end of any processing instruction
     626                        at the '>' character position.</td>
     627                  </tr>
     628                  <tr>
     629                     <td align="left"> CtCD_start </td>
     630                     <td align="left"> Marks the position of the start of any comment or CDATA
     631                        section at the '!' character position.</td>
     632                  </tr>
     633                  <tr>
     634                     <td align="left"> EndTag_start </td>
     635                     <td align="left"> Marks the position of any end tag at the '/' character
     636                        position.</td>
     637                  </tr>
     638                  <tr>
     639                     <td align="left"> CD_end </td>
     640                     <td align="left"> Marks the position of the end of any CDATA section at the '>'
     641                        character position. </td>
     642                  </tr>
     643                  <tr>
     644                     <td align="left"> DoubleHyphen </td>
     645                     <td align="left"> Marks the position of any double hyphen character.</td>
     646                  </tr>
     647                  <tr>
     648                     <td align="left"> RefStart </td>
     649                     <td align="left"> Marks the position of any ampersand character.</td>
     650                  </tr>
     651                  <tr>
     652                     <td align="left"> Hash </td>
     653                     <td align="left"> Marks the position of any hash character.</td>
     654                  </tr>
     655                  <tr>
     656                     <td align="left"> x </td>
     657                     <td align="left"> Marks the position of any 'x' character.</td>
     658                  </tr>
     659                  <tr>
     660                     <td align="left"> Digit </td>
     661                     <td align="left"> Marks the position of any digit character.</td>
     662                  </tr>
     663                  <tr>
     664                     <td align="left"> Hex </td>
     665                     <td align="left"> Marks the position of any hexidecimal character.</td>
     666                  </tr>
     667                  <tr>
     668                     <td align="left"> Semicolon </td>
     669                     <td align="left"> Marks the position of any semicolon character.</td>
    369670                  </tr>
    370671               </tbody>
    371672            </table>
    372673         </para>
    373          <para> The following table illustrates the various lexical items. <table>
    374             <caption>
    375                <para>Lexical Item Streams</para>
    376             </caption>
    377             <colgroup><col align="left" valign="top" /></colgroup>
    378             <tbody>     <tr valign="top"><td>XML</td><td><code>&lt;tag attrib=&apos;value&apos;&gt; -- ]]&gt; &lt;nested  attribute=&quot;value&quot;&gt;&lt;/tag&gt;</code></td></tr>
    379                <tr valign="top"><td>LAngle</td><td><code>1---------------------------1--------------------------1-----</code></td></tr>
    380                <tr valign="top"><td>Hyphen</td><td><code>---------------------11--------------------------------------</code></td></tr>
    381                <tr valign="top"><td>QMark</td><td><code>-------------------------------------------------------------</code></td></tr>
    382                <tr valign="top"><td>NonWS</td><td><code>1111-111111111111111-11-111-1111111--111111111111111111111111</code></td></tr>
    383                <tr valign="top"><td>Quote</td><td><code>------------1-----1----------------------------1-----1-------</code></td></tr>
    384                <tr valign="top"><td>CDATA</td><td><code>--------------------------1----------------------------------</code></td></tr>
    385                <tr valign="top"><td>NameFollow</td><td><code>----1------1-------11--1--11-------11---------1-------1-1---1</code></td></tr>
    386             </tbody>
    387          </table>
     674         <para>The following table illustrates a number of the lexical item streams.
     675            <!--
     676            <table>
     677               <caption>
     678                  <para>Lexical Item Streams</para>
     679               </caption>
     680           
     681               
     682               <colgroup>
     683                  <col align="left" valign="top"/>
     684               </colgroup>
     685
     686               </tbody>
     687            </table>
     688               -->
    388689         </para>
    389690      </section>
    390691
    391692      <section>
    392          <title>UTF-8 Classification and Validation Streams</title>
     693         <title>UTF-8 Byte Classification, Scope and Validation Streams</title>
    393694         <para> An XML parser must accept the UTF-8 encoding of Unicode [<xref linkend="XML10"/>].
    394695            It is a fatal error if an XML document determined to be in UTF-8 contains byte sequences
    395696            that are not legal in that encoding. UTF-8 byte classification, scope and error flag bit
    396             streams are defined to validate UTF-8 byte sequences as well as to support transcoding
    397             to UTF-16, if desired.</para>
     697            streams are defined to validate UTF-8 byte sequences and support transcoding to UTF-16
     698            if desired.</para>
    398699
    399700         <section>
     
    417718               process using parallel bit stream techniques. The result of this validation process
    418719               is an error flag stream identifying those positions at which errors are identified.</para>
    419             <para> 
     720            <para>
    420721               <table>
    421722                  <caption>
    422723                     <para>UTF-8 Scope Streams</para>
    423724                  </caption>
    424                   <colgroup><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /><col align="left" valign="top" /></colgroup>
    425                   <tbody>       <tr valign="top"><td>XML</td><td colspan="1"><code>A</code></td><td colspan="1"><code> </code></td><td colspan="1"><code>T</code></td><td colspan="1"><code>e</code></td><td colspan="1"><code>x</code></td><td colspan="1"><code>t</code></td><td colspan="1"><code> </code></td><td colspan="1"><code>i</code></td><td colspan="1"><code>n</code></td><td colspan="1"><code> </code></td><td colspan="1"><code>F</code></td><td colspan="1"><code>a</code></td><td colspan="1"><code>r</code></td><td colspan="1"><code>s</code></td><td colspan="1"><code>i</code></td><td colspan="1"><code>:</code></td><td colspan="2"><code>ى</code></td><td colspan="2"><code>س</code></td><td colspan="2"><code>ر</code></td><td colspan="2"><code>ا</code></td><td colspan="2"><code>ف</code></td><td colspan="1"><code> </code></td><td colspan="2"><code>ن</code></td><td colspan="2"><code>ت</code></td><td colspan="2"><code>Ù
    426 </code></td><td colspan="1"><code> </code></td><td colspan="2"><code>ك</code></td><td colspan="2"><code>ى</code></td></tr>
    427                      <tr valign="top"><td>UTF-8</td><td><code>41</code></td><td><code>20</code></td><td><code>54</code></td><td><code>65</code></td><td><code>78</code></td><td><code>74</code></td><td><code>20</code></td><td><code>69</code></td><td><code>6E</code></td><td><code>20</code></td><td><code>46</code></td><td><code>61</code></td><td><code>72</code></td><td><code>73</code></td><td><code>69</code></td><td><code>3A</code></td><td><code>D9</code></td><td><code>89</code></td><td><code>D8</code></td><td><code>B3</code></td><td><code>D8</code></td><td><code>B1</code></td><td><code>D8</code></td><td><code>A7</code></td><td><code>D9</code></td><td><code>81</code></td><td><code>20</code></td><td><code>D9</code></td><td><code>86</code></td><td><code>D8</code></td><td><code>AA</code></td><td><code>D9</code></td><td><code>85</code></td><td><code>20</code></td><td><code>D9</code></td><td><code>83</code></td><td><code>D9</code></td><td><code>89</code></td></tr>
    428                      <tr valign="top"><td>u8UniByte</td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td></tr>
    429                      <tr valign="top"><td>u8Prefix</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td></tr>
    430                      <tr valign="top"><td>u8Suffix</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td></tr>
    431                      <tr valign="top"><td>u8Prefix2</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td></tr>
    432                      <tr valign="top"><td>u8Scope22</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>0</code></td><td><code>1</code></td><td><code>0</code></td><td><code>1</code></td></tr>
    433                      <tr valign="top"><td>u8Error</td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td><td><code>0</code></td></tr>
     725                  <colgroup>
     726                     <col align="left" valign="top"/>
     727                     <col align="left" valign="top"/>
     728                     <col align="left" valign="top"/>
     729                     <col align="left" valign="top"/>
     730                     <col align="left" valign="top"/>
     731                     <col align="left" valign="top"/>
     732                     <col align="left" valign="top"/>
     733                     <col align="left" valign="top"/>
     734                     <col align="left" valign="top"/>
     735                     <col align="left" valign="top"/>
     736                     <col align="left" valign="top"/>
     737                     <col align="left" valign="top"/>
     738                     <col align="left" valign="top"/>
     739                     <col align="left" valign="top"/>
     740                     <col align="left" valign="top"/>
     741                     <col align="left" valign="top"/>
     742                     <col align="left" valign="top"/>
     743                     <col align="left" valign="top"/>
     744                     <col align="left" valign="top"/>
     745                     <col align="left" valign="top"/>
     746                     <col align="left" valign="top"/>
     747                     <col align="left" valign="top"/>
     748                     <col align="left" valign="top"/>
     749                     <col align="left" valign="top"/>
     750                     <col align="left" valign="top"/>
     751                     <col align="left" valign="top"/>
     752                     <col align="left" valign="top"/>
     753                     <col align="left" valign="top"/>
     754                  </colgroup>
     755                  <tbody>
     756                     <tr valign="top">
     757                        <td>Input Data</td>
     758                        <td colspan="1">
     759                           <code>A</code>
     760                        </td>
     761                        <td colspan="1">
     762                           <code> </code>
     763                        </td>
     764                        <td colspan="1">
     765                           <code>T</code>
     766                        </td>
     767                        <td colspan="1">
     768                           <code>e</code>
     769                        </td>
     770                        <td colspan="1">
     771                           <code>x</code>
     772                        </td>
     773                        <td colspan="1">
     774                           <code>t</code>
     775                        </td>
     776                        <td colspan="1">
     777                           <code> </code>
     778                        </td>
     779                        <td colspan="1">
     780                           <code>i</code>
     781                        </td>
     782                        <td colspan="1">
     783                           <code>n</code>
     784                        </td>
     785                        <td colspan="1">
     786                           <code> </code>
     787                        </td>
     788                        <td colspan="1">
     789                           <code>F</code>
     790                        </td>
     791                        <td colspan="1">
     792                           <code>a</code>
     793                        </td>
     794                        <td colspan="1">
     795                           <code>r</code>
     796                        </td>
     797                        <td colspan="1">
     798                           <code>s</code>
     799                        </td>
     800                        <td colspan="1">
     801                           <code>i</code>
     802                        </td>
     803                        <td colspan="1">
     804                           <code>:</code>
     805                        </td>
     806                        <td colspan="2">
     807                           <code>ى</code>
     808                        </td>
     809                        <td colspan="2">
     810                           <code>س</code>
     811                        </td>
     812                        <td colspan="2">
     813                           <code>ر</code>
     814                        </td>
     815                        <td colspan="2">
     816                           <code>ا</code>
     817                        </td>
     818                        <td colspan="2">
     819                           <code>ف</code>
     820                        </td>
     821                        <td colspan="1">
     822                           <code> </code>
     823                        </td>
     824                        <td colspan="2">
     825                           <code>ن</code>
     826                        </td>
     827                        <td colspan="2">
     828                           <code>ت</code>
     829                        </td>
     830                        <td colspan="2">
     831                           <code>Ù
     832</code>
     833                        </td>
     834                        <td colspan="1">
     835                           <code> </code>
     836                        </td>
     837                        <td colspan="2">
     838                           <code>ك</code>
     839                        </td>
     840                        <td colspan="2">
     841                           <code>ى</code>
     842                        </td>
     843                     </tr>
     844                     <tr valign="top">
     845                        <td>UTF-8</td>
     846                        <td>
     847                           <code>41</code>
     848                        </td>
     849                        <td>
     850                           <code>20</code>
     851                        </td>
     852                        <td>
     853                           <code>54</code>
     854                        </td>
     855                        <td>
     856                           <code>65</code>
     857                        </td>
     858                        <td>
     859                           <code>78</code>
     860                        </td>
     861                        <td>
     862                           <code>74</code>
     863                        </td>
     864                        <td>
     865                           <code>20</code>
     866                        </td>
     867                        <td>
     868                           <code>69</code>
     869                        </td>
     870                        <td>
     871                           <code>6E</code>
     872                        </td>
     873                        <td>
     874                           <code>20</code>
     875                        </td>
     876                        <td>
     877                           <code>46</code>
     878                        </td>
     879                        <td>
     880                           <code>61</code>
     881                        </td>
     882                        <td>
     883                           <code>72</code>
     884                        </td>
     885                        <td>
     886                           <code>73</code>
     887                        </td>
     888                        <td>
     889                           <code>69</code>
     890                        </td>
     891                        <td>
     892                           <code>3A</code>
     893                        </td>
     894                        <td>
     895                           <code>D9</code>
     896                        </td>
     897                        <td>
     898                           <code>89</code>
     899                        </td>
     900                        <td>
     901                           <code>D8</code>
     902                        </td>
     903                        <td>
     904                           <code>B3</code>
     905                        </td>
     906                        <td>
     907                           <code>D8</code>
     908                        </td>
     909                        <td>
     910                           <code>B1</code>
     911                        </td>
     912                        <td>
     913                           <code>D8</code>
     914                        </td>
     915                        <td>
     916                           <code>A7</code>
     917                        </td>
     918                        <td>
     919                           <code>D9</code>
     920                        </td>
     921                        <td>
     922                           <code>81</code>
     923                        </td>
     924                        <td>
     925                           <code>20</code>
     926                        </td>
     927                        <td>
     928                           <code>D9</code>
     929                        </td>
     930                        <td>
     931                           <code>86</code>
     932                        </td>
     933                        <td>
     934                           <code>D8</code>
     935                        </td>
     936                        <td>
     937                           <code>AA</code>
     938                        </td>
     939                        <td>
     940                           <code>D9</code>
     941                        </td>
     942                        <td>
     943                           <code>85</code>
     944                        </td>
     945                        <td>
     946                           <code>20</code>
     947                        </td>
     948                        <td>
     949                           <code>D9</code>
     950                        </td>
     951                        <td>
     952                           <code>83</code>
     953                        </td>
     954                        <td>
     955                           <code>D9</code>
     956                        </td>
     957                        <td>
     958                           <code>89</code>
     959                        </td>
     960                     </tr>
     961                     <tr valign="top">
     962                        <td>u8UniByte</td>
     963                        <td>
     964                           <code>1</code>
     965                        </td>
     966                        <td>
     967                           <code>1</code>
     968                        </td>
     969                        <td>
     970                           <code>1</code>
     971                        </td>
     972                        <td>
     973                           <code>1</code>
     974                        </td>
     975                        <td>
     976                           <code>1</code>
     977                        </td>
     978                        <td>
     979                           <code>1</code>
     980                        </td>
     981                        <td>
     982                           <code>1</code>
     983                        </td>
     984                        <td>
     985                           <code>1</code>
     986                        </td>
     987                        <td>
     988                           <code>1</code>
     989                        </td>
     990                        <td>
     991                           <code>1</code>
     992                        </td>
     993                        <td>
     994                           <code>1</code>
     995                        </td>
     996                        <td>
     997                           <code>1</code>
     998                        </td>
     999                        <td>
     1000                           <code>1</code>
     1001                        </td>
     1002                        <td>
     1003                           <code>1</code>
     1004                        </td>
     1005                        <td>
     1006                           <code>1</code>
     1007                        </td>
     1008                        <td>
     1009                           <code>1</code>
     1010                        </td>
     1011                        <td>
     1012                           <code>0</code>
     1013                        </td>
     1014                        <td>
     1015                           <code>0</code>
     1016                        </td>
     1017                        <td>
     1018                           <code>0</code>
     1019                        </td>
     1020                        <td>
     1021                           <code>0</code>
     1022                        </td>
     1023                        <td>
     1024                           <code>0</code>
     1025                        </td>
     1026                        <td>
     1027                           <code>0</code>
     1028                        </td>
     1029                        <td>
     1030                           <code>0</code>
     1031                        </td>
     1032                        <td>
     1033                           <code>0</code>
     1034                        </td>
     1035                        <td>
     1036                           <code>0</code>
     1037                        </td>
     1038                        <td>
     1039                           <code>0</code>
     1040                        </td>
     1041                        <td>
     1042                           <code>1</code>
     1043                        </td>
     1044                        <td>
     1045                           <code>0</code>
     1046                        </td>
     1047                        <td>
     1048                           <code>0</code>
     1049                        </td>
     1050                        <td>
     1051                           <code>0</code>
     1052                        </td>
     1053                        <td>
     1054                           <code>0</code>
     1055                        </td>
     1056                        <td>
     1057                           <code>0</code>
     1058                        </td>
     1059                        <td>
     1060                           <code>0</code>
     1061                        </td>
     1062                        <td>
     1063                           <code>1</code>
     1064                        </td>
     1065                        <td>
     1066                           <code>0</code>
     1067                        </td>
     1068                        <td>
     1069                           <code>0</code>
     1070                        </td>
     1071                        <td>
     1072                           <code>0</code>
     1073                        </td>
     1074                        <td>
     1075                           <code>0</code>
     1076                        </td>
     1077                     </tr>
     1078                     <tr valign="top">
     1079                        <td>u8Prefix</td>
     1080                        <td>
     1081                           <code>0</code>
     1082                        </td>
     1083                        <td>
     1084                           <code>0</code>
     1085                        </td>
     1086                        <td>
     1087                           <code>0</code>
     1088                        </td>
     1089                        <td>
     1090                           <code>0</code>
     1091                        </td>
     1092                        <td>
     1093                           <code>0</code>
     1094                        </td>
     1095                        <td>
     1096                           <code>0</code>
     1097                        </td>
     1098                        <td>
     1099                           <code>0</code>
     1100                        </td>
     1101                        <td>
     1102                           <code>0</code>
     1103                        </td>
     1104                        <td>
     1105                           <code>0</code>
     1106                        </td>
     1107                        <td>
     1108                           <code>0</code>
     1109                        </td>
     1110                        <td>
     1111                           <code>0</code>
     1112                        </td>
     1113                        <td>
     1114                           <code>0</code>
     1115                        </td>
     1116                        <td>
     1117                           <code>0</code>
     1118                        </td>
     1119                        <td>
     1120                           <code>0</code>
     1121                        </td>
     1122                        <td>
     1123                           <code>0</code>
     1124                        </td>
     1125                        <td>
     1126                           <code>0</code>
     1127                        </td>
     1128                        <td>
     1129                           <code>1</code>
     1130                        </td>
     1131                        <td>
     1132                           <code>0</code>
     1133                        </td>
     1134                        <td>
     1135                           <code>1</code>
     1136                        </td>
     1137                        <td>
     1138                           <code>0</code>
     1139                        </td>
     1140                        <td>
     1141                           <code>1</code>
     1142                        </td>
     1143                        <td>
     1144                           <code>0</code>
     1145                        </td>
     1146                        <td>
     1147                           <code>1</code>
     1148                        </td>
     1149                        <td>
     1150                           <code>0</code>
     1151                        </td>
     1152                        <td>
     1153                           <code>1</code>
     1154                        </td>
     1155                        <td>
     1156                           <code>0</code>
     1157                        </td>
     1158                        <td>
     1159                           <code>0</code>
     1160                        </td>
     1161                        <td>
     1162                           <code>1</code>
     1163                        </td>
     1164                        <td>
     1165                           <code>0</code>
     1166                        </td>
     1167                        <td>
     1168                           <code>1</code>
     1169                        </td>
     1170                        <td>
     1171                           <code>0</code>
     1172                        </td>
     1173                        <td>
     1174                           <code>1</code>
     1175                        </td>
     1176                        <td>
     1177                           <code>0</code>
     1178                        </td>
     1179                        <td>
     1180                           <code>0</code>
     1181                        </td>
     1182                        <td>
     1183                           <code>1</code>
     1184                        </td>
     1185                        <td>
     1186                           <code>0</code>
     1187                        </td>
     1188                        <td>
     1189                           <code>1</code>
     1190                        </td>
     1191                        <td>
     1192                           <code>0</code>
     1193                        </td>
     1194                     </tr>
     1195                     <tr valign="top">
     1196                        <td>u8Suffix</td>
     1197                        <td>
     1198                           <code>0</code>
     1199                        </td>
     1200                        <td>
     1201                           <code>0</code>
     1202                        </td>
     1203                        <td>
     1204                           <code>0</code>
     1205                        </td>
     1206                        <td>
     1207                           <code>0</code>
     1208                        </td>
     1209                        <td>
     1210                           <code>0</code>
     1211                        </td>
     1212                        <td>
     1213                           <code>0</code>
     1214                        </td>
     1215                        <td>
     1216                           <code>0</code>
     1217                        </td>
     1218                        <td>
     1219                           <code>0</code>
     1220                        </td>
     1221                        <td>
     1222                           <code>0</code>
     1223                        </td>
     1224                        <td>
     1225                           <code>0</code>
     1226                        </td>
     1227                        <td>
     1228                           <code>0</code>
     1229                        </td>
     1230                        <td>
     1231                           <code>0</code>
     1232                        </td>
     1233                        <td>
     1234                           <code>0</code>
     1235                        </td>
     1236                        <td>
     1237                           <code>0</code>
     1238                        </td>
     1239                        <td>
     1240                           <code>0</code>
     1241                        </td>
     1242                        <td>
     1243                           <code>0</code>
     1244                        </td>
     1245                        <td>
     1246                           <code>0</code>
     1247                        </td>
     1248                        <td>
     1249                           <code>1</code>
     1250                        </td>
     1251                        <td>
     1252                           <code>0</code>
     1253                        </td>
     1254                        <td>
     1255                           <code>1</code>
     1256                        </td>
     1257                        <td>
     1258                           <code>0</code>
     1259                        </td>
     1260                        <td>
     1261                           <code>1</code>
     1262                        </td>
     1263                        <td>
     1264                           <code>0</code>
     1265                        </td>
     1266                        <td>
     1267                           <code>1</code>
     1268                        </td>
     1269                        <td>
     1270                           <code>0</code>
     1271                        </td>
     1272                        <td>
     1273                           <code>1</code>
     1274                        </td>
     1275                        <td>
     1276                           <code>0</code>
     1277                        </td>
     1278                        <td>
     1279                           <code>0</code>
     1280                        </td>
     1281                        <td>
     1282                           <code>1</code>
     1283                        </td>
     1284                        <td>
     1285                           <code>0</code>
     1286                        </td>
     1287                        <td>
     1288                           <code>1</code>
     1289                        </td>
     1290                        <td>
     1291                           <code>0</code>
     1292                        </td>
     1293                        <td>
     1294                           <code>1</code>
     1295                        </td>
     1296                        <td>
     1297                           <code>0</code>
     1298                        </td>
     1299                        <td>
     1300                           <code>0</code>
     1301                        </td>
     1302                        <td>
     1303                           <code>1</code>
     1304                        </td>
     1305                        <td>
     1306                           <code>0</code>
     1307                        </td>
     1308                        <td>
     1309                           <code>1</code>
     1310                        </td>
     1311                     </tr>
     1312                     <tr valign="top">
     1313                        <td>u8Prefix2</td>
     1314                        <td>
     1315                           <code>0</code>
     1316                        </td>
     1317                        <td>
     1318                           <code>0</code>
     1319                        </td>
     1320                        <td>
     1321                           <code>0</code>
     1322                        </td>
     1323                        <td>
     1324                           <code>0</code>
     1325                        </td>
     1326                        <td>
     1327                           <code>0</code>
     1328                        </td>
     1329                        <td>
     1330                           <code>0</code>
     1331                        </td>
     1332                        <td>
     1333                           <code>0</code>
     1334                        </td>
     1335                        <td>
     1336                           <code>0</code>
     1337                        </td>
     1338                        <td>
     1339                           <code>0</code>
     1340                        </td>
     1341                        <td>
     1342                           <code>0</code>
     1343                        </td>
     1344                        <td>
     1345                           <code>0</code>
     1346                        </td>
     1347                        <td>
     1348                           <code>0</code>
     1349                        </td>
     1350                        <td>
     1351                           <code>0</code>
     1352                        </td>
     1353                        <td>
     1354                           <code>0</code>
     1355                        </td>
     1356                        <td>
     1357                           <code>0</code>
     1358                        </td>
     1359                        <td>
     1360                           <code>0</code>
     1361                        </td>
     1362                        <td>
     1363                           <code>1</code>
     1364                        </td>
     1365                        <td>
     1366                           <code>0</code>
     1367                        </td>
     1368                        <td>
     1369                           <code>1</code>
     1370                        </td>
     1371                        <td>
     1372                           <code>0</code>
     1373                        </td>
     1374                        <td>
     1375                           <code>1</code>
     1376                        </td>
     1377                        <td>
     1378                           <code>0</code>
     1379                        </td>
     1380                        <td>
     1381                           <code>1</code>
     1382                        </td>
     1383                        <td>
     1384                           <code>0</code>
     1385                        </td>
     1386                        <td>
     1387                           <code>1</code>
     1388                        </td>
     1389                        <td>
     1390                           <code>0</code>
     1391                        </td>
     1392                        <td>
     1393                           <code>0</code>
     1394                        </td>
     1395                        <td>
     1396                           <code>1</code>
     1397                        </td>
     1398                        <td>
     1399                           <code>0</code>
     1400                        </td>
     1401                        <td>
     1402                           <code>1</code>
     1403                        </td>
     1404                        <td>
     1405                           <code>0</code>
     1406                        </td>
     1407                        <td>
     1408                           <code>1</code>
     1409                        </td>
     1410                        <td>
     1411                           <code>0</code>
     1412                        </td>
     1413                        <td>
     1414                           <code>0</code>
     1415                        </td>
     1416                        <td>
     1417                           <code>1</code>
     1418                        </td>
     1419                        <td>
     1420                           <code>0</code>
     1421                        </td>
     1422                        <td>
     1423                           <code>1</code>
     1424                        </td>
     1425                        <td>
     1426                           <code>0</code>
     1427                        </td>
     1428                     </tr>
     1429                     <tr valign="top">
     1430                        <td>u8Scope22</td>
     1431                        <td>
     1432                           <code>0</code>
     1433                        </td>
     1434                        <td>
     1435                           <code>0</code>
     1436                        </td>
     1437                        <td>
     1438                           <code>0</code>
     1439                        </td>
     1440                        <td>
     1441                           <code>0</code>
     1442                        </td>
     1443                        <td>
     1444                           <code>0</code>
     1445                        </td>
     1446                        <td>
     1447                           <code>0</code>
     1448                        </td>
     1449                        <td>
     1450                           <code>0</code>
     1451                        </td>
     1452                        <td>
     1453                           <code>0</code>
     1454                        </td>
     1455                        <td>
     1456                           <code>0</code>
     1457                        </td>
     1458                        <td>
     1459                           <code>0</code>
     1460                        </td>
     1461                        <td>
     1462                           <code>0</code>
     1463                        </td>
     1464                        <td>
     1465                           <code>0</code>
     1466                        </td>
     1467                        <td>
     1468                           <code>0</code>
     1469                        </td>
     1470                        <td>
     1471                           <code>0</code>
     1472                        </td>
     1473                        <td>
     1474                           <code>0</code>
     1475                        </td>
     1476                        <td>
     1477                           <code>0</code>
     1478                        </td>
     1479                        <td>
     1480                           <code>0</code>
     1481                        </td>
     1482                        <td>
     1483                           <code>1</code>
     1484                        </td>
     1485                        <td>
     1486                           <code>0</code>
     1487                        </td>
     1488                        <td>
     1489                           <code>1</code>
     1490                        </td>
     1491                        <td>
     1492                           <code>0</code>
     1493                        </td>
     1494                        <td>
     1495                           <code>1</code>
     1496                        </td>
     1497                        <td>
     1498                           <code>0</code>
     1499                        </td>
     1500                        <td>
     1501                           <code>1</code>
     1502                        </td>
     1503                        <td>
     1504                           <code>0</code>
     1505                        </td>
     1506                        <td>
     1507                           <code>1</code>
     1508                        </td>
     1509                        <td>
     1510                           <code>0</code>
     1511                        </td>
     1512                        <td>
     1513                           <code>0</code>
     1514                        </td>
     1515                        <td>
     1516                           <code>1</code>
     1517                        </td>
     1518                        <td>
     1519                           <code>0</code>
     1520                        </td>
     1521                        <td>
     1522                           <code>1</code>
     1523                        </td>
     1524                        <td>
     1525                           <code>0</code>
     1526                        </td>
     1527                        <td>
     1528                           <code>1</code>
     1529                        </td>
     1530                        <td>
     1531                           <code>0</code>
     1532                        </td>
     1533                        <td>
     1534                           <code>0</code>
     1535                        </td>
     1536                        <td>
     1537                           <code>1</code>
     1538                        </td>
     1539                        <td>
     1540                           <code>0</code>
     1541                        </td>
     1542                        <td>
     1543                           <code>1</code>
     1544                        </td>
     1545                     </tr>
     1546                     <tr valign="top">
     1547                        <td>u8Error</td>
     1548                        <td>
     1549                           <code>0</code>
     1550                        </td>
     1551                        <td>
     1552                           <code>0</code>
     1553                        </td>
     1554                        <td>
     1555                           <code>0</code>
     1556                        </td>
     1557                        <td>
     1558                           <code>0</code>
     1559                        </td>
     1560                        <td>
     1561                           <code>0</code>
     1562                        </td>
     1563                        <td>
     1564                           <code>0</code>
     1565                        </td>
     1566                        <td>
     1567                           <code>0</code>
     1568                        </td>
     1569                        <td>
     1570                           <code>0</code>
     1571                        </td>
     1572                        <td>
     1573                           <code>0</code>
     1574                        </td>
     1575                        <td>
     1576                           <code>0</code>
     1577                        </td>
     1578                        <td>
     1579                           <code>0</code>
     1580                        </td>
     1581                        <td>
     1582                           <code>0</code>
     1583                        </td>
     1584                        <td>
     1585                           <code>0</code>
     1586                        </td>
     1587                        <td>
     1588                           <code>0</code>
     1589                        </td>
     1590                        <td>
     1591                           <code>0</code>
     1592                        </td>
     1593                        <td>
     1594                           <code>0</code>
     1595                        </td>
     1596                        <td>
     1597                           <code>0</code>
     1598                        </td>
     1599                        <td>
     1600                           <code>0</code>
     1601                        </td>
     1602                        <td>
     1603                           <code>0</code>
     1604                        </td>
     1605                        <td>
     1606                           <code>0</code>
     1607                        </td>
     1608                        <td>
     1609                           <code>0</code>
     1610                        </td>
     1611                        <td>
     1612                           <code>0</code>
     1613                        </td>
     1614                        <td>
     1615                           <code>0</code>
     1616                        </td>
     1617                        <td>
     1618                           <code>0</code>
     1619                        </td>
     1620                        <td>
     1621                           <code>0</code>
     1622                        </td>
     1623                        <td>
     1624                           <code>0</code>
     1625                        </td>
     1626                        <td>
     1627                           <code>0</code>
     1628                        </td>
     1629                        <td>
     1630                           <code>0</code>
     1631                        </td>
     1632                        <td>
     1633                           <code>0</code>
     1634                        </td>
     1635                        <td>
     1636                           <code>0</code>
     1637                        </td>
     1638                        <td>
     1639                           <code>0</code>
     1640                        </td>
     1641                        <td>
     1642                           <code>0</code>
     1643                        </td>
     1644                        <td>
     1645                           <code>0</code>
     1646                        </td>
     1647                        <td>
     1648                           <code>0</code>
     1649                        </td>
     1650                        <td>
     1651                           <code>0</code>
     1652                        </td>
     1653                        <td>
     1654                           <code>0</code>
     1655                        </td>
     1656                        <td>
     1657                           <code>0</code>
     1658                        </td>
     1659                        <td>
     1660                           <code>0</code>
     1661                        </td>
     1662                     </tr>
    4341663                  </tbody>
    4351664               </table>
    436                
     1665
    4371666            </para>
     1667
     1668            <section>
     1669               <title>UTF-8 Validation Streams</title>
     1670               <para> Proper formation of UTF-8 byte sequences requires that the correct number of
     1671                  suffix bytes always follow a UTF-8 prefix byte and that certain illegal
     1672                  combinations are ruled out. For example, sequences beginning with the prefix bytes
     1673                  0xF5 through 0xFF are illegal as they would represent code point values above
     1674                  10FFFF. In addition, there are constraints on the first suffix byte following
     1675                  certain special prefixes, namely that a suffix following the prefix 0xE0 must fall
     1676                  in the range 0xA0 –0xBF, a suffix following the prefix 0xED must fall in the range
     1677                  0x80 –0x9F, a suffix following the prefix 0xF0 must fall in the range 0x90 –0xBF
     1678                  and a suffix following the prefix 0xF4 must fall in the range 0x80 –0x8F. The task
     1679                  of ensuring that each of these constraints hold is known as UTF-8 validation. The
     1680                  following bit streams xE0, xED, xF0, xF4, xA0_xBF, x80_x9F, x90_xBF, and x80_x8F
     1681                  are constructed to flag UTF-8 validation errors. The result of UTF-8 validation is
     1682                  an UTF-8 error flag bit stream contructed as an ORing of a series of UTF-8
     1683                  validation tests. </para>
     1684            </section>
     1685         </section>
     1686
     1687         <section>
     1688            <title>UTF-8 Surrogate Character Streams</title>
     1689            <para> The Unicode surrogate characters OxFFFF and OxFFFE correspond to the UTF-8
     1690               encodings of 0xEF 0xBF 0xBF and 0xEF 0xBF 0xBE respectively. As such, bit streams
     1691               xEF, xBF, and xBE are constructed to flag illegal surrogate characters in XML as part
     1692               of the XML character validation process. </para>
    4381693         </section>
    4391694
     
    4421697            <para>UTF-8 is often preferred for storage and data exchange, it is suitable for
    4431698               processing, but it is significantly more complex to process than UTF-16 [<xref
    444                   linkend="Unicode"/>]. Consequently, XML documents are often encoded in UTF-8 for
    445                serialization and transport and then transcoded to UTF-16 for processing with
    446                languages such as Java and C#. Following the parallel bit stream methods developed
    447                for u8u16, a high-performance standalone UTF-8 to UTF-16 transcoder [<xref
    448                   linkend="u8u16"/>], transcoding to UTF-16 may be achieved by computing a series of
    449                16 bit streams for the individual bits of each code unit. </para>
     1699                  linkend="Unicode"/>]. As such, XML documents are typically encoded in UTF-8 for
     1700               serialization and transport, and subsequently transcoded to UTF-16 for processing
     1701               with programming languages such as Java and C#. Following the parallel bit stream
     1702               methods developed for the u8u16 transcoder, a high-performance standalone UTF-8 to
     1703               UTF-16 transcoder [<xref linkend="u8u16"/>], transcoding to UTF-16 may be achieved by
     1704               computing a series of 16 bit streams. One stream for each of the individual bits of a
     1705               UTF-16 code unit. </para>
    4501706            <para>The bit streams for UTF-16 are conveniently divided into groups: the eight streams
    451                U16Hi0, U16Hi1, ..., U16Hi7 for the high byte of each UTF-16 code unit and the eight
    452                streams U16Lo1, ..., U16Lo7 for the low byte. Upon conversion of the parallel bit
     1707               u16Hi0, u16Hi1, ..., u16Hi7 for the high byte of each UTF-16 code unit and the eight
     1708               streams u16Lo1, ..., u16Lo7 for the low byte. Upon conversion of the parallel bit
    4531709               stream data back to byte streams, eight sequential byte streams U16h0, U16h1, ...,
    4541710               U16Hi7 are used for the high byte of each UTF-16 code unit, while U16Lo0, U16Lo1,...,
     
    4631719               UTF-16 bits is required for encoding two or three-byte UTF-8 sequences and only two
    4641720               sets are required for surrogate pairs corresponding to four-byte UTF-8 sequences. The
    465                u8LastByte (UniByte , u8Scope22 , u8Scope33 , and u8Scope44 ) and u8Scope42 streams
     1721               u8LastByte (u8UniByte , u8Scope22 , u8Scope33 , and u8Scope44 ) and u8Scope42 streams
    4661722               mark the positions at which the correct UTF-16 bits are computed. The bit sets at
    4671723               other positions must be deleted to compress the streams to UTF-16 indexed form.
     
    4711727
    4721728      <section>
    473          <title>XML Character Error Streams</title>
    474          <para>Legal characters in XML are the tab, carriage return, and line feed characters
    475             together with all Unicode characters excluding the surrogate blocks, hexidecimal FFFE
    476             and hexidecimal FFFF [<xref linkend="XML10"/>]. The XML character error stream marks the
    477             position of all characters external to this set and defines error positions in the
    478             source XML byte stream.</para>
     1729         <title>Control Character Streams</title>
     1730         <para>The control character bit streams marks ASCII control characters in the range
     1731            x00-x1F. Additional control character bit streams mark the tab, carriage return, line
     1732            feed, and space characters. An additional bit stream to mark carriage return line
     1733            combinations is also constructed. Control character bit streams support the operations
     1734            of XML character validation and XML end-of-line handling.</para>
     1735
     1736         <section>
     1737            <title>XML Character Validation</title>
     1738            <para>Legal characters in XML are the tab, carriage return, and line feed characters
     1739               together with all Unicode characters and excluding the surrogate blocks, OxFFFE and
     1740               OxFFFF [<xref linkend="XML10"/>]. The x00_x1F bit stream is constructed and used in
     1741               combination with additional control character bit streams to flags illegal control
     1742               characters in XML. Bit stream XML character validation results in the production of a
     1743               bit stream error mask. </para>
     1744         </section>
     1745
     1746         <section>
     1747            <title>XML 1.0 End-of-line Handling</title>
     1748            <para>In XML 1.0 the two-character sequence CR LF (carriage return, line feed) together
     1749               with any CR character not followed by a LF character must be converted to a single LF
     1750               character [<xref linkend="XML10"/>].</para>
     1751            <para>By defining carriage return, line feed, and carriage return line feed bit streams,
     1752               dentoted CR, LF and CRLF respectively, end-of-line normalization processing can be
     1753               performed in parallel, using only a small number of logical and shift operations.</para>
     1754            <para/>
     1755            <para>The following example demonstrates the generation of the CRLF deletion mask. In
     1756               this example, the position of all CR characters followed by LF characters are marked
     1757               for deletion. Isolated carriage returns are then replaced with LF characters.
     1758               Completion of this process satisfies the XML 1.0 end-of-line handling requirements.</para>
     1759            <para>
     1760               <table>
     1761                  <caption>
     1762                     <para>XML 1.0 End-of-line Handling</para>
     1763                  </caption>
     1764                  <colgroup>
     1765                     <col align="left" valign="top"/>
     1766                  </colgroup>
     1767                  <tbody>
     1768                     <tr valign="top">
     1769                        <td>Input Data</td>
     1770                        <td>
     1771                           <code>first line C second line CL third line L one more C nothing
     1772                           left</code>
     1773                        </td>
     1774                     </tr>
     1775                     <tr valign="top">
     1776                        <td>CR</td>
     1777                        <td>
     1778                           <code>-----------1-------------1------------------------1-------------</code>
     1779                        </td>
     1780                     </tr>
     1781                     <tr valign="top">
     1782                        <td>LF</td>
     1783                        <td>
     1784                           <code>--------------------------1------------1------------------------</code>
     1785                        </td>
     1786                     </tr>
     1787                     <tr valign="top">
     1788                        <td>Delmask</td>
     1789                        <td>
     1790                           <code>-------------------------1--------------------------------------</code>
     1791                        </td>
     1792                     </tr>
     1793                  </tbody>
     1794               </table>
     1795
     1796            </para>
     1797         </section>
     1798
    4791799      </section>
    4801800
    481       <section>
    482          <title>XML 1.0 End-of-line Handling Streams</title>
    483          <para>In XML 1.0 the two-character sequence CR LF (carriage return, line feed) together
    484             with any CR character not followed by a LF character must be converted to a single LF
    485             character [<xref linkend="XML10"/>].</para>
    486          <para>By defining carriage return, line feed, and carriage return line feed bit streams,
    487             dentoted CR, LF and CRLF respectively, end-of-line normalization processing can be
    488             performed in parallel, using only a small number of logical and shift operations.</para>
    489          <para/>
    490          <para>The following example demonstrates the generation of the CRLF deletion mask. In this
    491             example, the position of all CR characters followed by LF characters are marked for
    492             deletion. Isolated carriage returns are then replaced with LF characters. Completion of
    493             this process satisfies the XML 1.0 end-of-line handling requirements.</para>
    494          <para>
    495             <table>
    496                <caption>
    497                   <para>XML 1.0 End-of-line Handling</para>
    498                </caption>
    499                <colgroup><col align="left" valign="top" /></colgroup>
    500                <tbody>  <tr valign="top"><td>XML</td><td><code>first line C second line CL third line L one more C nothing left</code></td></tr>
    501                   <tr valign="top"><td>CR</td><td><code>-----------1-------------1------------------------1-------------</code></td></tr>
    502                   <tr valign="top"><td>LF</td><td><code>--------------------------1------------1------------------------</code></td></tr>
    503                   <tr valign="top"><td>Delmask</td><td><code>-------------------------1--------------------------------------</code></td></tr>
    504                </tbody>
    505             </table>
    506            
    507          </para>
    508       </section>
     1801      <!-- Comment Processing Instruction and CDATA Section Streams ??? -->
    5091802
    5101803      <section>
     
    5171810            the positions of all non-interpreted XML markup for deletion.</para>
    5181811         <para>The following tables provides an example of marking comment extents. <table>
    519             <caption>
    520                <para>Comment, Processing Instuction and CDATA Streams</para>
    521             </caption>
    522             <colgroup><col align="left" valign="top" /></colgroup>
    523             <tbody>     <tr valign="top"><td>XML</td><td><code>&lt;!-- do a&amp;b --&gt; &lt;?php f(a&amp;b) ?&gt; &lt;!-- show x&lt;&lt;1 --&gt;&lt;![CDATA[abcdedf x&lt;&lt;1 ]]&gt;</code></td></tr>
    524                <tr valign="top"><td>Comment</td><td><code>111111111111111-----------------111111111111111111-------------------------</code></td></tr>
    525                <tr valign="top"><td>CDATA</td><td><code>--------------------------------------------------1111111111111111111111111</code></td></tr>
    526                <tr valign="top"><td>PI</td><td><code>----------------111111111111111--------------------------------------------</code></td></tr>
    527             </tbody>
    528          </table>
    529            
     1812               <caption>
     1813                  <para>Comment, Processing Instuction and CDATA Streams</para>
     1814               </caption>
     1815               <colgroup>
     1816                  <col align="left" valign="top"/>
     1817               </colgroup>
     1818               <tbody>
     1819                  <tr valign="top">
     1820                     <td>Input Data</td>
     1821                     <td>
     1822                        <code>&lt;!-- do a&amp;b --&gt; &lt;?php f(a&amp;b)
     1823                           ?&gt; &lt;!-- show x&lt;&lt;1
     1824                           --&gt;&lt;![CDATA[abcdedf x&lt;&lt;1 ]]&gt;</code>
     1825                     </td>
     1826                  </tr>
     1827                  <tr valign="top">
     1828                     <td>Comment</td>
     1829                     <td>
     1830                        <code>111111111111111-----------------111111111111111111-------------------------</code>
     1831                     </td>
     1832                  </tr>
     1833                  <tr valign="top">
     1834                     <td>CDATA</td>
     1835                     <td>
     1836                        <code>--------------------------------------------------1111111111111111111111111</code>
     1837                     </td>
     1838                  </tr>
     1839                  <tr valign="top">
     1840                     <td>PI</td>
     1841                     <td>
     1842                        <code>----------------111111111111111--------------------------------------------</code>
     1843                     </td>
     1844                  </tr>
     1845               </tbody>
     1846            </table>
    5301847         </para>
    5311848         <para> With the removal of all non-interpreteable markup, several phases of parallel bit
     
    5671884            <table>
    5681885               <caption>
    569                   <para>Call Out Streams for Parallel Parsing</para>
     1886                  <para>Parallel Parsing Call Out Streams</para>
    5701887               </caption>
    571                <colgroup><col align="left" valign="top" /></colgroup>
    572                <tbody>  <tr valign="top"><td>XML</td><td><code>&lt;first att1=&quot;val1&quot;&gt;&lt;second/&gt;&lt;third wrong=value&gt;some text&lt;/third&gt;&lt;/first/&gt;</code></td></tr>
    573                   <tr valign="top"><td>ElemNamePositions</td><td><code>-1------------------1--------1-------------------------------------------</code></td></tr>
    574                   <tr valign="top"><td>ElemNameFollows</td><td><code>------1-------------------1-------1--------------------------------------</code></td></tr>
    575                   <tr valign="top"><td>STagEnds</td><td><code>------------------1------------------------------------------------------</code></td></tr>
    576                   <tr valign="top"><td>EmptyTagEnds</td><td><code>---------------------------1---------------------------------------------</code></td></tr>
    577                   <tr valign="top"><td>ParseError</td><td><code>-----------------------------------------1-----------------------------1-</code></td></tr>
    578                   <tr valign="top"><td>AttNameStarts</td><td><code>-------1---------------------------1-------------------------------------</code></td></tr>
    579                   <tr valign="top"><td>AttNameFollows</td><td><code>-----------1----------------------------1--------------------------------</code></td></tr>
    580                   <tr valign="top"><td>AttValStarts</td><td><code>------------1----------------------------1-------------------------------</code></td></tr>
    581                   <tr valign="top"><td>AttValEnds</td><td><code>-----------------1-------------------------------------------------------</code></td></tr>
    582                   <tr valign="top"><td>EndTagSeconds</td><td><code>---------------------------------------------------------1-------1-------</code></td></tr>
    583                   <tr valign="top"><td>EndTagEnds</td><td><code>---------------------------------------------------------------1-------1-</code></td></tr>
     1888               <colgroup>
     1889                  <col align="left" valign="top"/>
     1890               </colgroup>
     1891               <tbody>
     1892                  <tr valign="top">
     1893                     <td>Input Data</td>
     1894                     <td>
     1895                        <code>&lt;first
     1896                           att1=&quot;val1&quot;&gt;&lt;second/&gt;&lt;third
     1897                           wrong=value&gt;some
     1898                        text&lt;/third&gt;&lt;/first/&gt;</code>
     1899                     </td>
     1900                  </tr>
     1901                  <tr valign="top">
     1902                     <td>ElemNamePositions</td>
     1903                     <td>
     1904                        <code>-1------------------1--------1-------------------------------------------</code>
     1905                     </td>
     1906                  </tr>
     1907                  <tr valign="top">
     1908                     <td>ElemNameFollows</td>
     1909                     <td>
     1910                        <code>------1-------------------1-------1--------------------------------------</code>
     1911                     </td>
     1912                  </tr>
     1913                  <tr valign="top">
     1914                     <td>STagEnds</td>
     1915                     <td>
     1916                        <code>------------------1------------------------------------------------------</code>
     1917                     </td>
     1918                  </tr>
     1919                  <tr valign="top">
     1920                     <td>EmptyTagEnds</td>
     1921                     <td>
     1922                        <code>---------------------------1---------------------------------------------</code>
     1923                     </td>
     1924                  </tr>
     1925                  <tr valign="top">
     1926                     <td>ParseError</td>
     1927                     <td>
     1928                        <code>-----------------------------------------1-----------------------------1-</code>
     1929                     </td>
     1930                  </tr>
     1931                  <tr valign="top">
     1932                     <td>AttNameStarts</td>
     1933                     <td>
     1934                        <code>-------1---------------------------1-------------------------------------</code>
     1935                     </td>
     1936                  </tr>
     1937                  <tr valign="top">
     1938                     <td>AttNameFollows</td>
     1939                     <td>
     1940                        <code>-----------1----------------------------1--------------------------------</code>
     1941                     </td>
     1942                  </tr>
     1943                  <tr valign="top">
     1944                     <td>AttValStarts</td>
     1945                     <td>
     1946                        <code>------------1----------------------------1-------------------------------</code>
     1947                     </td>
     1948                  </tr>
     1949                  <tr valign="top">
     1950                     <td>AttValEnds</td>
     1951                     <td>
     1952                        <code>-----------------1-------------------------------------------------------</code>
     1953                     </td>
     1954                  </tr>
     1955                  <tr valign="top">
     1956                     <td>EndTagSeconds</td>
     1957                     <td>
     1958                        <code>---------------------------------------------------------1-------1-------</code>
     1959                     </td>
     1960                  </tr>
     1961                  <tr valign="top">
     1962                     <td>EndTagEnds</td>
     1963                     <td>
     1964                        <code>---------------------------------------------------------------1-------1-</code>
     1965                     </td>
     1966                  </tr>
    5841967               </tbody>
    5851968            </table>
     
    9172300         or commercial models. </para>
    9182301   </section>
    919    
     2302
    9202303   <section>
    9212304      <title>Acknowledgments</title>
     
    9262309         processing. </para>
    9272310   </section>
    928    
     2311
    9292312   <bibliography>
    9302313      <title>Bibliography</title>
     
    9682351      <bibliomixed xml:id="Unicode" xreflabel="Unicode">The Unicode Consortium. 2009. On the Web at
    9692352            <link>http://unicode.org/</link>.</bibliomixed>
    970       <bibliomixed xml:id="Pex06" xreflabel="Hilewitz and Lee 2006"> Hilewitz, Y. and Ruby B. Lee. 2006.
    971          Fast Bit Compression and Expansion with Parallel Extract and Parallel Deposit Instructions.
    972          Proceedings of the IEEE 17th International Conference on Application-Specific Systems,
    973          Architectures and Processors (ASAP), pp. 65-72, September 11-13, 2006.</bibliomixed>
     2353      <bibliomixed xml:id="Pex06" xreflabel="Hilewitz and Lee 2006"> Hilewitz, Y. and Ruby B. Lee.
     2354         2006. Fast Bit Compression and Expansion with Parallel Extract and Parallel Deposit
     2355         Instructions. Proceedings of the IEEE 17th International Conference on Application-Specific
     2356         Systems, Architectures and Processors (ASAP), pp. 65-72, September 11-13, 2006.</bibliomixed>
    9742357      <bibliomixed xml:id="InfoSet" xreflabel="XML Infoset">XML Information Set (Second Edition) W3C
    9752358         Recommendation 4 February 2004. On the Web at
Note: See TracChangeset for help on using the changeset viewer.