Annotation of XML/parserInternals.h, revision 1.10

1.1       daniel      1: /*
                      2:  * parserInternals.h : internals routines exported by the parser.
                      3:  *
                      4:  * See Copyright for the status of this software.
                      5:  *
                      6:  * Daniel.Veillard@w3.org
                      7:  */
                      8: 
                      9: #ifndef __XML_PARSER_INTERNALS_H__
                     10: #define __XML_PARSER_INTERNALS_H__
                     11: 
                     12: #include "parser.h"
                     13: 
                     14: #ifdef __cplusplus
                     15: extern "C" {
                     16: #endif
                     17: 
1.2       daniel     18: /**
1.3       daniel     19:  * A few macros needed to help building the parser.
                     20:  */
                     21: 
                     22: #ifdef UNICODE
                     23: /************************************************************************
                     24:  *                                                                     *
                     25:  * UNICODE version of the macros.                                              *
                     26:  *                                                                     *
                     27:  ************************************************************************/
                     28: /*
                     29:  * [2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
                     30:  *                  | [#x10000-#x10FFFF]
                     31:  * any Unicode character, excluding the surrogate blocks, FFFE, and FFFF.
                     32:  */
                     33: #define IS_CHAR(c)                                                     \
                     34:     ((((c) == 0x09) || ((c) == 0x0a) || ((c) == 0x0d) ||               \
                     35:       (((c) >= 0x20) && ((c) != 0xFFFE) && ((c) != 0xFFFF))) &&                \
                     36:       (((c) <= 0xD7FF) || ((c) >= 0xE000)) && ((c) >= 0) &&            \
                     37:       ((c) <= 0x10FFFF))
                     38: 
                     39: /*
                     40:  * [3] S ::= (#x20 | #x9 | #xD | #xA)+
                     41:  */
                     42: #define IS_BLANK(c) (((c) == 0x20) || ((c) == 0x09) || ((c) == 0xa) || \
                     43:                      ((c) == 0x0D))
                     44: 
                     45: /*
                     46:  * [85] BaseChar ::= ... long list see REC ...
                     47:  *
                     48:  * VI is your friend !
                     49:  * :1,$ s/\[#x\([0-9A-Z]*\)-#x\([0-9A-Z]*\)\]/     (((c) >= 0x\1) \&\& ((c) <= 0x\2)) ||/
                     50:  * and 
                     51:  * :1,$ s/#x\([0-9A-Z]*\)/     ((c) == 0x\1) ||/
                     52:  */
                     53: #define IS_BASECHAR(c)                                                 \
                     54:      ((((c) >= 0x0041) && ((c) <= 0x005A)) ||                          \
                     55:       (((c) >= 0x0061) && ((c) <= 0x007A)) ||                          \
                     56:       (((c) >= 0x00C0) && ((c) <= 0x00D6)) ||                          \
                     57:       (((c) >= 0x00D8) && ((c) <= 0x00F6)) ||                          \
                     58:       (((c) >= 0x00F8) && ((c) <= 0x00FF)) ||                          \
                     59:       (((c) >= 0x0100) && ((c) <= 0x0131)) ||                          \
                     60:       (((c) >= 0x0134) && ((c) <= 0x013E)) ||                          \
                     61:       (((c) >= 0x0141) && ((c) <= 0x0148)) ||                          \
                     62:       (((c) >= 0x014A) && ((c) <= 0x017E)) ||                          \
                     63:       (((c) >= 0x0180) && ((c) <= 0x01C3)) ||                          \
                     64:       (((c) >= 0x01CD) && ((c) <= 0x01F0)) ||                          \
                     65:       (((c) >= 0x01F4) && ((c) <= 0x01F5)) ||                          \
                     66:       (((c) >= 0x01FA) && ((c) <= 0x0217)) ||                          \
                     67:       (((c) >= 0x0250) && ((c) <= 0x02A8)) ||                          \
                     68:       (((c) >= 0x02BB) && ((c) <= 0x02C1)) ||                          \
                     69:       ((c) == 0x0386) ||                                               \
                     70:       (((c) >= 0x0388) && ((c) <= 0x038A)) ||                          \
                     71:       ((c) == 0x038C) ||                                               \
                     72:       (((c) >= 0x038E) && ((c) <= 0x03A1)) ||                          \
                     73:       (((c) >= 0x03A3) && ((c) <= 0x03CE)) ||                          \
                     74:       (((c) >= 0x03D0) && ((c) <= 0x03D6)) ||                          \
                     75:       ((c) == 0x03DA) ||                                               \
                     76:       ((c) == 0x03DC) ||                                               \
                     77:       ((c) == 0x03DE) ||                                               \
                     78:       ((c) == 0x03E0) ||                                               \
                     79:       (((c) >= 0x03E2) && ((c) <= 0x03F3)) ||                          \
                     80:       (((c) >= 0x0401) && ((c) <= 0x040C)) ||                          \
                     81:       (((c) >= 0x040E) && ((c) <= 0x044F)) ||                          \
                     82:       (((c) >= 0x0451) && ((c) <= 0x045C)) ||                          \
                     83:       (((c) >= 0x045E) && ((c) <= 0x0481)) ||                          \
                     84:       (((c) >= 0x0490) && ((c) <= 0x04C4)) ||                          \
                     85:       (((c) >= 0x04C7) && ((c) <= 0x04C8)) ||                          \
                     86:       (((c) >= 0x04CB) && ((c) <= 0x04CC)) ||                          \
                     87:       (((c) >= 0x04D0) && ((c) <= 0x04EB)) ||                          \
                     88:       (((c) >= 0x04EE) && ((c) <= 0x04F5)) ||                          \
                     89:       (((c) >= 0x04F8) && ((c) <= 0x04F9)) ||                          \
                     90:       (((c) >= 0x0531) && ((c) <= 0x0556)) ||                          \
                     91:       ((c) == 0x0559) ||                                               \
                     92:       (((c) >= 0x0561) && ((c) <= 0x0586)) ||                          \
                     93:       (((c) >= 0x05D0) && ((c) <= 0x05EA)) ||                          \
                     94:       (((c) >= 0x05F0) && ((c) <= 0x05F2)) ||                          \
                     95:       (((c) >= 0x0621) && ((c) <= 0x063A)) ||                          \
                     96:       (((c) >= 0x0641) && ((c) <= 0x064A)) ||                          \
                     97:       (((c) >= 0x0671) && ((c) <= 0x06B7)) ||                          \
                     98:       (((c) >= 0x06BA) && ((c) <= 0x06BE)) ||                          \
                     99:       (((c) >= 0x06C0) && ((c) <= 0x06CE)) ||                          \
                    100:       (((c) >= 0x06D0) && ((c) <= 0x06D3)) ||                          \
                    101:       ((c) == 0x06D5) ||                                               \
                    102:       (((c) >= 0x06E5) && ((c) <= 0x06E6)) ||                          \
                    103:       (((c) >= 0x0905) && ((c) <= 0x0939)) ||                          \
                    104:       ((c) == 0x093D) ||                                               \
                    105:       (((c) >= 0x0958) && ((c) <= 0x0961)) ||                          \
                    106:       (((c) >= 0x0985) && ((c) <= 0x098C)) ||                          \
                    107:       (((c) >= 0x098F) && ((c) <= 0x0990)) ||                          \
                    108:       (((c) >= 0x0993) && ((c) <= 0x09A8)) ||                          \
                    109:       (((c) >= 0x09AA) && ((c) <= 0x09B0)) ||                          \
                    110:       ((c) == 0x09B2) ||                                               \
                    111:       (((c) >= 0x09B6) && ((c) <= 0x09B9)) ||                          \
                    112:       (((c) >= 0x09DC) && ((c) <= 0x09DD)) ||                          \
                    113:       (((c) >= 0x09DF) && ((c) <= 0x09E1)) ||                          \
                    114:       (((c) >= 0x09F0) && ((c) <= 0x09F1)) ||                          \
                    115:       (((c) >= 0x0A05) && ((c) <= 0x0A0A)) ||                          \
                    116:       (((c) >= 0x0A0F) && ((c) <= 0x0A10)) ||                          \
                    117:       (((c) >= 0x0A13) && ((c) <= 0x0A28)) ||                          \
                    118:       (((c) >= 0x0A2A) && ((c) <= 0x0A30)) ||                          \
                    119:       (((c) >= 0x0A32) && ((c) <= 0x0A33)) ||                          \
                    120:       (((c) >= 0x0A35) && ((c) <= 0x0A36)) ||                          \
                    121:       (((c) >= 0x0A38) && ((c) <= 0x0A39)) ||                          \
                    122:       (((c) >= 0x0A59) && ((c) <= 0x0A5C)) ||                          \
                    123:       ((c) == 0x0A5E) ||                                               \
                    124:       (((c) >= 0x0A72) && ((c) <= 0x0A74)) ||                          \
                    125:       (((c) >= 0x0A85) && ((c) <= 0x0A8B)) ||                          \
                    126:       ((c) == 0x0A8D) ||                                               \
                    127:       (((c) >= 0x0A8F) && ((c) <= 0x0A91)) ||                          \
                    128:       (((c) >= 0x0A93) && ((c) <= 0x0AA8)) ||                          \
                    129:       (((c) >= 0x0AAA) && ((c) <= 0x0AB0)) ||                          \
                    130:       (((c) >= 0x0AB2) && ((c) <= 0x0AB3)) ||                          \
                    131:       (((c) >= 0x0AB5) && ((c) <= 0x0AB9)) ||                          \
                    132:       ((c) == 0x0ABD) ||                                               \
                    133:       ((c) == 0x0AE0) ||                                               \
                    134:       (((c) >= 0x0B05) && ((c) <= 0x0B0C)) ||                          \
                    135:       (((c) >= 0x0B0F) && ((c) <= 0x0B10)) ||                          \
                    136:       (((c) >= 0x0B13) && ((c) <= 0x0B28)) ||                          \
                    137:       (((c) >= 0x0B2A) && ((c) <= 0x0B30)) ||                          \
                    138:       (((c) >= 0x0B32) && ((c) <= 0x0B33)) ||                          \
                    139:       (((c) >= 0x0B36) && ((c) <= 0x0B39)) ||                          \
                    140:       ((c) == 0x0B3D) ||                                               \
                    141:       (((c) >= 0x0B5C) && ((c) <= 0x0B5D)) ||                          \
                    142:       (((c) >= 0x0B5F) && ((c) <= 0x0B61)) ||                          \
                    143:       (((c) >= 0x0B85) && ((c) <= 0x0B8A)) ||                          \
                    144:       (((c) >= 0x0B8E) && ((c) <= 0x0B90)) ||                          \
                    145:       (((c) >= 0x0B92) && ((c) <= 0x0B95)) ||                          \
                    146:       (((c) >= 0x0B99) && ((c) <= 0x0B9A)) ||                          \
                    147:       ((c) == 0x0B9C) ||                                               \
                    148:       (((c) >= 0x0B9E) && ((c) <= 0x0B9F)) ||                          \
                    149:       (((c) >= 0x0BA3) && ((c) <= 0x0BA4)) ||                          \
                    150:       (((c) >= 0x0BA8) && ((c) <= 0x0BAA)) ||                          \
                    151:       (((c) >= 0x0BAE) && ((c) <= 0x0BB5)) ||                          \
                    152:       (((c) >= 0x0BB7) && ((c) <= 0x0BB9)) ||                          \
                    153:       (((c) >= 0x0C05) && ((c) <= 0x0C0C)) ||                          \
                    154:       (((c) >= 0x0C0E) && ((c) <= 0x0C10)) ||                          \
                    155:       (((c) >= 0x0C12) && ((c) <= 0x0C28)) ||                          \
                    156:       (((c) >= 0x0C2A) && ((c) <= 0x0C33)) ||                          \
                    157:       (((c) >= 0x0C35) && ((c) <= 0x0C39)) ||                          \
                    158:       (((c) >= 0x0C60) && ((c) <= 0x0C61)) ||                          \
                    159:       (((c) >= 0x0C85) && ((c) <= 0x0C8C)) ||                          \
                    160:       (((c) >= 0x0C8E) && ((c) <= 0x0C90)) ||                          \
                    161:       (((c) >= 0x0C92) && ((c) <= 0x0CA8)) ||                          \
                    162:       (((c) >= 0x0CAA) && ((c) <= 0x0CB3)) ||                          \
                    163:       (((c) >= 0x0CB5) && ((c) <= 0x0CB9)) ||                          \
                    164:       ((c) == 0x0CDE) ||                                               \
                    165:       (((c) >= 0x0CE0) && ((c) <= 0x0CE1)) ||                          \
                    166:       (((c) >= 0x0D05) && ((c) <= 0x0D0C)) ||                          \
                    167:       (((c) >= 0x0D0E) && ((c) <= 0x0D10)) ||                          \
                    168:       (((c) >= 0x0D12) && ((c) <= 0x0D28)) ||                          \
                    169:       (((c) >= 0x0D2A) && ((c) <= 0x0D39)) ||                          \
                    170:       (((c) >= 0x0D60) && ((c) <= 0x0D61)) ||                          \
                    171:       (((c) >= 0x0E01) && ((c) <= 0x0E2E)) ||                          \
                    172:       ((c) == 0x0E30) ||                                               \
                    173:       (((c) >= 0x0E32) && ((c) <= 0x0E33)) ||                          \
                    174:       (((c) >= 0x0E40) && ((c) <= 0x0E45)) ||                          \
                    175:       (((c) >= 0x0E81) && ((c) <= 0x0E82)) ||                          \
                    176:       ((c) == 0x0E84) ||                                               \
                    177:       (((c) >= 0x0E87) && ((c) <= 0x0E88)) ||                          \
                    178:       ((c) == 0x0E8A) ||                                               \
                    179:       ((c) == 0x0E8D) ||                                               \
                    180:       (((c) >= 0x0E94) && ((c) <= 0x0E97)) ||                          \
                    181:       (((c) >= 0x0E99) && ((c) <= 0x0E9F)) ||                          \
                    182:       (((c) >= 0x0EA1) && ((c) <= 0x0EA3)) ||                          \
                    183:       ((c) == 0x0EA5) ||                                               \
                    184:       ((c) == 0x0EA7) ||                                               \
                    185:       (((c) >= 0x0EAA) && ((c) <= 0x0EAB)) ||                          \
                    186:       (((c) >= 0x0EAD) && ((c) <= 0x0EAE)) ||                          \
                    187:       ((c) == 0x0EB0) ||                                               \
                    188:       (((c) >= 0x0EB2) && ((c) <= 0x0EB3)) ||                          \
                    189:       ((c) == 0x0EBD) ||                                               \
                    190:       (((c) >= 0x0EC0) && ((c) <= 0x0EC4)) ||                          \
                    191:       (((c) >= 0x0F40) && ((c) <= 0x0F47)) ||                          \
                    192:       (((c) >= 0x0F49) && ((c) <= 0x0F69)) ||                          \
                    193:       (((c) >= 0x10A0) && ((c) <= 0x10C5)) ||                          \
                    194:       (((c) >= 0x10D0) && ((c) <= 0x10F6)) ||                          \
                    195:       ((c) == 0x1100) ||                                               \
                    196:       (((c) >= 0x1102) && ((c) <= 0x1103)) ||                          \
                    197:       (((c) >= 0x1105) && ((c) <= 0x1107)) ||                          \
                    198:       ((c) == 0x1109) ||                                               \
                    199:       (((c) >= 0x110B) && ((c) <= 0x110C)) ||                          \
                    200:       (((c) >= 0x110E) && ((c) <= 0x1112)) ||                          \
                    201:       ((c) == 0x113C) ||                                               \
                    202:       ((c) == 0x113E) ||                                               \
                    203:       ((c) == 0x1140) ||                                               \
                    204:       ((c) == 0x114C) ||                                               \
                    205:       ((c) == 0x114E) ||                                               \
                    206:       ((c) == 0x1150) ||                                               \
                    207:       (((c) >= 0x1154) && ((c) <= 0x1155)) ||                          \
                    208:       ((c) == 0x1159) ||                                               \
                    209:       (((c) >= 0x115F) && ((c) <= 0x1161)) ||                          \
                    210:       ((c) == 0x1163) ||                                               \
                    211:       ((c) == 0x1165) ||                                               \
                    212:       ((c) == 0x1167) ||                                               \
                    213:       ((c) == 0x1169) ||                                               \
                    214:       (((c) >= 0x116D) && ((c) <= 0x116E)) ||                          \
                    215:       (((c) >= 0x1172) && ((c) <= 0x1173)) ||                          \
                    216:       ((c) == 0x1175) ||                                               \
                    217:       ((c) == 0x119E) ||                                               \
                    218:       ((c) == 0x11A8) ||                                               \
                    219:       ((c) == 0x11AB) ||                                               \
                    220:       (((c) >= 0x11AE) && ((c) <= 0x11AF)) ||                          \
                    221:       (((c) >= 0x11B7) && ((c) <= 0x11B8)) ||                          \
                    222:       ((c) == 0x11BA) ||                                               \
                    223:       (((c) >= 0x11BC) && ((c) <= 0x11C2)) ||                          \
                    224:       ((c) == 0x11EB) ||                                               \
                    225:       ((c) == 0x11F0) ||                                               \
                    226:       ((c) == 0x11F9) ||                                               \
                    227:       (((c) >= 0x1E00) && ((c) <= 0x1E9B)) ||                          \
                    228:       (((c) >= 0x1EA0) && ((c) <= 0x1EF9)) ||                          \
                    229:       (((c) >= 0x1F00) && ((c) <= 0x1F15)) ||                          \
                    230:       (((c) >= 0x1F18) && ((c) <= 0x1F1D)) ||                          \
                    231:       (((c) >= 0x1F20) && ((c) <= 0x1F45)) ||                          \
                    232:       (((c) >= 0x1F48) && ((c) <= 0x1F4D)) ||                          \
                    233:       (((c) >= 0x1F50) && ((c) <= 0x1F57)) ||                          \
                    234:       ((c) == 0x1F59) ||                                               \
                    235:       ((c) == 0x1F5B) ||                                               \
                    236:       ((c) == 0x1F5D) ||                                               \
                    237:       (((c) >= 0x1F5F) && ((c) <= 0x1F7D)) ||                          \
                    238:       (((c) >= 0x1F80) && ((c) <= 0x1FB4)) ||                          \
                    239:       (((c) >= 0x1FB6) && ((c) <= 0x1FBC)) ||                          \
                    240:       ((c) == 0x1FBE) ||                                               \
                    241:       (((c) >= 0x1FC2) && ((c) <= 0x1FC4)) ||                          \
                    242:       (((c) >= 0x1FC6) && ((c) <= 0x1FCC)) ||                          \
                    243:       (((c) >= 0x1FD0) && ((c) <= 0x1FD3)) ||                          \
                    244:       (((c) >= 0x1FD6) && ((c) <= 0x1FDB)) ||                          \
                    245:       (((c) >= 0x1FE0) && ((c) <= 0x1FEC)) ||                          \
                    246:       (((c) >= 0x1FF2) && ((c) <= 0x1FF4)) ||                          \
                    247:       (((c) >= 0x1FF6) && ((c) <= 0x1FFC)) ||                          \
                    248:       ((c) == 0x2126) ||                                               \
                    249:       (((c) >= 0x212A) && ((c) <= 0x212B)) ||                          \
                    250:       ((c) == 0x212E) ||                                               \
                    251:       (((c) >= 0x2180) && ((c) <= 0x2182)) ||                          \
                    252:       (((c) >= 0x3041) && ((c) <= 0x3094)) ||                          \
                    253:       (((c) >= 0x30A1) && ((c) <= 0x30FA)) ||                          \
                    254:       (((c) >= 0x3105) && ((c) <= 0x312C)) ||                          \
                    255:       (((c) >= 0xAC00) && ((c) <= 0xD7A3)))
                    256: 
                    257: /*
                    258:  * [88] Digit ::= ... long list see REC ...
                    259:  */
                    260: #define IS_DIGIT(c)                                                    \
                    261:      ((((c) >= 0x0030) && ((c) <= 0x0039)) ||                          \
                    262:       (((c) >= 0x0660) && ((c) <= 0x0669)) ||                          \
                    263:       (((c) >= 0x06F0) && ((c) <= 0x06F9)) ||                          \
                    264:       (((c) >= 0x0966) && ((c) <= 0x096F)) ||                          \
                    265:       (((c) >= 0x09E6) && ((c) <= 0x09EF)) ||                          \
                    266:       (((c) >= 0x0A66) && ((c) <= 0x0A6F)) ||                          \
                    267:       (((c) >= 0x0AE6) && ((c) <= 0x0AEF)) ||                          \
                    268:       (((c) >= 0x0B66) && ((c) <= 0x0B6F)) ||                          \
                    269:       (((c) >= 0x0BE7) && ((c) <= 0x0BEF)) ||                          \
                    270:       (((c) >= 0x0C66) && ((c) <= 0x0C6F)) ||                          \
                    271:       (((c) >= 0x0CE6) && ((c) <= 0x0CEF)) ||                          \
                    272:       (((c) >= 0x0D66) && ((c) <= 0x0D6F)) ||                          \
                    273:       (((c) >= 0x0E50) && ((c) <= 0x0E59)) ||                          \
                    274:       (((c) >= 0x0ED0) && ((c) <= 0x0ED9)) ||                          \
                    275:       (((c) >= 0x0F20) && ((c) <= 0x0F29)))
                    276: 
                    277: /*
                    278:  * [87] CombiningChar ::= ... long list see REC ...
                    279:  */
                    280: #define IS_COMBINING(c)                                                \
                    281:      ((((c) >= 0x0300) && ((c) <= 0x0345)) ||                          \
                    282:       (((c) >= 0x0360) && ((c) <= 0x0361)) ||                          \
                    283:       (((c) >= 0x0483) && ((c) <= 0x0486)) ||                          \
                    284:       (((c) >= 0x0591) && ((c) <= 0x05A1)) ||                          \
                    285:       (((c) >= 0x05A3) && ((c) <= 0x05B9)) ||                          \
                    286:       (((c) >= 0x05BB) && ((c) <= 0x05BD)) ||                          \
                    287:       ((c) == 0x05BF) ||                                               \
                    288:       (((c) >= 0x05C1) && ((c) <= 0x05C2)) ||                          \
                    289:       ((c) == 0x05C4) ||                                               \
                    290:       (((c) >= 0x064B) && ((c) <= 0x0652)) ||                          \
                    291:       ((c) == 0x0670) ||                                               \
                    292:       (((c) >= 0x06D6) && ((c) <= 0x06DC)) ||                          \
                    293:       (((c) >= 0x06DD) && ((c) <= 0x06DF)) ||                          \
                    294:       (((c) >= 0x06E0) && ((c) <= 0x06E4)) ||                          \
                    295:       (((c) >= 0x06E7) && ((c) <= 0x06E8)) ||                          \
                    296:       (((c) >= 0x06EA) && ((c) <= 0x06ED)) ||                          \
                    297:       (((c) >= 0x0901) && ((c) <= 0x0903)) ||                          \
                    298:       ((c) == 0x093C) ||                                               \
                    299:       (((c) >= 0x093E) && ((c) <= 0x094C)) ||                          \
                    300:       ((c) == 0x094D) ||                                               \
                    301:       (((c) >= 0x0951) && ((c) <= 0x0954)) ||                          \
                    302:       (((c) >= 0x0962) && ((c) <= 0x0963)) ||                          \
                    303:       (((c) >= 0x0981) && ((c) <= 0x0983)) ||                          \
                    304:       ((c) == 0x09BC) ||                                               \
                    305:       ((c) == 0x09BE) ||                                               \
                    306:       ((c) == 0x09BF) ||                                               \
                    307:       (((c) >= 0x09C0) && ((c) <= 0x09C4)) ||                          \
                    308:       (((c) >= 0x09C7) && ((c) <= 0x09C8)) ||                          \
                    309:       (((c) >= 0x09CB) && ((c) <= 0x09CD)) ||                          \
                    310:       ((c) == 0x09D7) ||                                               \
                    311:       (((c) >= 0x09E2) && ((c) <= 0x09E3)) ||                          \
                    312:       ((c) == 0x0A02) ||                                               \
                    313:       ((c) == 0x0A3C) ||                                               \
                    314:       ((c) == 0x0A3E) ||                                               \
                    315:       ((c) == 0x0A3F) ||                                               \
                    316:       (((c) >= 0x0A40) && ((c) <= 0x0A42)) ||                          \
                    317:       (((c) >= 0x0A47) && ((c) <= 0x0A48)) ||                          \
                    318:       (((c) >= 0x0A4B) && ((c) <= 0x0A4D)) ||                          \
                    319:       (((c) >= 0x0A70) && ((c) <= 0x0A71)) ||                          \
                    320:       (((c) >= 0x0A81) && ((c) <= 0x0A83)) ||                          \
                    321:       ((c) == 0x0ABC) ||                                               \
                    322:       (((c) >= 0x0ABE) && ((c) <= 0x0AC5)) ||                          \
                    323:       (((c) >= 0x0AC7) && ((c) <= 0x0AC9)) ||                          \
                    324:       (((c) >= 0x0ACB) && ((c) <= 0x0ACD)) ||                          \
                    325:       (((c) >= 0x0B01) && ((c) <= 0x0B03)) ||                          \
                    326:       ((c) == 0x0B3C) ||                                               \
                    327:       (((c) >= 0x0B3E) && ((c) <= 0x0B43)) ||                          \
                    328:       (((c) >= 0x0B47) && ((c) <= 0x0B48)) ||                          \
                    329:       (((c) >= 0x0B4B) && ((c) <= 0x0B4D)) ||                          \
                    330:       (((c) >= 0x0B56) && ((c) <= 0x0B57)) ||                          \
                    331:       (((c) >= 0x0B82) && ((c) <= 0x0B83)) ||                          \
                    332:       (((c) >= 0x0BBE) && ((c) <= 0x0BC2)) ||                          \
                    333:       (((c) >= 0x0BC6) && ((c) <= 0x0BC8)) ||                          \
                    334:       (((c) >= 0x0BCA) && ((c) <= 0x0BCD)) ||                          \
                    335:       ((c) == 0x0BD7) ||                                               \
                    336:       (((c) >= 0x0C01) && ((c) <= 0x0C03)) ||                          \
                    337:       (((c) >= 0x0C3E) && ((c) <= 0x0C44)) ||                          \
                    338:       (((c) >= 0x0C46) && ((c) <= 0x0C48)) ||                          \
                    339:       (((c) >= 0x0C4A) && ((c) <= 0x0C4D)) ||                          \
                    340:       (((c) >= 0x0C55) && ((c) <= 0x0C56)) ||                          \
                    341:       (((c) >= 0x0C82) && ((c) <= 0x0C83)) ||                          \
                    342:       (((c) >= 0x0CBE) && ((c) <= 0x0CC4)) ||                          \
                    343:       (((c) >= 0x0CC6) && ((c) <= 0x0CC8)) ||                          \
                    344:       (((c) >= 0x0CCA) && ((c) <= 0x0CCD)) ||                          \
                    345:       (((c) >= 0x0CD5) && ((c) <= 0x0CD6)) ||                          \
                    346:       (((c) >= 0x0D02) && ((c) <= 0x0D03)) ||                          \
                    347:       (((c) >= 0x0D3E) && ((c) <= 0x0D43)) ||                          \
                    348:       (((c) >= 0x0D46) && ((c) <= 0x0D48)) ||                          \
                    349:       (((c) >= 0x0D4A) && ((c) <= 0x0D4D)) ||                          \
                    350:       ((c) == 0x0D57) ||                                               \
                    351:       ((c) == 0x0E31) ||                                               \
                    352:       (((c) >= 0x0E34) && ((c) <= 0x0E3A)) ||                          \
                    353:       (((c) >= 0x0E47) && ((c) <= 0x0E4E)) ||                          \
                    354:       ((c) == 0x0EB1) ||                                               \
                    355:       (((c) >= 0x0EB4) && ((c) <= 0x0EB9)) ||                          \
                    356:       (((c) >= 0x0EBB) && ((c) <= 0x0EBC)) ||                          \
                    357:       (((c) >= 0x0EC8) && ((c) <= 0x0ECD)) ||                          \
                    358:       (((c) >= 0x0F18) && ((c) <= 0x0F19)) ||                          \
                    359:       ((c) == 0x0F35) ||                                               \
                    360:       ((c) == 0x0F37) ||                                               \
                    361:       ((c) == 0x0F39) ||                                               \
                    362:       ((c) == 0x0F3E) ||                                               \
                    363:       ((c) == 0x0F3F) ||                                               \
                    364:       (((c) >= 0x0F71) && ((c) <= 0x0F84)) ||                          \
                    365:       (((c) >= 0x0F86) && ((c) <= 0x0F8B)) ||                          \
                    366:       (((c) >= 0x0F90) && ((c) <= 0x0F95)) ||                          \
                    367:       ((c) == 0x0F97) ||                                               \
                    368:       (((c) >= 0x0F99) && ((c) <= 0x0FAD)) ||                          \
                    369:       (((c) >= 0x0FB1) && ((c) <= 0x0FB7)) ||                          \
                    370:       ((c) == 0x0FB9) ||                                               \
                    371:       (((c) >= 0x20D0) && ((c) <= 0x20DC)) ||                          \
                    372:       ((c) == 0x20E1) ||                                               \
                    373:       (((c) >= 0x302A) && ((c) <= 0x302F)) ||                          \
                    374:       ((c) == 0x3099) ||                                               \
                    375:       ((c) == 0x309A))
                    376: 
                    377: /*
                    378:  * [89] Extender ::= #x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 |
                    379:  *                   #x0E46 | #x0EC6 | #x3005 | [#x3031-#x3035] |
                    380:  *                   [#x309D-#x309E] | [#x30FC-#x30FE]
                    381:  */
                    382: #define IS_EXTENDER(c)                                                 \
                    383:     (((c) == 0xb7) || ((c) == 0x2d0) || ((c) == 0x2d1) ||              \
                    384:      ((c) == 0x387) || ((c) == 0x640) || ((c) == 0xe46) ||             \
                    385:      ((c) == 0xec6) || ((c) == 0x3005)                                 \
                    386:      (((c) >= 0x3031) && ((c) <= 0x3035)) ||                           \
                    387:      (((c) >= 0x309b) && ((c) <= 0x309e)) ||                           \
                    388:      (((c) >= 0x30fc) && ((c) <= 0x30fe)))
                    389: 
                    390: /*
                    391:  * [86] Ideographic ::= [#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029]
                    392:  */
                    393: #define IS_IDEOGRAPHIC(c)                                              \
                    394:     ((((c) >= 0x4e00) && ((c) <= 0x9fa5)) ||                           \
                    395:      (((c) >= 0xf900) && ((c) <= 0xfa2d)) ||                           \
                    396:      (((c) >= 0x3021) && ((c) <= 0x3029)) ||                           \
                    397:       ((c) == 0x3007))
                    398: 
                    399: /*
                    400:  * [84] Letter ::= BaseChar | Ideographic 
                    401:  */
                    402: #define IS_LETTER(c) (IS_BASECHAR(c) || IS_IDEOGRAPHIC(c))
                    403: 
                    404: #else
                    405: #ifndef USE_UTF_8
                    406: /************************************************************************
                    407:  *                                                                     *
                    408:  * 8bits / ISO-Latin version of the macros.                            *
                    409:  *                                                                     *
                    410:  ************************************************************************/
                    411: /*
                    412:  * [2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
                    413:  *                  | [#x10000-#x10FFFF]
                    414:  * any Unicode character, excluding the surrogate blocks, FFFE, and FFFF.
                    415:  */
                    416: #define IS_CHAR(c)                                                     \
                    417:     ((((c) == 0x09) || ((c) == 0x0a) || ((c) == 0x0d) ||               \
                    418:       (((c) >= 0x20) && ((c) != 0xFFFE) && ((c) != 0xFFFF))) &&                \
                    419:       (((c) <= 0xD7FF) || ((c) >= 0xE000)) && ((c) <= 0x10FFFF))
                    420: 
                    421: /*
                    422:  * [85] BaseChar ::= ... long list see REC ...
                    423:  */
                    424: #define IS_BASECHAR(c)                                                 \
                    425:     ((((c) >= 0x41) && ((c) <= 0x5a)) ||                               \
                    426:      (((c) >= 0x61) && ((c) <= 0x7a)) ||                               \
                    427:      (((c) >= 0xaa) && ((c) <= 0x5b)) ||                               \
                    428:      (((c) >= 0xc0) && ((c) <= 0xd6)) ||                               \
                    429:      (((c) >= 0xd8) && ((c) <= 0xf6)) ||                               \
                    430:      (((c) >= 0xf8) && ((c) <= 0xff)) ||                               \
                    431:       ((c) == 0xba))
                    432: 
                    433: /*
                    434:  * [88] Digit ::= ... long list see REC ...
                    435:  */
                    436: #define IS_DIGIT(c) (((c) >= 0x30) && ((c) <= 0x39))
                    437: 
                    438: /*
                    439:  * [84] Letter ::= BaseChar | Ideographic 
                    440:  */
                    441: #define IS_LETTER(c) IS_BASECHAR(c)
                    442: 
                    443: 
                    444: /*
                    445:  * [87] CombiningChar ::= ... long list see REC ...
                    446:  */
                    447: #define IS_COMBINING(c) 0
                    448: 
                    449: /*
                    450:  * [89] Extender ::= #x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 |
                    451:  *                   #x0E46 | #x0EC6 | #x3005 | [#x3031-#x3035] |
                    452:  *                   [#x309D-#x309E] | [#x30FC-#x30FE]
                    453:  */
                    454: #define IS_EXTENDER(c) ((c) == 0xb7)
                    455: 
                    456: #else /* USE_UTF_8 */
                    457: /************************************************************************
                    458:  *                                                                     *
                    459:  * 8bits / UTF-8 version of the macros.                                        *
                    460:  *                                                                     *
                    461:  ************************************************************************/
                    462: 
                    463: TODO !!!
                    464: #endif /* USE_UTF_8 */
                    465: #endif /* !UNICODE */
                    466: 
                    467: /*
                    468:  * Blank chars.
                    469:  *
                    470:  * [3] S ::= (#x20 | #x9 | #xD | #xA)+
                    471:  */
                    472: #define IS_BLANK(c) (((c) == 0x20) || ((c) == 0x09) || ((c) == 0xa) || \
                    473:                      ((c) == 0x0D))
                    474: 
                    475: /*
                    476:  * [13] PubidChar ::= #x20 | #xD | #xA | [a-zA-Z0-9] | [-'()+,./:=?;!*#@$_%]
                    477:  */
                    478: #define IS_PUBIDCHAR(c)                                                        \
                    479:     (((c) == 0x20) || ((c) == 0x0D) || ((c) == 0x0A) ||                        \
                    480:      (((c) >= 'a') && ((c) <= 'z')) ||                                 \
                    481:      (((c) >= 'A') && ((c) <= 'Z')) ||                                 \
                    482:      (((c) >= '0') && ((c) <= '9')) ||                                 \
                    483:      ((c) == '-') || ((c) == '\'') || ((c) == '(') || ((c) == ')') ||  \
                    484:      ((c) == '+') || ((c) == ',') || ((c) == '.') || ((c) == '/') ||   \
                    485:      ((c) == ':') || ((c) == '=') || ((c) == '?') || ((c) == ';') ||   \
                    486:      ((c) == '!') || ((c) == '*') || ((c) == '#') || ((c) == '@') ||   \
                    487:      ((c) == '$') || ((c) == '_') || ((c) == '%'))
                    488: 
                    489: #define SKIP_EOL(p)                                                    \
                    490:     if (*(p) == 0x13) { p++ ; if (*(p) == 0x10) p++; }                 \
                    491:     if (*(p) == 0x10) { p++ ; if (*(p) == 0x13) p++; }
                    492: 
                    493: #define MOVETO_ENDTAG(p)                                               \
                    494:     while (IS_CHAR(*p) && (*(p) != '>')) (p)++
                    495: 
                    496: #define MOVETO_STARTTAG(p)                                             \
                    497:     while (IS_CHAR(*p) && (*(p) != '<')) (p)++
1.8       daniel    498: 
                    499: /**
                    500:  * entity substitution default behaviour.
                    501:  */
                    502: 
                    503: int xmlSubstituteEntitiesDefaultValue;
                    504: 
1.3       daniel    505: /**
1.2       daniel    506:  * Parser context
                    507:  */
                    508: xmlParserCtxtPtr
                    509: xmlCreateDocParserCtxt(CHAR *cur);
                    510: xmlParserCtxtPtr
                    511: xmlCreateFileParserCtxt(const char *filename);
                    512: xmlParserCtxtPtr
                    513: xmlCreateMemoryParserCtxt(char *buffer, int size);
                    514: void
                    515: xmlFreeParserCtxt(xmlParserCtxtPtr ctxt);
                    516: 
                    517: /**
1.1       daniel    518:  * Entities
                    519:  */
                    520: void
                    521: xmlHandleEntity(xmlParserCtxtPtr ctxt, xmlEntityPtr entity);
                    522: 
1.2       daniel    523: /**
                    524:  * Input Streams
                    525:  */
                    526: xmlParserInputPtr
                    527: xmlNewEntityInputStream(xmlParserCtxtPtr ctxt, xmlEntityPtr entity);
                    528: void
                    529: xmlPushInput(xmlParserCtxtPtr ctxt, xmlParserInputPtr input);
                    530: CHAR
                    531: xmlPopInput(xmlParserCtxtPtr ctxt);
                    532: void
                    533: xmlFreeInputStream(xmlParserInputPtr input);
1.5       daniel    534: xmlParserInputPtr
1.8       daniel    535: xmlNewInputFromFile(xmlParserCtxtPtr ctxt, const char *filename);
1.2       daniel    536: 
                    537: /**
1.1       daniel    538:  * Namespaces.
                    539:  */
                    540: CHAR *
1.4       daniel    541: xmlSplitQName(const CHAR *name, CHAR **prefix);
                    542: CHAR *
1.1       daniel    543: xmlNamespaceParseNCName(xmlParserCtxtPtr ctxt);
                    544: CHAR *
                    545: xmlNamespaceParseQName(xmlParserCtxtPtr ctxt, CHAR **prefix);
                    546: CHAR *
                    547: xmlNamespaceParseNSDef(xmlParserCtxtPtr ctxt);
                    548: CHAR *
                    549: xmlParseQuotedString(xmlParserCtxtPtr ctxt);
                    550: void
                    551: xmlParseNamespace(xmlParserCtxtPtr ctxt);
                    552: 
1.2       daniel    553: /**
1.1       daniel    554:  * Generic production rules
                    555:  */
                    556: CHAR *
1.10    ! daniel    557: xmlScanName(xmlParserCtxtPtr ctxt);
        !           558: CHAR *
1.1       daniel    559: xmlParseName(xmlParserCtxtPtr ctxt);
                    560: CHAR *
                    561: xmlParseNmtoken(xmlParserCtxtPtr ctxt);
                    562: CHAR *
1.7       daniel    563: xmlParseEntityValue(xmlParserCtxtPtr ctxt, CHAR **orig);
1.1       daniel    564: CHAR *
                    565: xmlParseAttValue(xmlParserCtxtPtr ctxt);
                    566: CHAR *
                    567: xmlParseSystemLiteral(xmlParserCtxtPtr ctxt);
                    568: CHAR *
                    569: xmlParsePubidLiteral(xmlParserCtxtPtr ctxt);
                    570: void
                    571: xmlParseCharData(xmlParserCtxtPtr ctxt, int cdata);
                    572: CHAR *
                    573: xmlParseExternalID(xmlParserCtxtPtr ctxt, CHAR **publicID, int strict);
1.4       daniel    574: void 
1.1       daniel    575: xmlParseComment(xmlParserCtxtPtr ctxt, int create);
                    576: CHAR *
                    577: xmlParsePITarget(xmlParserCtxtPtr ctxt);
                    578: void
                    579: xmlParsePI(xmlParserCtxtPtr ctxt);
                    580: void
                    581: xmlParseNotationDecl(xmlParserCtxtPtr ctxt);
                    582: void
                    583: xmlParseEntityDecl(xmlParserCtxtPtr ctxt);
                    584: int
                    585: xmlParseDefaultDecl(xmlParserCtxtPtr ctxt, CHAR **value);
                    586: xmlEnumerationPtr
                    587: xmlParseNotationType(xmlParserCtxtPtr ctxt);
                    588: xmlEnumerationPtr
                    589: xmlParseEnumerationType(xmlParserCtxtPtr ctxt);
                    590: int
                    591: xmlParseEnumeratedType(xmlParserCtxtPtr ctxt, xmlEnumerationPtr *tree);
                    592: int
                    593: xmlParseAttributeType(xmlParserCtxtPtr ctxt, xmlEnumerationPtr *tree);
                    594: void
                    595: xmlParseAttributeListDecl(xmlParserCtxtPtr ctxt);
                    596: xmlElementContentPtr
                    597: xmlParseElementMixedContentDecl(xmlParserCtxtPtr ctxt);
                    598: xmlElementContentPtr
                    599: xmlParseElementChildrenContentDecl(xmlParserCtxtPtr ctxt);
                    600: int
                    601: xmlParseElementContentDecl(xmlParserCtxtPtr ctxt, CHAR *name,
                    602:                            xmlElementContentPtr *result);
                    603: int
                    604: xmlParseElementDecl(xmlParserCtxtPtr ctxt);
                    605: void
                    606: xmlParseMarkupDecl(xmlParserCtxtPtr ctxt);
1.6       daniel    607: int
1.1       daniel    608: xmlParseCharRef(xmlParserCtxtPtr ctxt);
1.6       daniel    609: xmlEntityPtr
1.1       daniel    610: xmlParseEntityRef(xmlParserCtxtPtr ctxt);
1.6       daniel    611: void
1.1       daniel    612: xmlParseReference(xmlParserCtxtPtr ctxt);
1.6       daniel    613: void
1.1       daniel    614: xmlParsePEReference(xmlParserCtxtPtr ctxt);
                    615: void
                    616: xmlParseDocTypeDecl(xmlParserCtxtPtr ctxt);
1.4       daniel    617: CHAR *
                    618: xmlParseAttribute(xmlParserCtxtPtr ctxt, CHAR **value);
1.9       daniel    619: CHAR *
1.1       daniel    620: xmlParseStartTag(xmlParserCtxtPtr ctxt);
                    621: void
1.9       daniel    622: xmlParseEndTag(xmlParserCtxtPtr ctxt, CHAR *tagname);
1.1       daniel    623: void
                    624: xmlParseCDSect(xmlParserCtxtPtr ctxt);
                    625: void
                    626: xmlParseContent(xmlParserCtxtPtr ctxt);
1.4       daniel    627: void
1.1       daniel    628: xmlParseElement(xmlParserCtxtPtr ctxt);
                    629: CHAR *
                    630: xmlParseVersionNum(xmlParserCtxtPtr ctxt);
                    631: CHAR *
                    632: xmlParseVersionInfo(xmlParserCtxtPtr ctxt);
                    633: CHAR *
                    634: xmlParseEncName(xmlParserCtxtPtr ctxt);
                    635: CHAR *
                    636: xmlParseEncodingDecl(xmlParserCtxtPtr ctxt);
                    637: int
                    638: xmlParseSDDecl(xmlParserCtxtPtr ctxt);
                    639: void
                    640: xmlParseXMLDecl(xmlParserCtxtPtr ctxt);
                    641: void
                    642: xmlParseMisc(xmlParserCtxtPtr ctxt);
1.6       daniel    643: 
                    644: /*
                    645:  * Entities substitution
                    646:  */
                    647: #define XML_SUBSTITUTE_NONE    0
                    648: #define XML_SUBSTITUTE_REF     1
                    649: #define XML_SUBSTITUTE_PEREF   2
                    650: #define XML_SUBSTITUTE_BOTH    3
                    651: 
                    652: CHAR *
                    653: xmlDecodeEntities(xmlParserCtxtPtr ctxt, int len, int what,
                    654:                   CHAR end, CHAR  end2, CHAR end3);
1.1       daniel    655: 
1.4       daniel    656: /*
                    657:  * Generated by MACROS on top of parser.c c.f. PUSH_AND_POP
                    658:  */
                    659: extern int nodePush(xmlParserCtxtPtr ctxt, xmlNodePtr value);
                    660: extern xmlNodePtr nodePop(xmlParserCtxtPtr ctxt);
                    661: extern int inputPush(xmlParserCtxtPtr ctxt, xmlParserInputPtr value);
                    662: extern xmlParserInputPtr inputPop(xmlParserCtxtPtr ctxt);
1.1       daniel    663: 
                    664: #endif /* __XML_PARSER_INTERNALS_H__ */

Webmaster