Annotation of XML/parserInternals.h, revision 1.11
1.1 daniel 1: /*
2: * parserInternals.h : internals routines exported by the parser.
3: *
4: * See Copyright for the status of this software.
5: *
6: * Daniel.Veillard@w3.org
7: */
8:
9: #ifndef __XML_PARSER_INTERNALS_H__
10: #define __XML_PARSER_INTERNALS_H__
11:
12: #include "parser.h"
13:
14: #ifdef __cplusplus
15: extern "C" {
16: #endif
17:
1.2 daniel 18: /**
1.3 daniel 19: * A few macros needed to help building the parser.
20: */
21:
22: #ifdef UNICODE
23: /************************************************************************
24: * *
25: * UNICODE version of the macros. *
26: * *
27: ************************************************************************/
28: /*
29: * [2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
30: * | [#x10000-#x10FFFF]
31: * any Unicode character, excluding the surrogate blocks, FFFE, and FFFF.
32: */
33: #define IS_CHAR(c) \
34: ((((c) == 0x09) || ((c) == 0x0a) || ((c) == 0x0d) || \
35: (((c) >= 0x20) && ((c) != 0xFFFE) && ((c) != 0xFFFF))) && \
36: (((c) <= 0xD7FF) || ((c) >= 0xE000)) && ((c) >= 0) && \
37: ((c) <= 0x10FFFF))
38:
39: /*
40: * [3] S ::= (#x20 | #x9 | #xD | #xA)+
41: */
42: #define IS_BLANK(c) (((c) == 0x20) || ((c) == 0x09) || ((c) == 0xa) || \
43: ((c) == 0x0D))
44:
45: /*
46: * [85] BaseChar ::= ... long list see REC ...
47: *
48: * VI is your friend !
49: * :1,$ s/\[#x\([0-9A-Z]*\)-#x\([0-9A-Z]*\)\]/ (((c) >= 0x\1) \&\& ((c) <= 0x\2)) ||/
50: * and
51: * :1,$ s/#x\([0-9A-Z]*\)/ ((c) == 0x\1) ||/
52: */
53: #define IS_BASECHAR(c) \
54: ((((c) >= 0x0041) && ((c) <= 0x005A)) || \
55: (((c) >= 0x0061) && ((c) <= 0x007A)) || \
56: (((c) >= 0x00C0) && ((c) <= 0x00D6)) || \
57: (((c) >= 0x00D8) && ((c) <= 0x00F6)) || \
58: (((c) >= 0x00F8) && ((c) <= 0x00FF)) || \
59: (((c) >= 0x0100) && ((c) <= 0x0131)) || \
60: (((c) >= 0x0134) && ((c) <= 0x013E)) || \
61: (((c) >= 0x0141) && ((c) <= 0x0148)) || \
62: (((c) >= 0x014A) && ((c) <= 0x017E)) || \
63: (((c) >= 0x0180) && ((c) <= 0x01C3)) || \
64: (((c) >= 0x01CD) && ((c) <= 0x01F0)) || \
65: (((c) >= 0x01F4) && ((c) <= 0x01F5)) || \
66: (((c) >= 0x01FA) && ((c) <= 0x0217)) || \
67: (((c) >= 0x0250) && ((c) <= 0x02A8)) || \
68: (((c) >= 0x02BB) && ((c) <= 0x02C1)) || \
69: ((c) == 0x0386) || \
70: (((c) >= 0x0388) && ((c) <= 0x038A)) || \
71: ((c) == 0x038C) || \
72: (((c) >= 0x038E) && ((c) <= 0x03A1)) || \
73: (((c) >= 0x03A3) && ((c) <= 0x03CE)) || \
74: (((c) >= 0x03D0) && ((c) <= 0x03D6)) || \
75: ((c) == 0x03DA) || \
76: ((c) == 0x03DC) || \
77: ((c) == 0x03DE) || \
78: ((c) == 0x03E0) || \
79: (((c) >= 0x03E2) && ((c) <= 0x03F3)) || \
80: (((c) >= 0x0401) && ((c) <= 0x040C)) || \
81: (((c) >= 0x040E) && ((c) <= 0x044F)) || \
82: (((c) >= 0x0451) && ((c) <= 0x045C)) || \
83: (((c) >= 0x045E) && ((c) <= 0x0481)) || \
84: (((c) >= 0x0490) && ((c) <= 0x04C4)) || \
85: (((c) >= 0x04C7) && ((c) <= 0x04C8)) || \
86: (((c) >= 0x04CB) && ((c) <= 0x04CC)) || \
87: (((c) >= 0x04D0) && ((c) <= 0x04EB)) || \
88: (((c) >= 0x04EE) && ((c) <= 0x04F5)) || \
89: (((c) >= 0x04F8) && ((c) <= 0x04F9)) || \
90: (((c) >= 0x0531) && ((c) <= 0x0556)) || \
91: ((c) == 0x0559) || \
92: (((c) >= 0x0561) && ((c) <= 0x0586)) || \
93: (((c) >= 0x05D0) && ((c) <= 0x05EA)) || \
94: (((c) >= 0x05F0) && ((c) <= 0x05F2)) || \
95: (((c) >= 0x0621) && ((c) <= 0x063A)) || \
96: (((c) >= 0x0641) && ((c) <= 0x064A)) || \
97: (((c) >= 0x0671) && ((c) <= 0x06B7)) || \
98: (((c) >= 0x06BA) && ((c) <= 0x06BE)) || \
99: (((c) >= 0x06C0) && ((c) <= 0x06CE)) || \
100: (((c) >= 0x06D0) && ((c) <= 0x06D3)) || \
101: ((c) == 0x06D5) || \
102: (((c) >= 0x06E5) && ((c) <= 0x06E6)) || \
103: (((c) >= 0x0905) && ((c) <= 0x0939)) || \
104: ((c) == 0x093D) || \
105: (((c) >= 0x0958) && ((c) <= 0x0961)) || \
106: (((c) >= 0x0985) && ((c) <= 0x098C)) || \
107: (((c) >= 0x098F) && ((c) <= 0x0990)) || \
108: (((c) >= 0x0993) && ((c) <= 0x09A8)) || \
109: (((c) >= 0x09AA) && ((c) <= 0x09B0)) || \
110: ((c) == 0x09B2) || \
111: (((c) >= 0x09B6) && ((c) <= 0x09B9)) || \
112: (((c) >= 0x09DC) && ((c) <= 0x09DD)) || \
113: (((c) >= 0x09DF) && ((c) <= 0x09E1)) || \
114: (((c) >= 0x09F0) && ((c) <= 0x09F1)) || \
115: (((c) >= 0x0A05) && ((c) <= 0x0A0A)) || \
116: (((c) >= 0x0A0F) && ((c) <= 0x0A10)) || \
117: (((c) >= 0x0A13) && ((c) <= 0x0A28)) || \
118: (((c) >= 0x0A2A) && ((c) <= 0x0A30)) || \
119: (((c) >= 0x0A32) && ((c) <= 0x0A33)) || \
120: (((c) >= 0x0A35) && ((c) <= 0x0A36)) || \
121: (((c) >= 0x0A38) && ((c) <= 0x0A39)) || \
122: (((c) >= 0x0A59) && ((c) <= 0x0A5C)) || \
123: ((c) == 0x0A5E) || \
124: (((c) >= 0x0A72) && ((c) <= 0x0A74)) || \
125: (((c) >= 0x0A85) && ((c) <= 0x0A8B)) || \
126: ((c) == 0x0A8D) || \
127: (((c) >= 0x0A8F) && ((c) <= 0x0A91)) || \
128: (((c) >= 0x0A93) && ((c) <= 0x0AA8)) || \
129: (((c) >= 0x0AAA) && ((c) <= 0x0AB0)) || \
130: (((c) >= 0x0AB2) && ((c) <= 0x0AB3)) || \
131: (((c) >= 0x0AB5) && ((c) <= 0x0AB9)) || \
132: ((c) == 0x0ABD) || \
133: ((c) == 0x0AE0) || \
134: (((c) >= 0x0B05) && ((c) <= 0x0B0C)) || \
135: (((c) >= 0x0B0F) && ((c) <= 0x0B10)) || \
136: (((c) >= 0x0B13) && ((c) <= 0x0B28)) || \
137: (((c) >= 0x0B2A) && ((c) <= 0x0B30)) || \
138: (((c) >= 0x0B32) && ((c) <= 0x0B33)) || \
139: (((c) >= 0x0B36) && ((c) <= 0x0B39)) || \
140: ((c) == 0x0B3D) || \
141: (((c) >= 0x0B5C) && ((c) <= 0x0B5D)) || \
142: (((c) >= 0x0B5F) && ((c) <= 0x0B61)) || \
143: (((c) >= 0x0B85) && ((c) <= 0x0B8A)) || \
144: (((c) >= 0x0B8E) && ((c) <= 0x0B90)) || \
145: (((c) >= 0x0B92) && ((c) <= 0x0B95)) || \
146: (((c) >= 0x0B99) && ((c) <= 0x0B9A)) || \
147: ((c) == 0x0B9C) || \
148: (((c) >= 0x0B9E) && ((c) <= 0x0B9F)) || \
149: (((c) >= 0x0BA3) && ((c) <= 0x0BA4)) || \
150: (((c) >= 0x0BA8) && ((c) <= 0x0BAA)) || \
151: (((c) >= 0x0BAE) && ((c) <= 0x0BB5)) || \
152: (((c) >= 0x0BB7) && ((c) <= 0x0BB9)) || \
153: (((c) >= 0x0C05) && ((c) <= 0x0C0C)) || \
154: (((c) >= 0x0C0E) && ((c) <= 0x0C10)) || \
155: (((c) >= 0x0C12) && ((c) <= 0x0C28)) || \
156: (((c) >= 0x0C2A) && ((c) <= 0x0C33)) || \
157: (((c) >= 0x0C35) && ((c) <= 0x0C39)) || \
158: (((c) >= 0x0C60) && ((c) <= 0x0C61)) || \
159: (((c) >= 0x0C85) && ((c) <= 0x0C8C)) || \
160: (((c) >= 0x0C8E) && ((c) <= 0x0C90)) || \
161: (((c) >= 0x0C92) && ((c) <= 0x0CA8)) || \
162: (((c) >= 0x0CAA) && ((c) <= 0x0CB3)) || \
163: (((c) >= 0x0CB5) && ((c) <= 0x0CB9)) || \
164: ((c) == 0x0CDE) || \
165: (((c) >= 0x0CE0) && ((c) <= 0x0CE1)) || \
166: (((c) >= 0x0D05) && ((c) <= 0x0D0C)) || \
167: (((c) >= 0x0D0E) && ((c) <= 0x0D10)) || \
168: (((c) >= 0x0D12) && ((c) <= 0x0D28)) || \
169: (((c) >= 0x0D2A) && ((c) <= 0x0D39)) || \
170: (((c) >= 0x0D60) && ((c) <= 0x0D61)) || \
171: (((c) >= 0x0E01) && ((c) <= 0x0E2E)) || \
172: ((c) == 0x0E30) || \
173: (((c) >= 0x0E32) && ((c) <= 0x0E33)) || \
174: (((c) >= 0x0E40) && ((c) <= 0x0E45)) || \
175: (((c) >= 0x0E81) && ((c) <= 0x0E82)) || \
176: ((c) == 0x0E84) || \
177: (((c) >= 0x0E87) && ((c) <= 0x0E88)) || \
178: ((c) == 0x0E8A) || \
179: ((c) == 0x0E8D) || \
180: (((c) >= 0x0E94) && ((c) <= 0x0E97)) || \
181: (((c) >= 0x0E99) && ((c) <= 0x0E9F)) || \
182: (((c) >= 0x0EA1) && ((c) <= 0x0EA3)) || \
183: ((c) == 0x0EA5) || \
184: ((c) == 0x0EA7) || \
185: (((c) >= 0x0EAA) && ((c) <= 0x0EAB)) || \
186: (((c) >= 0x0EAD) && ((c) <= 0x0EAE)) || \
187: ((c) == 0x0EB0) || \
188: (((c) >= 0x0EB2) && ((c) <= 0x0EB3)) || \
189: ((c) == 0x0EBD) || \
190: (((c) >= 0x0EC0) && ((c) <= 0x0EC4)) || \
191: (((c) >= 0x0F40) && ((c) <= 0x0F47)) || \
192: (((c) >= 0x0F49) && ((c) <= 0x0F69)) || \
193: (((c) >= 0x10A0) && ((c) <= 0x10C5)) || \
194: (((c) >= 0x10D0) && ((c) <= 0x10F6)) || \
195: ((c) == 0x1100) || \
196: (((c) >= 0x1102) && ((c) <= 0x1103)) || \
197: (((c) >= 0x1105) && ((c) <= 0x1107)) || \
198: ((c) == 0x1109) || \
199: (((c) >= 0x110B) && ((c) <= 0x110C)) || \
200: (((c) >= 0x110E) && ((c) <= 0x1112)) || \
201: ((c) == 0x113C) || \
202: ((c) == 0x113E) || \
203: ((c) == 0x1140) || \
204: ((c) == 0x114C) || \
205: ((c) == 0x114E) || \
206: ((c) == 0x1150) || \
207: (((c) >= 0x1154) && ((c) <= 0x1155)) || \
208: ((c) == 0x1159) || \
209: (((c) >= 0x115F) && ((c) <= 0x1161)) || \
210: ((c) == 0x1163) || \
211: ((c) == 0x1165) || \
212: ((c) == 0x1167) || \
213: ((c) == 0x1169) || \
214: (((c) >= 0x116D) && ((c) <= 0x116E)) || \
215: (((c) >= 0x1172) && ((c) <= 0x1173)) || \
216: ((c) == 0x1175) || \
217: ((c) == 0x119E) || \
218: ((c) == 0x11A8) || \
219: ((c) == 0x11AB) || \
220: (((c) >= 0x11AE) && ((c) <= 0x11AF)) || \
221: (((c) >= 0x11B7) && ((c) <= 0x11B8)) || \
222: ((c) == 0x11BA) || \
223: (((c) >= 0x11BC) && ((c) <= 0x11C2)) || \
224: ((c) == 0x11EB) || \
225: ((c) == 0x11F0) || \
226: ((c) == 0x11F9) || \
227: (((c) >= 0x1E00) && ((c) <= 0x1E9B)) || \
228: (((c) >= 0x1EA0) && ((c) <= 0x1EF9)) || \
229: (((c) >= 0x1F00) && ((c) <= 0x1F15)) || \
230: (((c) >= 0x1F18) && ((c) <= 0x1F1D)) || \
231: (((c) >= 0x1F20) && ((c) <= 0x1F45)) || \
232: (((c) >= 0x1F48) && ((c) <= 0x1F4D)) || \
233: (((c) >= 0x1F50) && ((c) <= 0x1F57)) || \
234: ((c) == 0x1F59) || \
235: ((c) == 0x1F5B) || \
236: ((c) == 0x1F5D) || \
237: (((c) >= 0x1F5F) && ((c) <= 0x1F7D)) || \
238: (((c) >= 0x1F80) && ((c) <= 0x1FB4)) || \
239: (((c) >= 0x1FB6) && ((c) <= 0x1FBC)) || \
240: ((c) == 0x1FBE) || \
241: (((c) >= 0x1FC2) && ((c) <= 0x1FC4)) || \
242: (((c) >= 0x1FC6) && ((c) <= 0x1FCC)) || \
243: (((c) >= 0x1FD0) && ((c) <= 0x1FD3)) || \
244: (((c) >= 0x1FD6) && ((c) <= 0x1FDB)) || \
245: (((c) >= 0x1FE0) && ((c) <= 0x1FEC)) || \
246: (((c) >= 0x1FF2) && ((c) <= 0x1FF4)) || \
247: (((c) >= 0x1FF6) && ((c) <= 0x1FFC)) || \
248: ((c) == 0x2126) || \
249: (((c) >= 0x212A) && ((c) <= 0x212B)) || \
250: ((c) == 0x212E) || \
251: (((c) >= 0x2180) && ((c) <= 0x2182)) || \
252: (((c) >= 0x3041) && ((c) <= 0x3094)) || \
253: (((c) >= 0x30A1) && ((c) <= 0x30FA)) || \
254: (((c) >= 0x3105) && ((c) <= 0x312C)) || \
255: (((c) >= 0xAC00) && ((c) <= 0xD7A3)))
256:
257: /*
258: * [88] Digit ::= ... long list see REC ...
259: */
260: #define IS_DIGIT(c) \
261: ((((c) >= 0x0030) && ((c) <= 0x0039)) || \
262: (((c) >= 0x0660) && ((c) <= 0x0669)) || \
263: (((c) >= 0x06F0) && ((c) <= 0x06F9)) || \
264: (((c) >= 0x0966) && ((c) <= 0x096F)) || \
265: (((c) >= 0x09E6) && ((c) <= 0x09EF)) || \
266: (((c) >= 0x0A66) && ((c) <= 0x0A6F)) || \
267: (((c) >= 0x0AE6) && ((c) <= 0x0AEF)) || \
268: (((c) >= 0x0B66) && ((c) <= 0x0B6F)) || \
269: (((c) >= 0x0BE7) && ((c) <= 0x0BEF)) || \
270: (((c) >= 0x0C66) && ((c) <= 0x0C6F)) || \
271: (((c) >= 0x0CE6) && ((c) <= 0x0CEF)) || \
272: (((c) >= 0x0D66) && ((c) <= 0x0D6F)) || \
273: (((c) >= 0x0E50) && ((c) <= 0x0E59)) || \
274: (((c) >= 0x0ED0) && ((c) <= 0x0ED9)) || \
275: (((c) >= 0x0F20) && ((c) <= 0x0F29)))
276:
277: /*
278: * [87] CombiningChar ::= ... long list see REC ...
279: */
280: #define IS_COMBINING(c) \
281: ((((c) >= 0x0300) && ((c) <= 0x0345)) || \
282: (((c) >= 0x0360) && ((c) <= 0x0361)) || \
283: (((c) >= 0x0483) && ((c) <= 0x0486)) || \
284: (((c) >= 0x0591) && ((c) <= 0x05A1)) || \
285: (((c) >= 0x05A3) && ((c) <= 0x05B9)) || \
286: (((c) >= 0x05BB) && ((c) <= 0x05BD)) || \
287: ((c) == 0x05BF) || \
288: (((c) >= 0x05C1) && ((c) <= 0x05C2)) || \
289: ((c) == 0x05C4) || \
290: (((c) >= 0x064B) && ((c) <= 0x0652)) || \
291: ((c) == 0x0670) || \
292: (((c) >= 0x06D6) && ((c) <= 0x06DC)) || \
293: (((c) >= 0x06DD) && ((c) <= 0x06DF)) || \
294: (((c) >= 0x06E0) && ((c) <= 0x06E4)) || \
295: (((c) >= 0x06E7) && ((c) <= 0x06E8)) || \
296: (((c) >= 0x06EA) && ((c) <= 0x06ED)) || \
297: (((c) >= 0x0901) && ((c) <= 0x0903)) || \
298: ((c) == 0x093C) || \
299: (((c) >= 0x093E) && ((c) <= 0x094C)) || \
300: ((c) == 0x094D) || \
301: (((c) >= 0x0951) && ((c) <= 0x0954)) || \
302: (((c) >= 0x0962) && ((c) <= 0x0963)) || \
303: (((c) >= 0x0981) && ((c) <= 0x0983)) || \
304: ((c) == 0x09BC) || \
305: ((c) == 0x09BE) || \
306: ((c) == 0x09BF) || \
307: (((c) >= 0x09C0) && ((c) <= 0x09C4)) || \
308: (((c) >= 0x09C7) && ((c) <= 0x09C8)) || \
309: (((c) >= 0x09CB) && ((c) <= 0x09CD)) || \
310: ((c) == 0x09D7) || \
311: (((c) >= 0x09E2) && ((c) <= 0x09E3)) || \
312: ((c) == 0x0A02) || \
313: ((c) == 0x0A3C) || \
314: ((c) == 0x0A3E) || \
315: ((c) == 0x0A3F) || \
316: (((c) >= 0x0A40) && ((c) <= 0x0A42)) || \
317: (((c) >= 0x0A47) && ((c) <= 0x0A48)) || \
318: (((c) >= 0x0A4B) && ((c) <= 0x0A4D)) || \
319: (((c) >= 0x0A70) && ((c) <= 0x0A71)) || \
320: (((c) >= 0x0A81) && ((c) <= 0x0A83)) || \
321: ((c) == 0x0ABC) || \
322: (((c) >= 0x0ABE) && ((c) <= 0x0AC5)) || \
323: (((c) >= 0x0AC7) && ((c) <= 0x0AC9)) || \
324: (((c) >= 0x0ACB) && ((c) <= 0x0ACD)) || \
325: (((c) >= 0x0B01) && ((c) <= 0x0B03)) || \
326: ((c) == 0x0B3C) || \
327: (((c) >= 0x0B3E) && ((c) <= 0x0B43)) || \
328: (((c) >= 0x0B47) && ((c) <= 0x0B48)) || \
329: (((c) >= 0x0B4B) && ((c) <= 0x0B4D)) || \
330: (((c) >= 0x0B56) && ((c) <= 0x0B57)) || \
331: (((c) >= 0x0B82) && ((c) <= 0x0B83)) || \
332: (((c) >= 0x0BBE) && ((c) <= 0x0BC2)) || \
333: (((c) >= 0x0BC6) && ((c) <= 0x0BC8)) || \
334: (((c) >= 0x0BCA) && ((c) <= 0x0BCD)) || \
335: ((c) == 0x0BD7) || \
336: (((c) >= 0x0C01) && ((c) <= 0x0C03)) || \
337: (((c) >= 0x0C3E) && ((c) <= 0x0C44)) || \
338: (((c) >= 0x0C46) && ((c) <= 0x0C48)) || \
339: (((c) >= 0x0C4A) && ((c) <= 0x0C4D)) || \
340: (((c) >= 0x0C55) && ((c) <= 0x0C56)) || \
341: (((c) >= 0x0C82) && ((c) <= 0x0C83)) || \
342: (((c) >= 0x0CBE) && ((c) <= 0x0CC4)) || \
343: (((c) >= 0x0CC6) && ((c) <= 0x0CC8)) || \
344: (((c) >= 0x0CCA) && ((c) <= 0x0CCD)) || \
345: (((c) >= 0x0CD5) && ((c) <= 0x0CD6)) || \
346: (((c) >= 0x0D02) && ((c) <= 0x0D03)) || \
347: (((c) >= 0x0D3E) && ((c) <= 0x0D43)) || \
348: (((c) >= 0x0D46) && ((c) <= 0x0D48)) || \
349: (((c) >= 0x0D4A) && ((c) <= 0x0D4D)) || \
350: ((c) == 0x0D57) || \
351: ((c) == 0x0E31) || \
352: (((c) >= 0x0E34) && ((c) <= 0x0E3A)) || \
353: (((c) >= 0x0E47) && ((c) <= 0x0E4E)) || \
354: ((c) == 0x0EB1) || \
355: (((c) >= 0x0EB4) && ((c) <= 0x0EB9)) || \
356: (((c) >= 0x0EBB) && ((c) <= 0x0EBC)) || \
357: (((c) >= 0x0EC8) && ((c) <= 0x0ECD)) || \
358: (((c) >= 0x0F18) && ((c) <= 0x0F19)) || \
359: ((c) == 0x0F35) || \
360: ((c) == 0x0F37) || \
361: ((c) == 0x0F39) || \
362: ((c) == 0x0F3E) || \
363: ((c) == 0x0F3F) || \
364: (((c) >= 0x0F71) && ((c) <= 0x0F84)) || \
365: (((c) >= 0x0F86) && ((c) <= 0x0F8B)) || \
366: (((c) >= 0x0F90) && ((c) <= 0x0F95)) || \
367: ((c) == 0x0F97) || \
368: (((c) >= 0x0F99) && ((c) <= 0x0FAD)) || \
369: (((c) >= 0x0FB1) && ((c) <= 0x0FB7)) || \
370: ((c) == 0x0FB9) || \
371: (((c) >= 0x20D0) && ((c) <= 0x20DC)) || \
372: ((c) == 0x20E1) || \
373: (((c) >= 0x302A) && ((c) <= 0x302F)) || \
374: ((c) == 0x3099) || \
375: ((c) == 0x309A))
376:
377: /*
378: * [89] Extender ::= #x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 |
379: * #x0E46 | #x0EC6 | #x3005 | [#x3031-#x3035] |
380: * [#x309D-#x309E] | [#x30FC-#x30FE]
381: */
382: #define IS_EXTENDER(c) \
383: (((c) == 0xb7) || ((c) == 0x2d0) || ((c) == 0x2d1) || \
384: ((c) == 0x387) || ((c) == 0x640) || ((c) == 0xe46) || \
385: ((c) == 0xec6) || ((c) == 0x3005) \
386: (((c) >= 0x3031) && ((c) <= 0x3035)) || \
387: (((c) >= 0x309b) && ((c) <= 0x309e)) || \
388: (((c) >= 0x30fc) && ((c) <= 0x30fe)))
389:
390: /*
391: * [86] Ideographic ::= [#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029]
392: */
393: #define IS_IDEOGRAPHIC(c) \
394: ((((c) >= 0x4e00) && ((c) <= 0x9fa5)) || \
395: (((c) >= 0xf900) && ((c) <= 0xfa2d)) || \
396: (((c) >= 0x3021) && ((c) <= 0x3029)) || \
397: ((c) == 0x3007))
398:
399: /*
400: * [84] Letter ::= BaseChar | Ideographic
401: */
402: #define IS_LETTER(c) (IS_BASECHAR(c) || IS_IDEOGRAPHIC(c))
403:
404: #else
405: #ifndef USE_UTF_8
406: /************************************************************************
407: * *
408: * 8bits / ISO-Latin version of the macros. *
409: * *
410: ************************************************************************/
411: /*
412: * [2] Char ::= #x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
413: * | [#x10000-#x10FFFF]
414: * any Unicode character, excluding the surrogate blocks, FFFE, and FFFF.
415: */
416: #define IS_CHAR(c) \
417: ((((c) == 0x09) || ((c) == 0x0a) || ((c) == 0x0d) || \
418: (((c) >= 0x20) && ((c) != 0xFFFE) && ((c) != 0xFFFF))) && \
419: (((c) <= 0xD7FF) || ((c) >= 0xE000)) && ((c) <= 0x10FFFF))
420:
421: /*
422: * [85] BaseChar ::= ... long list see REC ...
423: */
424: #define IS_BASECHAR(c) \
425: ((((c) >= 0x41) && ((c) <= 0x5a)) || \
426: (((c) >= 0x61) && ((c) <= 0x7a)) || \
427: (((c) >= 0xaa) && ((c) <= 0x5b)) || \
428: (((c) >= 0xc0) && ((c) <= 0xd6)) || \
429: (((c) >= 0xd8) && ((c) <= 0xf6)) || \
430: (((c) >= 0xf8) && ((c) <= 0xff)) || \
431: ((c) == 0xba))
432:
433: /*
434: * [88] Digit ::= ... long list see REC ...
435: */
436: #define IS_DIGIT(c) (((c) >= 0x30) && ((c) <= 0x39))
437:
438: /*
439: * [84] Letter ::= BaseChar | Ideographic
440: */
441: #define IS_LETTER(c) IS_BASECHAR(c)
442:
443:
444: /*
445: * [87] CombiningChar ::= ... long list see REC ...
446: */
447: #define IS_COMBINING(c) 0
448:
449: /*
450: * [89] Extender ::= #x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 |
451: * #x0E46 | #x0EC6 | #x3005 | [#x3031-#x3035] |
452: * [#x309D-#x309E] | [#x30FC-#x30FE]
453: */
454: #define IS_EXTENDER(c) ((c) == 0xb7)
455:
456: #else /* USE_UTF_8 */
457: /************************************************************************
458: * *
459: * 8bits / UTF-8 version of the macros. *
460: * *
461: ************************************************************************/
462:
463: TODO !!!
464: #endif /* USE_UTF_8 */
465: #endif /* !UNICODE */
466:
467: /*
468: * Blank chars.
469: *
470: * [3] S ::= (#x20 | #x9 | #xD | #xA)+
471: */
472: #define IS_BLANK(c) (((c) == 0x20) || ((c) == 0x09) || ((c) == 0xa) || \
473: ((c) == 0x0D))
474:
475: /*
476: * [13] PubidChar ::= #x20 | #xD | #xA | [a-zA-Z0-9] | [-'()+,./:=?;!*#@$_%]
477: */
478: #define IS_PUBIDCHAR(c) \
479: (((c) == 0x20) || ((c) == 0x0D) || ((c) == 0x0A) || \
480: (((c) >= 'a') && ((c) <= 'z')) || \
481: (((c) >= 'A') && ((c) <= 'Z')) || \
482: (((c) >= '0') && ((c) <= '9')) || \
483: ((c) == '-') || ((c) == '\'') || ((c) == '(') || ((c) == ')') || \
484: ((c) == '+') || ((c) == ',') || ((c) == '.') || ((c) == '/') || \
485: ((c) == ':') || ((c) == '=') || ((c) == '?') || ((c) == ';') || \
486: ((c) == '!') || ((c) == '*') || ((c) == '#') || ((c) == '@') || \
487: ((c) == '$') || ((c) == '_') || ((c) == '%'))
488:
489: #define SKIP_EOL(p) \
490: if (*(p) == 0x13) { p++ ; if (*(p) == 0x10) p++; } \
491: if (*(p) == 0x10) { p++ ; if (*(p) == 0x13) p++; }
492:
493: #define MOVETO_ENDTAG(p) \
494: while (IS_CHAR(*p) && (*(p) != '>')) (p)++
495:
496: #define MOVETO_STARTTAG(p) \
497: while (IS_CHAR(*p) && (*(p) != '<')) (p)++
1.8 daniel 498:
499: /**
500: * entity substitution default behaviour.
501: */
502:
503: int xmlSubstituteEntitiesDefaultValue;
504:
1.3 daniel 505: /**
1.2 daniel 506: * Parser context
507: */
508: xmlParserCtxtPtr
509: xmlCreateDocParserCtxt(CHAR *cur);
510: xmlParserCtxtPtr
511: xmlCreateFileParserCtxt(const char *filename);
512: xmlParserCtxtPtr
513: xmlCreateMemoryParserCtxt(char *buffer, int size);
514: void
515: xmlFreeParserCtxt(xmlParserCtxtPtr ctxt);
1.11 ! daniel 516: xmlParserCtxtPtr
! 517: xmlNewParserCtxt();
! 518: void
! 519: xmlSwitchEncoding(xmlParserCtxtPtr ctxt, xmlCharEncoding enc);
1.2 daniel 520:
521: /**
1.1 daniel 522: * Entities
523: */
524: void
525: xmlHandleEntity(xmlParserCtxtPtr ctxt, xmlEntityPtr entity);
526:
1.2 daniel 527: /**
528: * Input Streams
529: */
530: xmlParserInputPtr
531: xmlNewEntityInputStream(xmlParserCtxtPtr ctxt, xmlEntityPtr entity);
532: void
533: xmlPushInput(xmlParserCtxtPtr ctxt, xmlParserInputPtr input);
534: CHAR
535: xmlPopInput(xmlParserCtxtPtr ctxt);
536: void
537: xmlFreeInputStream(xmlParserInputPtr input);
1.5 daniel 538: xmlParserInputPtr
1.8 daniel 539: xmlNewInputFromFile(xmlParserCtxtPtr ctxt, const char *filename);
1.2 daniel 540:
541: /**
1.1 daniel 542: * Namespaces.
543: */
544: CHAR *
1.4 daniel 545: xmlSplitQName(const CHAR *name, CHAR **prefix);
546: CHAR *
1.1 daniel 547: xmlNamespaceParseNCName(xmlParserCtxtPtr ctxt);
548: CHAR *
549: xmlNamespaceParseQName(xmlParserCtxtPtr ctxt, CHAR **prefix);
550: CHAR *
551: xmlNamespaceParseNSDef(xmlParserCtxtPtr ctxt);
552: CHAR *
553: xmlParseQuotedString(xmlParserCtxtPtr ctxt);
554: void
555: xmlParseNamespace(xmlParserCtxtPtr ctxt);
556:
1.2 daniel 557: /**
1.1 daniel 558: * Generic production rules
559: */
560: CHAR *
1.10 daniel 561: xmlScanName(xmlParserCtxtPtr ctxt);
562: CHAR *
1.1 daniel 563: xmlParseName(xmlParserCtxtPtr ctxt);
564: CHAR *
565: xmlParseNmtoken(xmlParserCtxtPtr ctxt);
566: CHAR *
1.7 daniel 567: xmlParseEntityValue(xmlParserCtxtPtr ctxt, CHAR **orig);
1.1 daniel 568: CHAR *
569: xmlParseAttValue(xmlParserCtxtPtr ctxt);
570: CHAR *
571: xmlParseSystemLiteral(xmlParserCtxtPtr ctxt);
572: CHAR *
573: xmlParsePubidLiteral(xmlParserCtxtPtr ctxt);
574: void
575: xmlParseCharData(xmlParserCtxtPtr ctxt, int cdata);
576: CHAR *
577: xmlParseExternalID(xmlParserCtxtPtr ctxt, CHAR **publicID, int strict);
1.4 daniel 578: void
1.1 daniel 579: xmlParseComment(xmlParserCtxtPtr ctxt, int create);
580: CHAR *
581: xmlParsePITarget(xmlParserCtxtPtr ctxt);
582: void
583: xmlParsePI(xmlParserCtxtPtr ctxt);
584: void
585: xmlParseNotationDecl(xmlParserCtxtPtr ctxt);
586: void
587: xmlParseEntityDecl(xmlParserCtxtPtr ctxt);
588: int
589: xmlParseDefaultDecl(xmlParserCtxtPtr ctxt, CHAR **value);
590: xmlEnumerationPtr
591: xmlParseNotationType(xmlParserCtxtPtr ctxt);
592: xmlEnumerationPtr
593: xmlParseEnumerationType(xmlParserCtxtPtr ctxt);
594: int
595: xmlParseEnumeratedType(xmlParserCtxtPtr ctxt, xmlEnumerationPtr *tree);
596: int
597: xmlParseAttributeType(xmlParserCtxtPtr ctxt, xmlEnumerationPtr *tree);
598: void
599: xmlParseAttributeListDecl(xmlParserCtxtPtr ctxt);
600: xmlElementContentPtr
601: xmlParseElementMixedContentDecl(xmlParserCtxtPtr ctxt);
602: xmlElementContentPtr
603: xmlParseElementChildrenContentDecl(xmlParserCtxtPtr ctxt);
604: int
605: xmlParseElementContentDecl(xmlParserCtxtPtr ctxt, CHAR *name,
606: xmlElementContentPtr *result);
607: int
608: xmlParseElementDecl(xmlParserCtxtPtr ctxt);
609: void
610: xmlParseMarkupDecl(xmlParserCtxtPtr ctxt);
1.6 daniel 611: int
1.1 daniel 612: xmlParseCharRef(xmlParserCtxtPtr ctxt);
1.6 daniel 613: xmlEntityPtr
1.1 daniel 614: xmlParseEntityRef(xmlParserCtxtPtr ctxt);
1.6 daniel 615: void
1.1 daniel 616: xmlParseReference(xmlParserCtxtPtr ctxt);
1.6 daniel 617: void
1.1 daniel 618: xmlParsePEReference(xmlParserCtxtPtr ctxt);
619: void
620: xmlParseDocTypeDecl(xmlParserCtxtPtr ctxt);
1.4 daniel 621: CHAR *
622: xmlParseAttribute(xmlParserCtxtPtr ctxt, CHAR **value);
1.9 daniel 623: CHAR *
1.1 daniel 624: xmlParseStartTag(xmlParserCtxtPtr ctxt);
625: void
1.9 daniel 626: xmlParseEndTag(xmlParserCtxtPtr ctxt, CHAR *tagname);
1.1 daniel 627: void
628: xmlParseCDSect(xmlParserCtxtPtr ctxt);
629: void
630: xmlParseContent(xmlParserCtxtPtr ctxt);
1.4 daniel 631: void
1.1 daniel 632: xmlParseElement(xmlParserCtxtPtr ctxt);
633: CHAR *
634: xmlParseVersionNum(xmlParserCtxtPtr ctxt);
635: CHAR *
636: xmlParseVersionInfo(xmlParserCtxtPtr ctxt);
637: CHAR *
638: xmlParseEncName(xmlParserCtxtPtr ctxt);
639: CHAR *
640: xmlParseEncodingDecl(xmlParserCtxtPtr ctxt);
641: int
642: xmlParseSDDecl(xmlParserCtxtPtr ctxt);
643: void
644: xmlParseXMLDecl(xmlParserCtxtPtr ctxt);
645: void
646: xmlParseMisc(xmlParserCtxtPtr ctxt);
1.11 ! daniel 647: void
! 648: xmlParseExternalSubset(xmlParserCtxtPtr ctxt, const CHAR *ExternalID,
! 649: const CHAR *SystemID);
1.6 daniel 650:
651: /*
652: * Entities substitution
653: */
654: #define XML_SUBSTITUTE_NONE 0
655: #define XML_SUBSTITUTE_REF 1
656: #define XML_SUBSTITUTE_PEREF 2
657: #define XML_SUBSTITUTE_BOTH 3
658:
659: CHAR *
660: xmlDecodeEntities(xmlParserCtxtPtr ctxt, int len, int what,
661: CHAR end, CHAR end2, CHAR end3);
1.1 daniel 662:
1.4 daniel 663: /*
664: * Generated by MACROS on top of parser.c c.f. PUSH_AND_POP
665: */
666: extern int nodePush(xmlParserCtxtPtr ctxt, xmlNodePtr value);
667: extern xmlNodePtr nodePop(xmlParserCtxtPtr ctxt);
668: extern int inputPush(xmlParserCtxtPtr ctxt, xmlParserInputPtr value);
669: extern xmlParserInputPtr inputPop(xmlParserCtxtPtr ctxt);
1.1 daniel 670:
671: #endif /* __XML_PARSER_INTERNALS_H__ */
Webmaster