Annotation of libwww/Library/src/HTTeXGen.c, revision 2.26

2.10      frystyk     1: /*                                                                  HTTeXGen.c
                      2: **     HTML -> LaTeX CONVERTER
                      3: **
2.14      frystyk     4: **     (c) COPYRIGHT MIT 1995.
2.10      frystyk     5: **     Please first read the full copyright statement in the file COPYRIGH.
2.26    ! frystyk     6: **     @(#) $Id: HTTeXGen.c,v 2.25 1999/01/06 15:38:48 frystyk Exp $
2.1       frystyk     7: **
                      8: **     This version of the HTML object sends LaTeX to the output stream.
                      9: **     No attributes are considered in the translation!
                     10: **     The module uses simple 1:1 table-conversions, but this COULD be
                     11: **     expanded to a stack-machine. This would then be in start_element and
                     12: **     end_element...
                     13: **                                             Henrik 07/03-94
2.7       duns       14: **
                     15: ** HISTORY:
                     16: **      8 Jul 94  FM   Insulate free() from _free structure element.
                     17: **
2.1       frystyk    18: */
                     19: 
                     20: #define BUFFER_SIZE    80      /* Line buffer attempts to make neat breaks */
2.8       frystyk    21: #define WORD_DELIMITERS ",;:[]()"
2.1       frystyk    22: 
2.12      frystyk    23: /* Library include files */
2.24      frystyk    24: #include "wwwsys.h"
2.12      frystyk    25: #include "HTUtils.h"
2.1       frystyk    26: #include "HTTeXGen.h"
                     27: #include "HTMLPDTD.h"
2.15      frystyk    28: #include "HTStruct.h"
2.1       frystyk    29: #include "HTFormat.h"
                     30: 
                     31: /*             HTML Object
                     32: **             -----------
                     33: */
                     34: 
                     35: struct _HTStream {
2.22      frystyk    36:        const HTStreamClass *           isa;    
2.1       frystyk    37:        HTStream *                      target;
                     38:        HTStreamClass                   targetClass;       /* COPY for speed */
                     39: };
                     40: 
                     41: struct _HTStructured {
2.22      frystyk    42:        const HTStructuredClass *       isa;
2.1       frystyk    43:        HTStream *                      target;
                     44:        HTStreamClass                   targetClass;       /* COPY for speed */
2.22      frystyk    45:        const SGML_dtd *                dtd;
2.1       frystyk    46:        
2.5       frystyk    47:        char                            buffer[2*BUFFER_SIZE];   /* See note */
2.1       frystyk    48:        char *                          write_pointer;
                     49:        char *                          line_break;
                     50:        BOOL                            sensitive;          /* Can we put \n */
                     51:        BOOL                            preformatted;     /* Is it verbatim? */
                     52:        BOOL                            markup;     /* If doing LaTeX markup */
                     53:        BOOL                            startup;      /* To skip MIME header */
                     54: };
2.5       frystyk    55: 
                     56: /* The buffer has to be bigger than 80 as latex markup might make the line
                     57:    longer before we get to flush it. */
2.1       frystyk    58: 
2.25      frystyk    59: PRIVATE char *TeX_names[HTML_ELEMENTS][2] = {
2.1       frystyk    60:     { "",              ""              },      /* HTML_A               */
                     61:     { "",              ""              },      /* HTML_ABBREV          */
                     62:     { "\n\\begin{abstract}\n","\n\\end{abstract}\n"},  /* HTML_ABSTRACT        */
                     63:     { "",              ""              },      /* HTML_ACRONYM         */
                     64:     { "",              ""              },      /* HTML_ADDED           */
                     65:     { "{\\it ",                "}"             },      /* HTML_ADDRESS         */
2.25      frystyk    66:     { "",              ""              },      /* HTML_AREA            */
2.1       frystyk    67:     { "",              ""              },      /* HTML_ARG             */
                     68:     { "{\\bf ",                "}"             },      /* HTML_B               */
                     69:     { "",              ""              },      /* HTML_BASE            */
                     70:     { "{\\sf ",                "}"             },      /* HTML_BLOCKQUOTE      */
                     71:     { "",              ""              },      /* HTML_BODY            */
                     72:     { "",              ""              },      /* HTML_BOX             */
                     73:     { "",              ""              },      /* HTML_BR              */
                     74:     { "",              ""              },      /* HTML_BYLINE          */
                     75:     { "",              ""              },      /* HTML_CAPTION         */
                     76:     { "",              ""              },      /* HTML_CHANGED         */
                     77:     { "\\cite{",       "}"             },      /* HTML_CITE            */
                     78:     { "",              ""              },      /* HTML_CMD             */
                     79:     { "{\\tt ",                "}"             },      /* HTML_CODE            */
                     80:     { "\n\\typeout{",  "}\n"           },      /* HTML_COMMENT         */
                     81:     { "]",             ""              },      /* HTML_DD              */
                     82:     { "",              ""              },      /* HTML_DFN             */
                     83:     { "",              ""              },      /* HTML_DIR             */
                     84:     { "\n\\begin{description}","\n\\end{description}\n"}, /* HTML_DL   */
                     85:     { "\n\\item[",     ""              },      /* HTML_DT              */
                     86:     { "{\\em ",                "}"             },      /* HTML_EM              */
                     87:     { "",      ""                      },      /* HTML_FIG             */
                     88:     { "\n\\footnote{", "}\n"           },      /* HTML_FOOTNOTE        */
                     89:     { "",      ""                      },      /* HTML_FORM            */
2.25      frystyk    90:     { "",              ""              },      /* HTML_FRAME           */
                     91:     { "",              ""              },      /* HTML_FRAMESET        */
2.1       frystyk    92:     { "\n\\chapter{",  "}\n"           },      /* HTML_H1              */
                     93:     { "\n\\section{",  "}\n"           },      /* HTML_H2              */
                     94:     { "\n\\subsection{","}\n"                  },      /* HTML_H3              */
                     95:     { "\n\\subsubsection{","}\n"       },      /* HTML_H4              */
                     96:     { "\n\\paragraph{",        "}\n"           },      /* HTML_H5              */
                     97:     { "\n\\subparagraph{","}\n"                },      /* HTML_H6              */
                     98:     { "",              "\n"            },      /* HTML_H7              */
                     99:     { "",              ""              },      /* HTML_HEAD            */
                    100:     { "",              ""              },      /* HTML_HR              */
                    101:     { "",              ""              },      /* HTML_HTML            */
2.3       duns      102:     { "",              ""              },      /* HTML_HTMLPLUS        */
2.1       frystyk   103:     { "{\\it ",                "}"             },      /* HTML_I               */
                    104:     { "",              ""              },      /* HTML_IMAGE           */
2.8       frystyk   105:     { "_FIGUR_",       ""              },      /* HTML_IMG             */
2.1       frystyk   106:     { "",              ""              },      /* HTML_INPUT           */
                    107:     { "",              ""              },      /* HTML_ISINDEX         */
                    108:     { "{\\tt ",                "}"             },      /* HTML_KBD             */
                    109:     { "",              ""              },      /* HTML_L               */
                    110:     { "\n\\item ",      ""             },      /* HTML_LI              */
                    111:     { "",              ""              },      /* HTML_LINK            */
                    112:     { "",              ""              },      /* HTML_LISTING         */
                    113:     { "",              ""              },      /* HTML_LIT             */
                    114:     { "",              ""              },      /* HTML_MARGIN          */
                    115:     { "",              ""              },      /* HTML_MATH            */
                    116:     { "",              ""              },      /* HTML_MENU            */
                    117:     { "",              ""              },      /* HTML_NEXTID          */
                    118:     { "",              ""              },      /* HTML_NOTE            */
2.25      frystyk   119:     { "",              ""              },      /* HTML_OBJECT          */
2.1       frystyk   120:     { "\n\\begin{enumerate}\n","\n\\end{enumerate}\n"}, /* HTML_OL             */
                    121:     { "",              ""              },      /* HTML_OPTION          */
                    122:     { "",              ""              },      /* HTML_OVER            */
                    123:     { "\n\n",          ""              },      /* HTML_P               */
                    124:     { "",              ""              },      /* HTML_PERSON          */
                    125:     { "",              ""              },      /* HTML_PLAINTEXT       */
                    126:     { "\n\\begin{verbatim}"," \\end{verbatim}\n"},  /* HTML_PRE        */
                    127:     { "",              ""              },      /* HTML_Q               */
                    128:     { "\\begin{quote}",        "\\end{quote}"},        /* HTML_QUOTE           */
                    129:     { "",              ""              },      /* HTML_RENDER          */
                    130:     { "",              ""              },      /* HTML_REMOVED         */
                    131:     { "",              ""              },      /* HTML_S               */
                    132:     { "",              ""              },      /* HTML_SAMP            */
                    133:     { "",              ""              },      /* HTML_SELECT          */
                    134:     { "{\\bf ",                "}"             },      /* HTML_STRONG          */
                    135:     { "",              ""              },      /* HTML_SUB             */
                    136:     { "",              ""              },      /* HTML_SUP             */
                    137:     { "",              ""              },      /* HTML_TAB             */
                    138:     { "",              ""              },      /* HTML_TABLE           */
                    139:     { "",              ""              },      /* HTML_TD              */
                    140:     { "",              ""              },      /* HTML_TEXTAREA        */
                    141:     { "",              ""              },      /* HTML_TH              */
                    142:     { "\n\\title{",    "}\n\\author{}\n\\maketitle\n"},  /* HTML_TITLE */
                    143:     { "",              ""              },      /* HTML_TR              */
                    144:     { "",              ""              },      /* HTML_TT              */
                    145:     { "",              ""              },      /* HTML_U               */
                    146:     { "\n\\begin{itemize}","\n\\end{itemize}\n"},   /* HTML_UL         */
                    147:     { "",              ""              },      /* HTML_VAR             */
                    148:     { "{\\sf ",                "}"             }       /* HTML_XMP             */
                    149: };
                    150: 
2.8       frystyk   151: PRIVATE char *TeX_entities[HTML_ENTITIES] = {
2.1       frystyk   152:     "\\AE ",           /*"AElig",       capital AE diphthong (ligature) */ 
2.2       frystyk   153:     "\\\'{A}",         /*"Aacute",      capital A, acute accent */ 
                    154:     "\\^{A}",          /*"Acirc",       capital A, circumflex accent */ 
                    155:     "\\`{A}",          /*"Agrave",      capital A, grave accent */ 
                    156:     "\\AA",            /*"Aring",       capital A, ring */ 
                    157:     "\\~{A}",          /*"Atilde",      capital A, tilde */ 
                    158:     "\\\"{A}",         /*"Auml",        capital A, dieresis or umlaut mark */ 
                    159:     "\\c{C}",          /*"Ccedil",      capital C, cedilla */ 
                    160:     "\\OE ",           /*"ETH",         capital Eth, Icelandic */ 
                    161:     "\\\'{E}",         /*"Eacute",      capital E, acute accent */ 
                    162:     "\\^{E}",          /*"Ecirc",       capital E, circumflex accent */ 
                    163:     "\\`{E}",          /*"Egrave",      capital E, grave accent */ 
                    164:     "\\\"{E}",         /*"Euml",        capital E, dieresis or umlaut mark */ 
                    165:     "\\\'{I}",         /*"Iacute",      capital I, acute accent */ 
                    166:     "\\^{I}",          /*"Icirc",       capital I, circumflex accent */ 
                    167:     "\\`{I}",          /*"Igrave",      capital I, grave accent */ 
                    168:     "\\\"{I}",         /*"Iuml",        capital I, dieresis or umlaut mark */ 
                    169:     "\\~{N}",          /*"Ntilde",      capital N, tilde */ 
                    170:     "\\\'{O}",         /*"Oacute",      capital O, acute accent */ 
                    171:     "\\^{O}",          /*"Ocirc",       capital O, circumflex accent */ 
                    172:     "\\`{O}",          /*"Ograve",      capital O, grave accent */ 
2.1       frystyk   173:     "\\O ",                    /*"Oslash",      capital O, slash */ 
2.2       frystyk   174:     "\\~{O}",          /*"Otilde",      capital O, tilde */ 
                    175:     "\\\"{O}",         /*"Ouml",        capital O, dieresis or umlaut mark */ 
                    176:     " ",       /*"THORN",       capital THORN, Icelandic */ 
                    177:     "\\\'{U}",         /*"Uacute",      capital U, acute accent */ 
                    178:     "\\^{U}",          /*"Ucirc",       capital U, circumflex accent */ 
                    179:     "\\`{U}",          /*"Ugrave",      capital U, grave accent */ 
                    180:     "\\\"{U}",         /*"Uuml",        capital U, dieresis or umlaut mark */ 
                    181:     "\\\'{Y}",         /*"Yacute",      capital Y, acute accent */ 
                    182:     "\\\'{a}",         /*"aacute",      small a, acute accent */ 
                    183:     "\\^{a}",          /*"acirc",       small a, circumflex accent */ 
2.1       frystyk   184:     "\\ae ",           /*"aelig",       small ae diphthong (ligature) */ 
2.2       frystyk   185:     "\\`{a}",          /*"agrave",      small a, grave accent */ 
2.1       frystyk   186:     "&",               /*"amp",         ampersand */ 
                    187:     "\\aa ",           /*"aring",       small a, ring */ 
2.2       frystyk   188:     "\\~{a}",          /*"atilde",      small a, tilde */ 
                    189:     "\\\"{a}",         /*"auml",        small a, dieresis or umlaut mark */ 
                    190:     "\\c{c}",          /*"ccedil",      small c, cedilla */ 
                    191:     "\\\'{e}",         /*"eacute",      small e, acute accent */ 
                    192:     "\\^{c}",          /*"ecirc",       small e, circumflex accent */ 
                    193:     "\\`{c}",          /*"egrave",      small e, grave accent */ 
                    194:     "\\oe ",           /*"eth",         small eth, Icelandic */ 
                    195:     "\\\"{e}",         /*"euml",        small e, dieresis or umlaut mark */ 
2.1       frystyk   196:     ">",               /*"gt",  greater than */ 
2.2       frystyk   197:     "\\\'{\\i}",       /*"iacute",      small i, acute accent */ 
                    198:     "\\^{\\i}",        /*"icirc",       small i, circumflex accent */ 
                    199:     "\\`{\\i}",        /*"igrave",      small i, grave accent */ 
                    200:     "\\\"{\\i}",       /*"iuml",        small i, dieresis or umlaut mark */ 
2.1       frystyk   201:     "<",               /*"lt",  less than */ 
2.2       frystyk   202:     "\\~{n}",          /*"ntilde",      small n, tilde */ 
                    203:     "\\\'{o}",         /*"oacute",      small o, acute accent */ 
                    204:     "\\~{o}",          /*"ocirc",       small o, circumflex accent */ 
                    205:     "\\`{o}",          /*"ograve",      small o, grave accent */ 
2.1       frystyk   206:     "\\o ",                    /*"oslash",      small o, slash */ 
2.2       frystyk   207:     "\\~{o}",          /*"otilde",      small o, tilde */ 
                    208:     "\\\"{o}",         /*"ouml",        small o, dieresis or umlaut mark */ 
2.8       frystyk   209:     "\"",              /*"quot",        double quote sign - June 1994 */ 
2.1       frystyk   210:     "\\ss ",           /*"szlig",       small sharp s, German (sz ligature)*/ 
2.2       frystyk   211:     " ",               /*"thorn",       small thorn, Icelandic */ 
                    212:     "\\\'{u}",         /*"uacute",      small u, acute accent */ 
                    213:     "\\^{u}",          /*"ucirc",       small u, circumflex accent */ 
                    214:     "\\`{u}",          /*"ugrave",      small u, grave accent */ 
                    215:     "\\\"{u}",         /*"uuml",        small u, dieresis or umlaut mark */ 
                    216:     "\\\'{y}",         /*"yacute",      small y, acute accent */ 
                    217:     "\\\"{y}"          /*"yuml",        small y, dieresis or umlaut mark */ 
2.1       frystyk   218: };
                    219: 
                    220: 
                    221: /*     Flush Buffer
                    222: **     ------------
                    223: */
2.19      frystyk   224: PRIVATE int HTTeXGen_flush (HTStructured * me)
2.1       frystyk   225: {
2.13      frystyk   226:     int status;
                    227:     if ((status =
                    228:         (*me->targetClass.put_block)(me->target, me->buffer,
                    229:                                      me->write_pointer-me->buffer)) != HT_OK)
                    230:        return status;
2.1       frystyk   231:     me->write_pointer = me->buffer;
                    232:     me->line_break = me->buffer;
2.13      frystyk   233:     return (*me->targetClass.flush)(me->target);
2.1       frystyk   234: }
                    235: 
                    236: 
                    237: /*     Character handling
                    238: **     ------------------
                    239: **
                    240: */
2.19      frystyk   241: PRIVATE int HTTeXGen_put_character (HTStructured * me, char c)
2.1       frystyk   242: {
                    243:     if (!me->startup)                                /* To skip MIME header */
2.13      frystyk   244:        return HT_OK;
2.1       frystyk   245:     if (c=='\n') {
                    246:        if (me->markup || me->preformatted) {     /* Put out as is and flush */
                    247:            *me->write_pointer++ = c;
                    248:            HTTeXGen_flush(me);
2.13      frystyk   249:            return HT_OK;
2.1       frystyk   250:        } else if (me->sensitive || *(me->write_pointer-1)==' ') {
2.13      frystyk   251:            return HT_OK;
2.1       frystyk   252:         } else
                    253:            *me->write_pointer++ = ' ';               /* Try to pretty print */
                    254:     } else if (me->markup || me->preformatted) {
                    255:        *me->write_pointer++ = c;
                    256:     } else if (c==' ' || c=='\t') {                  /* Skip space and tabs */
                    257:        if (*(me->write_pointer-1) != ' ')
                    258:            *me->write_pointer++ = ' ';
                    259:        else
2.13      frystyk   260:            return HT_OK;
2.1       frystyk   261:     } else {
                    262:        if (c=='$' || c=='&' || c=='%' || c=='#' ||         /* Special chars */
                    263:            c=='{' || c=='}' || c=='_') {
                    264:            *me->write_pointer++ = '\\';
                    265:            *me->write_pointer++ = c;
                    266:        } else if (c=='\\') {                               /* Special names */
                    267:            char *temp = "$\\backslash$";
                    268:            strcpy(me->write_pointer, temp);
                    269:            me->write_pointer += strlen(temp);
                    270:        } else if (c=='^') {
                    271:            char *temp = "$\\hat{ }$";
                    272:            strcpy(me->write_pointer, temp);
                    273:            me->write_pointer += strlen(temp);      
                    274:        } else if (c=='~') {
                    275:            char *temp = "$\\tilde{ }$";
                    276:            strcpy(me->write_pointer, temp);
                    277:            me->write_pointer += strlen(temp);
                    278:        } else if (c=='|' || c=='<' || c=='>') {                /* Math mode */
                    279:            *me->write_pointer++ = '$';
                    280:            *me->write_pointer++ = c;
                    281:            *me->write_pointer++ = '$';
                    282:        } else
                    283:            *me->write_pointer++ = c;                   /* Char seems normal */
                    284:     }
                    285: 
2.6       frystyk   286:     if (c==' ')                                                   /* Find delimiter */
2.1       frystyk   287:        me->line_break = me->write_pointer;
                    288:     else if (strchr(WORD_DELIMITERS, c))
                    289:        me->line_break = me->write_pointer-1;
                    290: 
                    291:     /* Flush buffer out when full */
                    292:     if (me->write_pointer >= me->buffer+BUFFER_SIZE-3) {
2.9       frystyk   293: #ifdef OLD_CODE
2.1       frystyk   294:        if (me->markup || me->preformatted) {
2.9       frystyk   295: #endif /* OLD_CODE */
2.8       frystyk   296:        if (me->preformatted) {
2.1       frystyk   297:            *me->write_pointer = '\n';
                    298:            (*me->targetClass.put_block)(me->target,
                    299:                                         me->buffer,
                    300:                                         me->write_pointer-me->buffer+1);
                    301:            me->write_pointer = me->buffer;
                    302:        } else {                                          /* Use break-point */
                    303:            char line_break_char = *me->line_break;
                    304:            char *saved = me->line_break;
                    305:            *me->line_break = '\n';
                    306:            (*me->targetClass.put_block)(me->target,
                    307:                                         me->buffer,
                    308:                                         me->line_break-me->buffer+1);
                    309:            *me->line_break = line_break_char;
                    310:            {                                           /* move next line in */
                    311:                char *p = saved;
                    312:                char *q;
                    313:                for(q=me->buffer; p<me->write_pointer; )
                    314:                    *q++ = *p++;
                    315:            }
                    316:            me->write_pointer = me->buffer + (me->write_pointer-saved);
                    317:        }           
                    318:        me->line_break = me->buffer;
                    319:     }
2.13      frystyk   320:     return HT_OK;
2.1       frystyk   321: }
                    322: 
                    323: 
                    324: 
                    325: /*     String handling
                    326: **     ---------------
                    327: */
2.22      frystyk   328: PRIVATE int HTTeXGen_put_string (HTStructured * me, const char* s)
2.1       frystyk   329: {
2.13      frystyk   330:     while (*s)
                    331:        HTTeXGen_put_character(me, *s++);
                    332:     return HT_OK;
2.1       frystyk   333: }
                    334: 
                    335: 
2.22      frystyk   336: PRIVATE int HTTeXGen_write (HTStructured * me, const char* b, int l)
2.1       frystyk   337: {
2.13      frystyk   338:     while (l-- > 0)
                    339:        HTTeXGen_put_character(me, *b++);
                    340:     return HT_OK;
2.1       frystyk   341: }
                    342: 
                    343: 
                    344: /*     Start Element
                    345: **     -------------
                    346: **
                    347: **             No attributes are put to the output             Henrik 07/03-94
                    348: **     Does no assumptions of WHAT element is started...
                    349: */
2.19      frystyk   350: PRIVATE void HTTeXGen_start_element (HTStructured *    me,
                    351:                                     int                element_number,
2.22      frystyk   352:                                     const BOOL *       present,
                    353:                                     const char **      value)
2.1       frystyk   354: {
                    355:     me->startup = YES;                         /* Now, let's get down to it */
2.6       frystyk   356:     if (me->preformatted == YES) {            /* Don't start markup in here */
2.26    ! frystyk   357:        if (SGML_TRACE)
2.21      eric      358:            HTTrace("LaTeX....... No Markup in verbatim mode\n");
2.1       frystyk   359:        return;
2.6       frystyk   360:     }
2.1       frystyk   361:     if (element_number == HTML_PRE)
                    362:        me->preformatted = YES;
                    363:     if (element_number == HTML_CITE ||               /* No \n here, please! */
                    364:        element_number == HTML_DT ||
                    365:        element_number == HTML_H1 ||
                    366:        element_number == HTML_H2 ||
                    367:        element_number == HTML_H3 ||
                    368:        element_number == HTML_H4 ||
                    369:        element_number == HTML_H5 ||
                    370:        element_number == HTML_H6 ||
                    371:        element_number == HTML_H7 ||
                    372:        element_number == HTML_TITLE)
                    373:        me->sensitive = YES;
                    374:     else if (element_number == HTML_DD)         /* Only way to turn <DT> off */
                    375:        me->sensitive = NO;
                    376:     me->markup = element_number == HTML_A ? NO : YES;
                    377:     HTTeXGen_put_string(me, *TeX_names[element_number]);
                    378:     me->markup = NO;
                    379: }
                    380: 
                    381: 
                    382: /*             End Element
                    383: **             -----------
                    384: **
                    385: **     Ends an markup element                  Henrik 07/03-94
                    386: **     Does no assumptions of WHAT element is ended...
                    387: */
2.19      frystyk   388: PRIVATE void HTTeXGen_end_element (HTStructured * me, int element_number)
2.1       frystyk   389: {
2.6       frystyk   390:     if (me->preformatted && element_number != HTML_PRE) {
2.26    ! frystyk   391:        if (SGML_TRACE)
2.21      eric      392:            HTTrace("LaTeX....... No markup in verbatim mode\n");
2.6       frystyk   393:        return;
                    394:     }
2.1       frystyk   395:     me->preformatted = NO;
                    396:     me->markup = YES;
                    397:     HTTeXGen_put_string(me, *(TeX_names[element_number]+1));
                    398:     me->markup = NO;
                    399:     if (element_number == HTML_CITE || 
                    400:        element_number == HTML_DL ||
                    401:        element_number == HTML_H1 ||
                    402:        element_number == HTML_H2 ||
                    403:        element_number == HTML_H3 ||
                    404:        element_number == HTML_H4 ||
                    405:        element_number == HTML_H5 ||
                    406:        element_number == HTML_H6 ||
                    407:        element_number == HTML_H7 ||
                    408:        element_number == HTML_TITLE)
                    409:        me->sensitive = NO;
                    410: }
                    411: 
                    412: 
                    413: /*             Expanding entities
                    414: **             ------------------
                    415: **
                    416: */
2.19      frystyk   417: PRIVATE void HTTeXGen_put_entity (HTStructured * me, int entity_number)
2.1       frystyk   418: {
                    419:     BOOL mark = me->markup;
                    420:     if (*TeX_entities[entity_number] != '&' && /* Theese are converted later */
                    421:        *TeX_entities[entity_number] != '<' &&
                    422:        *TeX_entities[entity_number] != '>')
                    423:        me->markup = YES;
                    424:     HTTeXGen_put_string(me, TeX_entities[entity_number]);
                    425:     me->markup = mark;
                    426: }
                    427: 
2.25      frystyk   428: PRIVATE int HTTeXGen_unparsedBeginElement (HTStructured * me, const char * b, int l)
                    429: {
                    430:     return (*me->targetClass.put_block)(me->target, b, l);
                    431: }
2.1       frystyk   432: 
2.25      frystyk   433: PRIVATE int HTTeXGen_unparsedEndElement (HTStructured * me, const char * b, int l)
                    434: {
                    435:     return (*me->targetClass.put_block)(me->target, b, l);
                    436: }
                    437: 
                    438: PRIVATE int HTTeXGen_unparsedEntity (HTStructured * me, const char * b, int l)
                    439: {
                    440:     return (*me->targetClass.put_block)(me->target, b, l);
                    441: }
2.1       frystyk   442: 
                    443: /*     Free an HTML object
                    444: **     -------------------
                    445: **
                    446: */
2.19      frystyk   447: PRIVATE int HTTeXGen_free (HTStructured * me)
2.1       frystyk   448: {
                    449:     HTTeXGen_flush(me);
                    450:     (*me->targetClass.put_string)(me->target, "\n\\end{document}\n");
                    451:     HTTeXGen_flush(me);
2.7       duns      452:     (*me->targetClass._free)(me->target);      /* ripple through */
2.20      frystyk   453:     HT_FREE(me);
2.13      frystyk   454:     return HT_OK;
2.1       frystyk   455: }
                    456: 
                    457: 
2.19      frystyk   458: PRIVATE int HTTeXGen_abort (HTStructured * me, HTList * e)
2.1       frystyk   459: {
                    460:     HTTeXGen_free(me);
2.13      frystyk   461:     return HT_ERROR;
2.1       frystyk   462: }
                    463: 
                    464: 
                    465: /*     Structured Object Class
                    466: **     -----------------------
                    467: */
2.22      frystyk   468: PRIVATE const HTStructuredClass HTTeXGeneration = /* As opposed to print etc */
2.1       frystyk   469: {              
                    470:        "HTMLToTeX",
2.13      frystyk   471:        HTTeXGen_flush,
2.1       frystyk   472:        HTTeXGen_free,
                    473:        HTTeXGen_abort,
                    474:        HTTeXGen_put_character,         HTTeXGen_put_string,    HTTeXGen_write,
                    475:        HTTeXGen_start_element,         HTTeXGen_end_element,
2.25      frystyk   476:        HTTeXGen_put_entity,
                    477:        HTTeXGen_unparsedBeginElement,
                    478:        HTTeXGen_unparsedEndElement,
                    479:        HTTeXGen_unparsedEntity
2.1       frystyk   480: }; 
                    481: 
                    482: 
                    483: /*     HTConverter from HTML to TeX Stream
                    484: **     ------------------------------------------
                    485: **
                    486: */
2.19      frystyk   487: PUBLIC HTStream* HTMLToTeX (HTRequest *        request,
                    488:                            void *      param,
                    489:                            HTFormat    input_format,
                    490:                            HTFormat    output_format,
                    491:                            HTStream *  output_stream)
2.1       frystyk   492: {
2.20      frystyk   493:     HTStructured* me;
                    494:     if ((me = (HTStructured *) HT_CALLOC(1, sizeof(*me))) == NULL)
                    495:         HT_OUTOFMEM("HTMLToTeX");
2.1       frystyk   496: 
                    497:     me->isa = (HTStructuredClass*) &HTTeXGeneration;
2.25      frystyk   498:     me->dtd = HTML_dtd();
2.1       frystyk   499:     me->target = output_stream;
                    500:     me->targetClass = *me->target->isa;/* Copy pointers to routines for speed*/
                    501:     me->write_pointer = me->buffer;
                    502:     me->line_break =   me->buffer;
                    503:     (*me->targetClass.put_string)(me->target,
                    504:         "\\documentstyle[11pt]{report}\n\\begin{document}\n");
2.25      frystyk   505:     return SGML_new(HTML_dtd(), me);
2.1       frystyk   506: }

Webmaster