make parser more robuust, add string literals and escapes
[ccc.git] / ast.c
diff --git a/ast.c b/ast.c
index 0a17870..597dfa6 100644 (file)
--- a/ast.c
+++ b/ast.c
@@ -101,6 +101,14 @@ struct stmt *stmt_expr(struct expr *expr)
        return res;
 }
 
+struct stmt *stmt_vardecl(struct vardecl *vardecl)
+{
+       struct stmt *res = safe_malloc(sizeof(struct stmt));
+       res->type = svardecl;
+       res->data.svardecl = vardecl;
+       return res;
+}
+
 struct stmt *stmt_while(struct expr *pred, struct list *body)
 {
        struct stmt *res = safe_malloc(sizeof(struct stmt));
@@ -128,52 +136,44 @@ struct expr *expr_bool(bool b)
        res->data.ebool = b;
        return res;
 }
-int fromHex(char c)
-{
-       if (c >= '0' && c <= '9')
-               return c-'0';
-       if (c >= 'a' && c <= 'f')
-               return c-'a'+10;
-       if (c >= 'A' && c <= 'F')
-               return c-'A'+10;
-       return -1;
-}
 
-struct expr *expr_char(const char *c)
+struct expr *expr_char(char *c)
 {
        struct expr *res = safe_malloc(sizeof(struct expr));
        res->type = echar;
-       //regular char
-       if (c[0] == '\'' && c[2] == '\'')
-               res->data.echar = c[1];
-       //escape
-       else if (c[0] == '\'' && c[1] == '\\' && c[3] == '\'')
-               switch(c[2]) {
-               case '0': res->data.echar = '\0'; break;
-               case '\'': res->data.echar = '\''; break;
-               case '\\': res->data.echar = '\\'; break;
-               case 'a': res->data.echar = '\a'; break;
-               case 'b': res->data.echar = '\b'; break;
-               case 't': res->data.echar = '\t'; break;
-               case 'v': res->data.echar = '\v'; break;
-               case 'f': res->data.echar = '\f'; break;
-               case 'r': res->data.echar = '\r'; break;
-               }
-       //hex escape
-       else if (c[0] == '\'' && c[1] == '\\' && c[2] == 'x' && c[5] == '\'')
-               res->data.echar = (fromHex(c[3])<<4)+fromHex(c[4]);
-       else
-               die("malformed character: %s\n", c);
+       res->data.echar = unescape_char(c)[0];
        return res;
 }
 
-struct expr *expr_funcall(char *ident, struct list *args)
+static void set_fields(enum fieldspec **farray, int *n, struct list *fields)
+{
+       void **els = list_to_array(fields, n, true);
+       *farray = (enum fieldspec *)safe_malloc(*n*sizeof(enum fieldspec));
+       for (int i = 0; i<*n; i++) {
+               char *t = els[i];
+               if (strcmp(t, "fst") == 0)
+                       (*farray)[i] = fst;
+               else if (strcmp(t, "snd") == 0)
+                       (*farray)[i] = snd;
+               else if (strcmp(t, "hd") == 0)
+                       (*farray)[i] = hd;
+               else if (strcmp(t, "tl") == 0)
+                       (*farray)[i] = tl;
+               free(t);
+       }
+       free(els);
+}
+
+
+struct expr *expr_funcall(char *ident, struct list *args, struct list *fields)
 {
        struct expr *res = safe_malloc(sizeof(struct expr));
        res->type = efuncall;
        res->data.efuncall.ident = ident;
        res->data.efuncall.args = (struct expr **)
                list_to_array(args, &res->data.efuncall.nargs, true);
+       set_fields(&res->data.efuncall.fields,
+               &res->data.efuncall.nfields, fields);
        return res;
 }
 
@@ -190,23 +190,7 @@ struct expr *expr_ident(char *ident, struct list *fields)
        struct expr *res = safe_malloc(sizeof(struct expr));
        res->type = eident;
        res->data.eident.ident = ident;
-
-       void **els = list_to_array(fields, &res->data.eident.nfields, true);
-       res->data.eident.fields = (enum fieldspec *)safe_malloc(
-               res->data.eident.nfields*sizeof(enum fieldspec));
-       for (int i = 0; i<res->data.eident.nfields; i++) {
-               char *t = els[i];
-               if (strcmp(t, "fst") == 0)
-                       res->data.eident.fields[i] = fst;
-               else if (strcmp(t, "snd") == 0)
-                       res->data.eident.fields[i] = snd;
-               else if (strcmp(t, "hd") == 0)
-                       res->data.eident.fields[i] = hd;
-               else if (strcmp(t, "tl") == 0)
-                       res->data.eident.fields[i] = tl;
-               free(t);
-       }
-       free(els);
+       set_fields(&res->data.eident.fields, &res->data.eident.nfields, fields);
        return res;
 }
 
@@ -230,9 +214,15 @@ struct expr *expr_string(char *str)
 {
        struct expr *res = safe_malloc(sizeof(struct expr));
        res->type = estring;
-       res->data.estring = safe_strdup(str+1);
-       res->data.estring[strlen(res->data.estring)-1] = '\0';
-       //TODO escapes
+       res->data.estring.nchar = 0;
+       res->data.estring.chars = safe_malloc(strlen(str)+1);
+       char *p = res->data.estring.chars;
+       while(*str != '\0') {
+               str = unescape_char(str);
+               *p++ = *str++;
+               res->data.estring.nchar++;
+       }
+       *p = '\0';
        return res;
 }
 
@@ -296,20 +286,6 @@ struct type *type_var(char *ident)
        return res;
 }
 
-
-const char *cescapes[] = {
-       [0] = "0", [1] = "x01", [2] = "x02", [3] = "x03",
-       [4] = "x04", [5] = "x05", [6] = "x06", [7] = "a", [8] = "b",
-       [9] = "t", [10] = "n", [11] = "v", [12] = "f", [13] = "r",
-       [14] = "x0E", [15] = "x0F", [16] = "x10", [17] = "x11",
-       [18] = "x12", [19] = "x13", [20] = "x14", [21] = "x15",
-       [22] = "x16", [23] = "x17", [24] = "x18", [25] = "x19",
-       [26] = "x1A", [27] = "x1B", [28] = "x1C", [29] = "x1D",
-       [30] = "x1E", [31] = "x1F",
-       ['\\'] = "\\", ['\''] = "'",
-       [127] = "x7F"
-};
-
 void ast_print(struct ast *ast, FILE *out)
 {
        if (ast == NULL)
@@ -408,6 +384,9 @@ void stmt_print(struct stmt *stmt, int indent, FILE *out)
                expr_print(stmt->data.sexpr, out);
                safe_fprintf(out, ";\n");
                break;
+       case svardecl:
+               vardecl_print(stmt->data.svardecl, indent, out);
+               break;
        case swhile:
                pindent(indent, out);
                safe_fprintf(out, "while (");
@@ -428,6 +407,7 @@ void expr_print(struct expr *expr, FILE *out)
 {
        if (expr == NULL)
                return;
+       char buf[] = "\\xff";
        switch(expr->type) {
        case ebinop:
                safe_fprintf(out, "(");
@@ -440,16 +420,8 @@ void expr_print(struct expr *expr, FILE *out)
                safe_fprintf(out, "%s", expr->data.ebool ? "true" : "false");
                break;
        case echar:
-               if (expr->data.echar < 0) {
-                       safe_fprintf(out, "'?'");
-               } else if (expr->data.echar < ' ' || expr->data.echar == 127
-                               || expr->data.echar == '\\'
-                               || expr->data.echar == '\'') {
-                       safe_fprintf(out, "'\\%s'",
-                               cescapes[(int)expr->data.echar]);
-               } else {
-                       safe_fprintf(out, "'%c'", expr->data.echar);
-               }
+               safe_fprintf(out, "'%s'",
+                       escape_char(expr->data.echar, buf, false));
                break;
        case efuncall:
                safe_fprintf(out, "%s(", expr->data.efuncall.ident);
@@ -459,6 +431,9 @@ void expr_print(struct expr *expr, FILE *out)
                                safe_fprintf(out, ", ");
                }
                safe_fprintf(out, ")");
+               for (int i = 0; i<expr->data.efuncall.nfields; i++)
+                       fprintf(out, ".%s",
+                               fieldspec_str[expr->data.efuncall.fields[i]]);
                break;
        case eint:
                safe_fprintf(out, "%d", expr->data.eint);
@@ -480,7 +455,11 @@ void expr_print(struct expr *expr, FILE *out)
                safe_fprintf(out, ")");
                break;
        case estring:
-               safe_fprintf(out, "\"%s\"", expr->data.estring);
+               safe_fprintf(out, "\"");
+               for (int i = 0; i<expr->data.estring.nchar; i++)
+                       safe_fprintf(out, "%s", escape_char(
+                               expr->data.estring.chars[i], buf, true));
+               safe_fprintf(out, "\"");
                break;
        case eunop:
                safe_fprintf(out, "(%s", unop_str[expr->data.eunop.op]);
@@ -577,6 +556,7 @@ void stmt_free(struct stmt *stmt)
                free(stmt->data.sassign.ident);
                for (int i = 0; i<stmt->data.sassign.nfield; i++)
                        free(stmt->data.sassign.fields[i]);
+               free(stmt->data.sassign.fields);
                expr_free(stmt->data.sassign.expr);
                break;
        case sif:
@@ -600,6 +580,9 @@ void stmt_free(struct stmt *stmt)
                        stmt_free(stmt->data.swhile.body[i]);
                free(stmt->data.swhile.body);
                break;
+       case svardecl:
+               vardecl_free(stmt->data.svardecl);
+               break;
        default:
                die("Unsupported stmt node\n");
        }
@@ -623,6 +606,7 @@ void expr_free(struct expr *expr)
                free(expr->data.efuncall.ident);
                for (int i = 0; i<expr->data.efuncall.nargs; i++)
                        expr_free(expr->data.efuncall.args[i]);
+               free(expr->data.efuncall.fields);
                free(expr->data.efuncall.args);
                break;
        case eint:
@@ -638,7 +622,7 @@ void expr_free(struct expr *expr)
                expr_free(expr->data.etuple.right);
                break;
        case estring:
-               free(expr->data.estring);
+               free(expr->data.estring.chars);
                break;
        case eunop:
                expr_free(expr->data.eunop.l);