Improved error type with position annotation
[cc1516.git] / src / parse.icl
index fdcb9e3..5fc8f8c 100644 (file)
@@ -3,26 +3,92 @@ implementation module parse
 import StdString
 import StdTuple
 import StdList
-from StdFunc import const
+from StdFunc import const, o
 import Data.Either
+import Data.Functor
+import Data.Maybe
 import Control.Monad
 import Control.Applicative
 import Data.Func
+from Data.List import intercalate, replicate, instance Functor []
+from Text import class Text(concat), instance Text String
 
 import yard
 import lex
 
-parse :: LexerOutput -> ParserOutput
-parse (Left e) = Left $ toString $ LexError e
-parse (Right r) = case runParser parseProgram r of
+parser :: LexerOutput -> ParserOutput
+parser (Left e) = Left $ toString $ LexError e
+parser (Right r) = case runParser parseProgram r of
        (Right p, _) = Right p
        (Left e, _) = Left $ toString e
 
 parseProgram :: Parser Token AST
-parseProgram = parseVar >>= \t.pure $ AST [t] []
+parseProgram = liftM2 AST (many parseVarDecl) (some parseFunDecl)
 
-parseVar :: Parser Token VarDecl
-parseVar = parseType 
+parseFunDecl :: Parser Token FunDecl
+parseFunDecl = liftM5 FunDecl
+       (parseIdent <* satTok BraceOpenToken)
+       (parseSepList CommaToken parseIdent <* satTok BraceCloseToken)
+       (parseFunType <* satTok CBraceOpenToken)
+       (many parseVarDecl)
+       (many parseStmt <* satTok CBraceCloseToken)
+
+parseStmt :: Parser Token Stmt
+parseStmt = parseIfStmt <|> parseWhileStmt <|>
+       parseSColon parseAssStmt <|> parseSColon parseReturnStmt <|>
+       (liftM FunStmt (parseSColon parseFunCall))
+       where
+               parseSColon :: (Parser Token a) -> Parser Token a
+               parseSColon p = p <* satTok SColonToken
+
+               parseReturnStmt :: Parser Token Stmt
+               parseReturnStmt =
+                       satTok ReturnToken *> liftM ReturnStmt (optional parseExpr)
+
+               parseAssStmt :: Parser Token Stmt
+               parseAssStmt = 
+                       liftM2 AssStmt (parseVarDef <* satTok AssignmentToken) parseExpr
+
+               parseIfStmt :: Parser Token Stmt
+               parseIfStmt = liftM3 IfStmt
+                       (satTok IfToken *> parseBBraces parseExpr)
+                       (parseBlock <|> parseOneLine)
+                       (optional (satTok ElseToken *> (parseBlock <|> parseOneLine)
+                               ) >>= pure o fromMaybe [])
+
+               parseWhileStmt :: Parser Token Stmt
+               parseWhileStmt = satTok WhileToken *> 
+                       liftM2 WhileStmt (parseBBraces parseExpr) parseBlock
+
+               parseBlock :: Parser Token [Stmt]
+               parseBlock = parseBCBraces (many parseStmt)
+
+               parseOneLine :: Parser Token [Stmt]
+               //first pure makes singleton list from the statement
+               parseOneLine = liftM pure parseStmt
+
+parseBBraces :: (Parser Token a) -> Parser Token a
+parseBBraces p = satTok BraceOpenToken *> p <* satTok BraceCloseToken
+
+parseBCBraces :: (Parser Token a) -> Parser Token a
+parseBCBraces p = satTok CBraceOpenToken *> p <* satTok CBraceCloseToken
+
+parseFunType :: Parser Token FunType
+parseFunType = satTok DoubleColonToken *> 
+       (parseInOutType <|> (parseVoidOrType >>= \t->pure $ FunType [] t))
+       where
+               parseInOutType :: Parser Token FunType
+               parseInOutType = some parseType <* satTok ArrowToken
+                       >>= \intypes-> parseVoidOrType
+                       >>= \outtypes->pure $ FunType intypes outtypes
+
+               parseVoidOrType :: Parser Token (Maybe Type)
+               parseVoidOrType = (satTok VoidToken *> pure Nothing) <|> 
+                       (parseType >>= \type->pure $ Just type)
+
+parseVarDecl :: Parser Token VarDecl
+parseVarDecl = 
+       (parseType <|> trans1 VarToken VarType )
        >>= \t->parseIdent <* satTok AssignmentToken
        >>= \i->parseExpr <* satTok SColonToken
        >>= \e->pure $ VarDecl i t e
@@ -30,7 +96,6 @@ parseVar = parseType
 parseType :: Parser Token Type
 parseType = 
        trans1 IntTypeToken IntType <|>
-       trans1 VarToken VarType <|>
        trans1 CharTypeToken CharType <|>
        trans1 BoolTypeToken BoolType <|>
        (satTok SquareOpenToken *> parseType <* satTok SquareCloseToken 
@@ -42,39 +107,65 @@ parseType =
        empty
 
 parseExpr :: Parser Token Expr
-parseExpr = 
-       (satTok BraceOpenToken *> parseExpr <* satTok BraceCloseToken) <|>
-       (satTok BraceOpenToken *> parseExpr <* satTok CommaToken 
-               >>= \e1->parseExpr <* satTok BraceCloseToken 
-               >>= \e2->pure $ TupleExpr e1 e2) <|>
-       trans1 EmptyListToken EmptyListExpr <|>
-       trans2 TrueToken (const $ BoolExpr True) <|>
-       trans2 FalseToken (const $ BoolExpr True) <|>
-       trans2 (NumberToken zero) (\(NumberToken i)->IntExpr i) <|>
-       trans2 (CharToken zero) (\(CharToken c)->CharExpr c) <|>
-       (parseOp1 >>= \o->parseExpr >>= \e.pure $ Op1Expr o e) <|>
-       (parseIdent >>= \i. parseFieldSelector >>= \f.pure $ VarExpr i f)
+parseExpr = //Operators in order of binding strength
+       parseOpR (trans1 ColonToken BiCons) $
+       parseOpR (trans1 PipesToken BiOr) $
+       parseOpR (trans1 AmpersandsToken BiAnd) $
+       parseOpR (trans1 EqualsToken BiEquals <|>
+                       trans1 LesserToken BiLesser <|>
+                       trans1 BiggerToken BiGreater <|>
+                       trans1 LesserEqToken BiLesserEq <|>
+                       trans1 GreaterEqToken BiGreaterEq <|>
+                       trans1 NotEqualToken BiUnEqual) $
+       parseOpL (trans1 PlusToken BiPlus <|>
+                       trans1 DashToken BiMinus) $
+       parseOpL (trans1 StarToken BiTimes <|>
+                       trans1 SlashToken BiDivide <|>
+                       trans1 PercentToken BiMod) $ parseBasicExpr
+       where
+               parseOpR :: (Parser Token Op2) (Parser Token Expr) -> Parser Token Expr
+               parseOpR ops prev = prev >>= \e1->optional (
+                               ops >>= \op->parseOpR ops prev >>= \e->pure (op, e)
+                       ) >>= \moe->pure $ maybe e1 (\(op,e2)->Op2Expr e1 op e2) moe
+
+               parseOpL :: (Parser Token Op2) (Parser Token Expr) -> Parser Token Expr
+               parseOpL ops prev = prev >>= \e1->many (
+                               ops >>= \op->prev >>= \e->pure (op, e)
+                       ) >>= \moe->foldM (\e->(\(op,e2)->pure $ Op2Expr e op e2)) e1 moe
+
+               parseBasicExpr :: Parser Token Expr
+               parseBasicExpr = 
+                       (satTok BraceOpenToken *> parseExpr <* satTok CommaToken 
+                               >>= \e1->parseExpr <* satTok BraceCloseToken 
+                               >>= \e2->pure $ TupleExpr e1 e2) <|>
+                       (parseFunCall >>= \fc->pure $ FunExpr fc) <|>
+                       parseBBraces parseExpr <|>
+                       trans1 EmptyListToken EmptyListExpr <|>
+                       trans2 TrueToken (const $ BoolExpr True) <|>
+                       trans2 FalseToken (const $ BoolExpr False) <|>
+                       trans2 (NumberToken zero) (\(NumberToken i)->IntExpr i) <|>
+                       trans2 (CharToken zero) (\(CharToken c)->CharExpr c) <|>
+                       (parseOp1 >>= \o->parseExpr >>= \e.pure $ Op1Expr o e) <|>
+                       (parseVarDef >>= \ve->pure $ VarExpr ve)
+
+parseFunCall :: Parser Token FunCall
+parseFunCall = parseIdent <* satTok BraceOpenToken 
+       >>= \i->parseSepList CommaToken parseExpr 
+       <* satTok BraceCloseToken >>= \es->pure $ FunCall i es
+
+parseVarDef :: Parser Token VarDef
+parseVarDef = parseIdent 
+       >>= \i-> many (satTok DotToken *> (
+               (parseIdent >>= (\i.if (i == "hd") (pure FieldHd) empty)) <|>
+               (parseIdent >>= \i.if (i == "tl") (pure FieldTl) empty) <|>
+               (parseIdent >>= \i.if (i == "fst") (pure FieldFst) empty) <|>
+               (parseIdent >>= \i.if (i == "snd") (pure FieldSnd) empty))
+       ) >>= \f->pure $ VarDef i f
 
 parseOp1 :: Parser Token Op1
 parseOp1 = trans1 DashToken UnMinus <|> 
        trans1 ExclamationToken UnNegation
 
-parseOp2 :: Parser Token Op2
-parseOp2 = trans1 StarToken BiTimes <|> trans1 SlashToken BiDivide <|>
-       trans1 PercentToken BiMod <|> trans1 EqualsToken BiEquals <|>
-       trans1 LesserToken BiLesser <|> trans1 BiggerToken BiGreater <|>
-       trans1 LesserEqToken BiLesserEq <|> trans1 PlusToken BiPlus <|>
-       trans1 GreaterEqToken BiGreaterEq <|> trans1 DashToken BiMinus <|>
-       trans1 NotEqualToken BiUnEqual <|> trans1 AmpersandsToken BiAnd <|>
-       trans1 PipesToken BiOr <|> trans1 ColonToken BiCons
-
-parseFieldSelector :: Parser Token (Maybe FieldSelector)
-parseFieldSelector = optional (satTok DotToken *> (
-       (parseIdent >>= (\i.if (i == "hd") (pure FieldHd) empty)) <|>
-       (parseIdent >>= \i.if (i == "tl") (pure FieldTl) empty) <|>
-       (parseIdent >>= \i.if (i == "fst") (pure FieldFst) empty) <|>
-       (parseIdent >>= \i.if (i == "snd") (pure FieldSnd) empty)))
-
 trans2 :: TokenValue (TokenValue -> a) -> Parser Token a
 trans2 t f = satTok t >>= \(_, r).pure (f r)
 
@@ -82,7 +173,105 @@ trans1 :: TokenValue a -> Parser Token a
 trans1 t r = trans2 t $ const r
 
 satTok :: TokenValue -> Parser Token Token
-satTok t = satisfy ((===) t)
+satTok t = top >>= \tok=:(pos, tv) -> if (t === tok) (return tok) (fail <?> ("Token", pos))
+
+parseSepList :: TokenValue (Parser Token a) -> Parser Token [a]
+parseSepList sep p = 
+       (some (p <* satTok sep) >>= \es->p >>= \e.pure $ reverse [e:es]) <|>
+       (p >>= \e->pure [e]) <|> pure []
 
 parseIdent :: Parser Token String
 parseIdent = trans2 (IdentToken []) (\(IdentToken e).toString e)
+
+instance toString AST where
+       toString (AST v f) = concat (
+               ["\n":printersperse "\n" v] ++
+               ["\n":printersperse "\n" f])
+
+class print a :: a -> [String]
+
+printersperse :: String [a] -> [String] | print a
+printersperse i j = intercalate [i] (map print j)
+
+instance print FunDecl where
+       print (FunDecl i as t vs ss) =
+               ["\n", i, " (":printersperse "," as] ++
+               [") :: ":print t] ++
+               ["{":printersperse "\n\t" vs] ++
+               ["\n":printStatements ss 1] ++ ["}"]
+
+printStatements :: [Stmt] Int -> [String]
+printStatements [] i = []
+printStatements [s:ss] i = (case s of
+       (IfStmt b thens elses) = indent i ["if (":print b] ++ [")"] ++
+               printCodeBlock thens i ++ 
+               indent i ["else ":printCodeBlock elses i] ++ ["\n"]
+       (WhileStmt b dos) = indent i ["while (":print b] ++ 
+               [")":printCodeBlock dos i]
+       (AssStmt vardef val) =
+               indent i $ print vardef ++ ["=":print val] ++ [";\n"]
+       (FunStmt fc) = indent i $ print fc ++ [";\n"]
+       (ReturnStmt me) = indent i ["return ":maybe [""] print me] ++ [";\n"]
+       ) ++ printStatements ss i
+       where
+               printCodeBlock :: [Stmt] Int -> [String]
+               printCodeBlock [] _ = ["{}"]
+               printCodeBlock [x] i = ["\n":printStatements [x] (i+1)]
+               printCodeBlock x i =
+                       ["{\n":printStatements x (i+1)] ++ indent i ["}"]
+
+               indent :: Int [String] -> [String]
+               indent i rest = replicate i "\t" ++ rest
+
+instance print FunType where
+       print (FunType at rt) = printersperse " " at ++
+               [if (isEmpty at) "" "->":maybe ["Void"] print rt]
+
+instance print VarDecl where
+       print (VarDecl i t e) = print t ++ [" ":i:"=":print e] ++ [";"]
+
+instance print Type where
+       print (TupleType t1 t2) = ["(":print t1] ++ [",":print t2] ++ [")"]
+       print (ListType t) = ["[":print t] ++ ["]"]
+       print (IdType s) = print s
+       print IntType = print "Int"
+       print BoolType = print "Bool"
+       print CharType = print "Char"
+       print VarType = print "var"
+
+instance print String where
+       print s = [s]
+
+instance print FieldSelector where     
+       print FieldHd = print "hd"
+       print FieldTl = print "tl"
+       print FieldSnd = print "snd"
+       print FieldFst = print "fst"
+
+instance print VarDef where
+       print (VarDef i fs) = printersperse "." [i:flatten $ map print fs]
+
+instance print FunCall where
+       print (FunCall i args) = [i,"(":printersperse "," args] ++ [")"]
+
+instance print Expr where
+       print (VarExpr vd) = print vd
+       print (Op2Expr e1 o e2) = ["(":print e1] ++ [" ",case o of
+               BiPlus = "+"; BiMinus = "-"; BiTimes = "*"; BiDivide = "/"
+               BiMod = "%"; BiEquals = "="; BiLesser = "<"; BiGreater = ">"
+               BiLesserEq = "<="; BiGreaterEq = ">="; BiUnEqual = "!=";
+               BiAnd = "&&"; BiOr = "||"; BiCons = ":"
+               ," ":print e2] ++ [")"]
+       print (Op1Expr o e) = ["(",case o of
+               UnNegation = "!"; UnMinus = "-"
+               :print e] ++ [")"]
+       print (IntExpr i) = [toString i]
+       print (CharExpr c) = ["\'", case c of
+               '\b' = "\\b"; '\f' = "\\f"; '\n' = "\\n"
+               '\r' = "\\r"; '\t' = "\\t"; '\v' = "\\v"
+               c = if (c == toChar 7) "\\a" (toString c)
+               ,"\'"]
+       print (BoolExpr b) = [toString b]
+       print (FunExpr fc) = print fc
+       print EmptyListExpr = ["[]"]
+       print (TupleExpr e1 e2) = ["(":print e1] ++ [",":print e2] ++ [")"]