blob: ae114729700a1339df524c4dc1114f22195cb483 (
plain) (
blame)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
|
{
open Xi_lib
open Parser
open Parser_utils
(* Lexing z biblioteki standardowej ocamla *)
open Lexing
(* Standardowo w YACC-podobnych narzędziach to lekser jest uzależniony od parsera. To znaczy, że typ
* danych z tokenami definiuje moduł wygenerowany na bazie grammar.mly. Definiujemy alias na typ
* tokenu na potrzeby interfejsów Xi_lib.Iface *)
type token = Parser.token
(* Obsługa błędu *)
let handleError pos token =
let exc = InvalidToken (mkLocation pos, token) in
raise exc
(* vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv
* Miejsce na twój kod w Ocamlu
*)
(* ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
----------------------------------------------------------------------------- *)
}
(* vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv
* Miejsce na nazwane wyrażenia regularne
*)
let identifier = ['a'-'z' '_' 'A' - 'Z']['_' 'A' - 'Z' 'a'-'z' '0'-'9']*
let integer = ['0'-'9']*
(* ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
----------------------------------------------------------------------------- *)
rule token = parse
(* Trzeba pamiętać aby uaktualnić pozycje w lexbuf, gdy widzimy znak końca wiersza.
* To się samo nie robi. Moduł Lexing z standardowej biblioteki daje do tego wygodną
* funkcję new_line.
*)
| ['\n']
{ new_line lexbuf; token lexbuf }
(* widzimy początek komentarza i przechodzimy do pomocniczego stanu *)
| "//"
{ line_comment lexbuf }
| eof
{ EOF }
(* vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv
* Miejsce na twoje reguły
*)
| "," { COMMA }
| "(" { LPAREN }
| ")" { RPAREN }
| "{" { LBRACKET }
| "}" { RBRACKET }
| "[" { LSBRACKET }
| "]" { RSBRACKET }
| ":" { COLON }
| "+" { OP_PLUS }
| "-" { OP_MINUS }
| "*" { OP_MULT }
| "/" { OP_DIV }
| "%" { OP_REM }
| "&" { OP_AND }
| "|" { OP_OR }
| "==" { OP_EQ }
| "!=" { OP_NEQ }
| "<=" { OP_LE }
| ">=" { OP_GE }
| "<" { OP_LT }
| ">" { OP_GT }
| "!" { OP_NOT }
| "=" { ASSIGN }
| "if" { IF }
| "else" { ELSE }
| "while" { WHILE }
| "return" { RETURN }
| "length" { LENGTH }
| "int" { T_INT }
| "bool" { T_BOOL }
| identifier as id { IDENTIFIER id }
| integer as i { INT (int_of_string i) }
(* ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
----------------------------------------------------------------------------- *)
| " " {token lexbuf}
| _
{ handleError (Lexing.lexeme_start_p lexbuf) (Lexing.lexeme lexbuf) }
(* Pomocniczy stan aby wygodnie i prawidłowo obsłużyć komentarze *)
and line_comment = parse
| '\n'
{ new_line lexbuf; token lexbuf }
(* Niektóre edytory nie wstawiają znaku końca wiersza w ostatniej linijce, jesteśmy
* przygotowani na obsługę takiego komentarza.
*)
| eof
{ EOF }
| _
{ line_comment lexbuf }
|