-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathscript_parser.py
More file actions
1294 lines (1080 loc) · 50.8 KB
/
script_parser.py
File metadata and controls
1294 lines (1080 loc) · 50.8 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
"""
VBA風スクリプトパーサー
トークナイズとAST構築を行う
"""
# バージョン情報(Raw文字列リテラル対応版)
PARSER_VERSION = "2.1.0-raw-string-support"
PARSER_BUILD_DATE = "2025-01-21"
import re
from typing import List, Any, Optional, Union
try:
from .locales import get_message
except ImportError:
from locales import get_message
class Token:
"""トークンクラス"""
def __init__(self, type_: str, value: Any, line: int = 0, is_end_of_line: bool = False):
self.type = type_
self.value = value
self.line = line
self.is_end_of_line = is_end_of_line # 行末トークンかどうか(1行IF判定用)
class ASTNode:
"""Abstract Syntax Tree ノード"""
def __init__(self, type_: str, **kwargs):
self.type = type_
for key, value in kwargs.items():
setattr(self, key, value)
class ScriptParser:
"""VBA風スクリプトのパーサー"""
# トークンパターン
TOKEN_PATTERNS = [
# Raw文字列リテラル(エスケープ処理を最小限にする)
# VBA式""のみサポート: 文字列内の"を表す
# バックスラッシュは通常文字として扱う(エスケープ処理なし)
(r'^r"((?:[^"]|"")*)"', 'RAW_STRING'),
# 文字列リテラルを先に判定(コメントより優先)
# VBA式の"" エスケープをサポート: "" は " を表す
(r'^"((?:[^"]|"")*)"', 'STRING'),
(r"^'([^']*)'", 'STRING'),
# その後でコメントを判定
(r'^\s*\'\s+.*$', 'COMMENT'), # ' の後にスペースがある場合のみコメント
(r'^REM\b', 'COMMENT'),
# 配列操作キーワード
(r'^DIM\b', 'DIM'),
(r'^REDIM\b', 'REDIM'),
(r'^ARRAY\b', 'ARRAY_FUNC'),
(r'^SPLIT\b', 'SPLIT_FUNC'),
# 関数定義関連
(r'^FUNCTION\b', 'FUNCTION_DEF'),
(r'^END\s+FUNCTION\b', 'END_FUNCTION'),
(r'^BYVAL\b', 'BYVAL'),
(r'^BYREF\b', 'BYREF'),
(r'^OPTIONAL\b', 'OPTIONAL'),
(r'^AS\b', 'AS'),
# 制御構造
(r'^SELECT\s+CASE\b', 'SELECT_CASE'),
(r'^END\s+SELECT\b', 'END_SELECT'),
(r'^CASE\s+ELSE\b', 'CASE_ELSE'),
(r'^CASE\b', 'CASE'),
(r'^IS\b', 'IS'),
(r'^IF\b', 'IF'),
(r'^THEN\b', 'THEN'),
(r'^ELSE\b', 'ELSE'),
(r'^ELSEIF\b', 'ELSEIF'),
(r'^ENDIF\b', 'ENDIF'),
(r'^END\s+IF\b', 'ENDIF'),
(r'^WHILE\b', 'WHILE'),
(r'^END\s+WHILE\b', 'END_WHILE'),
(r'^WEND\b', 'WEND'),
(r'^DO\b', 'DO'),
(r'^LOOP\b', 'LOOP'),
(r'^FOR\b', 'FOR'),
(r'^TO\b', 'TO'),
(r'^STEP\b', 'STEP'),
(r'^NEXT\b', 'NEXT'),
(r'^RETURN\b', 'RETURN'),
# EXIT statements (order matters: specific before general)
(r'^EXIT\s+FUNCTION\b', 'EXIT_FUNCTION'),
(r'^EXIT\s+FOR\b', 'EXIT_FOR'),
(r'^EXIT\s+WHILE\b', 'EXIT_WHILE'),
(r'^AND\b', 'AND'),
(r'^OR\b', 'OR'),
(r'^NOT\b', 'NOT'),
(r'^MOD\b', 'MOD'),
(r'^&', 'CONCAT'),
(r'^<=', 'LTE'),
(r'^>=', 'GTE'),
(r'^!=', 'NEQ'), # C言語スタイルの不等号演算子
(r'^<>', 'NEQ'),
(r'^<', 'LT'),
(r'^>', 'GT'),
(r'^=', 'EQ'),
(r'^\+', 'PLUS'),
(r'^-', 'MINUS'),
(r'^\*', 'MULTIPLY'),
(r'^\\', 'INTDIV'), # 整数除算(DIVIDEより先にマッチさせる)
(r'^/', 'DIVIDE'),
(r'^\^', 'POWER'),
(r'^\(', 'LPAREN'),
(r'^\)', 'RPAREN'),
(r'^\[', 'LBRACKET'), # 配列アクセス用の左括弧
(r'^\]', 'RBRACKET'), # 配列アクセス用の右括弧
(r'^,', 'COMMA'),
# ブールリテラル
(r'^True\b', 'BOOL'),
(r'^False\b', 'BOOL'),
(r'^[0-9]+\.[0-9]+', 'FLOAT'),
(r'^[0-9]+', 'INT'),
(r'^[A-Za-z_][A-Za-z0-9_]*\[\]', 'ARRAY_VAR'), # 配列変数参照([]記法)
(r'^[A-Za-z_][A-Za-z0-9_]*\(', 'FUNCTION'), # 関数呼び出し
(r'^[A-Za-z_][A-Za-z0-9_]*', 'IDENTIFIER'), # 通常の識別子(配列アクセスは後で判定)
]
def __init__(self, locale: str = 'ja'):
self.locale = locale # デフォルトで日本語
self.tokens = []
self.current = 0
# バージョン情報をコンソールに出力
print(f"[ScriptParser] Version: {PARSER_VERSION} (Build: {PARSER_BUILD_DATE})")
def tokenize(self, script: str) -> List[Token]:
"""スクリプトをトークンに分解"""
tokens = []
lines = script.split('\n')
for line_num, line in enumerate(lines):
line = line.strip()
if not line:
continue
# コメント行はスキップ
# VBAスタイルのコメント: ' の後にスペースがあるか、= が含まれない行の場合
if line.startswith("'") and ('=' not in line or line.startswith("' ")):
continue
if line.upper().startswith("REM "):
continue
# インラインコメント処理: 文字列リテラル外の ' 以降を除去
# 文字列リテラル内の ' は保護する必要がある
processed_line = ""
in_string = False
escape_next = False
i = 0
while i < len(line):
char = line[i]
# エスケープ処理
if escape_next:
processed_line += char
escape_next = False
i += 1
continue
if char == '\\':
processed_line += char
escape_next = True
i += 1
continue
# ダブルクォート処理
if char == '"':
in_string = not in_string
processed_line += char
i += 1
continue
# インラインコメント検出(文字列外のみ)
if char == "'" and not in_string:
# ここから行末までコメント
break
processed_line += char
i += 1
# 処理後の行が空になった場合はスキップ
line = processed_line.strip()
if not line:
continue
# この行の開始トークンインデックスを記録
line_start_token_idx = len(tokens)
pos = 0
while pos < len(line):
# 空白をスキップ
while pos < len(line) and line[pos] in ' \t':
pos += 1
if pos >= len(line):
break
# トークンマッチング
matched = False
for pattern, token_type in self.TOKEN_PATTERNS:
regex = re.compile(pattern, re.IGNORECASE)
match = regex.match(line[pos:])
if match:
value = match.group(0)
# Raw文字列リテラルの場合、エスケープ処理を最小限にする
if token_type == 'RAW_STRING':
# グループ1が存在すれば(括弧でキャプチャされた部分)それを使用
original_value = match.group(0)
value = match.group(1) if match.groups() else value[2:-1] # r"..." の r" と " を除去
# Raw文字列ではVBA式エスケープ("")のみ処理
value = value.replace('""', '"')
print(f"[ScriptParser] RAW_STRING: '{original_value}' -> '{value}'")
# その他のエスケープシーケンス(\n, \t等)は処理しない
# 通常の文字列リテラルの場合、引用符を除去
elif token_type == 'STRING':
# グループ1が存在すれば(括弧でキャプチャされた部分)それを使用
original_value = match.group(0)
value = match.group(1) if match.groups() else value[1:-1]
print(f"[ScriptParser] STRING matched: '{original_value}' -> group(1)='{match.group(1) if match.groups() else 'N/A'}'")
# エスケープシーケンスを処理
# VBAでは "" はダブルクォート、その他の\はそのまま(正規表現用)
value = value.replace('""', '"')
print(f"[ScriptParser] STRING after VBA escape: '{value}'")
# 明示的なエスケープシーケンスのみ置換(日本語文字列の文字化け対策)
# unicode_escapeは日本語などマルチバイト文字で文字化けを引き起こすため使用しない
# CRITICAL: \\ を先に処理しないと、\\n や \\t が誤って変換される
value = value.replace('\\\\', '\x00') # 一時的にヌル文字に置き換え
value = value.replace('\\n', '\n')
value = value.replace('\\t', '\t')
value = value.replace('\\r', '\r')
value = value.replace('\x00', '\\')
# 関数呼び出しの場合、名前と括弧を分離
elif token_type == 'FUNCTION':
value = value[:-1] # 括弧を除去
# 配列変数参照の場合、名前と括弧を分離
elif token_type == 'ARRAY_VAR':
value = value[:-2] # []を除去
# 配列アクセスの場合、名前と括弧を分離
elif token_type == 'ARRAY':
value = value[:-1] # 括弧を除去
# 数値の場合、適切な型に変換
elif token_type == 'INT':
value = int(value)
elif token_type == 'FLOAT':
value = float(value)
tokens.append(Token(token_type, value, line_num))
pos += len(match.group(0))
matched = True
break
if not matched:
# マッチしなかった文字に対してエラーを発生
char = line[pos]
if char not in ' \t\n\r': # 空白文字以外で無効な文字
raise SyntaxError(get_message('error_invalid_char', self.locale, char, line_num, pos))
pos += 1
# この行の最後のトークンに is_end_of_line=True を設定
if len(tokens) > line_start_token_idx:
tokens[-1].is_end_of_line = True
return tokens
def parse(self, script: str) -> List[ASTNode]:
"""スクリプトをパースしてASTを構築"""
self.tokens = self.tokenize(script)
self.current = 0
statements = []
while not self.is_at_end():
stmt = self.parse_statement()
if stmt:
statements.append(stmt)
return statements
def parse_statement(self) -> Optional[ASTNode]:
"""ステートメントをパース"""
if self.is_at_end():
return None
# 🚨 予約語チェック(代入文として使おうとしている場合)
# IF, FOR, STEP等の予約語を変数名として使うことを禁止
RESERVED_KEYWORDS = [
'IF', 'THEN', 'ELSE', 'ELSEIF', 'ENDIF', 'END',
'FOR', 'TO', 'STEP', 'NEXT',
'DIM', 'REDIM',
'SELECT', 'CASE',
'FUNCTION', 'SUB'
]
if self.current < len(self.tokens):
token = self.peek()
# 次のトークンが '=' の場合、変数代入として使おうとしている
if token.type in RESERVED_KEYWORDS:
next_pos = self.current + 1
if next_pos < len(self.tokens) and self.tokens[next_pos].type == 'EQ':
from locales import get_message
raise SyntaxError(get_message('error_reserved_keyword', self.locale, token.value))
# FUNCTION定義
if self.check('FUNCTION_DEF'):
return self.parse_function_definition()
# SELECT CASE文
if self.check('SELECT_CASE'):
return self.parse_select_case_statement()
# IF文(IF関数ではない場合)
if self.check('IF') and not self.peek_ahead('LPAREN'):
return self.parse_if_statement()
# WHILE文
if self.check('WHILE'):
return self.parse_while_statement()
# FOR文
if self.check('FOR'):
return self.parse_for_statement()
# DIM文
if self.check('DIM'):
return self.parse_dim_statement()
# REDIM文
if self.check('REDIM'):
return self.parse_redim_statement()
# ARRAY文
if self.check('ARRAY_FUNC'):
return self.parse_array_statement()
# SPLIT文
if self.check('SPLIT_FUNC'):
return self.parse_split_statement()
# EXIT文 (EXIT FUNCTION / EXIT FOR / EXIT WHILE)
if self.check_any(['EXIT_FUNCTION', 'EXIT_FOR', 'EXIT_WHILE']):
return self.parse_exit_statement()
# 代入文または式文(RETURN変数への代入も含む)
# RETURN文は後で判定
return self.parse_assignment_or_expression()
def parse_if_statement(self) -> ASTNode:
"""IF文をパース(ELSEIF対応、1行IF対応)"""
self.consume('IF')
condition = self.parse_expression()
self.consume('THEN')
# 1行IF判定: THENトークンが行末にある場合は複数行IF
then_token_idx = self.current - 1 # THENトークンの位置
is_multiline_if = (then_token_idx >= 0 and then_token_idx < len(self.tokens) and
self.tokens[then_token_idx].is_end_of_line)
if is_multiline_if:
# 【既存ロジック】複数行IF(変更なし)
then_statements = []
elseif_branches = []
else_statements = []
# THEN部分のステートメント
while not self.check('ELSE') and not self.check('ELSEIF') and not self.check('ENDIF') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
then_statements.append(stmt)
# ELSEIF部分の処理
while self.check('ELSEIF'):
self.advance() # ELSEIF を消費
elseif_condition = self.parse_expression()
self.consume('THEN')
elseif_statements = []
while not self.check('ELSE') and not self.check('ELSEIF') and not self.check('ENDIF') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
elseif_statements.append(stmt)
elseif_branches.append((elseif_condition, elseif_statements))
# ELSE部分
if self.check('ELSE'):
self.advance()
while not self.check('ENDIF') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
else_statements.append(stmt)
# END IF
if not self.check('ENDIF'):
raise SyntaxError(get_message('error_if_needs_endif', self.locale))
self.consume('ENDIF')
return ASTNode('IF', condition=condition, then_branch=then_statements,
elseif_branches=elseif_branches, else_branch=else_statements)
else:
# 【新規ロジック】1行IF(EXIT文限定)
stmt = self.parse_statement()
# EXIT文以外はエラー
if stmt.type != 'EXIT':
raise SyntaxError(get_message('error_one_line_if_exit_only', self.locale,
f"1行IF文ではEXIT文のみサポートされています({stmt.type}は使用できません)"))
return ASTNode('IF', condition=condition,
then_branch=[stmt],
elseif_branches=[],
else_branch=[])
def parse_while_statement(self) -> ASTNode:
"""WHILE文をパース (WEND または END WHILE で終了)"""
self.consume('WHILE')
condition = self.parse_expression()
body = []
while not self.check('WEND') and not self.check('END_WHILE') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
body.append(stmt)
# WEND または END WHILE を受け付ける
if self.check('END_WHILE'):
self.consume('END_WHILE')
else:
self.consume('WEND')
return ASTNode('WHILE', condition=condition, body=body)
def parse_for_statement(self) -> ASTNode:
"""FOR文をパース(簡易版)"""
self.consume('FOR')
variable = self.consume('IDENTIFIER').value
self.consume('EQ')
start = self.parse_expression()
self.consume('TO')
end = self.parse_expression()
step = 1
if self.check('STEP'):
self.advance()
step = self.parse_expression()
body = []
while not self.check('NEXT') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
body.append(stmt)
self.consume('NEXT')
return ASTNode('FOR', variable=variable, start=start, end=end, step=step, body=body)
def parse_dim_statement(self) -> ASTNode:
"""DIM文をパース: DIM array(size) または DIM array(size1, size2)"""
self.consume('DIM')
# 配列名 - FUNCTIONトークンもサポート(ARR(のような場合)
if self.check('FUNCTION'):
# FUNCTIONトークンから配列名を取得(最後の(を除く)
array_name = self.peek().value
self.advance() # FUNCTIONトークンを消費
# この時点でLPARENは既に消費されている(FUNCTIONトークンに含まれる)
sizes = []
# サイズをパース
if not self.check('RPAREN'):
sizes.append(self.parse_expression())
# 複数次元の場合
while self.check('COMMA'):
self.advance()
sizes.append(self.parse_expression())
# )を期待
if not self.check('RPAREN'):
raise SyntaxError(get_message('error_dim_needs_paren', self.locale, self.peek().line))
self.advance()
return ASTNode('dim', array_name=array_name, sizes=sizes)
elif self.check('IDENTIFIER'):
array_name = self.peek().value
self.advance()
# (または[を期待
if self.check('LPAREN'):
self.advance() # (
sizes = []
# サイズをパース
sizes.append(self.parse_expression())
# 複数次元の場合
while self.check('COMMA'):
self.advance()
sizes.append(self.parse_expression())
# )を期待
if not self.check('RPAREN'):
raise SyntaxError(get_message('error_dim_needs_paren', self.locale, self.peek().line))
self.advance()
return ASTNode('dim', array_name=array_name, sizes=sizes)
elif self.check('LBRACKET'):
self.advance() # [
sizes = []
# 空の配列宣言の場合 DIM arr[]
if not self.check('RBRACKET'):
# サイズをパース
sizes.append(self.parse_expression())
# 複数次元の場合
while self.check('COMMA'):
self.advance()
sizes.append(self.parse_expression())
# ]を期待
if not self.check('RBRACKET'):
raise SyntaxError(get_message('error_dim_needs_bracket', self.locale, self.peek().line))
self.advance()
return ASTNode('dim', array_name=array_name, sizes=sizes)
else:
# DIM var のような単純な変数宣言
return ASTNode('dim', array_name=array_name, sizes=[])
def parse_redim_statement(self) -> ASTNode:
"""REDIM文をパース: REDIM array[size] または REDIM array(size)"""
self.consume('REDIM')
# 配列変数 - FUNCTIONトークンもサポート(ARR(のような場合)
if self.check('FUNCTION'):
# FUNCTIONトークンから配列名を取得
array_name = self.peek().value
self.advance() # FUNCTIONトークンを消費
sizes = []
# サイズをパース
if not self.check('RPAREN'):
sizes.append(self.parse_expression())
# 複数次元の場合
while self.check('COMMA'):
self.advance()
sizes.append(self.parse_expression())
# )を期待
if not self.check('RPAREN'):
raise SyntaxError(get_message('error_redim_needs_paren', self.locale, self.peek().line))
self.advance()
# 単一次元の場合のみREDIMをサポート(現在の実装)
if len(sizes) == 1:
return ASTNode('REDIM_STMT', array_name=array_name, size=sizes[0], preserve=None)
else:
# 多次元REDIMは未実装
raise SyntaxError(get_message('error_redim_multidim', self.locale, self.peek().line))
elif self.check('ARRAY_VAR'):
array_name = self.advance().value
elif self.check('IDENTIFIER'):
array_name = self.advance().value
# REDIM array[size] 形式をチェック
if self.check('LBRACKET'):
self.advance() # '['
size = self.parse_expression()
self.consume('RBRACKET') # ']'
return ASTNode('REDIM_STMT', array_name=array_name, size=size, preserve=None)
else:
raise SyntaxError(get_message('error_redim_needs_name', self.locale))
# REDIM array, size 形式(既存の形式)
if self.check('COMMA'):
self.consume('COMMA')
size = self.parse_expression()
# オプション: PRESERVE
preserve = None
if self.check('COMMA'):
self.advance()
preserve = self.parse_expression()
return ASTNode('REDIM_STMT', array_name=array_name, size=size, preserve=preserve)
else:
raise SyntaxError(get_message('error_redim_invalid_syntax', self.locale))
def parse_array_statement(self) -> ASTNode:
"""ARRAY文をパース"""
self.consume('ARRAY_FUNC')
# 配列変数
if self.check('ARRAY_VAR'):
array_name = self.advance().value
elif self.check('IDENTIFIER'):
array_name = self.advance().value
else:
raise SyntaxError(get_message('error_array_needs_name', self.locale))
self.consume('COMMA')
# 値のリスト
values = []
values.append(self.parse_expression())
while self.check('COMMA'):
self.advance()
values.append(self.parse_expression())
return ASTNode('ARRAY_STMT', array_name=array_name, values=values)
def parse_split_statement(self) -> ASTNode:
"""SPLIT文をパース"""
self.consume('SPLIT_FUNC')
# 配列変数
if self.check('ARRAY_VAR'):
array_name = self.advance().value
elif self.check('IDENTIFIER'):
array_name = self.advance().value
else:
raise SyntaxError(get_message('error_split_needs_name', self.locale))
self.consume('COMMA')
# テキスト
text = self.parse_expression()
self.consume('COMMA')
# 区切り文字
delimiter = self.parse_expression()
return ASTNode('SPLIT_STMT', array_name=array_name, text=text, delimiter=delimiter)
def parse_return_statement(self) -> ASTNode:
"""RETURN文をパース"""
self.consume('RETURN')
# RETURN値がある場合
if not self.is_at_end() and not self.check_newline():
value = self.parse_expression()
return ASTNode('RETURN', value=value)
else:
# 単純なRETURN(値なし)
return ASTNode('RETURN', value=None)
def parse_exit_statement(self) -> ASTNode:
"""EXIT文をパース (EXIT FUNCTION / EXIT FOR / EXIT WHILE)"""
# Consume EXIT_FUNCTION / EXIT_FOR / EXIT_WHILE token
if self.check('EXIT_FUNCTION'):
self.consume('EXIT_FUNCTION')
return ASTNode('EXIT', exit_type='FUNCTION')
elif self.check('EXIT_FOR'):
self.consume('EXIT_FOR')
return ASTNode('EXIT', exit_type='FOR')
elif self.check('EXIT_WHILE'):
self.consume('EXIT_WHILE')
return ASTNode('EXIT', exit_type='WHILE')
else:
raise SyntaxError(f"Unexpected EXIT statement at position {self.current}")
def check_newline(self) -> bool:
"""改行をチェック(簡易実装)"""
# 現在のトークンが新しい文の開始である可能性が高いキーワードかチェック
return (self.is_at_end() or
self.check('IF') or self.check('FOR') or self.check('WHILE') or
self.check('FUNCTION_DEF') or self.check('END_FUNCTION') or
self.check('REDIM') or self.check('ARRAY_FUNC') or self.check('SPLIT_FUNC') or
self.check('ENDIF') or self.check('NEXT') or self.check('WEND'))
def parse_select_case_statement(self) -> ASTNode:
"""SELECT CASE文をパース"""
self.consume('SELECT_CASE')
test_expression = self.parse_expression()
cases = []
else_case = None
while not self.check('END_SELECT') and not self.is_at_end():
if self.check('CASE_ELSE'):
# Case Else節
self.advance()
else_statements = []
while not self.check('END_SELECT') and not self.check('CASE') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
else_statements.append(stmt)
else_case = else_statements
elif self.check('CASE'):
# Case節
self.advance()
conditions = self.parse_case_conditions()
statements = []
while not self.check('CASE') and not self.check('CASE_ELSE') and not self.check('END_SELECT') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
statements.append(stmt)
cases.append(ASTNode('CASE', conditions=conditions, statements=statements))
else:
# 予期しないトークンはスキップ
self.advance()
self.consume('END_SELECT')
return ASTNode('SELECT_CASE', test_expression=test_expression, cases=cases, else_case=else_case)
def parse_case_conditions(self) -> List[ASTNode]:
"""Case条件リストをパース(カンマ区切り)"""
conditions = []
conditions.append(self.parse_case_condition())
while self.check('COMMA'):
self.advance()
conditions.append(self.parse_case_condition())
return conditions
def parse_case_condition(self) -> ASTNode:
"""個別のCase条件をパース"""
# IS演算子による比較
if self.check('IS'):
self.advance()
# 比較演算子を取得
if self.check_any(['LT', 'GT', 'LTE', 'GTE', 'EQ', 'NEQ']):
operator = self.advance().type
value = self.parse_expression()
return ASTNode('CASE_IS', operator=operator, value=value)
else:
# ISの後に比較演算子がない場合は、式として扱う
return self.parse_expression()
# 最初の式を取得
expr1 = self.parse_expression()
# TO演算子による範囲指定
if self.check('TO'):
self.advance()
expr2 = self.parse_expression()
return ASTNode('CASE_RANGE', start=expr1, end=expr2)
# 単一値
return ASTNode('CASE_VALUE', value=expr1)
def parse_function_definition(self) -> ASTNode:
"""FUNCTION文をパース"""
self.consume('FUNCTION_DEF')
# 関数名はIDENTIFIERまたはFUNCTIONトークンの場合がある
if self.check('FUNCTION'):
# FUNCTIONトークンとして認識された場合(関数名の後に括弧が続く)
func_name = self.advance().value
self.consume('LPAREN')
else:
# 通常のIDENTIFIERの場合
func_name = self.consume('IDENTIFIER').value
self.consume('LPAREN')
# パラメータリストのパース
parameters = []
if not self.check('RPAREN'):
# 最初のパラメータ
param = self.parse_parameter()
parameters.append(param)
# 追加のパラメータ
while self.check('COMMA'):
self.advance()
param = self.parse_parameter()
parameters.append(param)
self.consume('RPAREN')
# 戻り値型(オプション - 現時点では無視)
return_type = None
if self.check('AS'):
self.advance()
return_type = self.consume('IDENTIFIER').value
# 関数本体
body = []
while not self.check('END_FUNCTION') and not self.is_at_end():
stmt = self.parse_statement()
if stmt:
body.append(stmt)
self.consume('END_FUNCTION')
return ASTNode('FUNCTION_DEF',
name=func_name,
parameters=parameters,
body=body,
return_type=return_type)
def parse_parameter(self) -> ASTNode:
"""パラメータをパース"""
# Optional修飾子
optional = False
if self.check('OPTIONAL'):
self.advance()
optional = True
# ByVal/ByRef修飾子(デフォルトはByVal)
by_ref = False
if self.check('BYVAL'):
self.advance()
by_ref = False
elif self.check('BYREF'):
self.advance()
by_ref = True
# パラメータ名
param_name = self.consume('IDENTIFIER').value
# 型(オプション)
param_type = None
if self.check('AS'):
self.advance()
param_type = self.consume('IDENTIFIER').value
# デフォルト値(Optionalの場合)
default_value = None
if optional and self.check('EQ'):
self.advance()
default_value = self.parse_expression()
return ASTNode('PARAMETER',
name=param_name,
by_ref=by_ref,
optional=optional,
default_value=default_value,
param_type=param_type)
def parse_assignment_or_expression(self) -> ASTNode:
"""代入文または式文をパース"""
# 配列変数参照の場合 (ITEMS[]記法)
if self.check('ARRAY_VAR'):
array_name = self.advance().value
return ASTNode('ARRAY_VAR', name=array_name)
# 配列アクセスの場合 ([]記法)
elif self.check('ARRAY'):
array_name = self.advance().value
self.consume('LBRACKET')
index = self.parse_expression()
self.consume('RBRACKET')
if self.check('EQ'):
self.advance()
value = self.parse_expression()
return ASTNode('ASSIGN_ARRAY', array=array_name, index=index, value=value)
else:
return ASTNode('ARRAY_ACCESS', array=array_name, index=index)
# RETURN文または変数(RETURNトークンの場合)
elif self.check('RETURN'):
# 次のトークンが'='かチェック
saved_pos = self.current
self.advance() # RETURN を読み飛ばす
if self.check('EQ'):
# RETURN = value の代入文
self.current = saved_pos # 位置を戻す
var_name = self.advance().value # 'RETURN'
self.advance() # '='
value = self.parse_expression()
return ASTNode('ASSIGN', variable=var_name, value=value)
else:
# RETURN文(値あり/なし)
self.current = saved_pos # 位置を戻す
return self.parse_return_statement()
# 関数呼び出しまたは変数の場合
elif self.check('IDENTIFIER') or self.check('FUNCTION'):
token = self.peek()
if self.check('FUNCTION'):
# 関数呼び出し - または配列アクセス/代入
func_name = self.advance().value
# FUNCTIONトークンはLPARENを含まないので、明示的に消費する必要はない
# 引数を取得
args = []
if not self.check('RPAREN'):
args.append(self.parse_expression())
while self.check('COMMA'):
self.advance()
args.append(self.parse_expression())
self.consume('RPAREN')
# 配列代入かどうかチェック(ARR(1) = value または MATRIX(1,1) = valueの形)
if self.check('EQ'):
# 配列への代入として処理
self.advance() # '='を消費
value = self.parse_expression()
if len(args) == 1:
# 1次元配列への代入
return ASTNode('ASSIGN_ARRAY', array=func_name, index=args[0], value=value)
else:
# 多次元配列への代入
return ASTNode('ASSIGN_ARRAY_MULTI', array=func_name, indices=args, value=value)
else:
# 関数呼び出し
return ASTNode('FUNCTION_CALL', name=func_name, arguments=args)
else:
# 通常の変数または配列アクセス
var_name = self.advance().value
# IDENTIFIERの後に(が続く場合、ビルトイン関数かチェック
if self.check('LPAREN'):
from builtin_functions import is_builtin_function
if is_builtin_function(var_name):
# ビルトイン関数として処理
print(get_message('warning_space_before_paren', self.locale, var_name))
print(get_message('suggestion_no_space', self.locale, var_name))
self.consume('LPAREN')
# 引数を取得
args = []
if not self.check('RPAREN'):
args.append(self.parse_expression())
while self.check('COMMA'):
self.advance()
args.append(self.parse_expression())
self.consume('RPAREN')
return ASTNode('FUNCTION_CALL', name=var_name.upper(), arguments=args)
else:
# 未定義の関数
raise SyntaxError(get_message('error_function_not_defined', self.locale, var_name))
# 配列アクセスの場合
elif self.check('LBRACKET'):
self.advance() # '['
index = self.parse_expression()
self.consume('RBRACKET') # ']'
if self.check('EQ'):
# 配列代入
self.advance() # '='
value = self.parse_expression()
return ASTNode('ASSIGN_ARRAY', array=var_name, index=index, value=value)
else:
# 配列参照
return ASTNode('ARRAY_ACCESS', array=var_name, index=index)
elif self.check('EQ'):
# 通常の変数代入
self.advance()
value = self.parse_expression()
return ASTNode('ASSIGN', variable=var_name, value=value)
else:
# 変数参照
return ASTNode('VARIABLE', name=var_name)
# その他の式
return self.parse_expression()
def parse_expression(self) -> ASTNode:
"""式をパース(論理演算)"""
return self.parse_or()
def parse_or(self) -> ASTNode:
"""OR演算をパース"""
left = self.parse_and()
while self.check('OR'):
op = self.advance().type
right = self.parse_and()
left = ASTNode('BINARY_OP', operator=op, left=left, right=right)
return left
def parse_and(self) -> ASTNode:
"""AND演算をパース"""
left = self.parse_not()
while self.check('AND'):
op = self.advance().type
right = self.parse_not()
left = ASTNode('BINARY_OP', operator=op, left=left, right=right)
return left
def parse_not(self) -> ASTNode:
"""NOT演算をパース"""
if self.check('NOT'):
self.advance()
expr = self.parse_not()
return ASTNode('UNARY_OP', operator='NOT', operand=expr)
return self.parse_comparison()
def parse_comparison(self) -> ASTNode:
"""比較演算をパース"""
left = self.parse_concatenation()
while self.check_any(['LT', 'GT', 'LTE', 'GTE', 'EQ', 'NEQ']):
op = self.advance().type
right = self.parse_concatenation()
left = ASTNode('BINARY_OP', operator=op, left=left, right=right)