Leveling Up One's Parsing Game With ASTs

Konkretne kontra abstrakcyjne drzewa składniowe

Powrót do wydarzeń prowadzących do parsowania!

Faza analizy składni generuje drzewo parsekcyjne

Drzewo parsujące może być często super verbose.

Kompresja drzewa parseków pozwala nam uniknąć redundancji.

Zbędne informacje, które nie są dla nas użyteczne, mogą zostać usunięte z drzewa parsowania.

An AST abstrahuje od konkretnej składni.

Powyższy obrazek ilustruje dokładnie to samo wyrażenie, co nasze drzewo parseków: 5 + (1 x 12). Różnica polega na tym, że AST abstrahuje od konkretnej składni tego wyrażenia. Nie widzimy więcej nawiasów () w tym drzewie, ponieważ nie są one potrzebne. Podobnie, nie widzimy nie-terminali takich jak Exp, ponieważ już zorientowaliśmy się czym jest „wyrażenie” i jesteśmy w stanie wyciągnąć wartość, która naprawdę ma dla nas znaczenie – na przykład liczbę 5.

To jest właśnie czynnik odróżniający AST od CST. Wiemy, że abstrakcyjne drzewo składniowe ignoruje znaczną część informacji składniowej, którą zawiera drzewo parsowania i pomija „dodatkową zawartość”, która jest używana podczas parsowania. Ale teraz możemy dokładnie zobaczyć, jak to się dzieje!

An AST jest abstrakcyjną reprezentacją tekstu źródłowego.

Teraz, gdy skondensowaliśmy nasze własne drzewo parsowania, będziemy o wiele lepsi w wyłapywaniu niektórych wzorców, które odróżniają AST od CST.

Istnieje kilka sposobów, na które abstrakcyjne drzewo składniowe będzie się wizualnie różnić od drzewa parsekcyjnego:

An AST nigdy nie będzie zawierać szczegółów składniowych, takich jak przecinki, nawiasy i średniki (oczywiście w zależności od języka).
An AST będzie mieć zawalone wersje tego, co w przeciwnym razie pojawiłoby się jako węzły z pojedynczym następnikiem; nigdy nie będzie zawierać „łańcuchów” węzłów z pojedynczym dzieckiem.
Wreszcie, wszelkie tokeny operatorów (takie jak +, -, x i /) staną się wewnętrznymi (rodzicielskimi) węzłami w drzewie, a nie liśćmi, które kończą się w drzewie parseków.

Wizualnie, AST zawsze będzie wydawać się bardziej zwarta niż drzewo parseków, ponieważ jest to, z definicji, skompresowana wersja drzewa parseków, z mniejszą ilością szczegółów składniowych.

Więc, jeśli AST jest skompresowaną wersją drzewa parseków, to możemy stworzyć abstrakcyjne drzewo składniowe tylko wtedy, gdy mamy rzeczy do zbudowania drzewa parseków na początek!

Właśnie w ten sposób abstrakcyjne drzewo składniowe pasuje do większego procesu kompilacji. AST ma bezpośrednie połączenie z drzewami parse, o których już się dowiedzieliśmy, jednocześnie polegając na lexerze, aby wykonać swoją pracę, zanim AST może zostać kiedykolwiek utworzony.

Abstrakcyjne drzewo składniowe jest tworzone jako końcowy rezultat fazy analizy składniowej. Parser, który jest głównym „bohaterem” podczas analizy składni, może, ale nie zawsze musi wygenerować drzewo parsowania, czyli CST. W zależności od kompilatora i tego, jak został zaprojektowany, parser może bezpośrednio przejść do konstruowania drzewa składni, czyli AST. Ale parser zawsze wygeneruje AST jako wyjście, bez względu na to, czy w międzyczasie utworzy drzewo parsekcyjne, lub ile przejść będzie musiał wykonać, aby to zrobić.

Anatomia AST

Teraz, gdy wiemy, że abstrakcyjne drzewo składniowe jest ważne (ale niekoniecznie przerażające!), możemy zacząć je trochę bardziej rozbierać. Interesujący aspekt tego, jak skonstruowany jest AST, ma związek z węzłami tego drzewa.

Poniższy obrazek przedstawia przykład anatomii pojedynczego węzła w obrębie drzewa składni abstrakcyjnej.

Zauważymy, że ten węzeł jest podobny do innych, które widzieliśmy wcześniej w tym, że zawiera pewne dane (a token i jego value). Jednakże, zawiera on również pewne bardzo specyficzne wskaźniki. Każdy węzeł w AST zawiera odniesienia do swojego następnego węzła rodzeństwa, jak również do swojego pierwszego węzła potomnego.

Na przykład, nasze proste wyrażenie 5 + (1 x 12) może być skonstruowane w formie wizualnej ilustracji AST, jak ta poniżej.

Uproszczona wizualizacja naszego wyrażenia AST.

Leveling Up One’s Parsing Game With ASTs

Kondensacja jednego drzewa w drugie

Anatomia AST

Źródła

Dodaj komentarz Anuluj pisanie odpowiedzi