Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLVMのコード自動生成機構におけるコード記述を支援するツールの作成

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Arata Arata
January 16, 2024
82

 LLVMのコード自動生成機構におけるコード記述を支援するツールの作成

Avatar for Arata

Arata

January 16, 2024
Tweet

Transcript

  1. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 背景 / コンパイラの基本構成 2

    フロントエンド ソースコードを パース・解析 バックエンド CPUが実行可能な 機械語を出力 コンパイラ ソースコード 機械語
  2. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 背景 / LLVM: コンパイラを作るためのライブラリ

    • コンパイラを作るたびにバックエンドを作るのは難しい ◦ 世界では数多の種類のCPUが使われているため ◦ そこでバックエンドの実装として使えるLLVMが誕生した • C(Clang), C++(Clang), Rust, Swift, Juliaなどで使われ ている 3
  3. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • LLVMはCPUの情報を記述するためにTableGenを使う ◦ CPUの{レジスタ,

    機能, 命令}など ◦ CPUに合わせて機械語を出力するために必要となる 背景 / TableGen: LLVMのコード自動生成機構(DSL) 4 例: TableGenでx86-64のレジスタを記述
  4. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • TableGenを書く際にエディタの支援を受けられない ◦ エラーの表示、入力補完、シンタックスハイライトなど

    • 現在、約57万行のTableGenコードがLLVM内に存在する ◦ 57万行のプログラムをメモ帳で書くのと同じような状況 目指すこと: エディタの支援を受けながらTableGenのコードを 快適に書きたい 課題 / TableGenの開発環境が快適ではない 5
  5. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • エディタ支援を実装する方法として言語サーバがある ◦ Microsoftが発表したLanguage

    Server Protocol(LSP)を 実装するサーバ • LSPに対応したエディタならば言語サーバの機能を使うこ とができる ◦ Vim, Emacs, VSCodeなどが対応している 方針 / TableGenの言語サーバを作る 6
  6. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • RustでTableGenの言語サーバを実装し、GitHubと Marketplaceで成果物を公開した ◦

    https://github.com/arata-nvm/tablegen-lsp • 工夫した点(詳細は省略) ◦ Red-Green Treeを使用しているため、不完全なソースコードを 扱うことができる ◦ ソースコードのパース結果や解析結果をキャッシュしているた め、余分な処理をスキップできる ◦ パーサを言語サーバと分離しているため、別のプロジェクトで再 利用できる 実装 7
  7. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • デモのためにVSCode向けの拡張機能を作成した • 実装した以下の機能について、おおまかな使用例を紹介

    する ◦ エラーの表示 ◦ シンタックスハイライト ◦ 定義へ移動 / 参照へ移動 ◦ ホバー時のドキュメント表示 ◦ 入力補完 ◦ インレイヒント 使用例 8
  8. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • TableGenのすべての構文を処理できるようにする ◦ 現在は対応していない一部の構文を無視している

    • 使い勝手を改善する ◦ 補完候補が表示される順番の最適化、型チェックなど • 言語サーバーのWASM化 ◦ 現在はプラットフォームごとのバイナリをバンドルしている 今後の展望 15
  9. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • LLVMではマシンの情報を記述するためにTableGen言語 が使われている •

    TableGenをエディターで書きやすくするために言語サー バをRustで実装した • メモ帳でプログラミングをする必要がなくなった まとめ 16