そのCIは本当に役に立ってますか？～高品質なCIプロセスを実現する設計術～

そのCIは本当に役に立ってますか？～高品質なCIプロセスを実現する設計術～ Friday, November 29, 2024 Haruka Sakihara

自己紹介 Haruka Sakihara <主な取得資格> • ネットワークスペシャリスト試験(IPA) • AWS Certified 13資格
• Google Cloud Certification 4資格 <所属> • アクセンチュア株式会社テクノロジーコンサルティング本部 (2021年新卒入社) • クラウドの部署にいます <趣味> • Go言語が好きです • フィギュアスケートとサンリオも好きです <その他表彰> • 2023 Japan AWS Jr.Champion • 2024 Japan AWS All Certifications Engineer

静的解析ツール使ってますか？

静的解析ツールの良さを最大限利用できている自信はありますか？

今日の話題話すこと (In Scope) • 快適かつ意味のあるCIを作るための要件 • 各種静的解析SaaSツールへの期待設定・付き合い方話さないこと
(Out of Scope) • 各種静的解析SaaSツールの比較検討 • 具体的にどんな解析ルールを選定・使用するのがいいか • 今静的解析ツールを全く利用していなかっまでた環境にどうやって円滑にツールを導入するか • 静的解析ツールを使ってコード品質を整えることで本当に組織の生産性が上がるのか

そのCIは本当に役に立ってますか？～高品質なCIプロセスを実現する設計術 Agenda 静的解析ツールあるある静的解析ツールの設定静的解析ツールのストレスレス実行コードレビューサービスの価値 1 2
3 4

1. 静的解析ツールあるある解析結果がなかなか出ず作業効率が下がる解析ツールのPASSがPRマージの必須条件であった場合には、解析結果がなかなかでないという状況は開発におけるブロッカーになりえます。 mainブランチ feature/xxxブランチ解析中・・・(一時間) 機能開発担当者いつになったらマージできるんだ

1. 静的解析ツールあるあるリリース直前になるまでチェックFailに気づかない不備のない成果物がデプロイされることを担保するために、リリース前には各種チェックツールが PASSしている旨証跡を残す運用になっているところもあるかと思います。そのリリース資料を作っているときに初めてチェックがFAILしており修正必須であることが発覚することがあります。 mainブランチ feature/xxxブランチ feature/yyyブランチ deployment/prdブランチ
PASS FAIL FAIL リリース担当者 FAILしてるからリリースできない、誰だ放置したのは(怒)

1. 静的解析ツールあるあるチェックFailを無視する文化ができる設計や仕様上仕方がないFAILというものも発生すると思いますが、それをきちんとignore/supress する設定を引き継がないと、それを知らない担当者によって「FAILは昔からでているから無視して OK」という文化が生まれてしまいます。 mainブランチ feature/xxxブランチ feature/yyyブランチ PASS
FAIL 別要因の FAILを含むリリース担当者A このFAILは仕方がないやつ (ただしその旨引き継がずにチーム離脱) …… リリース担当者B FAILは昔から出ているから対処しなくていい！ (→結果、要対処のFAILを見逃してしまう)

3 4

2. 静的解析ツールの設定設定フェーズ一覧静的解析ツールの良さを生かすためには、実行・設定の際に以下のフェーズを意識するとよいでしょう。解析範囲の決定解析ルールの決定実行検知結果の
抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了

2. 静的解析ツールの設定解析範囲の決定ビルド成果物に影響を及ぼさないテストファイルや、自分たちでコードコントロールすることが不可能である自動生成コードをチェック対象から外したい場合があります。解析範囲の決定解析ルールの決定実行検知結果の
抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 特定のファイル・ディレクトリをチェック対象から外したいというニーズが存在 • テストファイル • 自動生成コード • 自チームで責任を持たないsubmodule など • ツールによってファイル・ディレクトリを解析対象から除外指定する方法が異なる • PMD CPD (https://pmd.github.io/pmd/pmd_userdocs_cpd) • --excludeオプションで除外ディレクトリを指定 • errcheck (github.com/kisielk/errcheck) • --ignoregeneratedオプションで自動生成コードを除外 • --ignoretestsオプションでテストコードを除外 • gofmt (https://pkg.go.dev/cmd/gofmt) • 特定ファイルを除外する実行オプション無し、どうしてもやるなら引数指定で頑張る

2. 静的解析ツールの設定解析範囲の決定また、チェックしたいコードがきちんと解析範囲に入っているかどうかを確認する必要があります。よくある落とし穴は「再帰でチェックされていると思っていたサブディレクトリが解析されていなかった」というものです。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析実行ディレクトリを指定した際に、その直下にあるサブディレクトリまで再帰的に解析対象となるのかどうかはツールによって異なる • PMD CPD (https://pmd.github.io/pmd/pmd_userdocs_cpd) • --non--recursiveオプションがついていると再帰探索を行わない • goimports (golang.org/x/tools/cmd/goimports) • 引数で解析範囲としてディレクトリを指定した場合にはサブディレクトリ以下も再帰で解析実行される • gosec (github.com/securego/gosec/v2) • デフォルトで再帰実行を行わない • 再帰実行させることができないのであれば、探索対象ディレクトリを別で洗いだした上で個別にツール実行させるという一工夫を挟む必要が出る

2. 静的解析ツールの設定解析ルールの決定たった一つのフォーマット・ルールを強制するツールもあれば、利用する側がどのルールを使用するのかある程度カスタムを行う場合もあります。解析範囲の決定解析ルールの決定実行検知結果の
抑制有無判断終了コード設定 • 解析でチェックするルールの選定 • 静的解析ツールのチェックルール全てをチェックする必要もなく、またデフォルトではチェックしないoptional項目もチェックしたいという場合もある • staticcheck (github.com/dominikh/go-tools/cmd/staticcheck) • デフォルト設定ではチェックを行わないルール項目が存在し、それらを有効化するためには明示的な設定が必要 • 両立しえないチェック項目がある場合には、チームとしてどちらの方針に寄せるか意思決定をする必要がある • ESLint (https://eslint.org/) • シングルクオーテーションとダブルクオーテーションどちらに統一するべきかなど、統一するべきコードフォーマットをまず人間が決める必要がある

2. 静的解析ツールの設定検知結果の抑制有無判断ツールによって検知された内容には常に・すべて従わなければならないわけではありません。意図的にツール推奨とは異なる実装を行う場合には、それ以降ツールには該当箇所に対するIssue起票をしないように設定したいです。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • エッジケースにおいて意図的にツール推奨フォーマットを採用しない場合や、誤検知が起こった場合など、ツールによるIssue起票を抑制したいというケースがある • ツールによって特定のコードスニペットにおけるIssue検知を抑制する方法は異なるうえ、そのようなオプションが存在しない場合も • gosec (github.com/securego/gosec/v2) • (例)unsafeパッケージによる直接的なメモリ操作はG103ルールでアラート検知されるが、意図的にこれを行いたい場合もある • gocyclo (github.com/fzipp/gocyclo) • コードの循環的複雑度をこれ以上下げられず、可読性の観点でメソッド分割も望ましくない場合にはアラート抑制したい • //gocyclo:ignoreディレクティブによって検知抑制が可能 • PMD CPD (https://pmd.github.io/pmd/pmd_userdocs_cpd) • CPD-OFFコメント記載によるsupress機能が存在

2. 静的解析ツールの設定終了コード設定異常が検知されたとしても、それに気づくことができないのならば意味がありません。ルール逸脱が見つかり修正が必要になったときにはプロセスを異常終了させてCI failするように組んでおくことが重要です。解析範囲の決定解析ルールの決定
実行検知結果の抑制有無判断終了コード設定 • 閾値以上のIssueが検知された場合に異常終了 • ツールによって異常終了させるoptionがあったりなかったりします • gosec (github.com/securego/gosec/v2) • -no-failオプションで検知時に異常終了させない挙動にできる • gocyclo (github.com/fzipp/gocyclo) • -over Nで複雑度N以上のロジック検知時に異常終了させるという閾値を調整することができる • misspell (github.com/client9/misspell) • デフォルトではexit 0だが、-errorオプションを付けることでmisspell県知事に異常終了させられる • そもそも異常終了させられないツールもあるので、そういう場合はシェルスクリプトでラップするなどする必要があります

2. 静的解析ツールの設定まとめ静的解析ツールを利用するためにはこれら4つの項目の設定をツールごとに行っていくことになりますが、その方法やそもそもチューニングできるかどうかはツールによってやり方がバラバラなのが現状です。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了

2. 静的解析ツールの設定まとめ静的解析ツールを利用するためにはこれら4つの項目の設定をツールごとに行っていくことになりますが、その方法やそもそもチューニングできるかどうかはツールによってやり方がバラバラなのが現状です。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了ツールごとに仕様・設定方法・オプション有無が全く異なる！！

3 4

3. 静的解析ツールのストレスレス実行ストレスなく回すことの重要性解析結果がOKなもののみをデプロイするように確実に運用するためには、リリース時に初めてFAIL が発覚するのはよくありません。シフトレフトのような考え方がここでも有効であり、それを遂行するためにはストレスなく回せるチェックであることが重要です。 Dev Ops Code Build
Test Deploy Operate Monitor Shift-Left 開発の早い段階から品質保証活動を行うことで問題の早期発見を狙う実現のためには品質保障の手軽さが重要！

3. 静的解析ツールのストレスレス実行実行フェーズのチューニング静的解析ツール自体の設定がきちんとできたとしたら、次に大事になるのは以下に気軽にそのチェックを実行し、結果を適切な形で活用できるかどうかです。ストレスなくツールを利用し続けるためには、実行フェーズのチューニングも重要になってきます。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了

3. 静的解析ツールのストレスレス実行実行フェーズのチューニング静的解析ツール自体の設定がきちんとできたとしたら、次に大事になるのは以下に気軽にそのチェックを実行し、結果を適切な形で活用できるかどうかです。ストレスなくツールを利用し続けるためには、実行フェーズのチューニングも重要になってきます。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了 • 並列実行による高速化 • 類似後続チェックが発生したときのキャンセル処理 • 差分実行やキャッシュの利用

3. 静的解析ツールのストレスレス実行並列実行による高速化解析プロセスが遅いとそれがブロッカーとなり開発効率が下がります。そのためにはツール実行の高速化が重要になりますが、並列実行をすることで実現することができます。解析範囲の決定解析ルールの決定実行検知結果の
抑制有無判断終了コード設定 • 並列実行による高速化 • 類似後続チェックが発生したときのキャンセル処理 • 差分実行やキャッシュの利用 • 複数個のツールを同時に実行する場合、ツールごとの結果は互いに独立であるため並列に実行することができる • (例) gosecとstaticcheckを並列に回す • 単独のツール実行に時間が掛かってしまう場合には、inputを複数個に分割しそれらを並列実行することで実行時間短縮を図る手法がある • (例)以下のようなディレクトリ構成だったとする • root • dirA • dirB • dirC • この場合、rootから1回で実行するのではなく、dirA/dirB/dirCと3回に分けて並列実行させると早くなる

3. 静的解析ツールのストレスレス実行リソース管理限られたリソースを数多くの解析プロセスで取り合う形になると、効率的な静的解析を行うことができなくなります。不要なプロセスはキャンセルを徹底することで、並列実行数やコストの節約にもつながります。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 並列実行による高速化 • 類似後続チェックが発生したときのキャンセル処理 • 差分実行やキャッシュの利用 • コミットが短い期間に連続して行われた場合では、本当に必要なのは最後の最新コミットに対する解析結果のみ。コストやコンピューティングリソース・並列実行数の節約のためにも、不要になった先行解析プロセスはキャンセルしたい • 例えばGitHub Actionsの場合には同種ワークフローの実行数を制限するcancel-in- progressという機能があり、それにて先行プロセスのキャンセルを実現することができる

3. 静的解析ツールのストレスレス実行差分実行 1回の実行ごとにすべてのファイルを解析しなくてもよい場合があります。その場合、差分が生じたファイルのみ実行することで解析時間の短縮を図ることができます。ただし、常に解析実行結果の冪等性が担保できるとも限らないため、適切な形で利用することが大事です。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 並列実行による高速化 • 類似後続チェックが発生したときのキャンセル処理 • 差分実行やキャッシュの利用 • 個別のファイルに対する解析結果に、他ファイルが影響を及ぼさないようなツールが存在する(例: gofmtのようなフォーマッター) • そのような場合は1コミットごとにすべてのファイルをチェックする必要はなく、 diffが生じたファイルのみ解析を行うことで解析時間を短くすることができる。 • ただし、常に同じファイル内容に対して同じ解析結果が出る(冪等性)とは限らない場合が存在するため、mainブランチやreleaseブランチといった重要なブランチでは常に全文解析を行い、差分実行はfeatureブランチ等のコミット頻度が高いところに限定するなどの適材適所が重要 • (例) 解析ツールの設定変更を行った場合には、解析対象ファイルそのものに diffがなくても解析結果が変わりうる

3 4

4. コードレビューサービスの価値快適な解析環境に求められることの多さ静的解析ツールを快適に運用し続けるためには求められることが多く、ツールごとにその設定方法も異なります。SaaSの静的解析ツール等を用いることで、ツールごとの仕様の違いを吸収した画一的な解析ワークフローの設計を行うことができます。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了 • 並列実行による高速化 • 類似後続チェックが発生したときのキャンセル処理 • 差分実行やキャッシュの利用

4. コードレビューサービスの価値快適な解析環境に求められることの多さ静的解析ツールを快適に運用し続けるためには求められることが多く、ツールごとにその設定方法も異なります。SaaSの静的解析ツール等を用いることで、ツールごとの仕様の違いを吸収した画一的な解析ワークフローの設計を行うことができます。解析範囲の決定解析ルールの決定実行
検知結果の抑制有無判断終了コード設定 • 特定ファイルの除外 • 特定ディレクトリの除外 • 再帰的なチェックが可能か • 解析でチェックするルールの選定 • 意図的に推奨設定に従わない場合の検知抑制 • 誤検知結果の抑制 • 閾値以上のIssueが検知された場合に異常終了 • 並列実行による高速化 • 類似後続チェックが発生したときのキャンセル処理 • 差分実行やキャッシュの利用ツールごとに設定方法が異なるこれらの要件を SaaS静的解析ツールが吸収し画一的な設定を実現

4. コードレビューサービスの価値コードレビューサービスに求められる価値ここまでの考察を踏まえて、快適なCI実行環境を整えるためにSaaSの静的解析ツールにアウトソースしたい事柄は以下の3点に絞られます。解析の前後処理解析の実行 • 特定ファイル・ディレクトリ除外といった直感的かつ統一的な
解析範囲の指定 • 検知結果の抑制機能を提供していないツールに対しては当該機能を代わりに提供 • 検出Issue数の閾値設定およびそれを上回った場合の異常終了の担保画一的な設定の提供柔軟な実行戦略の策定容易かつ高度な並列度の確保 • 独立した異なるツールを並列に動かす • 1つの解析ツールへのinputを分割しそれぞれのプロセスを並列に動かすオプションの提供 • 連続コミット実行時に先行解析プロセスをキャンセル・必要なプロセスのみ優先的に実行 • 差分検知機能を必要なときに正確な解析範囲で提供 • ブランチごとに実行戦略や実行ツールを分ける解析ツールに求める価値

4. コードレビューサービスの価値コード品質の「ランク」に対する考え方 SaaSの静的解析ツールによくある機能として解析対象のコードに点数やランク付けを行うというものがあります。ここでつけられた点数に対してどの値を閾値としてOKとするのか、そもそも点数を基準にして意思判断を行うことが適切なのかという問いが往々にしてあるかと思います。解析ツールによってコードにランクがつく例 (sonarcloud) 画像出典: https://github.com/marketplace/sonarcloud
何点/どのランクだったらPASSにすればいいのかわからない・・・よく聞くお悩み全部Aランクにするために頑張るというのは本当に意味のあることなのか？そもそもこのランク付けを真面目に意思決定の根拠として使っているところはあるのか？

4. コードレビューサービスの価値コード品質の「ランク」に対する考え方コード品質に関する様々な見解を聞いてみると、「悪い点数・評価が出たときに人間によるリスク許容判断が確実に入るようにするために、閾値そのものよりも点数の出し方に妥当性があるほうが重要である」と筆者は感じました。 • GoogleのCode Coverage Best
Practice (https://testing.googleblog.com/2020/08/code-coverage-best-practices.html) • すべての製品に普遍的に適用される「理想的なコードカバレッジの数値」は存在しない。閾値をいくつにするかはそのビジネスをよく知る人が個別に意思決定するべき • ある一定の閾値を超えてしまったら、コードカバレッジを上げることにあまり固執しないほうがいい。なぜならカバレッジを上げることで得られるメリットの量は対数的に増加していくものだから • UTによってカバーされているコードよりも、カバーされていないコードが本当に大丈夫なのかどうか・リスク許容できるかどうかが重要である • 某セキュリティプラットフォームの中の方に某カンファレンスで聞いたお話 • 「CIをPASSさせるスコアの閾値をいくつにすればいいのか」というのは実際によく聞くお悩み • 「XX点に設定すればいいですよ！」という統一見解はないが、「どうしてこの点数になっているのか」は確認できるようにしているため、点数が高いほど緊急度が高い脆弱性であるという点に関しては信用してもらえると思う点数が悪かったときに「何かあるかも？」と人間が疑えることが重要そのためには点数の出し方に妥当性・納得感があるかどうかがキーとなる

そのCIは本当に役に立ってますか？～高品質なCIプロセスを実現する設計術 Agenda 静的解析ツールあるある静的解析ツールの設定静的解析ツールのストレスレス実行コードレビューサービスの価値まとめ 1
2 3 4 5

まとめ • 静的解析ツールを意義のある形で使い続けるためには、FAILする文化を生まないこと & 快適かつ自然に回し続けられる環境を整えることが重要 • FAILする文化を生まないためには、解析範囲や使用するルール・誤検知や例外的に許容した書き方のIssue報告抑制といったチューニングを施していくことになる •
日々の開発を邪魔することなく快適に解析ツールを回すためには、並列実行や差分実行といった実行フェーズのパフォーマンスチューニングも必要 • このように、快適かつ意義のあるCIを実現するために考慮しないといけないことは意外と多い • 「ツールで引っかかった部分のリスク許容判断」という本当に人手を使うにふさわしい作業にリソースを割くために、よきCIを作るところはコードレビューサービスに任せるのがよいのでは

Thank You ご意見、ご質問ありましたらお気軽にご連絡下さい [email protected] Haruka Sakihara(崎原晴香)

そのCIは本当に役に立ってますか？～高品質なCIプロセスを実現する設計術～

そのCIは本当に役に立ってますか？～高品質なCIプロセスを実現する設計術～

Haruka Sakihara

More Decks by Haruka Sakihara

Featured

Transcript