Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LLMによる技術ブログレビューを導入した話
Search
Cloud Ace
April 01, 2024
Technology
540
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LLMによる技術ブログレビューを導入した話
Cloud Ace
April 01, 2024
More Decks by Cloud Ace
See All by Cloud Ace
今年の最難関と思われるProfessional Security Operations Engineer の概要
cloudace
0
21
Gemini CLI x Google Cloud Document MCP で作る Google Cloud クイズボット
cloudace
0
22
魅力的な LT を作りたい
cloudace
0
17
AIエージェントはqじゃなくてwqしよう
cloudace
0
16
文系からSRE分野に挑戦 ( 新卒 2年目、私がGCP/AWSを学んで 得た気づき)
cloudace
0
54
Gemini を Raspberry Pi で走ら せた経験
cloudace
0
230
ADK / BigQueryで実現する分析エージェントのガバナンス設計
cloudace
0
46
【ガードレール】組織ポリシーで脆弱な設定を防ごう
cloudace
0
160
Cloud RunならDBも含めた ゼロスケールが可能? WordPressをゼロスケールさせた話
cloudace
0
31
Other Decks in Technology
See All in Technology
AIはどのように 組織のアジリティを変えるのか?
junki
4
1.3k
事業会社における 機械学習・推薦システム技術の活用事例と必要な能力 / ml-recsys-in-layerx-wantedly-2026
yuya4
0
160
5分でわかるDuckDB Quack
chanyou0311
2
250
ロボティクスの技術 / Robotics Technology
ks91
PRO
0
130
AIをフル活用してオンコール機能のプロトタイプを2日で作った話 / Building an AI-Powered On-Call Prototype in Just Two Days
nari_ex
0
120
作る力から、見極める力へ — AI時代に広がるエンジニアの価値と役割
rince
0
330
本当の”仕事”を手放せる未来が見えた
mu7889yoon
0
110
AI Agentをシステムに組み込む前にゆるく向き合ってみる
hayama17
0
130
千葉での単身赴任からAWSをやり続け、千葉に戻ってきた話
yama3133
1
120
從開發到部署全都交給 AI:實作 AI 驅動的自動化流程
appleboy
0
160
クラウドファンディング版StackChan 3体(4体)をインタラクティブな体験型作品にして展示もした話 / スタックチャンお誕生日会2026
you
PRO
0
180
徹底討論!ECS vs EKS!
daitak
3
1.7k
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
1.1k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
240
Leo the Paperboy
mayatellez
7
1.9k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
450
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
6k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
Paper Plane (Part 1)
katiecoart
PRO
0
9.2k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
The SEO identity crisis: Don't let AI make you average
varn
0
500
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Transcript
LLM による技術ブログレビューを 導入してみた時の話 Jagu’e’r Tech Writers 分科会 Meetup #3
自己紹介 • 仕事内容 ◦ クラウドエース株式会社 ◦ Google Cloud を中心としたコンサル、インテグレーションに従事 ◦
主にコンテナ領域を専門としながらアプリ、インフラ、マネジメント全般を 担当 • その他 ◦ リモートでの資格試験では自宅の浴室で受験 ◦ Google Cloud Champion Innovators (Modern Architecture, Serverless App Development) ◦ Google Cloud Partner Top Engineer 2024 ◦ Google Cloud Partner Tech Blog Challenge 2024 受賞 間瀬 真 (@Makocchan_Re)
当社は Zenn にて技術ブログを発信してい ますが、レビュープロセスを経て外部公開 をしています。 レビュープロセスに LLM によるレビューを 組み込んだ時の話をします。 &
本日話すこと
ブログ公開までのプ ロセス Zenn 連携用の GitHub リポジトリ ①ブログ執筆 ②Pull Request(PR)作成 ③マネージャーによる
PR のレビュー ④PR マージ ⑤ブログ公開
レビュー観点例 ・文章の内容に(技術的な視点でみて)誤りがないか ・文章表現において分かりづらくないか、不適切ではないか ・Zenn の禁止事項に該当する内容ではないか ・自社の広報で定めるルールに反していないか - Google Cloud を
GCP や Google Cloud Platform と書かないこと - 半角英数記号の前後には半角スペースを挿入すること - 「最強」みたいな誇張表現をしないこと - などなど
私が文書のレビュー が苦手だった 当時(2023 初秋)、LLM のキャッチアップを個人的 にしたかった 動機・課題 GPT-3.5 です GPT-4
です PaLM です PaLM 2 です GPT-4-turbo です
レビュー精度を 評価した上で本格導入 を検討 試用期間 評価 本格導入 Bad... ブログ執筆者による フィードバックを収集
50%以上の Good 評 価を目標として設定 50 %
Slack での レビュー運用を構築 Slack レビュア(bot) 記事執筆 特定チャンネルより レビュー依頼 レビュー結果の返信 Bad...
レビュー結果に対する評価 slack-app slack-app 評価の蓄積 ※ Slack は、米国およびその他の国で登録された Slack Technologies, Inc. の商標およびサービス マークです。
期待値コントロール のためのキャラ設定 @article-reviewer さん • 記事内容をチェックするプロフェッショナル • おじいちゃんなので的外れなことも多々指摘してし まいます。 •
真面目すぎて文章内容のチェックしかできず、会話 することはできません。
本格導入判断ライン 評価期間において、 約 80% 以上ポジティブ な評価を獲得
評価振り返り 精度には関係ないバグでネガ ティブ評価をもらってしまうこと も 精度の問題によるレビュー指 摘誤りも多々見られた レビュー指摘された箇所が分かりにくい。指摘箇所 の行数を教えてくれるが誤っている。 修正不要な指摘をしてしまう 自分の名前が誤りと指摘された
などなど
本格運用では、GitHub Actions によるレビュー を実施 記事執筆 GitHub Actions LLM によるレビュー レビュー結果を
PR レビューコメントまた はコメントとして追加 レビュー結果/評価結果の蓄積 GitHub リポジトリ
暫定運用からの改善点 その 1 レビュー指摘箇所の特定は LLM にはやらせない
暫定運用からの改善点 その 2 LLM による W チェックを導入 レビュー結果 一次レビュー 二次レビュー
(おじいちゃんとはライバル関係) 最終判断は人間に委ねるように注意を促す
暫定運用からの改善点 その 3 コードのレビューは止める ブログでのコードはサンプルコードや一部簡略化された 記載が多く、指摘としては多いが修正に繋がらないので トークンの無駄と判断 コードレビューに使うくらいなら、 W チェックにトークンを
割いた方がいいと判断
まとめと感想 LLM に全てをやらせない。ルールベースにできるも のはその方が確実なのと、プロンプトも減るので他 の観点の精度向上が期待できる。 誤字脱字や不自然な文章表現、固有名詞の誤りな どの検出は得意そう。 私のレビューは不要にならなかった。 現状はあくまでも文章校正のセルフチェックツール としての位置付けに。
Thank you ※Google Cloud は Google LLC の商標です。