Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPTsで模擬問題生成して資格対策してみる
Search
hsg
December 11, 2024
Technology
2
120
GPTsで模擬問題生成して資格対策してみる
hsg
December 11, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
tokyo_re_Growth2024_yoshi
yoshi22
0
190
Tailwind CSSとAtomic Designで実現する効率的な Web 開発の事例
toranoana
1
310
継続的にアウトカムを生み出し ビジネスにつなげる、 戦略と運営に対するタイミーのQUEST(探求)
zigorou
0
240
統計データで2024年の クラウド・インフラ動向を眺める
ysknsid25
2
780
第3回Snowflake女子会_LT登壇資料(合成データ)_Taro_CCCMK
tarotaro0129
0
150
ブラックフライデーで購入したPixel9で、Gemini Nanoを動かしてみた
marchin1989
1
380
同一クラスタ上でのFluxCDとArgoCDのリソース最適化の話
kumorn5s
0
200
ABEMA スマートテレビアプリケーションのパフォーマンス改善 〜業界トップクラスを目指して〜 / Performance Improvements on ABEMA Smart TV App
nodaguti
0
290
OpsJAWS32 re:Invent 2024 Ops系アップデートまとめ
takahirohori
0
180
アップデート紹介:AWS Data Transfer Terminal
stknohg
PRO
0
150
Postman と API セキュリティ / Postman and API Security
yokawasa
0
180
密着! Bedrockerがre:Invent 2024で過ごした5日間を紹介
minorun365
PRO
3
380
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
Code Review Best Practice
trishagee
65
17k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
49k
Producing Creativity
orderedlist
PRO
341
39k
Designing on Purpose - Digital PM Summit 2013
jponch
116
7k
GitHub's CSS Performance
jonrohan
1030
460k
For a Future-Friendly Web
brad_frost
175
9.4k
How GitHub (no longer) Works
holman
311
140k
Thoughts on Productivity
jonyablonski
67
4.3k
Transcript
GPTsで模擬問題生成して 資格対策してみる hisagi ( @yuriy183 )
自己紹介 hisagi [ 𝕏: @yuriy183 ] システム開発会社勤務6年目 業務内容はクラウド関係の開発が中心 (現在はAzure) 最近の興味:
LLM
本日の内容 8月に取得したE資格の対策にGPTを使った話をします ※ChatGPT/LLMにそこまで詳しくない方向けの内容です
E資格について E資格とは - 一般社団法人日本ディープラーニング協会【公 式】 • 指定の講座を受講が必要。 • テストセンターで受けられるCBT試験。 •
選択式のみ、記述や実技はなし。 • 実際のプログラムについてなども含めた、 実践的な知識を問われる 公式HPから引用
状況 • 別の資格も受けており 本格的に対策開始したのが 1ヶ月前切ってから • 機械学習の基礎知識はあまりなし とにかく時間がなかったので、 問題をひたすら解いて定着を図る方向
ChatGPTを使うことに • 面倒なことはChatGPTにやらせよう という本を通して触り、 使えそうという感触はあり(PDFを渡して内容要約させる など) • GPT-4oが公開されて3ヶ月ほど経ち、 従来より性能もよくなっている 期待
ChatGPTを使って対策することに
実際どうするか シラバスの PDFが公開されているのでそ れを読み込ませる 問題を生成させる 回答する 正解不正解と 解説をもらう
まずPDFだけ入れて試す これでも十分ではあるが、いろいろ問題あり • 出題範囲外を認識してない 灰色背景部は出題範囲外。。
出題範囲外を除いて Markdown化 ここもChatGPTにやらせてみました https://chatgpt.com/share/67584189-af1c-800b-8b08- a87e2cda12bd しかし出題範囲外を除くところは うまくいかなかったので最後は手動編集
Markdownを使った場合 • (当然ですが)出題範囲外からの出題はなくなる • 大項目・中項目を指定した出題 も精度向上 ただし、以下の問題は存在 • 解説の粒度や有無が一定しない ※ハルシネーション対策もあるので、
選択肢全てについて正解・不正解の理由 を 説明してほしい • 形式を変えるようお願いすると おかしな問題 が出てくる (右の例は、E資格と関係ないPythonの実装問題)
もう少しプロンプトを加えて GPTs化 • 問題と回答の形式をガチガチに決めるプロンプト を作成 ◦ 問題形式の例は講座の付録にあった内容を参考に GPTで作成 • ハルシネーション対策
を狙って、 問題作成前にインターネット検索 するよう指示 ◦ しかしこれはあまり効果なし ◦ GPTsの中で検索させた時の挙動が普通のChatGPTとやや違う? ◦ 回答内のリンクがほとんど機能せず ChatGPT - E資格対策(非公式)
GPTs 2023年11月には有料会員向けにリリース。 カスタム設定のGPTを作成・利用できる機能。 今回で言うとPDFの情報を渡す、特定の指示を必ず入れるなどをプリセット化できるもの Introducing GPTs | OpenAI
😃よかった点 何と言っても手軽 • シラバスを渡すだけで、きちんと知識を持って 作る必要のある問題を量産 できる • スマホからでも使える ので スキマ時間を無限に活用できた
本当に、合格できたのは GPT利用のおかげでした 🙏
😃よかった点 出題範囲・形式の指定機能 • GPTの出題は割と偏る • 弱点を作らないようニッチ領域の範囲・形式も 指定して対策できたので効率が良かった
😃よかった点 ハルシネーション があるので、 逆に一つ一つの問題に丁寧に取り組めた • 正解と言われていても油断できない ので、 出された内容についてしっかり調べる ことに
😥いまいち・改善したい点 ハルシネーション • とはいえ、本当は正解不正解も 解答説明も全て正しくしてほしい • インターネット検索の利用 で緩和を試みたが 当時はあまりうまくいかず •
根本的な対策は難しい? ◦ 資料にできる文書を リソースに入れるなどは考えられる
😥いまいち・改善したい点 利用回数上限 • 4oは40回/3hまで(GPTsではない利用とも合算 ) ◦ 問題→回答のラリーは20回程度 ◦ 気合を入れて勉強していると 上限に当たることがあった
😥いまいち・改善したい点 利用回数上限の解決案 • Assistants API利用: 使った分だけになり費用も低減? しかしスマホからは使いづらい • GeminiのGems: 回数は気にしなくてよくなる
ただし、数式描画ができない • ClaudeのProjects: 同じく回数の制限は緩和されそう しかし数式描画は弱め。 • Proプラン(月$200)に入る: Money is All You Need😇
まとめ • シラバスPDFを投げ込むだけ で問題が作れたのは正直驚き • ハルシネーションも減ってきている →当然確認は必要だが、GPTが知識を持っている領域 であれば この種の使い方も十分できる と実感
Thank you for listening.
Appendix. システムプロンプトとシラバスの抽出内容 システムプロンプト: https://pastebin.com/BzRGnAuw シラバス抽出内容(出題範囲.md): https://pastebin.com/bY6KPaqM パスワードはいずれも NZY2X4Bp9K です。