Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
清水宏太_ポートフォリオ資料_2023年11月時点
Search
Lemio
November 06, 2023
Programming
0
92
清水宏太_ポートフォリオ資料_2023年11月時点
Lemio
November 06, 2023
Tweet
Share
More Decks by Lemio
See All by Lemio
20250520_Dify_Meetup_Tokyo__5_LT資料_アプリケーションが動かなくなったらバージョンを見よう_.pdf
lemio
1
900
0からDifyを学ぶには_Dify Meetup Tokyo #4
lemio
0
1.9k
生成AIの社内導入やってみて_SaySyaMeetUpVol3
lemio
0
84
第2回saysayオフ会LT_清水れみお
lemio
0
200
開発した生成AI活用アプリ
lemio
0
170
遅刻しなAI_LT資料
lemio
0
100
Other Decks in Programming
See All in Programming
チームのテスト力を総合的に鍛えて品質、スピード、レジリエンスを共立させる/Testing approach that improves quality, speed, and resilience
goyoki
5
1.2k
スタートアップの急成長を支えるプラットフォームエンジニアリングと組織戦略
sutochin26
1
7.3k
Python型ヒント完全ガイド 初心者でも分かる、現代的で実践的な使い方
mickey_kubo
1
240
AIともっと楽するE2Eテスト
myohei
9
3k
코딩 에이전트 체크리스트: Claude Code ver.
nacyot
0
950
Claude Code + Container Use と Cursor で作る ローカル並列開発環境のススメ / ccc local dev
kaelaela
12
7.2k
CDK引数設計道場100本ノック
badmintoncryer
2
490
Quand Symfony, ApiPlatform, OpenAI et LangChain s'allient pour exploiter vos PDF : de la théorie à la production…
ahmedbhs123
0
220
dbt民主化とLLMによる開発ブースト ~ AI Readyな分析サイクルを目指して ~
yoshyum
3
1.1k
MySQL9でベクトルカラム登場!PHP×AWSでのAI/類似検索はこう変わる
suguruooki
1
110
新メンバーも今日から大活躍!SREが支えるスケールし続ける組織のオンボーディング
honmarkhunt
5
8.8k
AI Agent 時代のソフトウェア開発を支える AWS Cloud Development Kit (CDK)
konokenj
6
820
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Building an army of robots
kneath
306
45k
Designing for Performance
lara
610
69k
Side Projects
sachag
455
42k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
126
53k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
What's in a price? How to price your products and services
michaelherold
246
12k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Optimizing for Happiness
mojombo
379
70k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The World Runs on Bad Software
bkeepers
PRO
70
11k
Transcript
AIは 考える×作る×聞く×話す×見る =無限∞のアイデア そして私はアイデアマンです。
アイデアに価値はない 形にできなければそれは寝言と同じだ。 by 清水 亮 出典
なので作りました。
考える×作る
5 遅刻しなAI アプリ紹介 自然言語からスケジュール登録と 移動スケジュールも同時に登録 LINE友達登録URL WEB簡易版
スケジュールURL生成 アーキテクチャ図 6 GPT-3.5-turbo-instruct スケジュール情報 Googleカレンダー 登録URL プロンプトにて 日付/時間/場所/イベント 名/イベント内容を分類
URLをZero Shotで生成 https://www.google.com/calendar/event?action=TEMPLATE&text=LLM+Application+Meetup+vol.99&dates =20231212T100000Z/20231212T120000Z&details=https://llm-app.connpass.com/event/297732/&location= 品川グランドセントラルタワー+日本マイクロソフト品川本社+31F+セミナールーム+A&trp=false <URL生成例> Olemi-llm-apprentice/Dont_be_late_AI: 遅刻しなAI (github.com)
乗換経路生成 アーキテクチャ図 7 GPT-3.5-turbo-instruct スケジュール情報 + 出発地 出発地 目的地 緯度経度
到着時刻 (日本標準時) URL合成 https://www.google.com/maps/dir/35.6896067,139.7005713/35.6267695,139.7404376/am=t/ data=!4m9!4m8!1m1!4e1!1m0!2m3!6e1!7e2!8j1702407000!3e3?entry=ttu <URL生成例>
プロンプトの一部
現状見えている課題と対応策 ・音声認識機能追加→ Whisper ・複数人同時で扱うとバグが発生→UserIDをDBで管理 ・車やサイクリング経路探索機能追加→GoogleMap API ・スクリーンショットや画像からスケジュール作成→日本語OCRモデルの勉強 ・セキュリティ設定→これから
聞く×考える×作る
動画→議事録化AIエージェント(11月末無料公開目標) Web会議 録画 レポート 議事録 現場打合せ 録音 様々な動画や音声データ
動画→議事録化AI アーキテクチャ図 12 GPT-3.5-turbo 動画 .mp4 音声 .mp3 文字起こし 全文
テキスト 分割 テキスト 要約 要約 テキスト 合成 合成 テキスト マークダウン 記事化 議事録化 全体要約 テキスト 分割 テキスト 分割 テキスト 分割 テキスト 要約 テキスト 要約 テキスト 要約 ffmpeg GPT-3.5-turbo Olemi-llm-apprentice/-whisper_test- (github.com)
生成例
動画に一語一語字幕(形態素解析) カラオケのように字幕が単語ごとに強調 (形態素解析したものは日本初?) 出展:https://www.youtube.com/watch?v=Gh0xzbgCIgg&pp=ygUc44K944OV44OI44OQ44Oz44KvIOWtq-ato-e-qQ%3D%3D
一語一語字幕 アーキテクチャ図 動画 .mp4 文字 起こし .json フォント 付字幕 .ass
ffmpeg WhisperX 単語から 形態素解析 .json janome 字幕付き 動画 .mp4
二つを合成して目指す最終系 M365 CopilotのTeams会議議事録機能 <機能> ・動画記録 ・議事録、タスク化 ・話者認識 ・会議内容をRAGでAI チャット ・議事録から動画の再生
場面へジャンプ ・ネガポジ発言探知
現状見えている課題と対応策 ・話者認識機能→ WhisperX ・文字起こしテキストをベクトル化→LangChain ・RAG_AIチャット機能→LangChain ・議事録からと動画のタイムスタンプ動機→これから ・ネガポジ発言探知モデルの追加→これから ・文字起こしおよび字幕焼き付け処理をローカルに飛ばすためのサーバー設定 およびセキュリティ設定→これから ・UI作成→これから(VercelV0を試したい)
生成AI系 MeetUpイベント 参加実績 ※オンライン含む
生成AI系 MeetUpイベント LT登壇実績 MicrosoftにてLT登壇 生成AI高専人会を 主催しLT登壇
今後つくりたいもの(個人として) 聞く×考える×話す ・3歳児向けおしゃべりぬいぐるみ(クリスマス目標) ・どんな時でも肯定的に励ましてくれる話せるAIアシスタント(12月末目標) 見る×考える×作る ・プラモデルの棚卸アプリ(1月末目標) ・チラシからお買い得商品通知+献立レシピ提供アプリ(3月末目標) 見る×考える×作る ・リアルおままごとレジ打ち(1月末目標)
考える×作る×聞く×話す×見る AIで 日本の生産性を革命的に向上させる プロダクトを作りたい