Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ゴミ入り文字列からGPTを使って 住所を取り出した話

かーでぃ
November 01, 2024
3

ゴミ入り文字列からGPTを使って 住所を取り出した話

かーでぃ

November 01, 2024
Tweet

Transcript

  1. 自己紹介 • 名前: かーでぃ/鎌田誠 • 今年の抱負: アウトプットの多様性 • 主催、運営: ◦

    RPACommunity LT支部、WAトーク支部、 LTを雑に雑談する30分 ◦ BabylonJS勉強会 ゆるほめLT会 ◦ CDLE RPA&クラウドフローグループ ◦ CommuPro Guild • モットー:IT知識は広ーく、浅ーく、幅広く • 好き:技術書典、コーヒー、チェアリング    ゆるキャン△、ぼざろ、マケイン、ガンダム 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm

  2. 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm
 データがボロいと後処理が大変… あいうえおかきくけこ 〒4400999愛知県豊橋市渋谷町 39-14エメラルドメンション東谷 201ささし***鎌田誠

    得たデータが構造化データではなく、 1つの文字列だったら … ※しかもゴミ入り これは、さすがに人が判断しないと、 郵便番号、県・市、町名・番地、建物名、氏名 にわけられない!
  3. 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm
 ChatGPTに分割させてみた 郵便番号 : 〒440-0999 住所:

     ・県・市 : 愛知県豊橋市  ・町名・番地 : 渋谷町39-14  ・建物名・部屋番号: エメラルドメンション東谷201 名前:  ・苗字 : 鎌田  ・名前 : 誠 ※ゴミ情報は削除してくれる 以下のテキストから、 郵便番号 、住所(県・市、町名・番地、建物名・部屋番号の3つに分ける)、 名前(苗字と名 前の2つに分ける)に分解してください。 あいうえおかきくけこ 〒4400999愛知県豊橋市渋谷町 39-14エメラルドメンション東谷 201ささし***鎌田誠
  4. 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm
 まとめ • AIは、推論と分類 (生成AIも最後はココ) •

    本来、事前学習が必要 • しかし、生成AI活用で、省略できちゃう 👉 つまり、コスト不要 • 是非、判断を要する箇所にAIの活用を!