Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自社開発SaaSバクラクのAI技術とそれに向き合うエンジニアのやりがい / layerx-ai...
Search
sbrf248
June 01, 2024
410
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
自社開発SaaSバクラクのAI技術とそれに向き合うエンジニアのやりがい / layerx-ai-engineer-dataconference20240601
sbrf248
June 01, 2024
More Decks by sbrf248
See All by sbrf248
LLMでAI-OCR、実際どうなの? / llm_ai_ocr_layerx_bet_ai_day_lt
sbrf248
1
10k
バクラクのアノテーション基盤の伸びしろを考えてみた
sbrf248
1
240
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
How STYLIGHT went responsive
nonsquared
100
6.2k
Six Lessons from altMBA
skipperchong
29
4.3k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
170
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
240
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
The Cult of Friendly URLs
andyhume
79
6.9k
What does AI have to do with Human Rights?
axbom
PRO
1
2.2k
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
400
Transcript
© LayerX Inc. 自社開発SaaSバクラクのAI技術とそれに向き合うエンジニアのやりがい 2024/06/01 DATA CONFERENCE 株式会社LayerX 北岡知晃 伊藤駿
2 © LayerX Inc. 自己紹介 伊藤 駿 (Shun Ito) @sbrf248
2020年04月〜 2023年12月 料理系スタートアップのデータサイエンティスト 2024年01月〜 株式会社LayerX バクラク事業部 機械学習チーム 機械学習エンジニア • 学生時代の研究テーマは、クラウドソーシングで収集 する教師ラベルの品質管理 • 趣味は音楽と将棋観戦
3 © LayerX Inc. 自己紹介 北岡 知晃(Tomoaki Kitaoka) @tapioca_pudd 2019年〜
株式会社LayerX バクラク事業部 機械学習チーム Software Engineer • インターン→新卒入社 • バクラクのリリース初期からAI-OCR機能の開発 • 趣味は体を鍛えること(クロスフィット)と服を作ること
目次 Agenda • 会社概要 • バクラクシリーズ概要 • バクラクにおけるAI-UX • バクラクにおけるMLOps
• インターン告知 • さいごに
会社概要
© LayerX Inc. 6 人類の未来をより良くする。 そのために私たちは、テクノロジーの可能性を探求し、 経済活動における複雑で大きな課題に挑む。 仕事や暮らしの中にある摩擦が解消され、 それぞれの創造力が発揮されている。 そんな希望あふれる優しいデジタル社会を、
未来に残していくために。 すべての経済活動を、デジタル化する。 MISSION
7 © LayerX Inc. 「すべての経済活動を、デジタル化する。」をミッションに掲げ、 法人支出管理サービス「バクラク」や企業内業務のデジタル化を支援するサービスを提供しています。 事業紹介 バクラク事業 企業活動のインフラとなる法人支出 管理(BSM)SaaSを開発・提供
Fintech事業 ソフトウェアを駆使したアセットマネジメ ント・証券事業を合弁会社にて展開 AI・LLM事業 文書処理を中心とした、LLMの活用による プロセスのリデザイン
© LayerX Inc. 8 • ChatGPTを始めとしたアイデアから生まれた体験を、「AI-UX」(AIを前提とした理想のUX)と呼ぶ • AI-UXは、「AIを前提とした理想のUX」を作るために、AIだけでなく、AI以外のあらゆる手段も総動員 する •
AIを知り尽くした上で、何のタスクを、どう解くかをデザインし、体験に落とし込む。どこでAIを使い、ど こであえてAIを使わないかを、全体の体験としてどう落とし込むかが鍵(ソフトウェアとデザインの総合 格闘技戦) • AI-UXはマーケティング、営業、カスタマーサクセス、サポートなどビジネス組織にも変化を及ぼしてい く • 洗練されたAI-UXで、ユーザーの体験を再構築していくことをAX(AI Transformation)と呼ぶ AI-UXとAX(AI Transformation) 2024年の注力ポイント 日経COMEMO「AI-UXとAX(AI Transformation)というLayerXの挑戦」より
© LayerX Inc. 9 「人がシステムに合わせる」から「システムが人に合わせる」世界へ システム システム AI ・・・ システムはデータを入れる箱
(業務は変わらない) システムは人を助ける アシスタント 領収書の写真を撮ったら 全て入力される 領収書を見ながら、 金額、社名などを手入力... 出張の手配は全て自分でし 申請も全て自分で入力... カレンダーの出張予定を見て 最適な旅程を提案→決済 カレンダー, システムの履歴 から自動で勤怠を作成 勤怠を自分で振り返り、上長 承認のためのシステム入力... 削れる費用をサジェスト、 最適な働き方を提案 システムに溜まったデータを分 析し、費用削減プランを実行... 人がシステムに合わせて(使役され)、仕事をしている... 入力は自動化され、データから理想をサジェスト(システムが人に合わせる) 今後の展望
バクラクシリーズ概要
© LayerX Inc. 11 バクラクシリーズラインナップ 稟議・支払申請・経費精算 仕訳・支払処理効率化 法人カードの発行・管理 帳票保存・ストレージ 帳票発行
* 経費精算のSlack連携は申請内容の通知のみ ・AIが領収書を5秒でデータ化 ・スマホアプリとSlack連携あり ・領収書の重複申請などミス防止機能 ・AIが請求書を5秒でデータ化 ・仕訳・振込データを自動作成 ・稟議から会計までスムーズに連携 ・年会費無料で何枚でも発行可 ・インボイス制度・電帳法対応 ・すべての決済で1%以上の還元 ・AIが書類を5秒でデータ化 ・あらゆる書類の電子保管に対応 ・電子取引・スキャナ保存に完全対応 ・帳票の一括作成も個別作成も自由自在 ・帳票の作成・稟議・送付・保存を一本化 ・レイアウトや項目のカスタマイズも可能
© LayerX Inc. 12 • 請求書に記入されている項目(支払期日や支払金 額、取引先名など)を目視で確認して、ミスなく入 力・管理することはとても負荷の高い仕事 ◦ 枚数が増えるにつれてミスが起こりやすい
◦ 帳票のフォーマットが多種に渡り単純に大変 ◦ ミスは許されないためダブルチェック等確認 作業にもコストがかかってしまう バクラクのAI-OCR 背景
© LayerX Inc. 13 バクラク請求書 AI-OCR(請求書読み取り)機能のデモ 背景
バクラクにおけるAI-UX
© LayerX Inc. 15 帳票ファイルを入力し、必要項目ごとの値を抽出する AI-OCRが解いている課題 帳票ファイル (画像・PDF) 帳票に記載の 項目ごとの値
500,000 2021/02/28 株式会社テンプレ 支払期日 支払金額 取引先名
© LayerX Inc. 16 AI-OCRが解いている課題 例1 支払期日として2021年2月28日(日)を検出 顧客「実際に支払うのは平日の26日(金)だから変更しないと!」 例2 支払金額として500,000円を検出
顧客「実際に支払うのは源泉税10.21%を差し引いた448,950円だから変更しないと!」 顧客が本当に欲しているのは 「帳票に記載の値」ではなく「実際の運用に即した値」 2つが一致しないケースが一定数存在する
© LayerX Inc. 17 帳票ファイルを入力し、実際の運用に即した値を抽出する AI-OCRが真に解いている課題 帳票ファイル (画像・PDF) 支払期日 支払金額
2021/02/28 取引先名 500,000 株式会社テンプレ 帳票に記載の 項目ごとの値 支払期日 支払金額 2021/02/26 取引先名 448,950 株式会社テンプレ 帳票に記載の 項目ごとの値に基づく 実際の運用に即した値
© LayerX Inc. 18 機械学習とルールベースやUXを組み合わせたアプローチ AI-OCRの課題へのアプローチ 帳票ファイル (画像・PDF) 支払期日 支払金額
2021/02/28 取引先名 500,000 株式会社テンプレ 帳票に記載の 項目ごとの値 支払期日 支払金額 2021/02/26 取引先名 448,950 株式会社テンプレ 帳票に記載の 項目ごとの値に基づく 実際の運用に即した値 ルールベースやプロダク トの体験(UX)で実現 機械学習で実現 • 帳票に記載の項目ごとの値 ◦ 大量に蓄積された顧客の利用データやアノテーションデータを用いて学習された機械学習モデル を利用 • 実際の運用に即した値 ◦ 「帳票に記載の項目ごとの値」と異なる場合は、ルールベースやプロダクトの体験(UX)でカバー
© LayerX Inc. 19 様々な機械学習モデルの検証や実運用 AI-OCRで利用されている機械学習モデル https://arxiv.org/abs/2012.14740 https://arxiv.org/pdf/1912.13318 https://arxiv.org/pdf/2204.08387 https://arxiv.org/pdf/1810.04805
• 商用利用可な日本語学習済みモデルが公開されているRoBERTa等をファインチューニングから実装 • マルチモーダル(画像+テキスト)なモデルであるLayoutLM系を事前学習から実装
© LayerX Inc. 20 既存のAI-OCRだけでは解決できない課題 書類単体の情報だけでは解決できない課題 経費精算時必要となる情報 立て替えをした日 立て替えした金額 立て替え先のお店情報
社内ルールに基づいた区分 飲食の場合、出席者情報 ・・・ 領収書からは得られず、各社独自のルールに基づく入 力項目のため、依然として手入力が存在 機械学習ベースの AI-OCRで自動読取 帳票・書類としては存在していない情報が必要であり、AI-OCRによる情報抽出だけでは対応不可
© LayerX Inc. 21 構造化データを利用した事例 過去の履歴データを利用した内訳推薦 過去に「どの取引先で」「どういう内訳を選択してきたか」の履歴データを利用することで実現。
© LayerX Inc. 22 バクラクの機械学習エンジニアのやりがい バクラクの機械学習エンジニアとしての難しさとやりがい “使っていただくお客様の体験を一番に考える” ということ • バクラクはお客様の毎日の仕事に密接に関わるプロダクトだからこそ、少しでも多くWowな体験を
届けたい! • そのためには、データ分析によるお客様ニーズの理解と、UXまで含めた試行錯誤が重要! ◦ 分析例: 同じ新幹線の領収書でも、お客様によって “購入日” と “乗車日” のどちらを “日付” として入力しているかが違っていそう ◦ 機械学習で両方読み取っておいて、過去の入力履歴からお客様が求めている方を推薦した方が よいかも? • 試行錯誤の連続で簡単ではないですが、悩みながらも少しずつプロダクトを改善させていく経験は 大きなやりがいだと感じます!
バクラクにおけるMLOps
© LayerX Inc. 24 バクラクにおけるMLOpsの取り組み バクラクのMLOpsの取り組み 機械学習モデルはリリースして終わりじゃない!むしろリリースしてからがスタート! Khalid Salama, Jarek
Kazmierczak, Donna Schut. Practitioners guide to MLOps: A framework for continuous delivery and automation of machine learning; 2021.
© LayerX Inc. 25 バクラクにおけるMLOpsの取り組み事例① 機械学習モデルの性能モニタリング リリースしたモデルが実際にどれくらいお客様に価値を提供できているのか、常に監視する必要があります。 • 過去モデルの性能との性能比較して悪化してないか? ◦
→ モデルを切り戻した方が良いかもしれない • 時系列的な精度の推移をみて悪化してないか? ◦ → 最新のデータセットで学習し直した方がいいかもしれない 単純な読み取り精度をモニタリングするのではなく、お客様の体験を モニタリングすることが重要
© LayerX Inc. 26 バクラクにおけるMLOpsの取り組み事例② 爆速でデータセットを作るためのアノテーションツール モニタリング後、精度改善に必要な学習用のデータを素早く作り再学習をさせることが重要であり、バクラク では手入力を徹底的になくすことでデータセットを爆速で作れるアノテーションツールを内製しています。
© LayerX Inc. 27 バクラクにおけるMLOpsのやりがい バクラクにおけるMLOpsの難しさとやりがい 様々な業種・規模のお客様が増え続ける中で、高い性能の機械学習モデルを提供し続けることは難しい! • データの流れをどうMLOpsエンジニアがデザインするかで改善のサイクルのスピードが大きく変わるため、 MLOpsエンジニアの仕事が高い性能のモデルを提供し続けることができるかに大きく影響する!
• 自社でプロダクトで展開しているからこそ、どのようなデータをためていくかの設計から考えあらゆるデータを駆使 してモデル開発することができる! 高性能のモデルを開発しても、傾向の異なる新規 のお客様に対しては高い性能がでない場合も 良質なデータセットを素早く作り、爆速で実験を 回すことで、継続的に高い性能のモデルを開発し 続けなければならない
インターン告知
© LayerX Inc. 29 インターン告知 サマーインターン初開催のお知らせ!
© LayerX Inc. 30 インターン告知 サマーインターン 機械学習エンジニア • テーマ:『AI・機械学習技術を活用したバクラクの機能改善』 • 開催日程:2024年8月26日(月)〜9月13日(金)
の3週間(15日間) ◦ 場合によっては、8月-9月の期間内で別途調整可能 具体的な取り組み内容は、これまでのご経験やご希望を伺いつつ、メンターと相談しつつ決定します。 画像処理、自然言語処理(LLMも含む)、Vison and Language、推薦システム、etc… これまで授業や研究で扱ってきた機械学習という技術が企業においてどのように活用されているのかを知りた い方も、 他の企業で積まれたご経験をLayerXでも活かして活躍したい方も、お待ちしております!
さいごに
© LayerX Inc. 32 さいごに 大切な “時間” を何に投資するか どれだけ自分で意思決定をしてきたかで、その後の成長角度が大きく変わってき ます。大小問わず、毎日意思決定ができる環境を選ぶこと。毎日1つ意思決定する
として、1年で200回。1年で数回の意思決定しか担えない環境と比べると、その 差は歴然です。 どれだけ自分で意思決定をしてきたかで、その後の成長角度が大きく変わる どんな会社に新卒入社/インター ンしたら良いか? 成長している事業があること