Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自社開発SaaSバクラクのAI技術とそれに向き合うエンジニアのやりがい / layerx-ai...

sbrf248
June 01, 2024
160

自社開発SaaSバクラクのAI技術とそれに向き合うエンジニアのやりがい / layerx-ai-engineer-dataconference20240601

sbrf248

June 01, 2024
Tweet

Transcript

  1. 2 © LayerX Inc. 自己紹介 伊藤 駿 (Shun Ito) @sbrf248

    2020年04月〜 2023年12月 料理系スタートアップのデータサイエンティスト 2024年01月〜 株式会社LayerX バクラク事業部 機械学習チーム 機械学習エンジニア • 学生時代の研究テーマは、クラウドソーシングで収集 する教師ラベルの品質管理 • 趣味は音楽と将棋観戦
  2. 3 © LayerX Inc. 自己紹介 北岡 知晃(Tomoaki Kitaoka) @tapioca_pudd 2019年〜

    株式会社LayerX バクラク事業部 機械学習チーム Software Engineer • インターン→新卒入社 • バクラクのリリース初期からAI-OCR機能の開発 • 趣味は体を鍛えること(クロスフィット)と服を作ること
  3. © LayerX Inc. 8 • ChatGPTを始めとしたアイデアから生まれた体験を、「AI-UX」(AIを前提とした理想のUX)と呼ぶ • AI-UXは、「AIを前提とした理想のUX」を作るために、AIだけでなく、AI以外のあらゆる手段も総動員 する •

    AIを知り尽くした上で、何のタスクを、どう解くかをデザインし、体験に落とし込む。どこでAIを使い、ど こであえてAIを使わないかを、全体の体験としてどう落とし込むかが鍵(ソフトウェアとデザインの総合 格闘技戦) • AI-UXはマーケティング、営業、カスタマーサクセス、サポートなどビジネス組織にも変化を及ぼしてい く • 洗練されたAI-UXで、ユーザーの体験を再構築していくことをAX(AI Transformation)と呼ぶ AI-UXとAX(AI Transformation) 2024年の注力ポイント 日経COMEMO「AI-UXとAX(AI Transformation)というLayerXの挑戦」より
  4. © LayerX Inc. 9 「人がシステムに合わせる」から「システムが人に合わせる」世界へ システム システム AI ・・・ システムはデータを入れる箱

    (業務は変わらない) システムは人を助ける アシスタント 領収書の写真を撮ったら 全て入力される 領収書を見ながら、 金額、社名などを手入力... 出張の手配は全て自分でし 申請も全て自分で入力... カレンダーの出張予定を見て 最適な旅程を提案→決済 カレンダー, システムの履歴 から自動で勤怠を作成 勤怠を自分で振り返り、上長 承認のためのシステム入力... 削れる費用をサジェスト、 最適な働き方を提案 システムに溜まったデータを分 析し、費用削減プランを実行... 人がシステムに合わせて(使役され)、仕事をしている... 入力は自動化され、データから理想をサジェスト(システムが人に合わせる) 今後の展望
  5. © LayerX Inc. 11 バクラクシリーズラインナップ 稟議・支払申請・経費精算 仕訳・支払処理効率化 法人カードの発行・管理 帳票保存・ストレージ 帳票発行

    * 経費精算のSlack連携は申請内容の通知のみ ・AIが領収書を5秒でデータ化 ・スマホアプリとSlack連携あり ・領収書の重複申請などミス防止機能 ・AIが請求書を5秒でデータ化 ・仕訳・振込データを自動作成 ・稟議から会計までスムーズに連携 ・年会費無料で何枚でも発行可 ・インボイス制度・電帳法対応 ・すべての決済で1%以上の還元 ・AIが書類を5秒でデータ化 ・あらゆる書類の電子保管に対応 ・電子取引・スキャナ保存に完全対応 ・帳票の一括作成も個別作成も自由自在 ・帳票の作成・稟議・送付・保存を一本化 ・レイアウトや項目のカスタマイズも可能
  6. © LayerX Inc. 12 • 請求書に記入されている項目(支払期日や支払金 額、取引先名など)を目視で確認して、ミスなく入 力・管理することはとても負荷の高い仕事 ◦ 枚数が増えるにつれてミスが起こりやすい

    ◦ 帳票のフォーマットが多種に渡り単純に大変 ◦ ミスは許されないためダブルチェック等確認 作業にもコストがかかってしまう バクラクのAI-OCR 背景
  7. © LayerX Inc. 16 AI-OCRが解いている課題 例1 支払期日として2021年2月28日(日)を検出 顧客「実際に支払うのは平日の26日(金)だから変更しないと!」 例2 支払金額として500,000円を検出

    顧客「実際に支払うのは源泉税10.21%を差し引いた448,950円だから変更しないと!」 顧客が本当に欲しているのは 「帳票に記載の値」ではなく「実際の運用に即した値」 2つが一致しないケースが一定数存在する
  8. © LayerX Inc. 17 帳票ファイルを入力し、実際の運用に即した値を抽出する AI-OCRが真に解いている課題 帳票ファイル (画像・PDF) 支払期日 支払金額

    2021/02/28 取引先名 500,000 株式会社テンプレ 帳票に記載の 項目ごとの値 支払期日 支払金額 2021/02/26 取引先名 448,950 株式会社テンプレ 帳票に記載の 項目ごとの値に基づく 実際の運用に即した値
  9. © LayerX Inc. 18 機械学習とルールベースやUXを組み合わせたアプローチ AI-OCRの課題へのアプローチ 帳票ファイル (画像・PDF) 支払期日 支払金額

    2021/02/28 取引先名 500,000 株式会社テンプレ 帳票に記載の 項目ごとの値 支払期日 支払金額 2021/02/26 取引先名 448,950 株式会社テンプレ 帳票に記載の 項目ごとの値に基づく 実際の運用に即した値 ルールベースやプロダク トの体験(UX)で実現 機械学習で実現 • 帳票に記載の項目ごとの値 ◦ 大量に蓄積された顧客の利用データやアノテーションデータを用いて学習された機械学習モデル を利用 • 実際の運用に即した値 ◦ 「帳票に記載の項目ごとの値」と異なる場合は、ルールベースやプロダクトの体験(UX)でカバー
  10. © LayerX Inc. 19 様々な機械学習モデルの検証や実運用 AI-OCRで利用されている機械学習モデル https://arxiv.org/abs/2012.14740 https://arxiv.org/pdf/1912.13318 https://arxiv.org/pdf/2204.08387 https://arxiv.org/pdf/1810.04805

    • 商用利用可な日本語学習済みモデルが公開されているRoBERTa等をファインチューニングから実装 • マルチモーダル(画像+テキスト)なモデルであるLayoutLM系を事前学習から実装
  11. © LayerX Inc. 20 既存のAI-OCRだけでは解決できない課題 書類単体の情報だけでは解決できない課題 経費精算時必要となる情報 立て替えをした日 立て替えした金額 立て替え先のお店情報

    社内ルールに基づいた区分 飲食の場合、出席者情報 ・・・ 領収書からは得られず、各社独自のルールに基づく入 力項目のため、依然として手入力が存在 機械学習ベースの AI-OCRで自動読取 帳票・書類としては存在していない情報が必要であり、AI-OCRによる情報抽出だけでは対応不可
  12. © LayerX Inc. 22 バクラクの機械学習エンジニアのやりがい バクラクの機械学習エンジニアとしての難しさとやりがい “使っていただくお客様の体験を一番に考える” ということ • バクラクはお客様の毎日の仕事に密接に関わるプロダクトだからこそ、少しでも多くWowな体験を

    届けたい! • そのためには、データ分析によるお客様ニーズの理解と、UXまで含めた試行錯誤が重要! ◦ 分析例: 同じ新幹線の領収書でも、お客様によって “購入日” と “乗車日” のどちらを “日付” として入力しているかが違っていそう ◦ 機械学習で両方読み取っておいて、過去の入力履歴からお客様が求めている方を推薦した方が よいかも? • 試行錯誤の連続で簡単ではないですが、悩みながらも少しずつプロダクトを改善させていく経験は 大きなやりがいだと感じます!
  13. © LayerX Inc. 25 バクラクにおけるMLOpsの取り組み事例① 機械学習モデルの性能モニタリング リリースしたモデルが実際にどれくらいお客様に価値を提供できているのか、常に監視する必要があります。 • 過去モデルの性能との性能比較して悪化してないか? ◦

    → モデルを切り戻した方が良いかもしれない • 時系列的な精度の推移をみて悪化してないか? ◦ → 最新のデータセットで学習し直した方がいいかもしれない 単純な読み取り精度をモニタリングするのではなく、お客様の体験を モニタリングすることが重要
  14. © LayerX Inc. 27 バクラクにおけるMLOpsのやりがい バクラクにおけるMLOpsの難しさとやりがい 様々な業種・規模のお客様が増え続ける中で、高い性能の機械学習モデルを提供し続けることは難しい! • データの流れをどうMLOpsエンジニアがデザインするかで改善のサイクルのスピードが大きく変わるため、 MLOpsエンジニアの仕事が高い性能のモデルを提供し続けることができるかに大きく影響する!

    • 自社でプロダクトで展開しているからこそ、どのようなデータをためていくかの設計から考えあらゆるデータを駆使 してモデル開発することができる! 高性能のモデルを開発しても、傾向の異なる新規 のお客様に対しては高い性能がでない場合も 良質なデータセットを素早く作り、爆速で実験を 回すことで、継続的に高い性能のモデルを開発し 続けなければならない
  15. © LayerX Inc. 30 インターン告知 サマーインターン 機械学習エンジニア • テーマ:『AI・機械学習技術を活用したバクラクの機能改善』 • 開催日程:2024年8月26日(月)〜9月13日(金)

    の3週間(15日間) ◦ 場合によっては、8月-9月の期間内で別途調整可能 具体的な取り組み内容は、これまでのご経験やご希望を伺いつつ、メンターと相談しつつ決定します。 画像処理、自然言語処理(LLMも含む)、Vison and Language、推薦システム、etc… これまで授業や研究で扱ってきた機械学習という技術が企業においてどのように活用されているのかを知りた い方も、 他の企業で積まれたご経験をLayerXでも活かして活躍したい方も、お待ちしております!
  16. © LayerX Inc. 32 さいごに 大切な “時間” を何に投資するか どれだけ自分で意思決定をしてきたかで、その後の成長角度が大きく変わってき ます。大小問わず、毎日意思決定ができる環境を選ぶこと。毎日1つ意思決定する

    として、1年で200回。1年で数回の意思決定しか担えない環境と比べると、その 差は歴然です。 どれだけ自分で意思決定をしてきたかで、その後の成長角度が大きく変わる どんな会社に新卒入社/インター ンしたら良いか? 成長している事業があること