Upgrade to Pro — share decks privately, control downloads, hide ads and more …

研究開発部メンバーの働き⽅ / Sansan R&D Profile

研究開発部メンバーの働き⽅ / Sansan R&D Profile

Sansan株式会社は、「出会いからイノベーションを生み出す」をミッションとして掲げ、ビジネスにおける出会いを後押ししています。
本資料では研究開発職の働き方に関する情報をまとめています。

◉ 研究開発職 採用情報
募集中のポジションや関連記事など
https://media.sansan-engineering.com/randd

◉ カジュアル面談
エンジニア、R&D、QAエンジニア、プロダクトマネジャー、プロダクトデザイナーポジションのカジュアル面談を希望される方向けの申し込みフォームです。
https://forms.gle/gbLPPzecKpyb5yR78

◉ Sansan Tech Blog
Sansanのものづくりを支えるメンバーのテックブログ(R&Dメンバーの連載も多数)
https://buildersbox.corp-sansan.com/

◉ R&Dの登壇資料
これまでの登壇や発表で使用した資料を公開しています。
https://speakerdeck.com/sansan_randd

Avatar for Sansan, Inc.

Sansan, Inc. PRO

October 01, 2025
Tweet

More Decks by Sansan, Inc.

Other Decks in Technology

Transcript

  1. - 会社概要 | Sansanのカタチ - 企業理念 - 提供サービス - 組織

    - 研究開発部について - キャリアパス - MLOps・Platformエンジニア - データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー - 研究開発プロジェクト紹介 - 社内制度 ⽬次
  2. © Sansan, Inc. 出会いから イノベーションを⽣み出す いつの時代も、世界を動かしてきたのは出会いです。 ⼈と⼈、企業と企業、 その出会いの連鎖が社会を前進させます。 私たちは出会いが持つ可能性を再発⾒し、 未来につなげることでビジネスを変えていきます。

    イノベーションにつながる新しい出会いを⽣み出す。 出会いの⼒でビジネスの課題にイノベーションを起こす。 そして、ビジネスの出会い、そのもののあり⽅を変えていきます。 Mission 会社概要 | Sansanのカタチ - 企業理念
  3. © Sansan, Inc. 働き⽅を変えるDXサービス サービス 請求 ⼈や企業との出会いをビジネスチャンスにつなげる「働き⽅を変えるDXサービス」を提供し、 ビジネスフローにおけるさまざまな分野でサービスを展開しています。 名刺管理 名刺DX

    営業 営業DX 契約 契約DX 経理DX 個⼈向けDX 法⼈向けDX 必要な情報を すぐに⾒つけられる 情報の管理がしやすく すぐに共有できる 情報を分析・活⽤しやすく データに基づいた判断ができる SansanのDXサービスの活⽤で変わる働き⽅
  4. 組織構成の概要 組織 Contract One Unit 4つの主軸プロダクトごとにフロント&プロダクト機能を集約。 PR、ブランディング、 AI トランスフォーメーション、グローバルビジネス推進 など

    その他の部⾨ エンジニア、研究開発(R&D)、 システム管理、CSIRT など 技術本部 Sansan事業部 マーケティング、 インサイドセールス、営業、 カスタマーサクセス ブランディング など Bill One事業部 マーケティング、 インサイドセールス、営業、 カスタマーサクセス ブランディング など Eight事業部 マーケティング、 インサイドセールス、営業 カスタマーサクセス ブランディング など マーケティング、営業 など COO室 ※COO=Chief Operating Officer 総務・法務、財務・経理など コーポレート本部 採⽤、労務、育成、制度設計・運⽤など ⼈事本部
  5. 技術本部 組織 技術本部 各事業部・プロダクトユニットと連携するEngineering Unitと、サービスの根幹技術を担う組織が存在。 Sansan Engineering Unit Contract One

    Engineering Unit Bill One Engineering Unit Quality Assurance Engineering Unit Digitization部 研究開発部(R&D) データアライアンス部 VPoE室 情報セキュリティ部 コーポレートシステム部 海外開発拠点⽀援室 Eight Engineering Unit Platform Engineering Unit
  6. 研究開発から事業へのアプリケーション提供・運⽤までを⼿掛ける 研究開発部について アカデミア 活動 中⻑期的な施策 ・研究開発 コア技術の 開発 アプリケーション・ APIのリリース・

    運⽤ 共同研究 論⽂投稿 学会協賛 勉強会主催・参加 各種サービスのデータ 構造化 A/Bテスト 社内データ分析 新規サービス検証 OCR技術 名寄せ技術 データ化のための各種 API Sansan Labs データ基盤 デプロイ基盤 帳票からの 情報抽出技術
  7. 各R&Dテーマの事業領域における位置付け 研究開発部について 画像処理・画像認識 ⾃然⾔語処理 機械学習 データサイエンス 因果推論 データ可視化 プロダクトマネジメント 新規事業

    営業/CS (社内課題) 解約阻⽌・利⽤促進(カスタマーサクセス部⾨) 営業効率化(営業) SceneText Recognition Object Detection ⼊⼒の⾃動化 OCR/項⽬分割など 特徴語判定 会社 キーワード 固有表現抽出 メール署名 取り込み 固有表現抽出 ニュース 配信 ⽂書分類 ResNet 企業ロゴ 抽出 Graph Embedding レコメンデ ーション ラベル 予測 名寄せ RCT ABテスト 効果検証 パネルデータ 分析 Sansan Labs (新機能開発) 固有表現抽出 帳票のデータ化 Graph Neural Network Vision Language Model Vision Language Model
  8. 研究開発部内のメンバー構成 研究開発部について 研究員 / データサイエンティスト MLOps・Platform エンジニア データエンジニア / アナリティクスエンジニア

    プロダクトマネジャー プロダクト組織 主に名刺や帳票の⾼精度なデータ化や蓄積 されたデータからプロダクトの価値を⾼め るデータを活⽤した機能の研究開発から サービスリリースまで担う サービスの品質・可⽤性・セキュリ ティー・オブザーバビリティーを担保 また研究員による試⾏錯誤を増やし、継続 的に素早くリリースするためのデプロイ基 盤を構築・推進 研究開発部や全社で利⽤する分析基盤の設 計・開発をリード ⾃社のプロダクトから⽣まれるさまざまな ログやデータ連携パートナー企業などから のデータを、活⽤しやすい形で社内に提供 プロダクト組織と連携し、各プロダクトを 連続的・⾮連続的に成⻑させる機能開発・ 検証をリード
  9. プロジェクトの進め⽅ 研究開発部について ⁃ 3カ⽉に⼀度、全社でOKRを策定する ⁃ トップダウン/ボトムアップ両⽅で策定し、 相互に連携しあう ⁃ OKRは漸進的な進歩ではなく、 ⾶躍のための⽬標

    ⁃ 研究開発部では全てを達成することは 期待しない野⼼的なOKRと コミットするOKRに分ける → ⼤きなチャレンジに取り組めるようにしている OKR例: Sansanの30%グロースのためにプロダクトの価値を⾼める → 営業DXを実現するために メール署名取り込みの品質を向上させる ⁃ X⽉末までにYアルゴリズムの精度(Precision)をZ%にする ⁃ … → Sansan Labsをスケールさせ、 営業DXをリードする機能を⽣み出す ⁃ X⽉末までに開発のリードタイムを前Q⽐でYY%削減する ⁃ X⽉末までにアプリケーションをY件リリースする ⁃ … OKRの達成のために プロジェクトとして取り組む 壮⼤な⽬標を伝え、測定し、達成するために使う ⽬標と主要な結果(OKR)
  10. 技術スタックと開発フロー 研究開発部について 主な利⽤⾔語 Python、R、C#、C++ クラウド AWS、GCP(Google Cloud Platform) ソースコード管理 Github

    使⽤するライブラリや フレームワーク テーマに合わせて⾃由に選択 サービス本番環境への 実装 Dockerコンテナ技術や AWS(Batch、Lambda、SageMakerなど)、 GCP(Cloud Run、Kubernetesなど) PC Windows PC、Macbookから選択。 AWSやGCPのインスタンスを使⽤可能。 データ 収集 サービス 構築 評価 リリース 学習 A/B テスト 前処理 推論 機械学習システム ワークフロー
  11. 働く上で⼤切にしている価値観 研究開発部について Product First 知⾏合⼀ ⁃ ユーザーの課題を解決することで事業に貢献する ⁃ 技術を磨くことが⽬的になるのではなく、課題解決に向きあう ⁃

    本当の知は実践を伴わなければならない ⁃ ⼩さく速く課題解決に取り組んでいく姿勢を重視する 1 2 Respect ⁃ それぞれのメンバーがプロフェッショナルである⾃負をもち、相互に尊敬・信頼する ⁃ プロフェッショナルなメンバーに裁量を与える 3
  12. 定期開催イベント 研究開発部について OKR 進捗会議 部⻑へ2週間に⼀度、 進捗状況のみをクイックに 共有 Monthly Review -

    チームごとに⽉1回部⻑へ 取り組み状況を共有 - 誰でもどのチームの Monthly Reviewに出ること ができる テックトーク (他部署からの参加歓迎!) 週1回、有志で各⾃取り組ん でいることや技術紹介のLTを している 論⽂読み会 2週間に1度、有志で読んだ論 ⽂の内容を共有する 勉強会 ⽉に1回、持ち回りで各⾃が 取り組んでいることや技術紹 介のLTをしている
  13. 名刺データ⼊⼒の⾃動化 MLOps・Platformエンジニア | データ化の⾃動化 解決策 名刺データ化システム「GEES」 - ⾼速・低コスト・セキュアなデータ化⽤に細分化されたマイクロタスクの集合体 画像処理技術による⾃動化 -

    NineOCR:名刺に特化した独⾃OCRエンジン - スマートキャプチャー:On-device名刺検出+OCRエンジンによる即時納品 - ⾔語・⼿書き⽂字判定:⽂字情報によらない名刺の属性判定 結果 - 名刺データ⼊⼒コストの削減 - ユーザーが即時に使える⼀次納品のデータ化精度向上 ビジネス課題 100%に近い精度を実現しながら、データ化にかかるコストの最⼩化と納品スピードの向上 ⾔語判定 ⽂字情報によらない名刺の属性判定 スマートキャプチャー On-device名刺検出+OCRエンジンによる 即時納品 NineOCR 名刺に特化した独⾃OCRエンジン
  14. 請求書データ⼊⼒の⾃動化 MLOps・Platformエンジニア | データ化の⾃動化 請求書画像⼊⼒/ データ化システム ⼊⼒ データ化 ⾃動化エンジン オペレーター

    名刺データ化ノウハウを活かした、請求書データ化システム 請求書画像 請求書データ ユーザ企業 Bill One Entry
  15. 機械学習(ML)開発フロー MLOps・Platformエンジニア | 機械学習(ML)開発 データ 収集 サービス 構築 評価 リリース

    学習 A/B テスト 前処理 推論 機械学習システム ワークフロー データエンジニア 研究員 DevOpsエンジニア 機械学習モデル開発 A/Bテストの設計 推論結果をモデルにフィードバック 研究員が作った機械学習モデルを 本番環境のサービスに載せる MLモデル開発が終わったら エンジニアにサービス化を依頼する
  16. 機械学習(ML)開発フローの課題 MLOps・Platformエンジニア | 機械学習(ML)開発 毎回ゼロから サービス構築するため ボトルネックになりがち 研究員が安全にセルフサービスで リリースできる環境を 整えることによって

    仮説検証スピードが向上し、 爆速でサービスリリースできる データ 収集 サービス 構築 評価 リリース 学習 A/B テスト 前処理 推論 機械学習システム ワークフロー
  17. MLOps・Platformエンジニア | 機械学習(ML)開発 研究員が、セルフサービスで安全に本番クラウド環境にアプリケーションを リリースできる基盤 - Kubernetesを利⽤したコンテナプラットフォーム - ワークロードに応じたKubernetesリソーステンプレートを提供 -

    ボタンひとつでテンプレートを⽣成し、GitHubへのPull Requestを 作成するGithub Actionsを提供 アプリケーション基盤:Circuit R&Dのアプリケーション基盤 “Circuit”について https://speakerdeck.com/sansan_randd/about-circuit-r-and-ds-application-platform
  18. - R&D 共通の Actions を作成し、各リポジトリから参照する仕組み - reusable workflow - composite

    action - 共通 Actions を管理するレポジトリを運⽤ - 参照元を修正すればすべてのリポジトリに反映 - 設定ファイルのメンテナンスコスト削減 - 共通 Actions の例 - 単体テスト - リンター - コンテナイメージのビルド/プッシュ GitHub ActionsによるCI/CDの導⼊ MLOps・Platformエンジニア | 機械学習(ML)開発
  19. - 開発時の負荷低減 - 開発を始める際に悩まなくてよい - フレームワーク、ログ、ディレクトリ構成、... - テンプレを⽤意することでコードベースが同じ - レビューがしやすい

    - 開発に⾃⾝がなくても⼀通り揃った状態からロジックを埋めれば良い - ⽤意しているテンプレ例 - web app - web api - batch - k8s yaml サービス開発時のテンプレート作成 MLOps・Platformエンジニア | 機械学習(ML)開発
  20. やりがい MLOps・Platformエンジニア 成果が⾒えやすい 処理の⾼精度化等のシステム改修 は、ユーザ体験向上やコスト削減 等のかたちですぐ成果が⾒えやす いです。 データ化という当社の価値の根源 を受け持ち、責任は⼤きいものの、 成果もまたインパクトの⼤きなも

    のになります。必要とされる仕事 だという実感を常に持てます。 研究員と距離が近い 新規開発・モダナイズに 携われる 研究員と組織上⼀体化したり、 定例会議を設けるなど、密なチャ ネルを持つようにしています。 新規施策の話、業務での困りごと や改善プランなど、研究員と互い にそういったトピックをすぐ拾い 上げて実⾏に移せる体制づくりを しています。 新規サービスを作ることも、古参 サービスの運⽤やモダナイズをす ることもあり、様々な業務に携わ ります。 マイクロサービスが多いため、 ⼀つ⼀つの開発・運⽤は⽐較的 難易度低く、かつ⼤きな裁量で ⾏えます。
  21. - 各プロダクトのデータオーナーと連携し、データ収集パイプラインの設計・構築 - Google Cloud上での分析基盤構築及び運⽤業務 - メタデータ管理システム構築、運⽤ - データガバナンスシステム構築、運⽤ -

    各プロダクトへのデータ利活⽤⽀援 データエンジニアの主な役割 データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー データ意思決定を⽀えるデータインフラ及びデータパイプラインの構築
  22. - データアナリストと協⼒し、各プロダクトのデータを分析することでの、データを使った 意思決定の推進 - アプリ開発者と協⼒してのデータプロダクト構築⽀援 - データエンジニアと協⼒し、データマートやDWHの設計・構築・運⽤ - メタデータ整備 -

    BIツールの利⽤ルール浸透や権限整備 - データガバナンスの整備 アナリティクスエンジニアの主な役割 データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー 基盤利⽤者、データエンジニアと協⼒して、データを使った意思決定の促進のための エンジニアリング業務
  23. - 全社横断データ基盤構築のリード - データレイク・データウェアハウス・データマートの設計、構築リード - 全社横断データ基盤を⽤いたデータ活⽤の普及・促進 - 全社にわたるデータガバナンス・データリネージ・データ品質に関する取り組みのリード - データ活⽤を加速させるための技術選定や導⼊

    - 社内データ活⽤・Sansan Labs アプリケーションのリード - 社内の各部⾨と連携して、データ活⽤の仮説検証や課題解決 - 仮説検証、全社横断データ基盤を⽤いたソリューション構築、導⼊ データプロダクトマネジャーの主な役割 データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー 社内のビジネス課題を解決するための新機能のプロダクトマネジメント、 データ活⽤を加速するためのデータ基盤構築のリード
  24. 権限と責務 データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー データ基盤 データソース DB ログ ファイル データ所有者 BigQuery Cloud

    Composer (Apache Airflow) データ レイク DWH データ マート メタデータ データ 収集 エンドユーザー PdM、開発者 Looker データ 活⽤ データ基盤利⽤者 データアナリスト アプリ開発者 データプロダクトマネジャー アナリティクスエンジニア データエンジニア Amazon EKS
  25. データ基盤アーキテクチャ データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー Cloud Storage Amazon S3 Amazon Aurora Storage Transfer

    Service Cloud SQL Logging Cloud Composer Project データ基盤 Data lake BigQuery Project データ分析A BigQuery DWH BigQuery Data mart BigQuery Project データ分析B BigQuery Group A Group B データ基盤エンジニア その他 AWSリソース Azure Blob Storage Salesforce
  26. やりがい データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー 多種多様なデータや モダンなシステムに携われる 扱うデータは、その量と独⾃性で 他に類を⾒ません。 膨⼤なデータに向き合うことも、 データ⼀つひとつに泥臭く向き合 うこともあります。 データベースの多くはGoogle

    Cloud上に構築されており、 Modern Data Stackやサーバーレ スアーキテクチャ、並列分散処理 などを⽤いたモダンなシステム開 発を担当できます。 さまざまな部署のメンバーと 切磋琢磨できる インパクトの⼤きい プロジェクトをリードできる データ×テクノロジー×オペレー ション(⼈⼒)を最⼤限に活⽤ したプロダクトに携われます。 どれかを偏重するのではなく、 プロダクト側やデータアナリスト とも連携しながら開発を進めてい きます。 また、少⼈数のチームを組むため ⼀⼈⼀⼈の裁量は⼤きく、⾃分の アイデアを存分に⽣かせます。 データプロダクトマネジャーは 「営業DXをドライブする機能を ⽣み出す」「データ活⽤で社内の ビジネス課題を解決する」という 2つのミッションの実現を⽬指し、 プロジェクトを推進できるポジ ションです。 ユーザーや社内の他部⾨へのヒア リングを通じて課題を特定し、課 題解決を形にするところまで⼀気 通貫で携わることができます。
  27. 「データを使った意思決定を5分で⾏える世界」を実現するための活動 今後の展開 データエンジニア/アナリティクスエンジニア/データプロダクトマネジャー - データを活⽤した意思決定を⾼速化する - 社内のデータ活⽤事例を創出する - データアナリスト・データサイエンティストのデータ分析に要する時間を短縮する -

    各プロダクトのドメイン知識を蓄積 - データウェアハウス上のデータ整備 - データソース追加に要する開発⼯数の短縮化 既存データ基盤の統合 - データのサイロ化を解消し、データ管理の運⽤負荷とコストを削減する
  28. 内製のVision-Language Model 「Viola」 ⽂書のデータ化 × Vision-Language Model 解決策 事前学習を通して汎⽤的な⽂字認識能⼒を持つモデルを作成し、 Fine-Tuningで各プロダクトのデータ化結果を直接学習する

    結果 複雑なルールをモデルで学習可能となり、いくつかのタスクで既存エンジンの精度を上回る ビジネス課題 名刺や請求書、契約書のデータ化精度を向上させる ⽂字認識に特化した 事前学習 データ化ルールを Fine-Tuning ⽂書 Viola 請求書特化 Viola 名刺特化 Viola システム 契約書特化 Viola
  29. グラフ機械学習を活⽤した検索・レコメンデーション Eight × Graph Embedding 解決策 企業間名刺交換ネットワークにGraph Embedding(node2vec)を 適⽤して、各企業をベクトル形式の特徴量で表現し、 埋め込み空間上で企業間類似度を計算

    結果 - Eight Career Designの候補者検索において、 特定企業に類似している企業で勤めている候補者が検索可能 - ニュース配信のレコメンデーションに活⽤し、 同業他社の動向を⾃動で取得可能 ※Eightの利⽤規約の許諾範囲内で 匿名化したデータを統計的に利⽤しています。 A社: (0.4, 0.2, 0.1, …, 0.8)T B社: (0.1, 0.5, 0.1, …, 0.2)T F社: (0.5, 0.1, 0.7, …, 0.5)T G社: (0.6, 0.7, 0.8, …, 0.6)T ビジネス課題 企業間名刺交換 Eight ネットワーク A社 D社 B社 C社 E社 F社 G社 … 特定の企業と同業界・同業態の企業を検索したり、 ニュースを配信する体験をつくる
  30. レイアウトを考慮した帳票からの情報抽出 帳票データ × ⾃然⾔語処理 & Graph Neural Network 解決策 テキストとそのレイアウトを特徴とするモデルによる情報抽出

    結果 既存システムからの⾃動化率の向上 1. 構造化 2. グラフ化 3. GNN 4. タグ予測 請求⾦額 10,000 ビジネス課題 スケーリングを⽬的とした、請求書や契約書のデータ化の⾃動化
  31. メール署名取り込み Sansan メール署名取り込み × ⾃然⾔語処理 解決策 メールから名刺相当の構造化された顧客情報を⾃然⾔語処理 (固有表現抽出や構⽂解析、辞書などによるスコアリング)を活⽤ することで抽出する 結果

    メールでのつながりの情報を企業の資産として蓄積し、 営業⼒を強化するというコンセプトを プロダクト上で実現できた 図:メール署名取り込みのイメージ図 ビジネス課題 メールだけでやりとりをしていて名刺交換できていない相⼿の連絡先を、 メールの署名から抽出し企業の資産として蓄積する
  32. モバイルアプリ内での効果的な利⽤訴求メッセージの特定 Sansan × 因果推論(RCT) 解決策 ABテストで複数の訴求メッセージの中から 効果的なものを特定 結果 - ⽬標値を上回る利⽤実績を実現

    - 利⽤訴求メッセージの違いを定量的に判断でき、 カスタマーサクセスのメッセージ作成にも 知⾒が蓄積された 商談前に、つながりを検索。 相⼿と同僚との接点を確認しよう スマホで⼈脈をサクサク検索。 商談相⼿とのつながりを事前に把握しよう A案 B案 Sansanモバイルアプリ上で 特定の機能を使⽤したことがないユーザーに対し、 効果的に利⽤促進するメッセージを特定する ビジネス課題
  33. © Sansan, Inc. Sansanの社内制度 社内制度 コミュニケーションの促進 上⻑、役員との交流 ・カタチサロン ・カタチバ ・代表の寺⽥と語るSansanのカタチ

    部⾨を越えた交流 ・ヨリアイ ・ななはち 業務効率向上 妊娠中・育児中のメンバー ・OYACO ・H2O ・M2O(新卒メンバー向け) 通勤による負担を軽減 ・チャージ休暇 ・どに〜ちょ ・社会⼈博⼠課程⽀援制度 スキルアップ 強みを活かす 個 ⼈ ・Jump! ・強マッチ ・コーチャ ・コーチャ for マネジメント 組 織 ・コーチャチーム ・⾒つカッチ ・Sansanファミリーデー ・フィット その他 ・マイミャク ヨリアイ 代表の寺⽥と語るSansanのカタチ 社内部活動 ・よいこ よいこ「Sansan BBC」
  34. © Sansan, Inc. 通勤による負担を軽減 社内制度 ・H2O ⾃宅の最寄り駅が本社近隣の対象駅*の場合に、 家賃にかかる費⽤の⼀部が補助される *対象駅(渋⾕駅から2駅以内。ただし、JR埼京線・湘南新宿ラインを除く): 渋⾕、表参道、中⽬⿊、代官⼭、三軒茶屋、池尻⼤橋、駒場東⼤前、神泉、広尾、恵⽐寿、

    ⽬⿊、原宿、代々⽊、代々⽊公園、明治神宮前、北参道、乃⽊坂、外苑前、⻘⼭⼀丁⽬ ・M2O(新卒社員向け) 新卒⼊社時に勤務地近隣の指定エリアに引っ越した場合に、 新⽣活を始めるための費⽤として⼀定額が⽀給される