Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How Scala works at Mercari
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Ryo Okubo
October 17, 2020
Programming
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
How Scala works at Mercari
Ryo Okubo
October 17, 2020
More Decks by Ryo Okubo
See All by Ryo Okubo
気軽に使える"情報のハブ"としてのNotion活用 〜フロー情報の集積点 と、 Claude Code × Notion AI〜
syucream
1
200
UbieのAIパートナーを支えるコンテキストエンジニアリング実践
syucream
3
1.6k
メルカリ・メルペイの成長を支える データ基盤とはどんなものか
syucream
6
7.4k
バッチとストリーミング、それぞれの障害に立ち向かう
syucream
3
3.8k
Production-ready stream data pipeline in Merpay, Inc
syucream
2
13k
データとML周辺エンジニアリン グを考える会 #2 イントロ
syucream
0
680
マイクロサービスにおける ログ収集の課題と取り組み
syucream
7
2.8k
Stream Data Pipeline for Microservices in Merpay
syucream
6
1.3k
メルペイにおける、マイクロサービスに寄り添うログ収集基盤 / Microservices-frendly Data Pipeline
syucream
0
18k
Other Decks in Programming
See All in Programming
そのテスト、説明できますか?~LWテスト戦略FW~のご紹介
nakahara
0
160
AIで効率化できた業務・日常
ochtum
0
150
エージェンティックRAGにAWSで入門しよう!
har1101
9
1.8k
LLM本来の能力を解き放つサンドボックス技術とAI民主化への適用
yukukotani
3
4.5k
過去最大のMCPアップデート! 2026-07-28 RC版の謎に迫る
licux
6
390
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
410
メソッドのジェネリクスでGoの夢は広がるか? / Kyoto.go #65
utgwkk
3
940
jQueryをバージョンアップする前に使いたいjQuery Migrate
matsuo_atsushi
0
590
Skillsは効率化、Agentsは"自分の拡張"——Builder時代のエージェント編成(CC Night 2026)
wemra
1
160
Make SRE Operations Easier with Azure SRE Agent
kkamegawa
0
8k
肥大化するレガシーコードに立ち向かうためのインターフェース分離と依存の逆転 / JJUG CCC 2026 Spring
hirokunimaeta
0
620
Developing with AI Agents — Codex, Claude Code & Cowork Practical Guide
x5gtrn
PRO
0
1.3k
Featured
See All Featured
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
2
240
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
310
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
490
Designing Experiences People Love
moore
143
24k
Odyssey Design
rkendrick25
PRO
2
710
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
740
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
430
Designing for humans not robots
tammielis
254
26k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
170
Measuring & Analyzing Core Web Vitals
bluesmoon
9
870
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
200
Claude Code のすすめ
schroneko
67
230k
Transcript
1 Scala がメルカリでどう動くか? ScalaMatsuri 2020 LT slides
2 メルカリとは •サービス開始日:2013年7月 •対応OS:Android、iOS ※Webブラウザからも利用可能 •利用料:無料 ※売れたときの手数料:販売価格の 10% •対応地域・言語:日本・日本語基本仕様
•累計出品数:15億品を突破 それを必要とする人の手に渡り、使用されることに喜びを感じ、ま た購入者は、多彩かつユニークな商品の中から「宝探し」感覚で 掘り出し物を見つける買い物体験を楽しんでいます。さらに「メル カリ」では、物の売買だけではなく、出品者・購入者間のチャットや 「いいね!」機能を通じて、お客さま間のコミュニケーションも活発 に行われています。 フリマアプリ「メルカリ」は、個人が簡単に中古品の売買を行える CtoCマーケットプレイスです。出品者・購入者双方が、安全・安心 な取引を楽しんでいただけるサービスを目指し、「メルカリ」が一時 的に購入代金を預かるエスクロー決済を活用した取引環境の整 備や、簡単かつ手頃な価格の配送オプション、差別化されたユ ニークなお客さま体験を提供しています。多くの出品者は、自分に とって必要でなくなったモノが、 2
3 • 社外に発信している情報は Go が多め ◦ 実際にバックエンド API の実装言語は Go
が非常に多い • でも一部 Scala も使っているんです! ◦ 当 LT で事例紹介させてください! ◦ Ref. 我々の技術スタック: https://engineering.mercari.com/technology-stack/ メルカリと Scala … ?
4 • ビッグデータ処理ジョブ実装言語として ◦ Java の資産が多いデータ処理において ◦ Apache Spark, Apache
Flink ジョブの実装のため • Gatling による負荷テストシナリオ記述のため • その他 Java 代替として メルカリにおける Scala の用途
5 • kintone に蓄積されたデータを分析に利用したい • kintone Spark connector で kintone
のレコード取得部分を実装 事例1. Spark による Kintone -> BigQuery データ同期
6 • 大規模データ基盤では品質の担保が困難 ◦ 信頼できないデータ基盤では、そこから得られた分析結果も信頼できなくなる ◦ 目視でデータの中身を確認できるはずもない • Deequ; AWS
が公開するデータユニットテストフレームワーク ◦ Apache Spark を利用している、ので Spark のリッチな API を利用可能 ◦ よく使われるテスト項目をサポート ▪ 重複した値が含まれていないか? ▪ NULL が含まれていないか? ▪ 想定したパターン以外の値が含まれていないか? 事例2. Deequ を使ったデータ品質チェック
7 • より抽象化されたテストシナリオのサポートを構想(開発中) ◦ Spark, Scala の強力な表現能力は嬉しいが、みんなに実装しろと言うのは酷 ◦ YAML にテスト項目を羅列するといい感じに実行されて欲しい
事例2. Deequ を使ったデータ品質チェック
8 • Pub/Sub で配送されたログを永続化・配送 • Apache Flink の Scala API
を用いてジョブを実装 事例3. マイクロサービスのログ収集パイプライン
9 • Flink ジョブでニアリアルタイムで変換・配送(開発中) ◦ CRM(Customer Relationship Management) 関連用途特化のアプリを開発予定 事例3.
マイクロサービスのログのストリーミング処理
10 • MySQL の binlog を BigQuery に配送しニアリアルタイムで分析可能に ◦ ETL
ジョブで MySQL に巨大クエリを投げるより低負荷でデータ同期可能 ◦ 分析可能になるまでのリードタイムが減少し、不正検知などへの活用が期待できる • 変更ログ送信エージェントを Scala で実装 • 変更ログを BigQuery に insert する Flink ジョブも Scala 製 事例4. CDC(Change Data Capture) パイプライン
11 • Apache Beam ベースの実装言語にも Scala を一部使用 ◦ For e.g.
https://github.com/mercari/pubsubloader • データ処理から派生して、スキーマ管理ツールも Scala で一部実装 余談