Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
日本人投手の2016年振り返り
Search
amacbee
September 22, 2016
Technology
1.3k
1
Share
日本人投手の2016年振り返り
ビッグデータとPythonではじめる野球の統計分析の発表資料
https://pycon.jp/2016/ja/schedule/presentation/75/
amacbee
September 22, 2016
More Decks by amacbee
See All by amacbee
技育CAMPアカデミア (2025-12-10)
amacbee
0
69
AI Agentsで沖縄を盛り上げたい
amacbee
0
65
[デモ説明資料] AIエージェントで実現するクラウドネイティブの世界
amacbee
1
82
ちゅらデータ会社紹介資料 / ChuraDATA Introduction
amacbee
2
57k
データサイエンスの業界トレンドと今後の動向
amacbee
1
1.2k
pip install pyladies
amacbee
0
450
PyCon Kyushu 2018 - Keynote
amacbee
0
2.7k
Pythonで競技プログラミングハンズオン
amacbee
1
1.4k
Pythonで作るWebクローラ入門
amacbee
21
47k
Other Decks in Technology
See All in Technology
Cortex Code君、今日から内製化支援担当ね。
coco_se
0
320
AI時代に新卒採用、はじめました/junior-engineer-never-die
dmnlk
0
230
新規サービス開発におけるReact Nativeのリアル〜技術選定の裏側と実践的OSS活用〜
grandbig
2
180
OpenClaw初心者向けセミナー / OpenClaw Beginner Seminar
cmhiranofumio
0
370
2026年度新卒技術研修 サイバーエージェントのデータベース 活用事例とパフォーマンス調査入門
cyberagentdevelopers
PRO
6
7.2k
3つのボトルネックを解消し、リリースエンジニアリングを再定義した話
nealle
0
340
Databricksで構築するログ検索基盤とアーキテクチャ設計
cscengineer
0
120
Strands Agents × Amazon Bedrock AgentCoreで パーソナルAIエージェントを作ろう
yokomachi
2
260
終盤で崩壊させないAI駆動開発
j5ik2o
0
410
AIドリブン開発の実践知 ― AI-DLC Unicorn Gym実施から見えた可能性と課題
mixi_engineers
PRO
0
120
Data Enabling Team立ち上げました
sansantech
PRO
0
300
プロンプトエンジニアリングを超えて:自由と統制のあいだでつくる Platform × Context Engineering
yuriemori
0
150
Featured
See All Featured
Being A Developer After 40
akosma
91
590k
How STYLIGHT went responsive
nonsquared
100
6k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.5k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
160
We Have a Design System, Now What?
morganepeng
55
8.1k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
150
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
25k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.4k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
120
Transcript
日本人投手の2016 年振り返り 真嘉比 愛(Ai Makabi) 2016-09-22 @PyConJP 2016 Room 202
#pyconjp_202
真嘉比愛(Ai Makabi) DATUM STUDIO 株式会社 PyLadies Tokyo 各種アカウント Slack: @amacbee
Twitter: @a_macbee Facebook: ai.makabi Python ライブラリ厳選レシピ( 共著) 昨日クロー ラの話をしてました
MLB に所属する日本人投手を セイバー メトリクスを使って分析
セイバー メトリクス デー タをもとに野球選手の能力を分析する指標 今回は以下の3 つの指標に着目 K/BB: 投手の完成度 DIPS: 投手自身の能力
WHIP: 安定感 ※ それぞれの指標の意味については後ほど ※ 参考: デー タで楽しむ野球講座 - 福岡ソフトバンク ホー クスオフィシャル
注目した選手 以下の3 選手について,2016 年に登壇した764 名の MLB 投手と比較 ダルビッシュ 有(Darvish Yu)
岩隈 久志(Iwakuma Hisashi) 前田 健太(Maeda Kenta)
使用したデー タ pitchpx から得られる2016 年の投球デー タ デー タサイズ: 251MB (
約60 万行,73 列) >>> df = pd.read_csv('...') >>> df.shape (593483, 73) 以下の4 つのカラムに着目 pit_mlbid, pit_last_name, pit_ rst_name pa_event_cd
pa_event_cd 発生したイベント情報が入っている(0~24 の数字) 三振やヒットの種類( 一塁打, 二塁打, 三塁打, HR), エラー, 妨害,etc.
参考:Play-by-Play Data Files (Event Files)
早速やってみましょう
前準備 各種指標を計算するために,「 投球回」 を計算 Wikipedia より引用 選手がどのくらい登板したかという指標 投球回(Innings pitched /
IP) は、 野球における 投手記録の一つで投手が登板したイニングの数を 表す。 イニングの途中で投手が交代した場合に は、 登板時に取ったアウト一つにつき1/3 ずつを 加える。 “ “
投球回のヒストグラム 2 つの山. 先発ロー テ勢は投球回が多い
投球回のヒストグラム ダルビッシュは投球回が少ない. 怪我の影響か
ダルビッシュ 有(Darvish Yu) 投球回: 273.33 三振: 425 / 四死球: 103
/ 被本塁打: 31 岩隈 久志(Iwakuma Hisashi) 投球回: 563.33 三振: 564 / 四死球: 187 / 被本塁打: 56 前田 健太(Maeda Kenta) 投球回: 567.33 三振: 716 / 四死球: 221 / 被本塁打: 80
K/BB - Strikeout to Walk ratio 投手の完成度の指標 四球を1 つ出すまでにいくつの三振を奪っているか 数値が大きいほどコントロー
ルが良く, 多くの三 振を奪える投手 K/BB = 奪三振数 / 与四球数 4.00 前後: 球界を代表するクラス 3.00 前後: リー グを代表するクラス 2.00 前後: 平均的なクラス
K/BB のヒストグラム 平均的な投手ラインである2.00 付近に山がある
K/BB のヒストグラム ダルビッシュが球界代表,2 人が球団内エー スな値
DIPS - Defence Independent Pitching Statistics 投手自身の能力の指標 奪三振・ 与四球・ 被本塁打の数値のみを考慮
数値がゼロに近いほど四死球が少なく, 三振を奪 える投手 DIPS = {( 与四球 - 故意四球 + 死球) * 3 + 被本塁打 * 13 - 奪三振 * 2} / 投球回数 + 3.12 1.50 前後: 球界を代表する投手 2.50 前後: 球団内のエー ス級 3.50 前後: 平均的な投手
DIPS のヒストグラム 平均的な投手ラインである3.50 付近に山がある
DIPS のヒストグラム ダルビッシュが球団内エー ス,2 人が平均的な値
WHIP - Walks plus Hits Inning Pitched 投手の安定感の指標 一イニングあたり何人の走者を出しているのか 数値がゼロに近いほどピンチを招く頻度の少ない
投手 WHIP = ( 被安打 + 与四球) / 投球回 1.00 未満: 球界を代表する投手 1.20 未満: 球団内のエー ス級 1.40 以上: 安定度に欠ける投手
WHIP のヒストグラム 1.4 以上が安定度にかける投手となり, 約半数が該当
WHIP のヒストグラム ダルビッシュが球界代表,2 人が球団内エー スな値
ダルビッシュ凄すぎでは
まとめ pitchpx 超便利 イベント情報のみ(pa_event_cd) を使った分析で も色々 な情報が分かる ダルビッシュはMLB でも球界を代表するエー ス