Upgrade to Pro — share decks privately, control downloads, hide ads and more …

JPEGの仕組みと圧縮品質が CV性能に与える影響について

Avatar for MIZUTANI RYOTA MIZUTANI RYOTA
November 13, 2025
10

JPEGの仕組みと圧縮品質が CV性能に与える影響について

25/7/31の社内勉強会で使用した資料です

Avatar for MIZUTANI RYOTA

MIZUTANI RYOTA

November 13, 2025
Tweet

Transcript

  1. AI 2 自己紹介 ▪ 氏名 ▪ 水谷亮太 ▪ 所属 ▪

    GOドライブ株式会社  ▪ AI本部 AI技術開発2部 データサイエンティスト ▪ 業務内容 ▪ 次世代AIドラレコサービス『DRIVE CHART』の機能開発 ▪ Competition ▪ Kaggle Expert ▪ SIGNATE Grandmaster ▪ オプト レコメンドエンジン作成コンペ 2位入賞 ▪ Motion Decoding Using Biosignals 重心位置予測部門 4位入賞 @rmizuta3
  2. ▪ CbCr成分をサブサンプリング ▪ 人間の視覚特性では色差成分の感度が低いため ▪ 主なパターン ▪ 4:4:4 圧縮なし ▪

    4:2:2 色差成分を水平方向に1/2 ▪ 4:2:0 色差成分を水平・垂直方向両方に1/2 2. サブサンプリング Cb(青色差成分) Cr(赤色差成分) Y (輝度成分) 4:2:0の場合のイメージ(2倍圧縮) 9
  3. ▪ 8x8の領域毎にDCTを行う ▪ 空間領域 → 周波数領域に変換することで量子化で高周波成分を重点的に削減する ため ▪ 空間領域のなだらかな変化→低周波(左上成分) ▪

    空間領域の急激な変化→高周波(右下成分) 3. DCT(離散コサイン変換) DCT 10 (低) 水平方向周波数 (高) (高) 垂直方向周波数 (低)
  4. 5.2 符号化 ランレングス圧縮 ▪ 連続して出現する数字を(対象の数字,連続出現回数)の形 式にまとめる [261,40,-13,-2,-8,-6,-5, 11,-6,2,1,-1,1,0,2,0,-2, 3,2,-1,-1,0,0,0,0,-1,0,-1 ,0,0,0,0,0,0,1,0,0,0,0,0,

    0,0,0,0,0,0,0,0,0,0,0,0,0 ,0,0,0,0,0,0,0,0,0,0,0] [(261, 1), (40, 1), (-13, 1), (-2, 1), (-8, 1), (-6, 1), (-5, 1), (11, 1), (-6, 1), (2, 1), (1, 1), (-1, 1), (1, 1), (0, 1), (2, 1), (0, 1), (-2, 1), (3, 1), (2, 1), (-1, 2), (0, 4), (-1, 1), (0, 1), (-1, 1), (0, 6), (1, 1), (0, 29)] 14
  5. 5.3 符号化 ハフマン符号化 ▪ 出現頻度が高い文字には短い符号を、低い文字には長い符号を割り当 てることで、全体のデータサイズを削減 [(261, 1), (40, 1),

    (-13, 1), (-2, 1), (-8, 1), (-6, 1), (-5, 1), (11, 1), (-6, 1), (2, 1), (1, 1), (-1, 1), (1, 1), (0, 1), (2, 1), (0, 1), (-2, 1), (3, 1), (2, 1), (-1, 2), (0, 4), (-1, 1), (0, 1), (-1, 1), (0, 6), (1, 1), (0, 29)] 15
  6. “First Gradually, Then Suddenly: Understanding the Impact of Image Compression

    on Object Detection Using Deep Learning” Tomasz et al(2022) ▪ 論文概要 ▪ COCO Detection Challenge 2017のデータを用い、JPEGの圧縮率を変 化させた場合にメジャーな物体検出モデルの精度の変化を調査 圧縮がCV性能へ与える影響を調査した論文紹介(1) 18
  7. ▪ 圧縮率を上げるとprecisionはあまり下がらないがrecallは低下 ▪ quality25あたりまではあまり性能の劣化はゆるやか 様々な物体検出モデルでJPEGの圧縮率を変化させた場合の性能評価(Fig12) 上からprecision, recall, f1 scoreの評価 19

    • 画像が劣化するとobjectが認識できなくなるため、PPVよりTPRに劣化が現れる • どのモデルもqualityを下げると緩やかに性能が落ちるが、25あたりで特に変化が大きくなる
  8. “Are Visual Recognition Models Robust to Image Compression?” João et

    al (2023) ▪ 論文概要 ▪ 画像圧縮が、画像分類、物体検出、セマンティックセグメンテーション という3つの視覚認識タスクに与える影響を分析。3つのタスクすべてに おいて、強力な圧縮を使用すると認識能力に大きな影響が出ることを示 した。 圧縮がCV性能へ与える影響を調査した論文紹介(2) 21
  9. "Learned Image Compression for Machine Perception" F. Codevilla et al

    (arXiv 2021) ▪ 人間の視覚品質と機械知覚の両方を最適化する、学習型画像圧縮のための Rate-Distortion-Utilityフレームワークを開発 ▪ 学習時の損失に分類や検出などのタスク損失の和を追加している 26