Upgrade to Pro — share decks privately, control downloads, hide ads and more …

銀_検出コンペ_202206_signate_くずしじコンペ

 銀_検出コンペ_202206_signate_くずしじコンペ

signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580

suguuuuuすぐー

October 27, 2022
Tweet

More Decks by suguuuuuすぐー

Other Decks in Research

Transcript

  1. サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -

    Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
  2. データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •

    難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。