Weakな画像分類用のクラスラベルならば1秒/枚・クラス程度 セグメンテーションの課題 [15] M Everingham, L Van˜Gool, C K I Williams, J Winn, and A Zisserman. The PASCAL Visual Object Classes Challenge 2012 VOC2012 Results. [4] Amy Bearman, Olga Russakovsky, Vittorio Ferrari, and Li Fei-Fei. What’s the point: Semantic segmentation with point supervision. In Bastian Leibe, Jiri Matas, Nicu Sebe, and Max Welling, editors, Computer Vision – ECCV 2016, pages 549–565, Cham, 2016. Springer International Publishing. [paper] ということは... 時給1200円でアノテーターを雇用したとして 250時間 x 1200円/時間 = 300,000円 以上
• 医学生による画像選定 • 眼科医4名によるアノテーション • 20年以上の臨床経験のある網膜専門医2名による検証 を経て作成された セグメンテーションの課題 * Kermany, Daniel S., et al. "Identifying medical diagnoses and treatable diseases by image-based deep learning." cell 172.5 (2018): 1122-1131. [paper]
弱教師あり学習:Weakアノテーションを組み合わせる ←本研究はここに着目 課題解決への選択肢 Active Learningの例 [44] [44] Yawar Siddiqui, Julien Valentin, and Matthias Nießner. Viewal: Active learning with viewpoint entropy for semantic segmentation. In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, pages 9433– 9443, 2020. [paper] どの方法でもセグメンテーションの アノテーション数を減らすことができる
+ Full < Fullのみ」の順序 FullとWeakを組み合わせると精度上がる?→先行研究あり [40] George Papandreou, Liang-Chieh Chen, Kevin P. Murphy, and Alan L. Yuille. Weakly- and semi-supervised learning of a deep convolutional network for semantic image segmentation. In Proceedings of the IEEE International Conference on Computer Vision (ICCV), December 2015. 1 [paper]
Lucas, David Acuna, Daiqing Li, Jonah Philion, Jose M Alvarez, Zhiding Yu, Sanja Fidler, and Marc T Law. How much more data do i need? estimating requirements for downstream tasks. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pages 275–284, 2022. [paper] [34] Rafid Mahmood, James Lucas, Jose M. Alvarez, Sanja Fidler, and Marc T. Law. Optimizing data collection for machine learning. Advances in Neural Information Processing Systems (NeurIPS), 10 2022. [paper] [33]より 10% or 50%のデータがある時 目標精度67%に必要な データセットサイズを予測
Weakアノテーション枚数 S: Fullアノテーション枚数 βc: Weakアノテーションのコスト βs: Fullアノテーションのコスト σ, lc, lsは学習対象のパラメータ mean function covariance function セグメンテーション精度 データサイズが大きいほど セグメンテーション精度が 対数に従い成長すると仮定 [42](U-Net) [42] Olaf Ronneberger, Philipp Fischer, and Thomas Brox. Unet: Convolutional networks for biomedical image segmentation. In International Conference on Medical image computing and computer-assisted intervention, pages 234–241. Springer, 2015. [paper] 2つのRBFカーネル