~ PubTables-1M: Towards comprehensive table extraction from unstructured documents と XYLayoutLM: Towards Layout-Aware Multimodal Networks For Visually-Rich Document Understanding と V-Doc : Visual questions answers with Documents と Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation は読んだし、 TableFormer: Table Structure Understanding with Transformers と Neural Collaborative Graph Machines for Table Structure Recognition と Revisiting Document Image Dewarping by Grid Regularization と Fourier Document Restoration for Robust Document Dewarping and Recognition は気になったが読まなかった。
第11回 全日本コンピュータビジョン勉強会(前編)
https://kantocv.connpass.com/event/253622/
で読みました。自分のムーンショットプロジェクトに使えそうな=一緒に研究をしてくれそうなAIロボット(?!)につながっていきそうなパーツを探しました。