Upgrade to Pro — share decks privately, control downloads, hide ads and more …

市民生成メディアの諸問題と共通プラットフォームへの期待/code_4_history_joss...

 市民生成メディアの諸問題と共通プラットフォームへの期待/code_4_history_joss2023

JOSS2023 B2 堀井ほか『人文学分野における地域資料情報収集を目的とした市民参加型共通プラットフォームの検討』の一部
https://joss.rcos.nii.ac.jp/session/overview/?id=se_116

Code for History

June 24, 2023
Tweet

More Decks by Code for History

Other Decks in Education

Transcript

  1. 市民生成メディア活動の取組経緯 • ~2008 ガラケー向け位置ゲー企画開発、企画で人を動かすことに 目覚める • 2010 位置ゲーに続く人を動かす企画として古地図技術開発開始、 後のM(2015~)につながる •

    2012頃~ オープンデータ生成に関わる活動に携わる – OpenStreetMap、Wikipedia – 古地図スキャン画像、古文書翻刻/口語訳データ • 古地図技術のニーズを探るため、表現したいことを自分の中に持 つために郷土史に携わり始める 8 Code for History
  2. 市民生成メディアの分類 • 個人メディア – 市民がデータの所有者、著作権者となるメディア、ブログ、Twitterなど • CGM(Consumer Generated Media) –

    サービス提供者の権利が強いメディア、Googleローカルガイドなど • 参加型オープンデータ – オープンデータ作成を目的としているメディア、Wikipedia、OSMなど • 厳密な議論にはこれらを分けて論じるべきだが – 市民自身が使い分けられていない、また発生する問題に被りもある – もとより研究者でなく厳密な議論は難しいため、視点提供に努める 9 Code for History
  3. 活動を通じて気づいた問題点(1) 1. 現在はかつてなく情報が残らない時代 – あらゆる情報は生まれた瞬間、歴史的情報になるのだが… – 情報が溢れて次々更新されるが、刹那的に消えていく – 後世に残そうという意識が薄い、あらゆる予算も削られる –

    デジタルデータだけで残ればよいのか?見落としたコンテキストは? – 残さなければと気づいた人がいた場合、その際に障害となるものは? 2. 必要な質、量、粒度の情報生成は、単独市民メディアで は難しい 11 Code for History
  4. 現在はかつてなく情報が残らない時代 情報が溢れて次々更新されるが、刹那的に消えていく 13 Code for History 明治の銀座 100年後でも 街の履歴が 解析できる

    現代は 雑居ビル1棟が 昔の村や町 くらいの規模が あるが、その 移り変わりには 誰も気を留め ないし記録も公には残らない 相模原市鵜野森 数年前までここに 地名の由来の残滓 でもあったであろう こんもりとした 雑木林があった © Google Maps
  5. 14 Code for History © @Tani_Gami https://twitter.com/Tani_Gami/status/1336864027683692545 © @__wCloverAnaco https://twitter.com/__wCloverAnaco/status/1341208772090314753

    現在はかつてなく情報が残らない時代 後世に残そうという意識が薄い、あらゆる予算も削られる • 近現代史は社史や書簡の研究で進んで きたと聞いた – 予算削減で社史や~周年誌を出さない会 社や官庁も増えている「Webで随時情報 公開してるんだからいいじゃん」 ⇒後世に残らない – コミュニケーションが書簡からメール、 Slackなどに移り、表に出てこない(コン プライアンス、個人情報保護) ⇒社外どころか社内ですら、1年で古いや り取りは自動消去する、というような会 社も増えている
  6. 15 Code for History 現在はかつてなく情報が残らない時代 デジタルデータだけで残ればよいのか?見落としたコンテキストは? • Unicodeの整備で、世界のテキスト 情報がデジタル情報として残しやすく なったが…

    © 下町ドリーム G-CONG Network このコンテキスト は、デジタルの羅 列だけでなくフォ ント、レイアウト などの表出まで維 持しなければ残せ ない © 小林護 https://mamogeo.blogspot.com/2019/05/blog-post_5.html • デジタルデータの脆弱性から、紙への 回帰の動きもある
  7. 16 Code for History 現在はかつてなく情報が残らない時代 残さなければと気づいた人がいた場合、その際に障害となるものは? • 生成された情報には、当然ながら製作者の著作権が生じる – 著作権が切れてパブリックドメインになるのは、作者の死から70年後

    – さらに著作権は非親告罪化 – 貴重なデジタル情報を消滅前にサルベージしようとしても、著作権が切れて いなければ1から作り直す以外のアクションを取れない⇒消滅 – 紙などで後世に残った情報でも、著作権が切れるまで待つのは果てしない話 • 残そう、引き継ごうという意思のある人がいなくなってしまう • 情報の存在が埋もれてしまい、再発見されなくなる • 再発見されても、著作権者の所在、生死情報やその継承者が不明 ⇒結局著作権的に浮いた状態に
  8. 活動を通じて気づいた問題点(2) 1. 現在はかつてなく情報が残らない時代 2. 必要な質、量、粒度の情報生成は、単独市民メディアで は難しい – インターネットと個人デバイスの普及で、市民メディアの構築ハードルはこ れまでになく低くなっているが –

    キュレーション的仕組みがなければ、質を保つのは困難 – 1つのメディアであらゆるユースケースに応え得るメディアの構築は困難、 不可能であるが、ユースケースごとにメディアを構築するとマンパワーが分 散される 17 Code for History
  9. 19 Code for History 単独市民メディアの限界 キュレーション的仕組みがなければ、質を保つのは困難 Google ローカルガイド: キュレーション的 仕組みはないが、

    運営によるBANは ある 飲食店向けなどの クチコミ機能の 流用 ↑ 根拠のない思い込み情報が 多くの投稿をしていることで レピュテーション上がる →典拠に依った正確な情報が BANされる • 既存のキュレーション的仕組みの実装例 – Wikipedia: 公開時は特にチェックは入らない が、検証のための記載の典拠は基本必須 – iNaturalist: 2名のエキスパートによるチェッ クを通ったもののみ研究用データタグ付与 – みんなで石仏調査(石仏情報学会): • 「改善提案」の仕組みによるユーザー間のインタラ クション • わかるはずのプロパティが入っていない場合は「改 善提案」 • ユーザーには負荷が重いようなプロパティは、権限 ユーザーによる「タグ付け」
  10. 20 Code for History 単独市民メディアの限界 あらゆるユースケースに応え得るメディアの構築は困難 奈良興福寺の観光アプリ での説明コンテンツ: Wikipediaが使えるのでは? •

    これだけの分量を旅行 先の出先で見せられて 楽しめるか? • Wikipediaには、項目立てに特筆性の原則もある ⇒地域の人が紹介したい事物であっても、特筆性がない とみなされれば、Wikipediaでは項目立てできない 石仏情報学会の事例 一見似たような活動でも… みんなで石仏調査 館林石造物調査 アプローチ: 石造物のデータベース ではなく、石造物調査 記録のデータベース アプローチ: 50年前の悉皆調査の データを元に、現況を 突き合わせる • システム統合し た方がよいのは 分かっていても、 折り合うのは困 難だった • しかし統合され てないので、 せっかく調査し ても一方にしか 反映されないこ とはよくある
  11. 解決案と共通プラットフォームへの期待 1. 現在はかつてなく情報が残らない時代 2. 必要な質、量、粒度の情報生成は、単独市民メディアで は難しい – マンパワーやリソースを無駄に分散させないよう、UIやレポジトリなど、 データの入りの部分と貯めの部分は共通基盤化してほしい –

    ユースケース別に適切なデータが集められるよう、データ構造は柔軟に – 必要となる膨大なストレージに対する、サービス間のバックアップの視点も 必要(みんなで石仏調査のデータ量はすでに無圧縮で44GB) 22 Code for History