Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_LT版

hayataka
March 27, 2024

Science of Scienceおよび科学計量学に関する研究論文の俯瞰可視化_LT版

第1回 Science of Science研究会 2024で発表したLT資料です。
https://sciscijp.github.io/scisciconfJP2024/

hayataka

March 27, 2024
Tweet

More Decks by hayataka

Other Decks in Science

Transcript

  1. 1 はじめに(要旨) 近年、Science of Scienceが注目されているが、類似する分野として、科学計量学、計量書誌学、メタサイエンス、Research on Research等が挙げられる。これらがカバーする研究テーマには、どのような共通点・相違点があるのであろうか。また、各国はどのような研 究テーマに取り組んでいるのであろうか。これらの点を明らかにすることは、Science of Scienceという分野の発展と、日本として行うべき

    ことを議論する際の基礎情報になるだろう。そこで本研究では、前述した分野のキーワードを含む論文を広く集め(約4万件)、全体像の 把握、時系列変化、Science of Scienceと他分野の違い、国別の取り組み等を把握する。なお、これらの分析を行う際、テキストマイ ニングと次元圧縮によって、大量の論文情報を1枚の絵で表現できる「俯瞰可視化」手法を適用する。
  2. 2 データ収集 Science of Scienceと、類似する分野・用語を検索している。 No. 観点 検索キーワード 件数 S001

    Science of Science “Science of Science” OR SciSci 391 S002 科学計量学 Scientometric 6,557 S003 計量書誌学 Bibliometric 34,883 S004 Research on Research “Research on Research” 155 S005 Metascience Metascience 198 S006 和集合 S001 OR S002 OR S003 OR S004 OR S005 39,709 ※補足 • 検索対象:Title, Abstract, Keywords, Fields of study • 発表年:2000年~2024年1月26日(検索日) • 検索DB:Lens • その他:アブストが英語であるものに絞っている
  3. 3 俯瞰可視化手法 クラスターA クラスターB クラスターC 類似文書 類似文書 類似文書 文書を単語の組み合わせで表現・ベクトル化 高次元空間における配置イメージ

    二次元可視化 TF-IDF (Term Frequency – Inverse Document Frequency)を計算。 出現頻度 × 偏在度で重みづけした重要度スコアである。 下記は3次元空間で表現しているが、実際は数千~数 万次元の空間 高次元での関係性がなるべく 保たれるように二次元に圧縮 ※TF-IDF以外にも、トピックモデル、Doc2Vec等、様々なベクトル化手法がある。 ※次元圧縮手法は、多次元尺 度構成法、主成分分析、T- SNE、UMAP等、いろんな手法 が提案されている。 各文書を特徴ベクトル化し、高次元上での関係性がなるべく保たれるように二次元圧縮している。
  4. 4 全体像の把握 俯瞰図を大別すると、1. 科学技術・研究という営みの解明・評価と、2. 学術情報を活用した特定分野の動向調査が挙げられる。 1. 科学技術・研究という営みの解明・評価 「科学評価・指標・解明」、「科学技術・イノベーショ ン」、「国別」 2.

    学術情報を活用した特定分野の動向調査 「教育」、「サステナビリティ」、「医療」、「デジタル・AI」、 「企業・金融」 オープンアクセス 評価 指標 ランキング ファンディング 生産性 ジェンダー コミュニケーション チーム 図書館 キャリア 政府・政策 アントレプレナー 特許イノベーション 都市・スマートシティ 再生可能エネルギー 観光 サーキュラーエコノミー 廃棄物 食料 CSR 銀行 マーケティング ビッグデータ 人工知能 AR/VR/メタバース COVID 公衆衛生 再現性 ガン 看護 ロシア スペイン ブラジル 中国 ラテン オルトメトリクス 人文学 大学 教育 科学評価・ 指標・解明 科学技術・イノベーション サステナビリティ 企業・金融 デジタル・AI 医療 国別 ① ②
  5. 5 時系列推移 2013以前 2014-18 2019-23 図書館 指標 特許 スポーツ イノベーション

    アントレプレナー 看護 中国 オルトメトリクス ジェンダー 再生可能エネルギー 観光 教育 COVID ガン 人工知能 マーケティング ブロック チェーン SCM 都市 ランキング 2013以前は図書館、科学評価・指標・ランキング等が中心的だった。2014-18にはオルトメトリクス、アントレプレナー、イノベーション等が活 発化している。ここまではどちらかというと、1. 科学技術・研究という営みを研究対象とする領域が中心的であった。2019-23には、2. 学術情 報を活用した特定分野の動向調査が活発化している。 評価
  6. 6 Science of Scienceで語られる研究テーマ Science of Scienceは、1. 科学技術イノベーション(政策、都市等)、2. 生産性・ファンディング、3. ジェンダー、4.

    チーム・コミュニケーション、 5. 人工知能・ビッグデータ、6. その他(ワークショップ、哲学、ポーランド)といった領域に出現している。 イノベーション 人工知能 ビッグデータ コミュニケーション 政府・政策 科学技術開発 生産性・ ファンディング チーム 哲学 ジェンダー ポーランド ワークショップ Science of Science ※検索条件:タイトル・アブスト・キーワード・分野に、”Science of Science” OR SciSciを含む論文 都市 1. イノベーション Science of Science and Innovation Policyや、Science of Science and Technology Policy といった文脈でヒットする。また中国では、2006年時点で、”Science of Science”という用語を使 っており、科学技術政策やイノベーションを明らかにするための技法(科学計量学、可視化)と言って いる。中国では、”Studies in Science of Science”という学術雑誌がある。 2. 生産性・ファンディング SciSciの中心的課題として、科学研究の基本法則を明らかにすることや、資金投入と研究成果 の関係性を把握することだと述べている。研究者コミュニティの変化、実際の研究者の資金と成果 の関係性分析等を行っている。 3. ジェンダー 学術界における性差について注目。特に女性研究者の過小評価について指摘されている。 4. チーム・コミュニケーション チームの性別構成、力関係や構造等と研究成果・生産性の関係性を調査している。 5. 人工知能・ビッグデータ SciSciによって、AIのトレンドを調査・予測するという研究と、SciSciのためのオープンデータ・ツール等 の提供という研究もある。また、科学的発見そのものの理解のことをSciSciと定義し、AI科学者に よって実行されることを目指す研究もある。
  7. 7 Science of Science論文の事例 領域 タイトル 1. 科学技術イノベーション the returns

    to r&d: division of policy research and analysis at the national science foundation (University of North Carolina, 2013) Science of Science and Innovation Policyの文脈でヒット。NSFが1980年代に行った民間・公的R&Dのリターン測定が、イノベーション政策の基礎になったとして、改めてこ の教訓を活かそうと提言している。 1. 科学技術イノベーション thinking about the construction of "science of science" theory system——the report about the progress of ""science of science"" which based on scientometrics in china and foreign countries (Dalian University of Technology, 2006) Science of Scienceという用語を使っているが、科学技術政策やイノベーションを明らかにするための技法(科学計量学、可視化)と言っている。 1. 科学技術イノベーション(政策) methodology study on the science of science and technology policy (Chinese Academy of Sciences, 2014) Science of Science and Technology Policyの文脈でヒット。中国における科学技術政策の定量的な評価を行う方法論を提案している。 1. 科学技術イノベーション(都市) mapping the efficiency of international scientific collaboration between cities worldwide (University of Debrecen, 2018) Science of Scienceという用語を使っている。科学拠点の都市間の国際共同研究パターンと引用の関係を調査している。 2. 生産性・ファンディング research on overlapping communities in scientific cooperation network (National University of Defense Technology, 2022) Science of Scienceは、科学研究の基本法則を明らかにすることと述べている。研究者コミュニティの変化の仕方に関する研究。 2. 生産性・ファンディング using context-dependent dea to analyze the efficiency of highly funded scientists in china (Sichuan University, 2021) Science of Scienceでは、資金投入と研究成果の関係性把握は中心的な課題だと述べている。中国における345人の研究資金と研究成果の情報をもとに、傾向を分析 している。 3. ジェンダー historical comparison of gender inequality in scientific careers across countries and disciplines (Northeastern University等, 2020) 学術界における性差について調査。女性が過小評価されており、キャリアを通じて発表論文や引用数が少ないことを示唆している。 4. チーム・コミュニケーション team gender composition impact on the production of disruptive research (U. of Michigan, 2022) チームの性別構成が、研究の生産に与える影響を調査している。 4. チーム・コミュニケーション igem: a model system for team science and innovation (Université Paris Cité, Northeastern University等, 2023) チームサイエンスとイノベーションの関係を分析できるデータセットとして、iGEMコンペティションのデータを紹介している。 4. チーム・コミュニケーション team power dynamics and team impact: new perspectives on scientific collaboration using career age as a proxy for team power (University of Texas等, 2022) 研究チーム内の力関係や構造と、研究成果のインパクトの関係を調査している。 5. 人工知能・ビッグデータ tracing the evolution of ai in the past decade and forecasting the emerging trends (Beijing Academy of Artificial Intelligence等, 2022) 科学計量学やScience of Scienceの技法を用いて、AIのトレンド調査と予測を行っている。 5. 人工知能・ビッグデータ nobel turing challenge: creating the engine for scientific discovery (The Systems Biology Institute, 2021) 科学的発見そのものの理解のことをScience of Scienceと呼んでいる。Science of Scienceが確立しAI科学者によって実行され、科学的発見が促進することを目指している。 5. 人工知能・ビッグデータ open data and open code for big science of science studies (Indiana University, 2020) Science of Scienceの研究のためのオープンデータやツールを提供している。
  8. 8 他の分野で語られる研究テーマ Scientometrics, Bibliometricsともに全方位的にカバーしているが、前者は科学指標、後者は様々な分野の調査に軸足がある。 Scientometrics Bibliometrics 図書館 インド オルトメトリクス 指標

    ランキング ロシア COVID ガン 人工知能 教育 特許 イノベーション 再生可能エネルギー BIM 都市 図書館 ジェンダー イノベーション アントレプレナー 教育 看護 ガン COVID 人工知能 観光 再生可能エネルギー マーケ SCM チーム・コミュ ニケーション ジェンダー
  9. 10 国別の取り組み 1位2位の中国と米国は、ともに全方位的にカバーしている。中国は「2. 学術情報を活用した特定分野の動向調査」が多く、米国は「1. 科 学技術・研究という営みの解明・評価」が多い。特に、ジェンダー、チーム・コミュニケーション、オルトメトリクス、指標等は、中国よりも米国が 活発である。一方、中国は自国の領域が形成されるほど研究もしている。 No. 国 論文数

    1 CN 5666 2 US 3107 3 BR 1799 4 GB 1513 5 ES 1435 6 IN 1413 7 ID 1178 8 AU 955 9 IT 819 10 DE 812 ・・・ 25 JP 251 中国 米国 ジェンダー オルトメトリクス 指標 図書館 チーム・コミュニケー ション 看護 COVID 人工知能 ナノテク イノベーション 図書館 中国 特許 イノベーション 人工知能 看護 ガン 鍼 再エネ・脱炭素 都市 観光 SCM ブロックチェーン 幹細胞 漢方
  10. 11 国別の取り組み No. 国 論文数 1 CN 5666 2 US

    3107 3 BR 1799 4 GB 1513 5 ES 1435 6 IN 1413 7 ID 1178 8 AU 955 9 IT 819 10 DE 812 ・・・ 25 JP 251 ブラジル 日本 3位のブラジルはイノベーションやアントレプレナーを中心に、様々な分野での調査を行っている。また自国に関する調査も活発である。最後に 日本は25位であり、そもそも件数が少ないものの、評価、ジェンダー、イノベーション、特許等に取り組んでいる。また、サステナビリティ・環境や 人工知能に関する計量書誌学的な調査も行っている。 アントレプレナー ブラジル 看護 マーケティング サステナビリティ 会計 観光 都市 SCM 都市 サステナビリティ 特許 評価 ジェンダー 人工知能 気候変動 観光 イノベーション イノベーション 再生可能エネルギー
  11. 12 サマリ • Science of Scienceは「科学技術・研究という営みの解明・評価、科学的発見そのものの理解」に軸足を置いているものの、科学計量 学や計量書誌学といった分野でも同様のテーマを扱っている。 Science of Scienceは全く新しい概念というわけではない。「科学技術や

    研究をより良くしていく」という共通目標に向かって、これらの分野における研究蓄積も踏まえて、Science of Scienceの研究やコミュニティ が発展していくことを期待している。 • 中国、米国、欧州などは、千件~数千件規模で論文発表している。1位2位である中国と米国は、共に全方位的にカバーしている。中国 は「2. 学術情報を活用した特定分野の動向調査」が多く、米国は「1. 科学技術・研究という営みの解明・評価」が多い。一方、日本は、 これらの国々と比べるとそもそも件数が少ない。日本の環境を踏まえたScience of Science研究を、世界で発信・コミュニケーションしていく ことが重要なのではないか。