Upgrade to Pro — share decks privately, control downloads, hide ads and more …

研究をするAIへ向けて

Shiro Takagi
December 20, 2024
600

 研究をするAIへ向けて

@ 第28回汎用人工知能研究会

Shiro Takagi

December 20, 2024
Tweet

Transcript

  1. 【おまけ】 自律実行が大変 社会への影響が甚大 他分野の研究自動化にも寄与 研究成果で 自己改善 課題を 研究課題に コンピュータ内で完結 AI

    安 全 性 の 技 術 的 解 決 に も 寄 与 なぜAI研究かというとそれは自己改善に繋がり理想的にはAIの 指数的な性能向上をもたらしうるという意味で重要すぎるから
  2. 結論(と個人的所感)からいうと… 人工機械学習研究者実現に必要な、個別タスクの自動化の研究は、 これまでたくさん行われてきた (特に Sakana AI の the AI Scientist

    登場以前)人工機械学習研究 者の作成を目指す研究は多くなかったが、最近増加している 現在公開されている範囲では、色々下駄を履かせて「アルゴリズム の実装はできるが、それがなぜうまくいくのかの理論的理解には課 題がある初級の機械学習研究者」程度の論文を自動執筆するくらい のレベルで、かつまだ真に人工研究者と呼べるものはない ただ、各社やってないわけがないので実際の最先端はもっと進んで いると想定するのが妥当だし、分野の進展を考えると1~2年で相当 程度のものができるのでは? Lu et al. (2024) The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery
  3. Objective Solution Implementation Experiment Plan Solution Idea Experiment Result Research

    Paper Experiment Implementation Research Problem 研究過程全体
  4. Objective Solution Implementation Experiment Plan Solution Idea Experiment Result Research

    Paper Experiment Implementation Research Problem アイデア生成/問いの生成/課題発見 (発見の文脈)
  5. Scideator: Human-LLM Scientific Idea Generation Grounded in Research-Paper Facet Recombination

    [Radensky+ 2024] IdeaBench: Benchmarking Large Language Models for Research Idea Generation [Guo+ 2024] Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation [Su+ 2024] Chain of Ideas: Revolutionizing Research Via Novel Idea Development with LLM Agents [Li+ 2024] SciPIP: An LLM-based Scientific Paper Idea Proposer [Wang+ 2024] Improving Scientific Hypothesis Generation with Knowledge Grounded Large Language Models [Xiong+ 2024] Nova: An Iterative Planning and Search Approach to Enhance Novelty and Diversity of LLM Generated Ideas [Hu+ 2024] IdeaSynth: Iterative Research Idea Development Through Evolving and Composing Idea Facets with Literature-Grounded Feedback [Pu+ 2024] ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [Baek+ 2024] OpenResearcher: Unleashing AI for Accelerated Scientific Research [Zheng+ 2024] Generation and human-expert evaluation of interesting research ideas using knowledge graphs and large language models [Gu & Krenn 2024] SCIMON : Scientific Inspiration Machines Optimized for Novelty [Wang+ 2023] AutoML-GPT: Automatic Machine Learning with GPT [Zhang+ 2023] Large Language Models for Automated Open-domain Scientific Hypotheses Discovery [Yang+ 2023] SciAgents: Automating scientific discovery through multi-agent intelligent graph reasoning [Ghafarollahi & Buehler 2024] Creative research question generation for human-computer interaction research [Liu+ 2023] Mapping the challenges of hci: An application and evaluation of chatgpt and gpt-4 for cost-efficient question answering [Oppenlaender & Hamalainen 2023] Evaluating the use of large language model in identifying top research questions in gastroenterology [Lahat+ 2023] ... and more !! アイデア生成/課題発見研究は昔からあり今も新しい論文が続々出てる
  6. Novelty Kumar+ (2024) Can Large Language Models Unlock Novel Scientific

    Research Ideas? 現在の LLM でも人間に比肩する研究アイデアを生成可能であり、 特に新規性の点では人間を超えるようなアイデアも生成可能 一方凡庸なアイデアも生成するし実現可能性などの面では課題もあり Si+ (2024) Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers Guo+ (2024) IdeaBench: Benchmarking Large Language Models for Research Idea Generation
  7. Objective Solution Implementation Experiment Plan Solution Idea Experiment Result Research

    Paper Experiment Implementation Research Problem アイデアの実装と実験 (エンジニアリング)
  8. 探索空間 手法提案/発見 手法評価 *[Hu+ 2024] を参考 Open-Ended な試みが増えてきている! 自動化の試みは昔からある LLM

    の能力向上によりオープンエンドな探索空間での手法の自動構 成/提案/発見の試みができるようになってきた!
  9. [Hong+ 2024] [Ifargan+ 2024] データ科学の自動化の試みは数多くあり、複雑なパイプライン構築も含め自動化され始めている DS-Agent: Automated Data Science by

    Empowering Large Language Models with Case-Based Reasoning [Guo+ 2024] JarviX: A LLM No code Platform for Tabular Data Analysis and Optimization [Liu+ 2023] Autonomous LLM-driven research from data to human-verifiable research papers [Ifargan+ 2024] Data Interpreter: An LLM Agent For Data Science [Hong+ 2024] Towards Automated Data Sciences with Natural Language and SageCopilot: Practices and Lessons Learned [Liao+ 2024] Towards Fully Autonomous Research Powered by LLMs: Case Study on Simulations [Liu+ 2024] BLADE: Benchmarking Language Model Agents for Data-Driven Science [Gu+ 2024] An Empirical Study on Self-correcting Large Language Models for Data Science Code Generation [Quoc+ 2024] DA-Code: Agent Data Science Code Generation Benchmark for Large Language Models [Huang+ 2024] AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions [Li+ 2024] ...
  10. ??? Complicated/Concrete Idea Simple/Abstract Idea Brain-inspired AI AI model Inspired

    by visual information processing ... ??? Papers Mathematical Model ??? Code Implementation [Fukushima 1980] 単純なアイデアからオープンエンドに複雑な手法を発展するのはまだ
  11. Feedback Propose Method Design Experiment Run Experiment Propose Method Design

    Experiment Run Experiment Feedback また、実験結果の帰属先を柔軟に決定して修正するようなこともできてない
  12. Objective Solution Implementation Experiment Plan Solution Idea Experiment Result Research

    Paper Experiment Implementation Research Problem 査読/研究評価
  13. Artificial Intelligence Technologies to Support Research Assessment: A Review [Kousha+

    2022] Automated Scholarly Paper Review: Possibility and Challenges [Lin+ 2022] Can Large Language Models Provide Useful Feedback on Research Papers? A Large-Scale Empirical Analysis [Liang+ 2023] Reviewergpt? an Exploratory Study on Using Large Language Models for Paper Reviewing [Liu+ 2023] Aries: A Corpus of Scientific Paper Edits Made in Response to Peer Reviews [D’Arcy+ 2023] Gpt4 is Slightly Helpful for Peer-Review Assistance: A Pilot Study [Robertson 2023] AgentReview: Exploring Peer Review Dynamics with LLM Agents [Jin+ 2024] Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions [Tan+ 2024] RelevAI-Reviewer: A Benchmark on AI Reviewers for Survey Paper Relevance [Couto+ 2024] MARG: Multi-Agent Review Generation for Scientific Papers [D'Arcy+ 2024] Generative Adversarial Reviews: When LLMs Become the Critic [Bougie+ 2024] The AI Review Lottery: Widespread AI-Assisted Peer Reviews Boost Paper Scores and Acceptance Rates [Latona+ 2024] Usefulness of LLMs as an Author Checklist Assistant for Scientific Papers: NeurIPS’24 Experiment [Goldberg+ 2024] What Can Natural Language Processing Do for Peer Review? [Kuznetsov+ 2024] ReviewFlow: Intelligent Scaffolding to Support Academic Peer Reviewing [Sun+ 2024] Prompting LLMs to Compose Meta-Review Drafts from Peer-Review Narratives of Scholarly Manuscripts [Santu+ 2024] OpenReviewer: A Specialized Large Language Model for Generating Critical Scientific Paper Reviews [Idahl+ 2024] LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing [Du+ 2024] Are We There Yet? Revealing the Risks of Utilizing Large Language Models in Scholarly Peer Review [Ye+ 2024] Is LLM a Reliable Reviewer? A Comprehensive Evaluation of LLM on Automatic Paper Reviewing Tasks [Zhou+ 2024] ... and more! 査読(研究評価)の自動化とその評価の研究もたくさん
  14. 既存ベンチマークは単純なタスクに制限/自由度も制限 人のような研究の自律遂行能力を評価するベンチマークが必要 研究遂行能力の評価 RQ、仮説、検証手順などの研究の中間生産物の質の評価 例:仮説の新規性の評価、RQ の重要性の評価、etc. 自律性の評価 どの過程でどの程度どんな人間の介入が必要か評価 社会的望ましさの評価 安全性、倫理、社会的影響などの評価

    一方で、そもそも何が良い研究なのかは人間でも明確に理解してない [Huang+ 2023] [Zenil+ 2023] 人工研究者のベンチマーク設計の重要性 例えば研究の「新規性」をどう測るかはそれを多くの人が研究してる Science of Science の分野でもまだ議論が続いているという状況らしい 三浦 (2024) “研究の新規性をどう測るか” 参照)
  15. # チャールズ・ダーウィンの進化論発展の詳細年表 ## 1809年 - 2月12日:チャールズ・ダーウィン、イングランドのシュルーズベリーで誕生 ## 1825-1827年 - エディンバラ大学で医学を学ぶが中退

    - 自然科学への興味を深める ## 1828-1831年 - ケンブリッジ大学クライスツ・カレッジに入学 - 植物学者ジョン・ヘンズローの指導を受け、生物学への関心が高まる ## 1831-1836年:ビーグル号航海 - 博物学者として世界周航に参加 - 重要な観察: 1. 南アメリカで絶滅した巨大哺乳類の化石を発見、現存種との類似性に注目 2. ガラパゴス諸島のフィンチの嘴の形状が島ごとに異なることを発見 3. ガラパゴスゾウガメの甲羅の形状の島ごとの違いを観察 - これらの観察が、種の可変性の考えの基礎となる ## 1837年 - 7月:最初の進化ノート(「赤いノート」)の執筆を開始 - 種の変化に関する初期の考えを記録 ## 1838年 - 9月:トマス・マルサスの「人口論」を読み、自然選択の概念を着想 - 生存競争の概念を発展させる ## 1842年 - 進化論の最初の概要を35ページの草稿にまとめる - 「自然選択」という用語を初めて使用 - 変異、遺伝、過剰生産、生存競争の概念を統合 ## 1844年 - より詳細な230ページの進化論草稿を執筆 - 自然選択による進化の過程をより詳細に説明 - 妻エマに草稿を託し、死後の公表を指示 ## 1846-1854年 - 主に蔓脚類(フジツボの仲間)の研究に従事 - 種の変異の範囲と遺伝の仕組みについての理解を深める ## 1854年 - 自然選択による進化の研究を本格的に再開 - 家畜育種の事例を収集し、人為選択と自然選択の類似性を探究 ## 1858年6月 - アルフレッド・ラッセル・ウォレスから類似の進化理論に関する論文を受け取る - 7月1日:リンネ協会でウォレスの論文とダーウィン自身の要約を共同発表 ## 1859年 - 11月24日:「種の起源」出版 https://www.kousakusha.co.jp/BOOK/ISBN978-4-87502-417-0.html
  16. そもそも研究/科学とはなんでしょう? 【作業的定義】 研究とはある社会にとっての新しい知識を生産する営み? すでに誰かがやってる ことをやっても研究 とは呼ばれなそう 研究はこの世界の知ら ないことを明らかにし ている営みという印象 人間社会とか

    [Takagi 2023] →科学哲学者間でも合意がない (むしろ統一的定義は無いという共通見解) この世界の理解? 創造性? 発見? 論文書くこと? 系統的な手続き? 科学的方法に則るもの?