Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Examine the meaning of unknown terms
Search
Sho Yokoi
PRO
October 05, 2017
Research
10
4.3k
Examine the meaning of unknown terms
知らない用語の調べ方〜「Googleの外側」を活用するための3つのTips〜
2017-10-05, 東北大学乾研究室, 研究Tips
Sho Yokoi
PRO
October 05, 2017
Tweet
Share
More Decks by Sho Yokoi
See All by Sho Yokoi
Embers of Autoregression: Understanding Large Language Models Through the Problem They are Trained to Solve
eumesy
PRO
7
1.2k
「確率的なオウム」にできること、またそれがなぜできるのかについて
eumesy
PRO
7
3.1k
A Theory of Emergent In-Context Learning as Implicit Structure Induction
eumesy
PRO
5
1.3k
ChatGPT と自然言語処理 / 言語の意味の計算と最適輸送
eumesy
PRO
24
17k
Revisiting Over-smoothing in BERT from the Perspective of Graph
eumesy
PRO
0
1.1k
構造を持った言語データと最適輸送
eumesy
PRO
5
7.2k
最適輸送と自然言語処理
eumesy
PRO
19
12k
言葉の形を教えてくれる自然言語処理
eumesy
PRO
1
1.5k
自分を知る,遊び場を作る
eumesy
PRO
9
4.4k
Other Decks in Research
See All in Research
RCEへの近道
kawakatz
1
820
授業評価アンケートのテキストマイニング
langstat
1
360
Weekly AI Agents News! 8月号 プロダクト/ニュースのアーカイブ
masatoto
1
180
[依頼講演] 適応的実験計画法に基づく効率的無線システム設計
k_sato
0
130
クロスセクター効果研究会 熊本都市交通リノベーション~「車1割削減、渋滞半減、公共交通2倍」の実現へ~
trafficbrain
0
220
第 2 部 11 章「大規模言語モデルの研究開発から実運用に向けて」に向けて / MLOps Book Chapter 11
upura
0
370
言語処理学会30周年記念事業留学支援交流会@YANS2024:「学生のための短期留学」
a1da4
1
240
文化が形作る音楽推薦の消費と、その逆
kuri8ive
0
150
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
0
470
snlp2024_multiheadMoE
takase
0
420
The Fellowship of Trust in AI
tomzimmermann
0
130
[第62回NLPコロキウム]「なりきり」を促すHCI設計:対話型接客ロボットの遠隔操作者へのリアルタイム変換音声フィードバックの適用
nami_ogawa
1
320
Featured
See All Featured
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
Fireside Chat
paigeccino
33
3k
Rails Girls Zürich Keynote
gr2m
94
13k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.3k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
4
370
A better future with KSS
kneath
238
17k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
246
1.3M
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
Embracing the Ebb and Flow
colly
84
4.5k
Transcript
知らない用語の調べかた 「Google の外側」 を活用するための3 つのTips 東北大学乾研究室「 研究Tips」, 2017‑10‑05 ( 木)
横井 祥 (D1)
知らない用語の調べかた: よくある失敗例 (“ ロジスティック回帰” がよく分からない…) ( 教えてGoogle!) 線形回帰分析が量的変数を予測するのに対して、 ロジスティッ ク回帰分析は発生確率を予測する手法です。
(???)
学術用語を調べたい場合に「 適当にググる」 のは悪手 前提: 世の中には信頼度の高い情報と信頼度の低い情報がある 検索結果の上位には信頼度の低い情報が大量に存在 “ 調べてみた” 系 blog
記事, メンテナンスされていない “ 事典” フィルタする必要がある 書籍としてのみ存在する( 電子化・ オンライン化されていない), または有料DB として存在する信頼度の高い情報はたくさんある 専門事典, 教科書 一概に「 ググるのはダメ」 というわけではない 良質なネットコンテンツも増える一方 どんな分野の話かを知るするためにググってみるのも効果的 しかし, 書籍や有料DB を活用しないと調べ物の効率が大幅に落ちる
今日触れるTips 辞書事典ポー タルとしてジャパンナレッジを使う 分野くらいは分かっている用語に対しては専門事典を使う 教科書や講義資料をストックしておいて用語集として使う
情報源の粒度 ↑ 情報の粒度が粗い, 初学者向け, 古い( 確立している), 先に調べる 1. 百科事典; レファレンス・
サー ビス 2. 専門事典 3. 教科書; OCWs, MOOCs, 講義資料 4. サー ベイ論文 5. 原著論文, 著者スライド ↓ 情報の粒度が細かい, 専門家向け, 新しい ほか, 各種インター ネットリソー ス (blog, 掲示板, etc.)
1. 百科事典 「 何も分からない… 何も…」「 どんな分野に属する用語なのかも分 からない…」 という状態でまず調べるべきもの ありとあらゆることに関して基礎的な説明を与えることを目指 した事典
ここに書いてあることは既知の事実として扱われる( と思って 良い) 分野や関連キー ワー ドのあたりをつけるのに使う ( 図書館に行って引いても良いが…) 紙の百科事典は大部で辛い → ネット資源に頼る i. ジャパンナレッジで検索できる各種百科事典 ii. Wikipedia
ジャパンナレッジ, ニッポニカ ジャパンナレッジ 百科事典をはじめとした多くの辞書事典のオンラインポー タル たとえばこのような事典が入っている: 小学館『 日本大百科全書 ( ニッポニカ)』,
約14 万項目 平凡社『 改訂新版 世界大百科事典』, 約9 万項目 調べ物の強い味方 年間2 万円程度で利用できる → ( それなりに大きな) 大学の附属図書館は団体契約してくれている ので, 大学に所属していると無料で利用できる 電子ブック ‑ 東北大学附属図書館 ジャパンナレッジ 同時利用人数: 基本コレクション:4 利用終了時は必ずログアウトしてください
… 次にどんな分野の文献を辿れば良いか分かる
小学館『 日本方言大辞典』 百科事典以外にも色々 な辞書事典が入っている
『 日本国語大辞典』( 通称“ 日国”, 50 万項目, 唯一の“ 大事典”) も利用可 語源や語史の記述に優れる
Wikipedia よくある前時代的な批判: 「 匿名なので信用できない」 紙媒体・ 記名性の百科事典と同程度の信頼性 [Giles'05, etc.] 我々 が調べるドメインの品質は別に悪くない(
とくに英語版) 著名な人が書いた信頼できない記事だっていくらでもある よくある小学生向け指導: 「 信用できないので引用してはいけない」 そもそも辞書事典は引用しない 理解の助けになりそうならどんどん使う ( 特に我々 のドメインに関しては) 英語版推奨 “References” が結構充実しているので活用する Wikiwand で少し見やすく
2. 専門事典 専門事典= 分野別の事典 その道のプロが「 一言で言うと…」「1 ペー ジでまとめると…」 をやってくれている, 日常的な調べ物の初手として非常に便利
日常的に調べたくなる用語はだいたい分野くらいは分かってい る, 百科事典まで戻らなくて良い 図書館の参考図書コー ナー には各分野の専門事典が揃っている 2017 年現在ほとんどオンライン化されていない, 紙で引くしかない 個人的おすすめ:『 言語処理学事典』, 『 人工知能学大事典』, 『MIT 認知科学大事典』; 『 言語学百科事典』, 『 英語学要語辞 典』; 『 現代数理科学事典』; 『 岩波数学入門辞典』, 『 プリン ストン数学大全』; 『 岩波哲学・ 思想事典』, Stanford Encyclopedia of Philosophy (SEP); etc. 全部研究室にあります
『MIT 認知科学大事典』 目次 哲学, 心理学, 神経科学, 計算論的知能( 所謂人工知能), 言語学, 文化・
認知・ 進化 のトピックについてそれぞれ2 ペー ジ程度の解説 我々 に馴染み深いテー マ多数. 超おすすめ
『 岩波数学入門辞典』s 数学用語のみならず, “ 数学語” も多数 掲載. 気持ちをたくさん書いてくれて いる稀有な数学辞典. 著者のひとりによる紹介
最終段階では, 700ペー ジの 辞書を最初から最後 まで通して 読む, という, かなり非人間的 な作業を, 何人もの執筆者が行 い, たとえば筆者は少なくとも 1 0回は繰り返した.
3. 教科書; OCWs/MOOCs, 講義資料 ググるよりも, 事典を引くよりも, 教科書を調べてしまうのが早い話 題はたくさんある 講義資料のPDF やOCWs/MOOCs
の動画が今は山ほど手に入る いずれも一般にその辺の blog よりもはるかに正確で分かりやすい おすすめアクション 有用な( 自分にとって分かりやすく正確な) 教科書を探す, リスト アップしておく 有用な講義資料はまとめてダウンロー ドしておく, 全文検索の対象 にする
例えば… ロジックの用語が分からない → 教科書: 『 論理と計算のしくみ』, 『 情報科学における論理』; 新井『 数学基礎論』
機械学習用語が分からない → 教科書: 『 はじめてのパター ン認識』, 中川『 機械学習』, 『 統 計的学習の基礎』, Murphy『Machine Learning: A Probabilistic Perspective』 講義資料: Bonen&Ng2017 鈴木& 野村2015 杉山2013 鹿島2010 ※ オンライン用語集朱鷺の杜Wiki も有用
まとめ 百科事典 分野すら分からない場合は百科事典を使う ジャパンナレッジを使う ( ニッポニカ, 日国, etc.) 専門事典 専門家による“
まとめ記事”, 調べ物の初手としておすすめ ほとんど電子化されていないので紙で引く 教科書; OCWc/MOOCs, 講義資料 教科書や講義資料も大事な“ 用語集” 自分にとって分かりやすい& 有用な教科書のリストを作る 有用な講義資料はロー カルに保存して全文検索の対象にする
蛇足1: 勿論ネットリソー スも極めて重要 たとえば 数学の調べ物: Stack Exchange Mathematics; MathOverflow Tech
な話: 各種公式 Docs, Stack Overflow 論文に関する議論, 速報: reddit, Twitter 分野毎に「 どこに調べに行けば良いか」 は異なる リストを更新し続けましょう
蛇足2: ポエム 「Google の外」 をも活用し, 不案内な概念の正確な定義に素早くた どり着く力は, 高等教育で身につけるべき重要な情報リテラシー 武器を買い替え, 磨き,
鍛え続けましょう 研究活動を通して「 調べ方」 そのものをチュー ニングし続けま しょう 有用な文献・ ウェブサイトのリストを常に更新し続けましょう