Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIPS 2011 勉強会 (Information Diffusion)
Search
@smly
April 08, 2012
2
2.7k
NIPS 2011 勉強会 (Information Diffusion)
NIPS 2011 勉強会 (
http://chouseisan.com/schedule/List?h=cc568b40d9d6c20e02222e320c608810
) での論文紹介スライドです
@smly
April 08, 2012
Tweet
Share
More Decks by @smly
See All by @smly
(Recognition) Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset
smly
1
440
(Retrieval) Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset
smly
2
11k
画像検索 (特定物体認識) — 古典手法、マッチング、深層学習、Kaggle
smly
24
7.5k
データ分析コンテストの 勝者解答から学ぶ
smly
46
18k
データ分析コンテストの技術と最近の進展
smly
25
8.7k
Python とデータ分析コンテストの実践
smly
15
8.8k
実験の再現性と効率化の話(Docker と Serialization 周辺)
smly
5
3.2k
Workflow, Serialization & Docker for Kaggle
smly
10
2.6k
Chapter9 Convolutional Networks
smly
2
340
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
44
13k
How STYLIGHT went responsive
nonsquared
96
5.3k
Documentation Writing (for coders)
carmenintech
67
4.5k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
192
16k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
3
240
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
173
51k
It's Worth the Effort
3n
183
28k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
We Have a Design System, Now What?
morganepeng
51
7.3k
Transcript
勉強会 紹介論文
今日読むもの Reconstructing Patterns of Information Diffusion from Incomplete Observations –
By Flavio Chierichetti, Jon Kleinberg, David Liben-Nowell オンライン上で広まっている情報の伝染を調べる話 情報の広がりを木として扱い、全体は観測できないが 部分的なパスをいくつか観測できるケースを考える ⇒ 部分的な観測から構築した木の性質を調べる ⇒ 元の木のサイズを推定する (※ Rights to all the images belong to their respective owners)
情報伝染の木構造の構築 [Liben-Nowell & Klenberg 2008] と同様、嘆願書(名前を連 ねてコピーメールを転送するチェーンメール)の広がりの パターンを木としてモデル化 一部の人が公開した署名リストから木を作る 何度受け取ったとしてもコピーするのは一度だけと仮定
http://petitions.cs.cornell.edu/
部分的に観測する木を で扱う • 各ノードは Root までのパスを確率 δ > 0 で晒す
– 観測されたパスにより部分木 T’ ⊆ T を構築 • 木 T から δ-sampling によりできる木の全体を T_δ 確率δで晒す
None
糸っぽい… 不思議
観測したパスから再構築した木 T’ はとても糸のような奇 妙な木 (94% が single child node) 1.
どうしてこのような糸っぽい木になったのか δ-sampling と single child fraction の関係を形式的に調べる 2. オリジナルの木 T のサイズ(ノード数)を推定したい T’ T
観測したパスから再構築した木 T’ はとても糸のような奇 妙な木 (94% が single child node) 1.
どうしてこのような糸っぽい木になったのか δ-sampling と single child fraction の関係を形式的に調べる 2. オリジナルの木 T のサイズ(ノード数)を推定したい T’ T 1. δ-sampling した木 Tδ に対してδ→ 0 としたとき Single Child fraction が 1 に収束することを証明 2. δの普遍推定量を導出してオリジナルの木のサイズ n 推定
① [Golub & Jackson 2010] Galton-Watson branching process でシュミレーションして single
child fraction が大きくなることを示した [Chierichetti+ 2011] (this paper) Bounded-degree tree を仮定して, 小さい δ で δ-sampling すると single child fraction が大きくなることを示した 結果 (this paper) • となるような関数 を考える • T は最大 k の子ノードを持つとする (degree bounded) • の single child fraction は
• |T| = n, max(deg) = k • 木のノードを3つのタイプに分ける –
branching node (1人以上の子持ち) – Leave – Single child node • 内の葉がすべて expose した node するケース を考えると の leave の数は大きくても δn • Branching node は O(δn) … max(deg) = k • Leave と branching node の他は single child node 互いを制約する
• Leave … O(δn) / Branching node … O(δn) •
[Th2.1] のノード数は高い確率で – のサイズは O(δn) を超えるので single-child node の割合は →
② 元の木のサイズを推定をする V = V(Tδ) L ⊆ V … set
of its leaves E ⊆ V ... set of its nodes that were exposed |V – L| … leave 以外. 大きいと縦長 大きくなるとδ小さくなり糸っぽい (①) ¥hat{δ} は普遍推定量となる (Lemma 3.1)
Iraq-War protest chain 18,119 signers → approximately 173,000 signers
(あとで Full version 読んで証明を加えてスライド Update します…) • 実世界で観測された木の奇妙な特徴(糸っぽい 木)に対する数学的な説明を与えた •
観測された木を未知の木(オリジナル)の性質 を予測するために使った • 実世界の chain letter のデータセットではじめて signer の数を推定した