Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIPS 2011 勉強会 (Information Diffusion)
Search
@smly
April 08, 2012
2
2.6k
NIPS 2011 勉強会 (Information Diffusion)
NIPS 2011 勉強会 (
http://chouseisan.com/schedule/List?h=cc568b40d9d6c20e02222e320c608810
) での論文紹介スライドです
@smly
April 08, 2012
Tweet
Share
More Decks by @smly
See All by @smly
(Recognition) Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset
smly
1
430
(Retrieval) Large-scale Landmark Retrieval/Recognition under a Noisy and Diverse Dataset
smly
2
11k
画像検索 (特定物体認識) — 古典手法、マッチング、深層学習、Kaggle
smly
24
7.4k
データ分析コンテストの 勝者解答から学ぶ
smly
46
18k
データ分析コンテストの技術と最近の進展
smly
25
8.7k
Python とデータ分析コンテストの実践
smly
15
8.8k
実験の再現性と効率化の話(Docker と Serialization 周辺)
smly
5
3.2k
Workflow, Serialization & Docker for Kaggle
smly
10
2.6k
Chapter9 Convolutional Networks
smly
2
330
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
127
18k
Documentation Writing (for coders)
carmenintech
66
4.5k
Side Projects
sachag
452
42k
Why Our Code Smells
bkeepers
PRO
335
57k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Embracing the Ebb and Flow
colly
84
4.5k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
66k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
95
17k
GitHub's CSS Performance
jonrohan
1030
460k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
520
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
Transcript
勉強会 紹介論文
今日読むもの Reconstructing Patterns of Information Diffusion from Incomplete Observations –
By Flavio Chierichetti, Jon Kleinberg, David Liben-Nowell オンライン上で広まっている情報の伝染を調べる話 情報の広がりを木として扱い、全体は観測できないが 部分的なパスをいくつか観測できるケースを考える ⇒ 部分的な観測から構築した木の性質を調べる ⇒ 元の木のサイズを推定する (※ Rights to all the images belong to their respective owners)
情報伝染の木構造の構築 [Liben-Nowell & Klenberg 2008] と同様、嘆願書(名前を連 ねてコピーメールを転送するチェーンメール)の広がりの パターンを木としてモデル化 一部の人が公開した署名リストから木を作る 何度受け取ったとしてもコピーするのは一度だけと仮定
http://petitions.cs.cornell.edu/
部分的に観測する木を で扱う • 各ノードは Root までのパスを確率 δ > 0 で晒す
– 観測されたパスにより部分木 T’ ⊆ T を構築 • 木 T から δ-sampling によりできる木の全体を T_δ 確率δで晒す
None
糸っぽい… 不思議
観測したパスから再構築した木 T’ はとても糸のような奇 妙な木 (94% が single child node) 1.
どうしてこのような糸っぽい木になったのか δ-sampling と single child fraction の関係を形式的に調べる 2. オリジナルの木 T のサイズ(ノード数)を推定したい T’ T
観測したパスから再構築した木 T’ はとても糸のような奇 妙な木 (94% が single child node) 1.
どうしてこのような糸っぽい木になったのか δ-sampling と single child fraction の関係を形式的に調べる 2. オリジナルの木 T のサイズ(ノード数)を推定したい T’ T 1. δ-sampling した木 Tδ に対してδ→ 0 としたとき Single Child fraction が 1 に収束することを証明 2. δの普遍推定量を導出してオリジナルの木のサイズ n 推定
① [Golub & Jackson 2010] Galton-Watson branching process でシュミレーションして single
child fraction が大きくなることを示した [Chierichetti+ 2011] (this paper) Bounded-degree tree を仮定して, 小さい δ で δ-sampling すると single child fraction が大きくなることを示した 結果 (this paper) • となるような関数 を考える • T は最大 k の子ノードを持つとする (degree bounded) • の single child fraction は
• |T| = n, max(deg) = k • 木のノードを3つのタイプに分ける –
branching node (1人以上の子持ち) – Leave – Single child node • 内の葉がすべて expose した node するケース を考えると の leave の数は大きくても δn • Branching node は O(δn) … max(deg) = k • Leave と branching node の他は single child node 互いを制約する
• Leave … O(δn) / Branching node … O(δn) •
[Th2.1] のノード数は高い確率で – のサイズは O(δn) を超えるので single-child node の割合は →
② 元の木のサイズを推定をする V = V(Tδ) L ⊆ V … set
of its leaves E ⊆ V ... set of its nodes that were exposed |V – L| … leave 以外. 大きいと縦長 大きくなるとδ小さくなり糸っぽい (①) ¥hat{δ} は普遍推定量となる (Lemma 3.1)
Iraq-War protest chain 18,119 signers → approximately 173,000 signers
(あとで Full version 読んで証明を加えてスライド Update します…) • 実世界で観測された木の奇妙な特徴(糸っぽい 木)に対する数学的な説明を与えた •
観測された木を未知の木(オリジナル)の性質 を予測するために使った • 実世界の chain letter のデータセットではじめて signer の数を推定した