Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
検索エンジン自作入門
Search
Masanori Ogino
September 25, 2021
Technology
0
92
検索エンジン自作入門
2021年9月25日の読書会にて使用したスライド。
Masanori Ogino
September 25, 2021
Tweet
Share
More Decks by Masanori Ogino
See All by Masanori Ogino
A Linux smartphone? What's the difference from Android?
omasanori
0
110
SJ3をたずねて
omasanori
1
71
Progress Report (2023-02-19)
omasanori
0
120
LinuxカーネルのFPGAサブシステム
omasanori
0
790
動かしてわかる CPUの作り方10講
omasanori
0
54
Rust入門以前:発表版
omasanori
13
2.3k
Other Decks in Technology
See All in Technology
Google CloudのLLM活用の選択肢を広げるVertex AIのパートナーモデル
nayuts
0
130
開発生産性を始める前に開発チームができること / optim-improve-development-productivity.pdf
optim
0
100
持続可能なソフトウェア開発を支える『GitHub CI/CD実践ガイド』
tmknom
6
1.3k
Javaにおける関数型プログラミンへの取り組み
skrb
7
320
プログラム検証入門
riru
6
860
DevRelの始め方
moongift
PRO
1
380
「認証認可」という体験をデザインする ~Nekko Cloud認証認可基盤計画
logica0419
2
430
四国クラウドお遍路 2024 in 高知 エンディング
yukataoka
0
200
再考 アクターモデル/ reconsider actor model
ytake
0
310
Envoy External AuthZとgRPC Extensionを利用した「頑張らない」Microservices認証認可基盤
andoshin11
0
240
リアルお遍路+SORACOM IoT
ozk009
1
130
App Router を実プロダクトで採用して見えてきた勘所をちょっとだけ紹介
marokanatani
1
920
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
65
9.8k
Designing on Purpose - Digital PM Summit 2013
jponch
114
6.8k
Atom: Resistance is Futile
akmur
261
25k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
23
1.7k
Robots, Beer and Maslow
schacon
PRO
157
8.2k
How to name files
jennybc
75
98k
Principles of Awesome APIs and How to Build Them.
keavy
125
16k
Faster Mobile Websites
deanohume
304
30k
YesSQL, Process and Tooling at Scale
rocio
167
14k
Typedesign – Prime Four
hannesfritz
39
2.3k
Producing Creativity
orderedlist
PRO
340
39k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
227
52k
Transcript
検索エンジン自作入門 手を動かしながら見渡す検索の舞台裏 Masanori Ogino DoC on 2021-09-25
Table of Contents 1. 今回紹介する本 2. 読もうと思ったきっかけ 3. 感想 4.
おすすめポイント 1
今回紹介する本
今回紹介する本 題 検索エンジン自作入門 著 山田浩之、末永匡a 頁 224 ページ 年 2014
年 版 技術評論社 PDF EPUB aニコニコ周辺文化に親しんだ人なら 「グニャラくん」の方がピンと来るかも。 2
今回紹介する本 DRM1 1各ページにユーザ名とメールアドレスの透かしが入っている。 こうしたデッドコピー流通抑止手法を social DRM と呼ぶ場合もあるが、 今回は DRM として扱わないものとする。
3
今回紹介する本 Figure 1: The official video of Drake, “Hotline Bling”.
https://www.youtube.com/watch?v=uxpDa-c-4Mc 4
読もうと思ったきっかけ
読もうと思ったきっかけ • Google の検索結果がイマイチ、でも Bing2も…… • プライバシー:DuckDuckGo は本当に信頼できるのか? • DDG
がダメなら Startpage? Searx セルフホスト? 「どうちがうの? 同じようなものじゃない。 もっとホンシツを見ようよ、なるほどくん。 」 —— 綾里真宵 2検索結果上位 5 件が広告だったときは流石にいかがなものかと 思った。 5
読もうと思ったきっかけ メタサーチエンジンで検索の質を向上できるのか? Big Tech のリソースなしには、もはや Web 検索を実現する ことはできないのか? Web 全体を網羅することはできないにしても、
“十分良い” 検索エンジンを作るのは可能なのではないか? 6
感想
感想 • 難易度はやさしめ • ただし、プログラミング入門は済ませている前提 • 手を動かしながら読むのによい本 • 私は C++と
TypeScript で少しずつ書き進めている • アルゴリズムの種類は絞り気味 • 本格的な専門書に進む前の一冊目として 7
おすすめポイント
おすすめポイント • 自然言語処理の前提知識は不要 • サンプルコードが本文にベタ貼りされてない (サポートページからダウンロードすること) • 永続化を SQLite に任せている
• 索引に注力してデータ構造や永続化を省く割り切り 8