Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
検索エンジン自作入門
Search
Masanori Ogino
September 25, 2021
Technology
0
110
検索エンジン自作入門
2021年9月25日の読書会にて使用したスライド。
Masanori Ogino
September 25, 2021
Tweet
Share
More Decks by Masanori Ogino
See All by Masanori Ogino
A Linux smartphone? What's the difference from Android?
omasanori
0
160
SJ3をたずねて
omasanori
1
110
Progress Report (2023-02-19)
omasanori
0
170
LinuxカーネルのFPGAサブシステム
omasanori
0
870
動かしてわかる CPUの作り方10講
omasanori
0
80
Rust入門以前:発表版
omasanori
13
2.5k
Other Decks in Technology
See All in Technology
セキュアなAI活用のためのLiteLLMの可能性
tk3fftk
1
370
ロールが細分化された組織でSREは何をするか?
tgidgd
1
440
SREのためのeBPF活用ステップアップガイド
egmc
2
1.3k
無理しない AI 活用サービス / #jazug
koudaiii
0
110
Four Keysから始める信頼性の改善 - SRE NEXT 2025
ozakikota
0
420
モニタリング統一への道のり - 分散モニタリングツール統合のためのオブザーバビリティプロジェクト
niftycorp
PRO
1
530
エンジニアリングマネージャー“お悩み相談”パネルセッション
ar_tama
1
110
データ駆動経営の道しるべ:プロダクト開発指標の戦略的活用法
ham0215
2
150
今だから言えるセキュリティLT_Wordpress5.7.2未満を一斉アップデートせよ
cuebic9bic
2
170
【あのMCPって、どんな処理してるの?】 AWS CDKでの開発で便利なAWS MCP Servers特集
yoshimi0227
6
1k
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
13k
Microsoft Fabric ガバナンス設計の一歩目を考える
ryomaru0825
1
100
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
980
A better future with KSS
kneath
238
17k
Done Done
chrislema
184
16k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
108
19k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
990
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
181
54k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
It's Worth the Effort
3n
185
28k
RailsConf 2023
tenderlove
30
1.1k
Transcript
検索エンジン自作入門 手を動かしながら見渡す検索の舞台裏 Masanori Ogino DoC on 2021-09-25
Table of Contents 1. 今回紹介する本 2. 読もうと思ったきっかけ 3. 感想 4.
おすすめポイント 1
今回紹介する本
今回紹介する本 題 検索エンジン自作入門 著 山田浩之、末永匡a 頁 224 ページ 年 2014
年 版 技術評論社 PDF EPUB aニコニコ周辺文化に親しんだ人なら 「グニャラくん」の方がピンと来るかも。 2
今回紹介する本 DRM1 1各ページにユーザ名とメールアドレスの透かしが入っている。 こうしたデッドコピー流通抑止手法を social DRM と呼ぶ場合もあるが、 今回は DRM として扱わないものとする。
3
今回紹介する本 Figure 1: The official video of Drake, “Hotline Bling”.
https://www.youtube.com/watch?v=uxpDa-c-4Mc 4
読もうと思ったきっかけ
読もうと思ったきっかけ • Google の検索結果がイマイチ、でも Bing2も…… • プライバシー:DuckDuckGo は本当に信頼できるのか? • DDG
がダメなら Startpage? Searx セルフホスト? 「どうちがうの? 同じようなものじゃない。 もっとホンシツを見ようよ、なるほどくん。 」 —— 綾里真宵 2検索結果上位 5 件が広告だったときは流石にいかがなものかと 思った。 5
読もうと思ったきっかけ メタサーチエンジンで検索の質を向上できるのか? Big Tech のリソースなしには、もはや Web 検索を実現する ことはできないのか? Web 全体を網羅することはできないにしても、
“十分良い” 検索エンジンを作るのは可能なのではないか? 6
感想
感想 • 難易度はやさしめ • ただし、プログラミング入門は済ませている前提 • 手を動かしながら読むのによい本 • 私は C++と
TypeScript で少しずつ書き進めている • アルゴリズムの種類は絞り気味 • 本格的な専門書に進む前の一冊目として 7
おすすめポイント
おすすめポイント • 自然言語処理の前提知識は不要 • サンプルコードが本文にベタ貼りされてない (サポートページからダウンロードすること) • 永続化を SQLite に任せている
• 索引に注力してデータ構造や永続化を省く割り切り 8