Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
技育展登壇資料 Omochi
Search
Yuki Yada
September 11, 2022
Programming
0
440
技育展登壇資料 Omochi
Yuki Yada
September 11, 2022
Tweet
Share
More Decks by Yuki Yada
See All by Yuki Yada
DEIM2024 / 大規模言語モデルを用いたカテゴリ説明文付与によるニュース推薦の性能向上
yadayuki
0
16
【情報科学若手の会 2023秋 軽井沢】大規模言語モデル(BERT)を用いたニュース推薦のPyTorchによる実装と評価
yadayuki
1
630
インターン成果発表資料 / サイボウズ・フロントエンドエキスパートコース
yadayuki
0
1.5k
クックパッド・インターン成果発表
yadayuki
0
470
Other Decks in Programming
See All in Programming
はてなにおける CSS Modules、及び CSS Modules に足りないもの / CSS Modules in Hatena, and CSS Modules missing parts
mizdra
7
930
Prepare for Jakarta EE 11 - Performance and Developer Productivity
ivargrimstad
0
780
[技育CAMPアカデミア]アイディアを形に!【超入門】スマホアプリ開発〜リリースまでの流れをご紹介
teamlab
PRO
0
370
障害対応を起点としたもっといい開発と運用のサイクル作りのためにできること / Hatena Enginner Seminar #29
polamjag
0
170
Blue/Greenデプロイの導入による 運用フローの改善
kudoas
1
380
MetricKitで予期せぬ終了を検知する話 / Detect unexpected termination with MetricKit
nekowen
1
190
Fragment Composition of GraphQL
quramy
7
980
1BRC--Nerd Sniping the Java Community
gunnarmorling
0
340
Komplexe Oberflächen mit SVG und der Web Animation API
joergneumann
0
670
Behind VS Code Extensions for JavaScript / TypeScript Linnting and Formatting
unvalley
5
920
GraphQLサーバの構成要素を整理する #ハッカー鮨 #tsukijigraphql / graphql server technology selection
izumin5210
4
840
Site Reliability Engineering for GMO
pyama86
8
1k
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
[RailsConf 2023] Rails as a piece of cake
palkan
23
3.9k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
501
140k
5 minutes of I Can Smell Your CMS
philhawksworth
199
19k
Web development in the modern age
philhawksworth
202
10k
The Pragmatic Product Professional
lauravandoore
25
5.8k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
78
42k
We Have a Design System, Now What?
morganepeng
43
6.8k
Teambox: Starting and Learning
jrom
128
8.4k
Robots, Beer and Maslow
schacon
PRO
155
7.9k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
14
1.5k
The Power of CSS Pseudo Elements
geoffreycrofte
60
5k
Transcript
全文検索エンジンOmochi 無駄開発部門 / 矢田宙生 ( yyada.jp )
作ったもの 全文検索エンジンの Goによるスクラッチ実装
なんで作った? 全文検索エンジンOmochi 世の役に立つ? 起業? 開発支援? コスト削減?
なんで作った? 全文検索エンジンOmochi 世の役に立つ? 起業? コスト削減? 面白そうだから。 開発支援?
全文検索エンジン・Omochi • 転置インデックス型全文検索エンジン "ドラえもん"という検索ワードで検索したら、 "ドラえもん"というワードを含む文書を返してくれる • 全文検索の部分をGoで全てスクラッチ実装 (「Elasticsearch ? そんなものナンセンスさ
😏」) • HTTP API経由で検索することが可能! ドラえもんで検索するとき : “/v1/document/search?keywords=ドラえもん” • 対応言語: 日本語 & 英語
転置インデックス is 何 1. "java ruby js" 2. "cpp java
rust" 3. "zig carbon rust" 全文検索の肝とも言える文書に登場するトークン(単語)と 文書情報を紐づけたようなデータ構造 文書
転置インデックス is 何 1. "java ruby js" 2. "cpp java
rust" 3. "zig carbon rust" { “java”: [ 1 ,2 ] “rust”: [ 2 , 3 ] “zig”: [ 3 ] …. } 全文検索の肝とも言える文書に登場するトークン(単語)と 文書情報を紐づけたようなデータ構造 文書 転置インデックス
Omochiの技術スタック
デモ🤩
反響😳 • 執筆した記事がzennでトレンド一位 • 有名 & 強い人が拡散してくれた Kosuke tsujino さん(検索エンジン開発者
at Google) mattnさん(Go Expert at メルカリ) • リポジトリのスター数: 65 (皆さん、是非 ⭐ してください🥺 )
まとめ
まとめ 車輪の再発明、 楽しいぞ!!!!!!! 🎉🎉🎉
ご静聴ありがとうございました!