Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Java で統計とか機械学習とか自然言語処理とかをやりたい ときに役立つライブラリ達
Search
KOMIYA Atsushi
October 24, 2014
Programming
12
9.2k
Java で統計とか機械学習とか自然言語処理とかをやりたい ときに役立つライブラリ達
BizReach 社にお邪魔して発表したときのスライドです。
KOMIYA Atsushi
October 24, 2014
Tweet
Share
More Decks by KOMIYA Atsushi
See All by KOMIYA Atsushi
#JJUG Java における乱数生成器とのつき合い方
komiya_atsushi
5
5.5k
#JJUG Fork/Join フレームワークを効率的に正しく使いたい
komiya_atsushi
0
550
[#JSUG] SmartNews における container friendly な Spring Boot アプリケーション開発
komiya_atsushi
1
11k
Java のデータ圧縮ライブラリを極める #jjug_ccc #ccc_c7
komiya_atsushi
4
5.2k
#devsumi 自然言語処理・機械学習によるファクトチェック業務の支援
komiya_atsushi
1
4.7k
SmartNews Ads における機械学習の活用とその運用 #mlops
komiya_atsushi
3
20k
GBDT によるクリック率予測を高速化したい #オレシカナイト vol.4
komiya_atsushi
5
1.4k
Maven central repository の artifact をランキングする #渋谷java
komiya_atsushi
0
1.5k
確率的データ構造を Java で扱いたい! #JJUG
komiya_atsushi
6
2.4k
Other Decks in Programming
See All in Programming
Data-Centric Kaggle
isax1015
2
770
KIKI_MBSD Cybersecurity Challenges 2025
ikema
0
1.3k
AgentCoreとHuman in the Loop
har1101
5
230
Honoを使ったリモートMCPサーバでAIツールとの連携を加速させる!
tosuri13
1
180
CSC307 Lecture 04
javiergs
PRO
0
660
それ、本当に安全? ファイルアップロードで見落としがちなセキュリティリスクと対策
penpeen
7
3.9k
React 19でつくる「気持ちいいUI」- 楽観的UIのすすめ
himorishige
11
7.4k
Lambda のコードストレージ容量に気をつけましょう
tattwan718
0
120
なぜSQLはAIぽく見えるのか/why does SQL look AI like
florets1
0
450
HTTPプロトコル正しく理解していますか? 〜かわいい猫と共に学ぼう。ฅ^•ω•^ฅ ニャ〜
hekuchan
2
680
AI によるインシデント初動調査の自動化を行う AI インシデントコマンダーを作った話
azukiazusa1
1
710
Rust 製のコードエディタ “Zed” を使ってみた
nearme_tech
PRO
0
160
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
So, you think you're a good person
axbom
PRO
2
1.9k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.6k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
1
99
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Skip the Path - Find Your Career Trail
mkilby
0
54
How to make the Groovebox
asonas
2
1.9k
Building AI with AI
inesmontani
PRO
1
690
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
92
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
Transcript
Java Ͱ౷ܭͱ͔ػցֶशͱ͔ ࣗવݴޠॲཧͱ͔ΛΓ͍ͨ ͱ͖ʹཱͭϥΠϒϥϦୡ 2014-10-24 at BizReach @komiya_atsushi / SmartNews,
Inc.
τϐοΫ • ίϨΫγϣϯϥΠϒϥϦ • ܗଶૉղੳ • ֶɾ౷ܭ • ػցֶश
ίϨΫγϣϯϥΠϒϥϦ
GNU Trove
GNU Trove net.sf.trove4j:trove4j:3.0.3 • ϓϦϛςΟϒܕΛޮΑ֨͘ೲɾΞΫηε͢ ΔͨΊͷίϨΫγϣϯΛఏڙ͢Δ • ϥΠηϯεɿLGPL
fastutil
fastutil it.unimi.dsi:fastutil:6.5.15 • GNU Trove ͱಉ͘͡ɺϓϦϛςΟϒܕΛޮ Α֨͘ೲɾΞΫηε͢ΔͨΊͷίϨΫγϣϯ Λఏڙ͢Δ • ଟ༷ͳ
Map ࣮Λఏڙͯ͘͠ΕΔ • AVL tree, RB tree, Open Hash, Linked Open Hash (?)
Koloboke
Koloboke • Trove / fastutil ͱಉ༷ • ࠷ۙͷϓϩμΫτʁ • తʹҰ൪͍ͬΆ͍ʁ
• ґଘϥΠϒϥϦΛ 2 ͭՃ͢Δඞཁ͕͋Δ • compile 'net.openhft:koloboke-api-jdk6-7:0.6.3' • runtime ‘net.openhft:koloboke-impl-jdk6-7:0.6.3' • ݱࡏ Map ͷΈͷఏڙ
ܗଶૉղੳ
kuromoji
kuromoji org.atilika.kuromoji:kuromoji:0.7.7 • ຊޠจʹରͯ͠Θ͔ͪॻ͖ˍࢺਪఆΛ͠ ͯ͘ΕΔ • ґଘϥΠϒϥϦʢͱΦϨΦϨϦϙδτϦʣΛ Ճ͢Δ͚ͩͰָ͑ͯͪΜ • Α͘ϦϙδτϦ͕མ͍ͪͯͯ͠ΐΜ΅Γ͢
Δ͜ͱ͕ଟ͍ͱ͔…
Stanford CoreNLP
Stanford CoreNLP edu.stanford.nlp:stanford-corenlp:3.4.1 • ϤʔϩούܥݴޠͷॲཧΛ͍ͨ͠ͱ͖͜Ε͕͓͢͢ Ί • ࢺಉఆ lemmatization ʢ׆༻ܗ
→ ݪܗʹ͢Δͳ ͲʣΛͯ͘͠ΕΔ • ϞσϧϑΝΠϧ Maven Central Repo ʹ͋ΔͷͰɺ ηοτΞοϓָ͕ͪΜ • ͕͔ͩ͠͠ඦ MB…
ֶɾ౷ܭ
commons-math3
commons-math3 org.apache.commons:commons-math3:3.2 • ֶɾ౷ܭํ໘ͷػೳ͕๛ • ԾઆݕఆΒ͕֬ѻ͑ΔͷͰݸਓత ʹͱͯॏๅͯ͠·͢ • ػցֶशΞϧΰϦζϜͷࣗલ࣮Λ͢Δࡍͷ ͓ڙʹ
ػցֶश
liblinear-java
liblinear-java de.bwaldvogel:liblinear:1.94 • ΈΜͳ͍͖ͩ͢ LIBSVM ͷઢܗྨಛԽ൛ LIBLINEAR Λ Java ʹϙʔςΟϯάͨ͠ͷ
• ΞϠϝσʔλͩͬͨΓχϡʔεهࣄΛΧςΰ Ϧྨͱ͔͔ͨͬͨ͠Βɺ·ͣ͜ΕΛͬ ͯΈΑ͏
MLlib
MLlib org.apache.spark:spark-mllib_2.10:1.1.0 • Apache Spark ্Ͱಈ͘ػցֶशϥΠϒϥϦ • 1.1.0 ΑΓ Word2Vec
࣮͞Ε·ͨ͠ʂ
σϞ
ίϨΫγϣϯϥΠϒϥϦͷ ൺֱ
None
None
None
liblinear-java Ͱ ϩδεςΟοΫճؼ
None
MLlib ͷ Word2Vec Λ ৮ͬͯΈΔ
None