Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Java で統計とか機械学習とか自然言語処理とかをやりたい ときに役立つライブラリ達
Search
KOMIYA Atsushi
October 24, 2014
Programming
12
9.1k
Java で統計とか機械学習とか自然言語処理とかをやりたい ときに役立つライブラリ達
BizReach 社にお邪魔して発表したときのスライドです。
KOMIYA Atsushi
October 24, 2014
Tweet
Share
More Decks by KOMIYA Atsushi
See All by KOMIYA Atsushi
#JJUG Java における乱数生成器とのつき合い方
komiya_atsushi
5
5.4k
#JJUG Fork/Join フレームワークを効率的に正しく使いたい
komiya_atsushi
0
510
[#JSUG] SmartNews における container friendly な Spring Boot アプリケーション開発
komiya_atsushi
1
11k
Java のデータ圧縮ライブラリを極める #jjug_ccc #ccc_c7
komiya_atsushi
4
5k
#devsumi 自然言語処理・機械学習によるファクトチェック業務の支援
komiya_atsushi
1
4.5k
SmartNews Ads における機械学習の活用とその運用 #mlops
komiya_atsushi
3
19k
GBDT によるクリック率予測を高速化したい #オレシカナイト vol.4
komiya_atsushi
5
1.3k
Maven central repository の artifact をランキングする #渋谷java
komiya_atsushi
0
1.4k
確率的データ構造を Java で扱いたい! #JJUG
komiya_atsushi
6
2.3k
Other Decks in Programming
See All in Programming
あなたとJIT, 今すぐアセンブ ル
sisshiki1969
0
250
ワープロって実は計算機で
pepepper
2
910
#QiitaBash TDDで(自分の)開発がどう変わったか
ryosukedtomita
1
350
実践 Dev Containers × Claude Code
touyu
1
140
SQLアンチパターン第2版 データベースプログラミングで陥りがちな失敗とその対策 / Intro to SQL Antipatterns 2nd
twada
PRO
37
11k
物語を動かす行動"量"
konifar
0
280
画像コンペでのベースラインモデルの育て方
tattaka
3
1.2k
あのころの iPod を どうにか再生させたい
orumin
2
390
iOS開発スターターキットの作り方
akidon0000
0
240
Comparing decimals in Swift Testing
417_72ki
0
160
[Codecon - 2025] Como não odiar seus testes
camilacampos
0
100
プロダクトという一杯を作る - プロダクトチームが味の責任を持つまでの煮込み奮闘記
hiliteeternal
0
410
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
462
33k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
283
13k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
6k
GraphQLとの向き合い方2022年版
quramy
49
14k
Practical Orchestrator
shlominoach
190
11k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
KATA
mclloyd
31
14k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.6k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
21
1.4k
Transcript
Java Ͱ౷ܭͱ͔ػցֶशͱ͔ ࣗવݴޠॲཧͱ͔ΛΓ͍ͨ ͱ͖ʹཱͭϥΠϒϥϦୡ 2014-10-24 at BizReach @komiya_atsushi / SmartNews,
Inc.
τϐοΫ • ίϨΫγϣϯϥΠϒϥϦ • ܗଶૉղੳ • ֶɾ౷ܭ • ػցֶश
ίϨΫγϣϯϥΠϒϥϦ
GNU Trove
GNU Trove net.sf.trove4j:trove4j:3.0.3 • ϓϦϛςΟϒܕΛޮΑ֨͘ೲɾΞΫηε͢ ΔͨΊͷίϨΫγϣϯΛఏڙ͢Δ • ϥΠηϯεɿLGPL
fastutil
fastutil it.unimi.dsi:fastutil:6.5.15 • GNU Trove ͱಉ͘͡ɺϓϦϛςΟϒܕΛޮ Α֨͘ೲɾΞΫηε͢ΔͨΊͷίϨΫγϣϯ Λఏڙ͢Δ • ଟ༷ͳ
Map ࣮Λఏڙͯ͘͠ΕΔ • AVL tree, RB tree, Open Hash, Linked Open Hash (?)
Koloboke
Koloboke • Trove / fastutil ͱಉ༷ • ࠷ۙͷϓϩμΫτʁ • తʹҰ൪͍ͬΆ͍ʁ
• ґଘϥΠϒϥϦΛ 2 ͭՃ͢Δඞཁ͕͋Δ • compile 'net.openhft:koloboke-api-jdk6-7:0.6.3' • runtime ‘net.openhft:koloboke-impl-jdk6-7:0.6.3' • ݱࡏ Map ͷΈͷఏڙ
ܗଶૉղੳ
kuromoji
kuromoji org.atilika.kuromoji:kuromoji:0.7.7 • ຊޠจʹରͯ͠Θ͔ͪॻ͖ˍࢺਪఆΛ͠ ͯ͘ΕΔ • ґଘϥΠϒϥϦʢͱΦϨΦϨϦϙδτϦʣΛ Ճ͢Δ͚ͩͰָ͑ͯͪΜ • Α͘ϦϙδτϦ͕མ͍ͪͯͯ͠ΐΜ΅Γ͢
Δ͜ͱ͕ଟ͍ͱ͔…
Stanford CoreNLP
Stanford CoreNLP edu.stanford.nlp:stanford-corenlp:3.4.1 • ϤʔϩούܥݴޠͷॲཧΛ͍ͨ͠ͱ͖͜Ε͕͓͢͢ Ί • ࢺಉఆ lemmatization ʢ׆༻ܗ
→ ݪܗʹ͢Δͳ ͲʣΛͯ͘͠ΕΔ • ϞσϧϑΝΠϧ Maven Central Repo ʹ͋ΔͷͰɺ ηοτΞοϓָ͕ͪΜ • ͕͔ͩ͠͠ඦ MB…
ֶɾ౷ܭ
commons-math3
commons-math3 org.apache.commons:commons-math3:3.2 • ֶɾ౷ܭํ໘ͷػೳ͕๛ • ԾઆݕఆΒ͕֬ѻ͑ΔͷͰݸਓత ʹͱͯॏๅͯ͠·͢ • ػցֶशΞϧΰϦζϜͷࣗલ࣮Λ͢Δࡍͷ ͓ڙʹ
ػցֶश
liblinear-java
liblinear-java de.bwaldvogel:liblinear:1.94 • ΈΜͳ͍͖ͩ͢ LIBSVM ͷઢܗྨಛԽ൛ LIBLINEAR Λ Java ʹϙʔςΟϯάͨ͠ͷ
• ΞϠϝσʔλͩͬͨΓχϡʔεهࣄΛΧςΰ Ϧྨͱ͔͔ͨͬͨ͠Βɺ·ͣ͜ΕΛͬ ͯΈΑ͏
MLlib
MLlib org.apache.spark:spark-mllib_2.10:1.1.0 • Apache Spark ্Ͱಈ͘ػցֶशϥΠϒϥϦ • 1.1.0 ΑΓ Word2Vec
࣮͞Ε·ͨ͠ʂ
σϞ
ίϨΫγϣϯϥΠϒϥϦͷ ൺֱ
None
None
None
liblinear-java Ͱ ϩδεςΟοΫճؼ
None
MLlib ͷ Word2Vec Λ ৮ͬͯΈΔ
None