Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bigdata with 0% java
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
kd0g
August 31, 2014
Programming
1.3k
10
Share
Bigdata with 0% java
PyconKR 2014
kd0g
August 31, 2014
Other Decks in Programming
See All in Programming
net-httpのHTTP/2対応について
naruse
0
430
TypeScriptだけでAIエージェントを作る フロント・エージェント・インフラのフルスタック実践
har1101
6
1.3k
さぁV100、メモリをお食べ・・・
nilpe
0
130
CLIであることを活かしたGitHub Copilot CLI活用術 / GitHub Copilot CLI Pro Tips & Tricks
nao_mk2
1
1.2k
Copilot CLI の継戦能力を高める コンテキスト管理
nozomutu
1
1.2k
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
1.8k
[2026年度第1回ORセミナー] 計画最適化ベンチャーと競技プログラミング人材
terryu16
0
240
tsserverとは何だったのか、これからどうなるのか
nowaki28
1
440
脅威をエンジニアリングの糧にして――現場編 / Turning Threats into Engineering Fuel — Field Edition
nrslib
0
240
AI時代のUIはどこへ行く?その2!
yusukebe
19
6.5k
開発体験を左右するライブラリの API 設計 - GraphQL スキーマ構築ライブラリから考える #tskaigi
izumin5210
2
1.6k
「エンジニアインターン、どうやって取った?」準備のリアルを語るLT会 Progate BAR
akiomatic
0
120
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
135
9.9k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
Tell your own story through comics
letsgokoyo
1
940
Producing Creativity
orderedlist
PRO
348
40k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
380
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
930
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
310
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
370
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Un-Boring Meetings
codingconduct
0
310
Transcript
bigdata, with 0% java 김태웅
[email protected]
@ python / mac /go 강제 에반젤리스트 @ S*/K* 등
통신사 쪽 경험이 ၞ !
목 차 what is big data what is map reduce
introducing disco build your own cluster
@ Volume(규모) @ Variety(다양성) @ Velocity(속도) @ Value(가치) what is
big data?
@ 10년전 떡밥 : web 2.0 @ “기술적” 관점에서의 빅
데이터 - map reduce @ 데이터 기반 의사결정을 할 수 있게 해주는 보조도구 - microsoft excel? 마케팅 용어인가요?
bigdata glossary (python 으로 5분 만에 만듬)
what is map reduce
수직 vs 수평
wordcount is hello world of Map Reduce
MapReduce 구현 @ hadoop - 하둡 스트리밍을 이용, 여러 언어에서
사용할 수 있음 - 사실상의 표준 - 수 많은 오픈소스 프로젝트, 보조도구들 - 하지만 자바
왜 하둡/자바 디스하나요?
introducing disco
disco @ erlang + python @ 웹UI와 잡 관리는 erlang
@ 나머지는 전부 python @ 하둡보다 매우 짧은 소스코드(10배?) @ 설치가… 매우 쉬움 @ worker protocol @ 노키아에서 ville tuulos 가 시작
client master slave worker
None
DDFS @ tag based file system
DDFS
chain jobs
chain jobs
헬로 월드
build your own cluster
내 노트북이 리눅스다. @ 공식 싸이트에서 Setting up Disco 따라하면
5분
내 노트북이 맥북이다. @ 공식 싸이트에서 Setting up Disco 따라하면
5분 @ erlang crash dump 생기면 1주일 @ 그냥 vagrant 까세요 @ slave 노드에 pycurl 필요함 @ hostname 안 맞추면 아무것도 안됨
Amazon EC2 @ starcluster : python !!
docker 시도: 실패 (성공하신 분 개인적으로 연락주시 면 후사하겠습니다)
홈 클러스터
None
생각 @ erlang 은 또 하나의 진입장벽이다 @ 왠만한 데이터는
DBMS가 답임 @ HBase Pig Hive 등을 만들어서 쓴다면? @ MR을 더욱 효과적으로? -> 리액 node에 slave-worker 를 띄울 수 있다면 @ MR은 전체 빅데이터 의사결정의 일부분 으로 설계해야 @ 맥 프로 정말 좋음
Where to Start? @ discoproject.org(massive data, minimal code) @ run
tests(disco/tests) -> run_tests_python25 @ follow for -> scipy conference -> ville tuulos(founder of disco) @ NoSQL distilled(MR 설명, 인사이트에 서 번역 나와있음ㅎ)
감사합니다!!