Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Bigdata with 0% java
Search
kd0g
August 31, 2014
Programming
10
1.3k
Bigdata with 0% java
PyconKR 2014
kd0g
August 31, 2014
Tweet
Share
Other Decks in Programming
See All in Programming
モデル駆動設計をやってみようワークショップ開催報告(Modeling Forum2025) / model driven design workshop report
haru860
0
230
宅宅自以為的浪漫:跟 AI 一起為自己辦的研討會寫一個售票系統
eddie
0
480
手が足りない!兼業データエンジニアに必要だったアーキテクチャと立ち回り
zinkosuke
0
510
大体よく分かるscala.collection.immutable.HashMap ~ Compressed Hash-Array Mapped Prefix-tree (CHAMP) ~
matsu_chara
1
210
「コードは上から下へ読むのが一番」と思った時に、思い出してほしい話
panda728
PRO
37
23k
251126 TestState APIってなんだっけ?Step Functionsテストどう変わる?
east_takumi
0
300
堅牢なフロントエンドテスト基盤を構築するために行った取り組み
shogo4131
8
2.1k
CSC305 Lecture 17
javiergs
PRO
0
300
配送計画の均等化機能を提供する取り組みについて(⽩⾦鉱業 Meetup Vol.21@六本⽊(数理最適化編))
izu_nori
0
140
AIコードレビューがチームの"文脈"を 読めるようになるまで
marutaku
0
340
Full-Cycle Reactivity in Angular: SignalStore mit Signal Forms und Resources
manfredsteyer
PRO
0
110
非同期処理の迷宮を抜ける: 初学者がつまづく構造的な原因
pd1xx
1
660
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.8k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.3k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Art, The Web, and Tiny UX
lynnandtonic
303
21k
It's Worth the Effort
3n
187
29k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Typedesign – Prime Four
hannesfritz
42
2.9k
The Cult of Friendly URLs
andyhume
79
6.7k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.8k
A Tale of Four Properties
chriscoyier
162
23k
Transcript
bigdata, with 0% java 김태웅
[email protected]
@ python / mac /go 강제 에반젤리스트 @ S*/K* 등
통신사 쪽 경험이 ၞ !
목 차 what is big data what is map reduce
introducing disco build your own cluster
@ Volume(규모) @ Variety(다양성) @ Velocity(속도) @ Value(가치) what is
big data?
@ 10년전 떡밥 : web 2.0 @ “기술적” 관점에서의 빅
데이터 - map reduce @ 데이터 기반 의사결정을 할 수 있게 해주는 보조도구 - microsoft excel? 마케팅 용어인가요?
bigdata glossary (python 으로 5분 만에 만듬)
what is map reduce
수직 vs 수평
wordcount is hello world of Map Reduce
MapReduce 구현 @ hadoop - 하둡 스트리밍을 이용, 여러 언어에서
사용할 수 있음 - 사실상의 표준 - 수 많은 오픈소스 프로젝트, 보조도구들 - 하지만 자바
왜 하둡/자바 디스하나요?
introducing disco
disco @ erlang + python @ 웹UI와 잡 관리는 erlang
@ 나머지는 전부 python @ 하둡보다 매우 짧은 소스코드(10배?) @ 설치가… 매우 쉬움 @ worker protocol @ 노키아에서 ville tuulos 가 시작
client master slave worker
None
DDFS @ tag based file system
DDFS
chain jobs
chain jobs
헬로 월드
build your own cluster
내 노트북이 리눅스다. @ 공식 싸이트에서 Setting up Disco 따라하면
5분
내 노트북이 맥북이다. @ 공식 싸이트에서 Setting up Disco 따라하면
5분 @ erlang crash dump 생기면 1주일 @ 그냥 vagrant 까세요 @ slave 노드에 pycurl 필요함 @ hostname 안 맞추면 아무것도 안됨
Amazon EC2 @ starcluster : python !!
docker 시도: 실패 (성공하신 분 개인적으로 연락주시 면 후사하겠습니다)
홈 클러스터
None
생각 @ erlang 은 또 하나의 진입장벽이다 @ 왠만한 데이터는
DBMS가 답임 @ HBase Pig Hive 등을 만들어서 쓴다면? @ MR을 더욱 효과적으로? -> 리액 node에 slave-worker 를 띄울 수 있다면 @ MR은 전체 빅데이터 의사결정의 일부분 으로 설계해야 @ 맥 프로 정말 좋음
Where to Start? @ discoproject.org(massive data, minimal code) @ run
tests(disco/tests) -> run_tests_python25 @ follow for -> scipy conference -> ville tuulos(founder of disco) @ NoSQL distilled(MR 설명, 인사이트에 서 번역 나와있음ㅎ)
감사합니다!!