실행환경: 실행환경(venv, conda) • 모델 소스코드: train.py • 모델 파라미터: epoch=10 dropout=0.5 어떤 방법을 이용해서든지 이 3가지 정보만 있으면 OK # run ml training venv/bin/python train.py epoch=10 dropout=0.5
컨테이너(Pod)로 만들어졌기 때문에! • Pod 정보 • 이미지 주소 (실행환경) • 볼륨 정보 (ML code) • args 정보 (파라미터) # in jupyter notebook Pod POD_INFO=$(kubectl get pod $(hostname) -oyaml)
No need 하 (workflow.yaml) 즉각 Argo Workflow Required 상 (Kubernetes Manifest) 이미지 배포 Airflow No need 중 (Airflow DAG) 깃 배포, ansible 배포, 이미지 배포 Kubeflow Required 상 (Kubeflow Pipelines SDK) 이미지 배포 • 난이도*: 주관적인 기준입니다.
작업으로 끝이 아니라 여러 번 시도하며 개선해 나가는 과정 이 과정을 지원하는 모든 일들 • 모델링 과정 이해 • ML Framework 파악 • 모델링 & 분석 경험 • 클러스터 시스템 • CI / CD • 모니터링 • 자원 관리 커피고래가 생각하는 MLOps: https://coffeewhale.com/what-is-mlops