Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[2024 창구 성장 지원 세미나] LLM과 온디바이스LM으로 스팸필터 앱 서비스 만들기

Beomi
September 03, 2024

[2024 창구 성장 지원 세미나] LLM과 온디바이스LM으로 스팸필터 앱 서비스 만들기

Beomi

September 03, 2024
Tweet

More Decks by Beomi

Other Decks in Programming

Transcript

  1. AI/ML GDE로 활동하고 있어요 KcBERT, KoAlpaca, Llama-Ko와 같은 한국어 오픈

    언어모델 연구를 합니다. 이번 세션에서 개발기를 다루는 "Smart Spam Filter", AI 기반 스팸차단 앱 서비스를 만들었어요. 안녕하세요, 이준범(Beomi)입니다👋
  2. “1개는 사람이 할 수 있어. 10개도 할 수 있겠지. 하지만

    1000개, 1만개는 할 수 없어. 그건 기계가 해야하는 영역이야.”
  3. LLM을 서비스하려면 얼마나 들지? (e.g., GPT4o) System prompt 합쳐서 대략

    103 tokens → $0.005 / 1K tokens → $0.0005 / 1 SMS → 0.7원 / 1문자 한사람: 10문자/day = 7원 나혼자(1) = 1달에 210원 가족+친구들(10) = 1달에 2,100원 일반사용자(1만) = 1달에 210만원 if 5만명 유저 → 1달에 1050만원(!!)
  4. 다양하게 제공되는 작은 LLM (e.g., Gemini-Flash 1.5) 문자 하나당 약

    100 tokens → $0.00008 / 1K tokens → $0.000008 / 1 SMS → 0.01원 / 1문자 한사람: 10문자/day = 0.1원 나혼자(1) = 1달에 3원 일반사용자(1만) = 1달에 3만원 if 5만명 유저 → 1달에 15만원(!)
  5. 1. 수동 라벨링 → 고성능, 알고있는 스팸 분류는 완벽하게 가능.

    → 시간이 엄청나게 오래 걸림 2. LLM 라벨링 → Prompt engineering이 필수. → 성능이 낮음 데이터 라벨링은 어떻게?
  6. OpenAI GPT4o + Gemini 1.5 Pro + Claude 3.5 Sonnet

    여러 LLM으로 라벨링 하기
  7. EOD