본문 바로가기
인공지능과정 이론 수업

Kakao AI Platform(KAP)?

by eun5098 2024. 8. 10.
728x90

Kakao AI Platform(KAP)

클라우드 인프라(아래)-Data/Model Store(데이터 저장)-serve(모델이 만들어지면 배포하고 서빙하도록 도와주는 역할)-Training(fine tuning 등)-Agent(사내용 GPTs 같은)-Service APPs
표준 serving frame

 

ex. speculative decoding
: 큰 모델과 작은 모델 같이 띄워서 작은 모델로 추론 (높은 속도, 낮은 정확성)
-> 추론한 토큰 여러개 grouping해 큰모델한테 전달 -> 확률 분포 값 계산 -> 토큰 유효성 판단

 

KAP Serve / Training

1) Inference 기능

- AI Model 카탈로그 : 다양한 AI 모델 접근 가능

- 모델 & GPU 선택: 사용자 맞춤형 Inference API Endpoint 생성

- 통합 관리 : 인증, 보안, 성능, 로깅 모니터링

ex. 카카오톡 AI 요약/어조 변경 가능

2) Training / Fine-Tuning 기능

- 모델 & 데이터 선택, 파인튜닝, 결과 자동 평가, 서비스 배포

- 작업 큐 & 스케줄러: 배치 잡, 장기/병렬 잡, Interactive console UI

- 효율적 작업 관리: 쿼터/크레딧 기반 작업 처리

 

KAP Data Store

[데이터 유형]

1) Corpus (그냥 아무데서나 긁어온 데이터)

- 모델 처음 만들 때 pretraining할 때 활용(초기학습) 단어들간의 관계 어느정도 이해함

2) SFT Data (Supervised Fine-Tuning Data)

- 지도 학습을 위한 데이터

3) RLHF Data (Reinforcement Learning from Human Feedback Data)

- 인간의 피드백을 통해 강화 학습 방식으로 AI 모델 개선을 위해 사용됨

 

 

KAP Agent

코딩을 몰라도 인공지능 행동 지침(Prompt)과 +@지식학습 통해 누구나 AI 지식 챗봇 생성 가능!

여러개의 지식들을 연관되어서 습득할 수 있도록 m:n으로 연결할 수 있게 해놓음

 

생성형 AI 성숙도 모델

위에서부터 성숙도 낮은 순(일일이 하나하나 제작하는 단계)

 

프로그램의 입력과 출력 관계를 결정하는 것

1. software 1.0 : algorithm

- 알고리즘 개발 통해 입력과 출력 관계 결정

- input data -> program(algorithm) -> output

단점! 케이스가 너무 많거나 애매한 것들은 소프트웨어로 풀 수 없다는 단점 발생

2. software 2.0: 데이터셋으로부터 학습된 머신러닝 모델

- 학습용 데이터 -> 데이터셋 학습 -> 머신러닝 모델

- input data -> program(ML model) -> output

단점! 학습에 많은 비용 소모, 기능별 모델 필요, 입력&출력 관계 보장X

3. software 3.0: prompt

- 프롬프트= context + 지시

- 프롬프트 일부인 컨텍스트를 프로그램으로 볼 수 있음

- 프롬프트(프로그램 + Input data) -> LLM(Agent) -> output

단점! 높은 운영 비용, 의도한 출력이 나오지 않을 가능성 존재  -> 인공지능 개발자가 가져야 할 역량