데이터 엔지니어링 프로젝트 및 인강/5. MLOps - FastCampus

챕터1. MLOps 란?

쟈누이 2022. 3. 14. 22:27
반응형

 

1. 기존 ml 프로젝트 진행방식의 한계


- validataion dataset 에서는 성능이  좋았던 모델이 배포때 test datsset 에서는 성능이 나쁠 수 있음
- 그럴 경우, n 번째 모델들을 배포하고 싶고, 성능이 좋았던 모델들을 참고하고 싶은 경우가 있다
- 체계적으로 모델, 데이터를 관리하지 않았다면, 성능이 안좋은 원인을 파악하기 어렵고 과거 모델을 재현하기 어려운 상황 발생
- 이럴경우 처음부터 다시 시작해야되는 문제가 발생할 수 있음

 

 

2. 실무에서겪을 수 있는 문제


1) 서로 다른 가상환경에서 개발한다면?

2) 하나의 컴퓨터, 서버를 공유해야 한다면

 

--> 1), 2) 의 이야기는 대다수의 기업에서 겪는 일이다.

 

 

3.  성공적인 ML 프로젝트를 위해서는?


- 단순히 좋은 모델만 사용하는 것이 중요한 것이 아니라 성능이 떨어지니 않는지,

- 시스템에 문제가 발생하고 있지 않은지.

- 데이터 분포가 변하고 있지 않은지에 대한 모니터링 부터 ,

- 이상한 데이터가 들어오지 않는지 검증도 해야하고,

- 성능이 떨어지면 쉽게 이전 모델로 돌아갈 수 있어야하고,

- 트레픽이 많을 떄는 자동적으로 스케일링 하고,

- 주기적으로 데이터 백업도 해줘야하고,

- 고려해야될 점이 매우 많다..

 

 

 

4. MLOps 가 탄생한 계기


==> 전통적인 방법은 매우 이상적인 방법이기에 한계가 많았고

 

이러한 한계를 극복하고자 데브옵스라는 소프트웨어 방법론/문화를 차용하고자 하는 아이디어에서 비롯된

MLOps 라는 것이 탄생했다.

반응형