반응형
1. 기존 ml 프로젝트 진행방식의 한계
- validataion dataset 에서는 성능이 좋았던 모델이 배포때 test datsset 에서는 성능이 나쁠 수 있음
- 그럴 경우, n 번째 모델들을 배포하고 싶고, 성능이 좋았던 모델들을 참고하고 싶은 경우가 있다
- 체계적으로 모델, 데이터를 관리하지 않았다면, 성능이 안좋은 원인을 파악하기 어렵고 과거 모델을 재현하기 어려운 상황 발생
- 이럴경우 처음부터 다시 시작해야되는 문제가 발생할 수 있음
2. 실무에서겪을 수 있는 문제
1) 서로 다른 가상환경에서 개발한다면?
2) 하나의 컴퓨터, 서버를 공유해야 한다면
--> 1), 2) 의 이야기는 대다수의 기업에서 겪는 일이다.
3. 성공적인 ML 프로젝트를 위해서는?
- 단순히 좋은 모델만 사용하는 것이 중요한 것이 아니라 성능이 떨어지니 않는지,
- 시스템에 문제가 발생하고 있지 않은지.
- 데이터 분포가 변하고 있지 않은지에 대한 모니터링 부터 ,
- 이상한 데이터가 들어오지 않는지 검증도 해야하고,
- 성능이 떨어지면 쉽게 이전 모델로 돌아갈 수 있어야하고,
- 트레픽이 많을 떄는 자동적으로 스케일링 하고,
- 주기적으로 데이터 백업도 해줘야하고,
- 고려해야될 점이 매우 많다..
4. MLOps 가 탄생한 계기
==> 전통적인 방법은 매우 이상적인 방법이기에 한계가 많았고
이러한 한계를 극복하고자 데브옵스라는 소프트웨어 방법론/문화를 차용하고자 하는 아이디어에서 비롯된
MLOps 라는 것이 탄생했다.
반응형
'데이터 엔지니어링 프로젝트 및 인강 > 5. MLOps - FastCampus' 카테고리의 다른 글
MLOps 란 무엇일까? (0) | 2022.03.17 |
---|