머신러닝 모델 서빙과 배포 차이

MLOps/Life cycle

remarkable-book 2023. 11. 8. 18:30

머신러닝 모델 서빙과 배포는 ML 모델을 사용 가능한 상태로 제공하고

클라이언트 애플리케이션에서 모델에 데이터를 전달할 수 있도록 하는 두 가지 다른 개념이다.

모델 서빙 (Model Serving)

모델 서빙은 학습된 머신러닝 모델을 실제 환경에서 예측 또는 추론을 수행할 수 있도록 제공하는 과정을 의미.

모델 서빙은 모델의 예측 또는 추론을 위한 API 또는 서비스로 모델을 노출.

모델 서빙은 클라이언트 애플리케이션이 모델에 데이터를 보내고 예측 결과를 받을 수 있도록 하는 중요한 단계.

모델 배포는 학습된 모델을 프로덕션 환경 또는 클라우드 서버와 같은 운영 환경으로 이동하고, 모델을 서빙 가능한 상태로 구동하는 과정을 의미.

모델 배포에는 모델의 서버 설정, 환경 변수, 스케일링, 모델 버전 관리 등이 포함.

모델 배포는 모델을 모델 서빙 인프라 (예: 웹 서버, 컨테이너, 함수)에 배포하는 작업을 의미.

요약하면,

모델 배포는 모델을 서비스 환경에 배치하고 운영 가능한 상태로 설정하는 것,

모델 서빙은 실제로 모델을 사용하여 예측을 수행하고 클라이언트 애플리케이션에 결과를 반환하는 것.

배포는 모델을 서빙하기 위한 준비 작업이며,

서빙은 배포된 모델을 활용하는 과정.