머신러닝 엔지니어로서 모델 배포는 MLOps의 중요한 구성 요소이며, 클라우드와 엣지 배포가 두 가지 주요 카테고리가 되는 다양한 ML 모델 배포 방법이 있습니다. 클라우드 배포가 가장 인기 있는 선택이지만, API 배포, 서버리스 배포, 배치 처리와 같이 하위 카테고리로 나눌 수도 있습니다. API 배포는 모델을 API로 배포하는 것으로, 간단한 명령을 통해 쿼리할 수 있으며, 구현의 용이성, 확장성, 중앙 집중 관리로 인해 인기가 있습니다. 그러나 비용이 많이 들 수 있으며 지연 문제가 있을 수 있습니다. 반면에 서버리스 배포는 서버를 소유하거나 프로비저닝하지 않고 모델을 실행하는 것이며, 트래픽이 적은 애플리케이션에 비용 효율적입니다. 배치 처리 또한 실시간 결과를 필요로 하지 않고 비용 효율적인 작업에 적합한 또 다른 클라우드 배포 옵션입니다. 스마트폰과 같은 장치에 모델을 배포하는 엣지 배포는 종종 간과되지만 실시간 처리, 개인 정보 보호, 낮은 인프라 비용이 필요한 애플리케이션에 실행 가능한 옵션이 될 수 있습니다. 엣지 배포는 각각 고유한 특성이 있는 네이티브 폰 애플리케이션, 웹 애플리케이션, 엣지 서버로 나눌 수 있습니다. 네이티브 앱 배포는 인프라 비용이 전혀 들지 않고, 개인 정보 보호가 더 뛰어나며 앱과 직접 통합할 수 있는 등의 여러 가지 장점이 있지만, 휴대폰 리소스 제약과 기기 단편화와 같은 한계가 있을 수 있습니다. 궁극적으로 클라우드와 엣지 배포 중 선택은 프로젝트의 특정 요구 사항에 따라 달라집니다.
towardsdatascience.com
How to Choose the Best ML Deployment Strategy: Cloud vs. Edge
