Dans cet article, nous démontrons comment déployer un petit modèle de langage sur SageMaker AI en étendant nos conteneurs pré-construits pour être compatibles avec les instances AWS Graviton. Nous fournissons d'abord un aperçu de la solution, puis des étapes d'implémentation détaillées pour vous aider à démarrer. Vous pouvez trouver le cahier d'exemples dans le dépôt GitHub.
aws.amazon.com
Run small language models cost-efficiently with AWS Graviton and Amazon SageMaker AI
