Flux RSS du blog d'apprentissage automatique AWS

Automatiser l'inférence par lots Amazon Bedrock : Créer un pipeline évolutif et efficace

Même si l'inférence par lot offre de nombreux avantages, elle est limitée à 10 travaux d'inférence par lot soumis par modèle et par région. Pour répondre à cette considération et améliorer votre utilisation de l'inférence par lot, nous avons développé une solution évolutivité en utilisant AWS Lambda et Amazon DynamoDB. Cet article vous guide tout au long de la mise en œuvre d'un système de gestion de files d'attente qui surveille automatiquement les emplacements de travail disponibles et soumet de nouveaux travaux lorsque des emplacements deviennent disponibles.
favicon
aws.amazon.com
Automate Amazon Bedrock batch inference: Building a scalable and efficient pipeline
Create attached notes ...