RSS AWS マシンラーニング ブログ

Amazon Bedrock バッチ推論の自動化:スケーラブルかつ効率的なパイプラインの構築

バッチ推論が多くの利点を提供するにもかかわらず、1つのモデルあたり1つのリージョンで提出できるバッチ推論の仕事が10個に制限されています。この制限に対処し、バッチ推論の使用を強化するために、AWS LambdaとAmazon DynamoDBを使用したスケーラブルなソリューションを開発しました。この投稿では、使用可能なジョブスロットを自動的に監視し、スロットが利用可能になると新しいジョブを提出するキュー管理システムの実装方法をガイドします。
favicon
aws.amazon.com
Automate Amazon Bedrock batch inference: Building a scalable and efficient pipeline