TheNote.app
Sign In
Sign Up
RSS Google Developers Blog
ジェマが説明した:パリジェマ建築
PaliGemmaは、軽量のオープンビジョン言語モデル(VLM)で、画像とテキストの両方を入力として受け取り、テキスト応答を生成します。このBaseGemmaモデルに追加されたビジョンモデルです。
developers.googleblog.com
Gemma explained: PaliGemma architecture