Google Distributed Cloud bringt Googles AI-Dienstleistungen in die eigenen Rechenzentren oder Edge-Orte von Organisationen, um Herausforderungen im Zusammenhang mit Datenhoheit, regulatorischer Compliance und Anforderungen an niedrige Latenzzeiten zu lösen. Diese vollständig verwaltete Hardware- und Software-Lösung bietet eine Vielzahl von Dienstleistungen und ist in verschiedenen Hardware-Formfaktoren erhältlich, mit integrierten Lösungen unabhängiger Softwareanbieter für die Branche. Die neuen AI-optimierten Server von Google Distributed Cloud mit NVIDIA H100 Tensor Core GPUs ermöglichen es Organisationen, die Technologie der retrieval-augmented generation in ihre vor Ort befindlichen Umgebungen zu bringen. Die neuen Server führen die A3-VM-Familie ein, die für den NVIDIA-NVLink-Interconnect optimiert ist und schnelleres geteiltes Rechnen und Speichern für AI-Workloads unterstützt. Die GDC-gen-AI-Suchlösung ist eine sofort einsetzbare, vor Ort arbeitende konversationale Suchlösung auf Basis des Gemma-2-LLM mit 9 Milliarden Parametern. Diese Lösung ermöglicht es Organisationen, empfindliche vor Ort befindliche Daten einfach zu importieren und relevante Informationen per natürlichsprachlicher Suche zu finden, während Suchanfragen und Daten vor Ort bleiben. Die GDC-gen-AI-Suchlösung basiert auf einer RAG-Architektur, um traditionelle Suche und generative AI-Vorteile zu kombinieren, und enthält Integrationen mit Vertex-AI-vortrainierten-APIs und dem AlloyDB-Omni-Datenbankdienst. Organisationen können diese Lösung nach ihren Bedürfnissen anpassen und Komponenten austauschen, wenn nötig. Um am GDC-gen-AI-Suchlösung-Vorschau teilzunehmen, können Organisationen ihren Google-Kontaktvertreter kontaktieren, benötigen jedoch eine GDC-Bereitstellung, um den Vorschau zu deployen und zu betreiben. Die GDC-gen-AI-Suchlösung zielt darauf ab, wie Organisationen Informationen abrufen und multimodale und multilinguale natürlichsprachliche Sucherfahrungen über Text-, Bild-, Sprach- und Videodaten schaffen.
cloud.google.com
Find sensitive data faster (but safely) with Google Distributed Cloud’s gen AI search solution
bsky.app
AI and ML News on Bluesky @ai-news.at.thenote.app
Create attached notes ...