Alors que l'analyse des données évolue, les outils traditionnels tels que SQL rencontrent des limites. BigQuery DataFrames, une nouvelle bibliothèque open source, allie la flexibilité de Python et l'évolutivité de BigQuery, permettant ainsi l'analyse de données à grande échelle.
BigQuery DataFrames unifie l'entrée/sortie des données, la manipulation des données et la transition transparente vers des pandas. Il améliore également les capacités ML de BigQuery via son API ML, offrant des fonctions Python évolutives, un déploiement de fonctions à distance et une intégration à Vertex AI.
BigQuery DataFrames s'intègre à des outils tiers tels que Hex et Deepnote, fournissant une prise en charge polyglotte et une analyse interactive des données. Il simplifie le transfert entre BigQuery et Vertex AI SDK, éliminant ainsi le besoin de déplacer manuellement les données.
Avec BigQuery DataFrames, les développeurs peuvent utiliser Python pour traiter les données directement dans BigQuery, tirant parti de l'évolutivité du cloud. Il offre une API Python familière pour l'analyse exploratoire des données et la manipulation complexe des données.
BigQuery DataFrames permet la formation ML à grande échelle, le déploiement de fonctions à distance et l'intégration à Vertex AI. Il fournit une interface accessible en Python pour BigQuery ML, rationalisant les projets d'IA générative et intégrant les modèles de base de Vertex AI.
En déchargeant le traitement Python sur le cloud, BigQuery DataFrames permet des déploiements de production transparents, facilitant ainsi le passage de l'analyse des données aux pipelines d'IA. Il exploite le modèle d'autorisation utilisateur de BigQuery, permettant aux développeurs Python d'utiliser leurs compétences au sein de BigQuery.
BigQuery DataFrames est disponible dans un package unifié qui peut être facilement installé et utilisé dans divers environnements Python, notamment les notebooks Jupyter, BigQuery Studio et Colab Enterprise. Il fournit une API Python unifiée sur le stockage géré de BigQuery et les tables BigLake, évoluant automatiquement pour gérer des ensembles de données volumineux.
cloud.google.com
Build AI/ML and generative AI applications in Python with BigQuery DataFrames
Create attached notes ...
