데이터 분석이 발전하면서 SQL과 같은 기존 도구는 한계에 직면합니다. 새로운 오픈소스 라이브러리인 BigQuery DataFrames는 Python의 유연성과 BigQuery의 확장성을 결합하여 대규모 데이터 분석을 가능하게 합니다.
BigQuery DataFrames는 데이터 입출력, 데이터 조작, 팬더스로의 원활한 전환을 통합합니다. 또한 ML API를 통해 BigQuery의 ML 기능을 강화하고, 확장 가능한 Python 함수, 원격 함수 배포, Vertex AI와의 통합을 제공합니다.
BigQuery DataFrames는 Hex 및 Deepnote와 같은 타사 도구와 통합되어 다국어 지원 및 대화형 데이터 분석을 제공합니다. BigQuery와 Vertex AI SDK 간의 핸드오프를 간소화하여 수동 데이터 이동의 필요성을 없앱니다.
BigQuery DataFrames를 사용하면 개발자는 Python을 사용하여 클라우드의 확장성을 활용하여 BigQuery에서 직접 데이터를 처리할 수 있습니다. 탐색적 데이터 분석 및 복잡한 데이터 조작을 위한 친숙한 Python API를 제공합니다.
BigQuery DataFrames는 대규모 ML 트레이닝, 원격 함수 배포, Vertex AI와의 통합을 지원합니다. BigQuery ML에 Python 액세스 가능한 인터페이스를 제공하고, 생성적 AI 프로젝트를 간소화하고 Vertex AI의 기반 모델을 통합합니다.
BigQuery DataFrames는 Python 처리를 클라우드로 오프로드함으로써 데이터 분석에서 AI 파이프라인으로의 전환을 용이하게 하여 원활한 프로덕션 배포를 가능하게 합니다. BigQuery의 사용자 권한 모델을 활용하여 Python 개발자가 BigQuery 내에서 자신의 기술을 사용할 수 있습니다.
BigQuery DataFrames는 단일 패키지로 제공되며 Jupyter 노트북, BigQuery Studio, Colab Enterprise를 포함한 다양한 Python 환경에 쉽게 설치하여 사용할 수 있습니다. BigQuery의 관리형 스토리지와 BigLake 테이블 기반에서 통합 Python API를 제공하며, 대규모 데이터셋을 처리하도록 자동으로 확장됩니다.
cloud.google.com
Build AI/ML and generative AI applications in Python with BigQuery DataFrames
