RSS 행성 파이썬

실제 파이썬: 판다스 그룹바이 - 파이썬에서 데이터 그룹화에 대한 가이드

파이썬에서 pandas의 .groupby() 메서드는 열 값에 따라 DataFrame을 그룹으로 나누고, 각 그룹에 함수를 적용하고, 결과를 새로운 DataFrame으로 결합하여 데이터셋을 분석하고 변환하는 데 사용됩니다. 이 기술은 집계, 필터링 및 그룹화된 데이터의 변환과 같은 작업에 필수적입니다. .groupby() 메서드는 단일 열 또는 열 이름의 목록을 전달하여 여러 열로 그룹화할 수 있습니다. pandas의 일반적인 집계 방법에는 .sum(), .mean(), .count()가 포함됩니다. 또한 pandas .groupby()와 함께 사용자 지정 함수를 사용하여 그룹에 특정 작업을 수행할 수도 있습니다. 이 튜토리얼은 pandas에 대한 이전 경험이 있다고 가정하고, 연습을 위해 U.S. Congress 데이터셋, 대기질 데이터셋 및 뉴스 애그리게이터 데이터셋을 제공합니다. 따라서 최신 버전의 pandas를 새 가상 환경에 설치하고 데이터셋을 다운로드하여 따라갈 수 있습니다. 데이터셋은 .zip 파일로 다운로드하여 현재 디렉터리의 groupby-data/ 폴더에 압축을 풀 수 있습니다. 이 튜토리얼에서는 이러한 데이터셋을 사용하여 .groupby()의 기능을 보여줄 것입니다. 첫 번째 예에서는 U.S. Congress 데이터셋을 사용하여, 역사적인 의회 회원의 공공 정보를 포함하고, read_csv()를 사용하여 CSV 파일을 pandas DataFrame으로 읽는 방법을 보여줍니다.
favicon
realpython.com
Real Python: pandas GroupBy: Your Guide to Grouping Data in Python