파이썬으로 데이터 분석하기: 피벗 테이블 활용
데이터 분석은 현대 사회에서 매우 중요한 역할을 맡고 있습니다. 이를 위해 파이썬은 많은 데이터 분석가들에게 선택되는 언어 중 하나입니다. 파이썬은 직관적이고 강력한 라이브러리들을 제공하여 데이터 분석 작업을 효율적으로 수행할 수 있습니다. 이번 포스팅에서는 파이썬에서 흔히 사용되는 데이터 분석 작업 중 하나인 피벗 테이블(Pivot Table)에 대해 알아보겠습니다.
1. 피벗 테이블이란?
- 피벗 테이블은 엑셀의 피벗 테이블과 유사한 개념으로, 데이터를 조직화 및 요약하는 데 사용됩니다. 피벗 테이블은 데이터에 대한 다양한 요약 통계를 목적에 따라 확인하고 분석할 수 있는 기능을 제공합니다.
- 파이썬에서는 pandas 라이브러리를 통해 피벗 테이블을 구현할 수 있습니다. pandas는 파이썬에서 데이터 처리와 분석을 위한 가장 인기 있는 라이브러리 중 하나로, 다양한 데이터 구조와 기능을 제공합니다.
2. 피벗 테이블의 활용
- 피벗 테이블은 데이터 분석 작업에서 다양한 활용 방법이 있습니다. 주로 다음과 같은 분석 작업에 사용됩니다.
- 데이터 요약: 피벗 테이블을 사용하여 데이터를 한 눈에 볼 수 있는 형태로 요약할 수 있습니다. 예를 들어, 어떤 지역에서 어떤 상품이 얼마나 팔렸는지를 한 눈에 확인할 수 있습니다.
- 데이터 필터링: 피벗 테이블을 사용하여 데이터를 필터링할 수 있습니다. 원하는 조건을 설정하여 특정 범위의 데이터만 확인할 수 있습니다.
- 데이터 그룹화: 피벗 테이블을 사용하여 데이터를 그룹화할 수 있습니다. 예를 들어, 날짜별로 매출액을 확인하고 싶은 경우, 날짜를 기준으로 그룹화하여 확인할 수 있습니다.
- 데이터 정렬: 피벗 테이블을 사용하여 데이터를 정렬할 수 있습니다. 정렬 기준에 따라 데이터를 오름차순이나 내림차순으로 정렬할 수 있습니다.
3. 피벗 테이블 예제
- 이제 pandas를 사용하여 실제 데이터에서 피벗 테이블을 구현하는 예제를 살펴보겠습니다.
```python import pandas as pd
데이터 생성
data = { 'Region': ['East', 'West', 'North', 'South', 'East', 'West', 'North', 'South'], 'Product': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'Sales': [100, 200, 150, 300, 250, 150, 200, 100] } df = pd.DataFrame(data)
피벗 테이블 생성
pivottable = pd.pivottable(df, values='Sales', index='Region', columns='Product', aggfunc='sum')
print(pivot_table) ```
위 예제에서는 간단한 데이터를 생성하고, 이를 피벗 테이블로 변환하여 출력하는 과정을 보여줍니다. 결과는 다음과 같이 나타납니다.
plaintext
Product A B
Region
East 100 250
North 150 200
South 300 100
West 200 150
위 결과를 보면 각 지역별로 상품 A와 B의 판매량을 확인할 수 있습니다.
4. 예제 설명 및 결과 해석
- 예제에서 사용한 데이터는 지역, 상품, 판매량으로 이루어져 있습니다.
- 피벗 테이블을 생성할 때,
values
인자에는 테이블에 표시되는 데이터(판매량)을 지정합니다. index
인자에는 테이블의 행 인덱스를 지정하고,columns
인자에는 테이블의 열 인덱스를 지정합니다.aggfunc
인자에는 데이터를 어떻게 집계할지를 지정합니다. 이 예제에서는 판매량을 합산하여 표시하도록 하였습니다.
위 예제 결과를 해석해보면, East 지역에서는 상품 A의 판매량이 100, 상품 B의 판매량이 250입니다. North 지역은 상품 A의 판매량이 150, 상품 B의 판매량이 200입니다.
5. 결론
- 파이썬의 pandas 라이브러리를 통해 피벗 테이블을 활용해보았습니다. 피벗 테이블은 데이터 분석 작업에서 매우 유용하게 사용될 수 있으며, 데이터를 요약하고 필터링하며 그룹화하고 정렬할 수 있는 기능을 제공합니다. 데이터 분석가들에게는 피벗 테이블을 잘 활용하는 것이 매우 중요합니다.
'■ 칼퇴를 위한 파이썬 : 사례' 카테고리의 다른 글
파이썬으로 웹 스크래핑하기: 정규식 활용 (0) | 2023.07.15 |
---|---|
파이썬으로 딥러닝하기: 컨볼루션 신경망(CNN) 기초 (0) | 2023.07.15 |
파이썬으로 웹 애플리케이션 개발하기: Django를 활용한 캐싱 기법 (0) | 2023.07.15 |
파이썬으로 데이터 시각화하기: NetworkX 기초 (0) | 2023.07.15 |
파이썬으로 딥러닝하기: TensorFlow 소개 (0) | 2023.07.15 |