본문 바로가기
■ 칼퇴를 위한 파이썬 : 사례

파이썬으로 데이터 분석하기: 피벗 테이블 활용

by 포탈메이커 2023. 7. 15.

파이썬으로 데이터 분석하기: 피벗 테이블 활용

데이터 분석은 현대 사회에서 매우 중요한 역할을 맡고 있습니다. 이를 위해 파이썬은 많은 데이터 분석가들에게 선택되는 언어 중 하나입니다. 파이썬은 직관적이고 강력한 라이브러리들을 제공하여 데이터 분석 작업을 효율적으로 수행할 수 있습니다. 이번 포스팅에서는 파이썬에서 흔히 사용되는 데이터 분석 작업 중 하나인 피벗 테이블(Pivot Table)에 대해 알아보겠습니다.

1. 피벗 테이블이란?

  • 피벗 테이블은 엑셀의 피벗 테이블과 유사한 개념으로, 데이터를 조직화 및 요약하는 데 사용됩니다. 피벗 테이블은 데이터에 대한 다양한 요약 통계를 목적에 따라 확인하고 분석할 수 있는 기능을 제공합니다.
  • 파이썬에서는 pandas 라이브러리를 통해 피벗 테이블을 구현할 수 있습니다. pandas는 파이썬에서 데이터 처리와 분석을 위한 가장 인기 있는 라이브러리 중 하나로, 다양한 데이터 구조와 기능을 제공합니다.

2. 피벗 테이블의 활용

  • 피벗 테이블은 데이터 분석 작업에서 다양한 활용 방법이 있습니다. 주로 다음과 같은 분석 작업에 사용됩니다.
    • 데이터 요약: 피벗 테이블을 사용하여 데이터를 한 눈에 볼 수 있는 형태로 요약할 수 있습니다. 예를 들어, 어떤 지역에서 어떤 상품이 얼마나 팔렸는지를 한 눈에 확인할 수 있습니다.
    • 데이터 필터링: 피벗 테이블을 사용하여 데이터를 필터링할 수 있습니다. 원하는 조건을 설정하여 특정 범위의 데이터만 확인할 수 있습니다.
    • 데이터 그룹화: 피벗 테이블을 사용하여 데이터를 그룹화할 수 있습니다. 예를 들어, 날짜별로 매출액을 확인하고 싶은 경우, 날짜를 기준으로 그룹화하여 확인할 수 있습니다.
    • 데이터 정렬: 피벗 테이블을 사용하여 데이터를 정렬할 수 있습니다. 정렬 기준에 따라 데이터를 오름차순이나 내림차순으로 정렬할 수 있습니다.

3. 피벗 테이블 예제

  • 이제 pandas를 사용하여 실제 데이터에서 피벗 테이블을 구현하는 예제를 살펴보겠습니다.

```python import pandas as pd

데이터 생성

data = { 'Region': ['East', 'West', 'North', 'South', 'East', 'West', 'North', 'South'], 'Product': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'Sales': [100, 200, 150, 300, 250, 150, 200, 100] } df = pd.DataFrame(data)

피벗 테이블 생성

pivottable = pd.pivottable(df, values='Sales', index='Region', columns='Product', aggfunc='sum')

print(pivot_table) ```

위 예제에서는 간단한 데이터를 생성하고, 이를 피벗 테이블로 변환하여 출력하는 과정을 보여줍니다. 결과는 다음과 같이 나타납니다.

plaintext Product A B Region East 100 250 North 150 200 South 300 100 West 200 150

위 결과를 보면 각 지역별로 상품 A와 B의 판매량을 확인할 수 있습니다.

4. 예제 설명 및 결과 해석

  • 예제에서 사용한 데이터는 지역, 상품, 판매량으로 이루어져 있습니다.
  • 피벗 테이블을 생성할 때, values 인자에는 테이블에 표시되는 데이터(판매량)을 지정합니다.
  • index 인자에는 테이블의 행 인덱스를 지정하고, columns 인자에는 테이블의 열 인덱스를 지정합니다.
  • aggfunc 인자에는 데이터를 어떻게 집계할지를 지정합니다. 이 예제에서는 판매량을 합산하여 표시하도록 하였습니다.

위 예제 결과를 해석해보면, East 지역에서는 상품 A의 판매량이 100, 상품 B의 판매량이 250입니다. North 지역은 상품 A의 판매량이 150, 상품 B의 판매량이 200입니다.

5. 결론

  • 파이썬의 pandas 라이브러리를 통해 피벗 테이블을 활용해보았습니다. 피벗 테이블은 데이터 분석 작업에서 매우 유용하게 사용될 수 있으며, 데이터를 요약하고 필터링하며 그룹화하고 정렬할 수 있는 기능을 제공합니다. 데이터 분석가들에게는 피벗 테이블을 잘 활용하는 것이 매우 중요합니다.