Ch.1 Python 라이브러리 15선

pandas — 데이터 분석

lightbulb

핵심 개념

pandas

데이터 분석용 Python 라이브러리

DataFrame

행과 열로 구성된 2차원 표 형태 자료구조


article

핵심 내용

pandas는 파이썬의 엑셀입니다

한 줄 요약: CSV, 엑셀 파일을 읽어서 필터·정렬·합계를 코드 한 줄로 처리하는 데이터 분석 라이브러리. 실생활 비유: 엑셀에서 마우스로 드래그해서 필터 걸고, 피벗 테이블 만들고, VLOOKUP 쓰는 작업을 코드 한 줄로 끝내는 '자동화된 엑셀 고수'라고 생각하세요.

수작업 30분 → 코드 3초

수동 (엑셀): 파일 열기 → 필터 설정 → 피벗 테이블 → 복사 붙여넣기 → 서식 맞추기. 파일이 10개면 10번 반복.

코드 (pandas): df = pd.read_excel('매출.xlsx')

df.groupby('지역')['매출'].sum()

끝. 파일 100개도 for문 하나.

터미널에 한 줄이면 설치 끝

pip install pandas openpyxl
import pandas as pd
df = pd.read_excel('매출.xlsx')
print(df.head())

실행 결과: 엑셀 파일의 처음 5줄이 표 형태로 출력됩니다. 열 이름, 데이터 타입까지 자동으로 인식해줍니다.

AI에게 이렇게 요청하세요

좋은 프롬프트 예시 "매출.xlsx 파일을 읽어서 '지역' 열 기준으로 그룹화하고, 각 지역의 매출 합계를 구한 뒤 내림차순으로 정렬해서 result.xlsx로 저장해줘. pandas 써줘."

프롬프트 변형 • "매출이 100만 원 이상인 행만 필터링해줘" • "월별 평균 매출을 막대 그래프로 그려줘" • "두 개 엑셀 파일을 하나로 합쳐줘"

import pandas as pd

df = pd.read_excel('매출.xlsx')
result = df.groupby('지역')['매출'].sum()
result = result.sort_values(ascending=False)
result.to_excel('result.xlsx')
print(result)

카페 매출 분석 미니 프로젝트

import pandas as pd

# 샘플 데이터 생성
data = {
    '메뉴': ['아메리카노', '라떼', '아메리카노', '라떼', '모카', '모카'],
    '수량': [50, 30, 45, 25, 20, 15],
    '단가': [4500, 5000, 4500, 5000, 5500, 5500],
}
df = pd.DataFrame(data)

# 매출 계산
df['매출'] = df['수량'] * df['단가']

# 메뉴별 총 매출
summary = df.groupby('메뉴')['매출'].sum().sort_values(ascending=False)
print(summary)

실행 방법: 위 코드를 .py 파일로 저장하고 터미널에서 `python 파일이름.py` 실행. 메뉴별 매출 합계가 내림차순으로 출력됩니다.

Pandas의 핵심 데이터 구조 중 2차원 테이블 형태인 것은?

key

핵심 용어

🐼

pandas

데이터 분석용 Python 라이브러리

📊

DataFrame

행과 열로 구성된 2차원 표 형태 자료구조

📊 매출 분석

지역별·월별 매출 합계, 평균, 순위를 한 번에 계산

🧹 데이터 정리

중복 제거, 빈 칸 채우기, 열 이름 바꾸기

📈 보고서 자동화

분석 결과를 새 엑셀 파일로 저장해서 매주 자동 생성

check_circle

핵심 정리

  • 1pandas는 파이썬에서 엑셀 데이터를 다루는 핵심 라이브러리
  • 2read_excel()로 읽고, groupby()로 집계하고, to_excel()로 저장
  • 3수작업 30분 → 코드 3초로 데이터 분석 자동화
  • 4AI 프롬프트에 '파일명 + 원하는 분석 + pandas'를 명시하면 정확한 코드 생성

퀴즈와 인터랙션으로 더 깊이 학습하세요

play_circle인터랙티브 레슨 시작