Ch.1 Python 라이브러리 15선
pandas — 데이터 분석
핵심 개념
pandas
데이터 분석용 Python 라이브러리
DataFrame
행과 열로 구성된 2차원 표 형태 자료구조
핵심 내용
pandas는 파이썬의 엑셀입니다
한 줄 요약: CSV, 엑셀 파일을 읽어서 필터·정렬·합계를 코드 한 줄로 처리하는 데이터 분석 라이브러리. 실생활 비유: 엑셀에서 마우스로 드래그해서 필터 걸고, 피벗 테이블 만들고, VLOOKUP 쓰는 작업을 코드 한 줄로 끝내는 '자동화된 엑셀 고수'라고 생각하세요.
수작업 30분 → 코드 3초
수동 (엑셀): 파일 열기 → 필터 설정 → 피벗 테이블 → 복사 붙여넣기 → 서식 맞추기. 파일이 10개면 10번 반복.
코드 (pandas): df = pd.read_excel('매출.xlsx')
df.groupby('지역')['매출'].sum()
끝. 파일 100개도 for문 하나.
터미널에 한 줄이면 설치 끝
pip install pandas openpyxlimport pandas as pd
df = pd.read_excel('매출.xlsx')
print(df.head())실행 결과: 엑셀 파일의 처음 5줄이 표 형태로 출력됩니다. 열 이름, 데이터 타입까지 자동으로 인식해줍니다.
AI에게 이렇게 요청하세요
좋은 프롬프트 예시 "매출.xlsx 파일을 읽어서 '지역' 열 기준으로 그룹화하고, 각 지역의 매출 합계를 구한 뒤 내림차순으로 정렬해서 result.xlsx로 저장해줘. pandas 써줘."
프롬프트 변형 • "매출이 100만 원 이상인 행만 필터링해줘" • "월별 평균 매출을 막대 그래프로 그려줘" • "두 개 엑셀 파일을 하나로 합쳐줘"
import pandas as pd
df = pd.read_excel('매출.xlsx')
result = df.groupby('지역')['매출'].sum()
result = result.sort_values(ascending=False)
result.to_excel('result.xlsx')
print(result)카페 매출 분석 미니 프로젝트
import pandas as pd
# 샘플 데이터 생성
data = {
'메뉴': ['아메리카노', '라떼', '아메리카노', '라떼', '모카', '모카'],
'수량': [50, 30, 45, 25, 20, 15],
'단가': [4500, 5000, 4500, 5000, 5500, 5500],
}
df = pd.DataFrame(data)
# 매출 계산
df['매출'] = df['수량'] * df['단가']
# 메뉴별 총 매출
summary = df.groupby('메뉴')['매출'].sum().sort_values(ascending=False)
print(summary)실행 방법: 위 코드를 .py 파일로 저장하고 터미널에서 `python 파일이름.py` 실행. 메뉴별 매출 합계가 내림차순으로 출력됩니다.
Pandas의 핵심 데이터 구조 중 2차원 테이블 형태인 것은?
핵심 용어
pandas
데이터 분석용 Python 라이브러리
DataFrame
행과 열로 구성된 2차원 표 형태 자료구조
📊 매출 분석
지역별·월별 매출 합계, 평균, 순위를 한 번에 계산
🧹 데이터 정리
중복 제거, 빈 칸 채우기, 열 이름 바꾸기
📈 보고서 자동화
분석 결과를 새 엑셀 파일로 저장해서 매주 자동 생성
핵심 정리
- 1pandas는 파이썬에서 엑셀 데이터를 다루는 핵심 라이브러리
- 2read_excel()로 읽고, groupby()로 집계하고, to_excel()로 저장
- 3수작업 30분 → 코드 3초로 데이터 분석 자동화
- 4AI 프롬프트에 '파일명 + 원하는 분석 + pandas'를 명시하면 정확한 코드 생성
퀴즈와 인터랙션으로 더 깊이 학습하세요
play_circle인터랙티브 레슨 시작