topic★★★★★난이도
pandas — 코드로 쓰는 엑셀
CSV·엑셀 파일을 읽어서 필터·정렬·그룹핑·합계를 코드 한 줄로 처리하는 데이터 분석 라이브러리.
#pandas#DataFrame#데이터분석#CSV
왜 배우는가
엑셀로 하루 걸리던 데이터 정리를 pandas 코드 10줄이면 끝낸다. 데이터 분석·자동화의 출발점이다.
pandas는 코드로 조작하는 엑셀이다. 엑셀 시트처럼 행과 열로 된 표(DataFrame)를 만들고, 필터·정렬·집계를 메서드 체이닝으로 처리한다.
| 용도 | 설명 |
|---|---|
| `pd.read_csv()` | CSV 파일을 DataFrame으로 읽기 |
| `df.groupby()` | 특정 열 기준으로 그룹핑 후 합계·평균 |
| `df.merge()` | 두 DataFrame을 공통 열 기준으로 합치기 (엑셀 VLOOKUP) |
| `df.to_excel()` | 결과를 엑셀 파일로 저장 |
| `df.describe()` | 기초 통계량 한눈에 보기 |
pip install pandas로 설치 후, read_csv로 파일을 읽고 groupby로 집계한다. 조건 필터링은 대괄호 안에 조건식을 넣으면 된다.
Claude Code에서 "이 CSV 파일을 읽어서 부서별 평균 매출을 구해줘"라고 지시하면 pandas 코드를 자동 생성한다. 데이터 파일 경로만 정확히 알려주면 된다.