통합 요약노트
Ch.4 벡터와 행렬 — 의미를 수학으로
단어를 벡터로, 벡터를 행렬로 — AI가 의미를 이해하는 방식을 배웁니다.
이 챕터의 내용
1
벡터란? — King - Man + Woman = Queen
벡터 — AI가 단어의 의미를 숫자로 표현하는 핵심 도구입니다. LLM 파이프라인의 첫 번째 관문이죠.
벡터는 크기와 방향을 가진 숫자들의 나열입니다
[3, 4]는 '오른쪽 3, 위로 4' 만큼의 이동입니다
AI에서는 수백~수천 차원의 벡터를 사용합니다
- 벡터 = 크기와 방향을 가진 숫자 나열
- 임베딩 = 단어를 벡터로 변환하는 것
- King - Man + Woman ≈ Queen — 벡터 연산으로 의미 관계 포착
2
코사인 유사도 — 단어 거리 측정
코사인 유사도 — 두 벡터가 이루는 각도로 유사성을 측정하는 방법입니다.
두 벡터가 같은 방향을 가리키면 유사도는 1에 가깝습니다
코사인 유사도는 두 벡터 사이의 각도(θ)를 측정합니다
0° → cos=1 (동일), 90° → cos=0 (무관)
- 코사인 유사도 = 두 벡터 사이의 각도 기반 유사성 측정
- 1이면 동일, 0이면 무관, -1이면 반대
- 히트맵으로 여러 단어 간 유사도를 한눈에 파악
3
행렬 연산 — AI의 핵심 도구
행렬 연산 — 수백만 개의 숫자를 한 번에 처리하는 AI의 핵심 엔진입니다.
행렬은 숫자를 행과 열로 배열한 직사각형 표입니다
벡터가 1차원이라면, 행렬은 2차원 숫자 표입니다
3×4 행렬 = 3행 4열 = 12개 숫자
- 벡터 = 숫자 나열, 임베딩 = 단어→벡터 변환
- 코사인 유사도로 벡터 간 의미 유사성 측정
- 행렬 곱셈 = AI의 기본 연산, (m×n)·(n×p)=(m×p)
- NumPy는 순수 Python보다 수천 배 빠른 행렬 연산 제공
key
핵심 용어 모음
➡️
벡터
크기와 방향을 가진 수의 배열, 의미를 숫자로 표현
🎯
임베딩
단어·문장을 고정 길이 벡터로 변환하는 것
📐
코사인 유사도
두 벡터 사이의 각도로 유사성을 측정하는 방법
🔢
행렬
숫자를 2차원 격자로 배열한 것, AI 가중치의 기본 단위
🧮
텐서
다차원 배열을 GPU에서 효율적으로 연산할 수 있게 만든 자료구조
퀴즈와 인터랙션으로 더 깊이 학습하세요
play_circle인터랙티브 코스 시작하기