본문으로 건너뛰기
Margin

가능성과 오차 사이

최근 노트

갈래

가능성과 오차 사이

예측과 한계

회귀, 점들 사이를 가르는 선

한 도시의 집값과 그 집의 면적을 적은 자료가 있다. 두 자료를 좌표 위에 점으로 찍으면 막연한 무리가 그려진다. 면적이 클수록 값도 비싼 경향이 또렷이 보이지만, 점들은 일정한 선 위에 있지 않고 흩어져 … Read more

노트 모음

언어와 데이터

엔트로피, 모름의 양을 재는 셈

어떤 일을 두고 얼마나 모르는지를 셈으로 잴 수 있을까. 모름이라는 것을 마치 길이나 무게처럼 한 숫자로 적을 수 있을까. 놀랍게도 그런 셈이 있고, 그 셈은 정보를 다루는 학문의 가장 깊은 자리에 놓여 … Read more

예측과 한계

과적합, 잘 외우고 못 일반화하는 일

한 학생이 시험 공부를 한다. 기출 문제 백 개를 풀고 또 풀어 모든 답을 외운다. 같은 문제를 다시 풀면 만점이다. 그런데 새 시험에서 표현만 조금 바뀐 문제가 나오자 손이 멈춘다. 답을 외웠을 … Read more

불확실성의 모형

마르코프 체인, 다음만 보는 셈

날씨를 가늠하는 가장 단순한 방법을 떠올려 보자. 오늘 비가 왔다면 내일도 비가 올 가능성이 조금 높고, 오늘 맑았다면 내일도 맑을 가능성이 조금 높다. 그저께가 어땠는지는 따지지 않는다. 어제도 따지지 않는다. 오로지 오늘의 … Read more

언어와 데이터

어텐션, 모델이 문장에서 무엇을 보는가

요즘 언어 모델 이야기를 하면 어김없이 나오는 말이 어텐션이다. 영어 단어 그대로 옮기면 주의나 주목쯤 된다. 모델이 어떤 문장을 다룰 때 그 안의 어느 부분에 더 무게를 두고 보는지를 정하는 장치, 그것이 … Read more

언어와 데이터

토큰, 기계가 글을 쪼개는 단위

요즘 화제가 되는 언어 모델에 관해 이야기할 때 토큰이라는 말이 자주 들린다. 한 모델이 한 번에 다룰 수 있는 글의 길이를 토큰의 수로 잰다고도 하고, 모델을 쓸 때 든 비용을 토큰 단위로 … Read more

불확실성의 모형

상관과 인과, 함께 움직임의 함정

여름이 깊어지면 아이스크림이 잘 팔린다. 그리고 같은 시기에 물놀이 사고와 익사 사건이 늘어난다. 두 자료를 나란히 놓고 보면 분명한 함께 움직임이 보인다. 아이스크림 판매가 늘어난 달에는 익사 사고도 많고, 줄어든 달에는 사고도 … Read more

불확실성의 모형

표본과 모집단, 일부로 전체를 가늠하기

선거가 다가오면 늘 같은 일이 일어난다. 어느 조사 기관에서 천 명을 뽑아 의향을 물어보고는, 오천만 명이 사는 나라 전체의 마음을 가늠한다. 그리고 더 놀라운 일은, 그 가늠이 자주 맞는다는 사실이다. 어떻게 천 … Read more

불확실성의 모형

정규분포, 종 모양 곡선의 정체

자연을 가만히 들여다보면 묘한 일이 자주 눈에 띈다. 사람의 키를 잰 자료, 한 학교 학생들의 시험 점수, 공장에서 같은 부품을 깎아 만든 길이의 미세한 어긋남, 같은 저울로 같은 물건을 여러 번 잰 … Read more

예측과 한계

기댓값과 긴 반복

우연이 지배하는 일에는 묘한 이중성이 있다. 한 번의 결과는 도무지 알 수 없는데, 같은 일을 아주 여러 번 되풀이하면 전체의 모습은 또렷이 가늠된다는 것이다. 이 긴 반복의 평균이 향하는 자리를 기댓값이라 부른다. … Read more