본문으로 건너뛰기
Margin

가능성과 오차 사이

최근 노트

갈래

가능성과 오차 사이

예측과 한계

기댓값과 긴 반복

우연이 지배하는 일에는 묘한 이중성이 있다. 한 번의 결과는 도무지 알 수 없는데, 같은 일을 아주 여러 번 되풀이하면 전체의 모습은 또렷이 가늠된다는 것이다. 이 긴 반복의 평균이 향하는 자리를 기댓값이라 부른다. … Read more

노트 모음

불확실성의 모형

신호와 잡음, 데이터에서 진짜를 가리기

어떤 데이터든 그 안에는 두 가지가 섞여 있다. 진짜 규칙과 우연한 들쭉날쭉함이다. 앞의 것을 신호, 뒤의 것을 잡음이라 부른다. 데이터를 다루는 일의 많은 부분이 이 둘을 가려내는 데 있다. 잡음을 신호로 착각하면 … Read more

불확실성의 모형

믿음을 고치는 셈, 베이즈의 생각

우리는 살면서 끊임없이 마음을 고쳐먹는다. 어떤 일을 반신반의하다가 새 소식을 듣고 더 믿거나 덜 믿게 된다. 이렇게 새로운 정보가 들어올 때 믿음을 어떻게 고쳐야 하는가를 또렷한 셈으로 다듬은 것이, 십팔 세기의 한 … Read more

언어와 데이터

언어 모델은 어떻게 다음 단어를 고르나

요즘 화제가 되는 언어 기술의 바탕에는 뜻밖에도 단순한 일이 깔려 있다. 앞에 놓인 말들을 보고 다음에 올 말을 가늠하는 일이다. 빈칸 채우기 놀이와 다르지 않다. 그런데 이 단순한 일을 아주 잘하게 되면, … Read more

언어와 데이터

단어를 좌표로, 의미의 기하학

단어의 뜻을 좌표로 바꾼다는 생각을 좌표가 된 의미에서 소개했다. 비슷한 자리에 쓰이는 말은 비슷한 좌표를 갖고, 그래서 뜻이 가까운 단어들이 한 공간에서 가까이 모인다는 이야기였다. 이 글은 그 생각을 한 걸음 더 … Read more