기댓값과 긴 반복
우연이 지배하는 일에는 묘한 이중성이 있다. 한 번의 결과는 도무지 알 수 없는데, 같은 일을 아주 여러 번 되풀이하면 전체의 모습은 또렷이 가늠된다는 것이다. 이 긴 반복의 평균이 향하는 자리를 기댓값이라 부른다. … Read more
가능성과 오차 사이
가능성과 오차 사이
우연이 지배하는 일에는 묘한 이중성이 있다. 한 번의 결과는 도무지 알 수 없는데, 같은 일을 아주 여러 번 되풀이하면 전체의 모습은 또렷이 가늠된다는 것이다. 이 긴 반복의 평균이 향하는 자리를 기댓값이라 부른다. … Read more
불확실성의 모형
어떤 데이터든 그 안에는 두 가지가 섞여 있다. 진짜 규칙과 우연한 들쭉날쭉함이다. 앞의 것을 신호, 뒤의 것을 잡음이라 부른다. 데이터를 다루는 일의 많은 부분이 이 둘을 가려내는 데 있다. 잡음을 신호로 착각하면 … Read more
불확실성의 모형
우리는 살면서 끊임없이 마음을 고쳐먹는다. 어떤 일을 반신반의하다가 새 소식을 듣고 더 믿거나 덜 믿게 된다. 이렇게 새로운 정보가 들어올 때 믿음을 어떻게 고쳐야 하는가를 또렷한 셈으로 다듬은 것이, 십팔 세기의 한 … Read more
언어와 데이터
요즘 화제가 되는 언어 기술의 바탕에는 뜻밖에도 단순한 일이 깔려 있다. 앞에 놓인 말들을 보고 다음에 올 말을 가늠하는 일이다. 빈칸 채우기 놀이와 다르지 않다. 그런데 이 단순한 일을 아주 잘하게 되면, … Read more
언어와 데이터
단어의 뜻을 좌표로 바꾼다는 생각을 좌표가 된 의미에서 소개했다. 비슷한 자리에 쓰이는 말은 비슷한 좌표를 갖고, 그래서 뜻이 가까운 단어들이 한 공간에서 가까이 모인다는 이야기였다. 이 글은 그 생각을 한 걸음 더 … Read more