기본 콘텐츠로 건너뛰기

세상에서 가장 쉬운 통계학입문 - 나는 어렵다


현대 사회가 복자해졌다. 그 이유는 어떻게 보면 단순하다. 인간이 많아졌다. 딱 10명만 인류가 존재하면 데이터는 크게 필요없다. 보기만해도 충분히 예측할 수 있게 통계를 내지 않아도 판단내리기 쉽다. 점점 인류는 인구가 증가하며 예측할 수 없게 되었다. 큰 범위에서는 알 수도 있다. 페루에는 '나스카의 지상화'가 존재한다. 지상에서 아무리 보고 싶어도 나스카의 지상화를 제대로 감상할 수 없다. 워낙 거대한 그림이 연결되어 있어 연속성을 갖고 있는 그림의 일부라는 것을 모른다.

하지만, 하늘 위에서 전체 모습을 보게 되면 드디어 보이게 된다. 이처럼 통계는 개별 움직임은 무작위로 보이며 어떤 패턴도 알기 힘들지만 이들을 묶고 합치고 나누다보면 특정 패턴을 볼 수 있다. 인간들은 자신은 의식하지 못하지만 특정한 행동을 반복적으로 하는 경우가 많다. 개별적으로 움직임을 주체적으로 한다고 생각했지만 그런 사람들끼리 모으고 그들의 공통점을 뽑아내면 패턴이 보인다. 이런 역할을 통계는 한다.

인간이 지금까지 발전할 수 있었던 것은 별 것 아닌 것에서 패턴을 발견하고 이를 적용한 결과다. 역으로 이런 패턴으로 무엇이든 적용하려는 행동이 멍청한 행동을 초래하거나 무작위인데도 특정 패턴으로 억지로 꿰어맞춰 실패한 사례도 많다. 통계가 많은 것을 보여주지만 만능은 아니라는 것이다. 더욱 재미있는 현상은 통계를 만들어 자신만 알고 있다고 얼마 지나지 않아 여러 사람이 알고 적용하며 패턴이 무의미하게 변하기도 한다.

점점 빅데이터가 중요해지고 있다. 과거와 딱히 달라 진 것이 없는데 이런 현상이 발생한 것은 기술의 발달이다. 통계를 내기위해서는 기초 데이터가 많을수록 좋다. 자연스럽게 소음이 섞이기도 하지만. 아주 적은 데이터를 갖고 통계를 낼 수밖에 없는 과거에 비해 이제는 수많은 사람들이 자발적으로 자신의 데이터를 남기고 있다. 국가에서도 관리차원에서 수없이 많은 데이터를 남겼다. 이런 데이터들이 쌓이고 쌓여 빅데이터 시대가 되었다.

어느 날 갑자기 빅데이터의 시대가 온 것은 아니지만 나도 모르는 내 행동마저도 빅 데이터로 알아낼 수 있다고 한다. 가면 갈수록 통계가 중요해지고 있다. 주식시장에서 특정 이론이 나오면 얼마 지나지 않아 그 이론만으로 투자하는 것은 무의미해진다. 무조건 적용하려고 하기 보다는 최소한 통계를 제대로 볼줄 아는 눈을 갖고 있는 것이 가장 중요하고 이를 직접 만드는 것도 중요하다. 자신이 원하는 궁금증을 해소하기 위해 직접 만는는 것만 좋은 것은 없다.
지금까지도 거의 그러지 않았지만 앞으로도 그럴 줄은 모르겠다. 대부분 내가 직접 만들기보다 남들이 만든 데이터를 읽기만 했다. 완벽하고 직접적인 데이터를 만들 능력이 없었기에 그랬고 귀찮아서 남들이 만든 데이터를 읽으며 유추하거나 사람들이 만든 더 다양한 데이터를 읽는 것으로 보완했다. 그래도 어느 정도 기본은 만들줄 알거나 해석해야 한다는 생각에 <세상에서 가장 쉬운 통계학입문>을 읽었다.

중학교 수학이면 충분히 3주 만에 끝낸다고 하니 도전해 볼 만한 욕심이 생겼다. 초반에는 다소 쉬웠다. 도수분포표를 만들어 키의 등급을 만들고 인원수(도수)를 묶고 그에 따른 상대도수로 백분율을 하고 누적도수로 구분한다. 여기까지는 계산도 필요없이 읽기만 해도 충분히 쫓아 갈 수 있었다. 그 후에 히스토그램을 만들어 보기 편하게 만들지 않았지만 그거야 엑셀로 하는 것이 어렵지 않다. 그런후 평균을 구한다. 산술평균을 대체로 구한다.

이제 편차가 나온다. 버스가 도착하는 시간은 중앙값이 있지만 정확하지 않다. 각자 도착하는 시간을 구한 후 어느 정도 편차가 나오는지 표준적인 편차를 구한다. 이제 버스가 정각에 어느 정도 오차범위 내에서 도착할 수 있다는 사실을 알게 된다. 95% 신뢰도가 무엇을 의미하는지 말한다. 동전 던지기에서 앞면이 10개 나왔다면 몇 번 던졌을까에 대한 예측을 할 수 있다. 최대에서 최소까지 범위를 대략적으로 구한다. 여기까지는 잘 쫓아갔다.

모집단의 의미까지는 이해했는데 그 다음부터는 솔직히 정신줄을 놔버렸다. 내가 중학교 몇 학년때 수학을 포기했는지 모르겠는데 그 이유가 아닐까한다. 어느 정도 통계를 읽을 때 필요한 의미정도를 알게 되었다는 데 만족해야 할 듯 하다. 지금까지도 솔직히 이 책을 읽지 않아도 통계까지는 아니라도 어느정도 발표된 자료를 이해는 했는데 직접 만들기도 해 볼까하는 마음도 있어 읽었는데 엑셀에 이런 계산이 이미 포함되어 이해만 해도 될 듯도 하다.

나온지 꽤 된 책인데 오래도록 사랑을 받고 있는 걸 보면 이쪽분야에 좋은 책이 드물다는 이야긴지, <세상에서 가장 쉬운 통계학입문>이 워낙 좋은 책인지 모르겠다. 책의 중간정도까지는 흥미롭고 읽고 후반부는 절망적으로 대강 넘겨 읽었다. 정말 오랫만에 읽었으되 읽었다고 하기 힘든 책을 만났다. 워낙 이 분야를 모르고 내가 포기한 수학도 고등(?)수학이라 앞으로도 입문으로 끝내지 않을까도 싶다. 쫓아가는 게 참 버겁다. 그래도 어쩌랴..

까칠한 핑크팬더의 한 마디 : 중학교때 난 수학을 포기했다.
친절한 핑크팬더의 한 다미 : 통계의 의미와 이해는 할 수 있다.

함께 읽을 책
왜 전문가들은 금융위기를 몰랐나? - 신호와 소음
신호와 소음 작가 네이트 실버 출판 더퀘스트 발매 2014.07.11 리뷰보기 <신호와 소음>책의 리뷰...
blog.naver.com
본문으로 이동
원화의 미래 - 놀라운 예측력
원화의 미래 작가 홍춘욱 출판 에이지21 발매 2009.11.30 리뷰보기 홍춘욱씨를 처...
blog.naver.com
본문으로 이동
넘버스, 숫자가 당신을 지배한다 - 공인된 거짓말 통계
넘버스 숫자가 당신을 지배한다 작가 카이저 펑 출판 타임북스 발매 2011.03.10 리뷰보기 헤밍웨이가 일찌기 '세상에는 세 가지 거...
blog.naver.com
본문으로 이동

댓글

이 블로그의 인기 게시물

하기 싫은 일을 하는 힘 - 받아들이기

하고 싶은 일만 하고 하기 싫은 일을 하지 않는 삶. 많은 사람들이 꿈꾸는 삶이다. 부자를 꿈꾸는 이유 중 하나도 하고 싶은 것만 할 수 있다는 착각때문이다. 성공한 사람은 자기가 좋아하는 일을 한 것이 아니다. 하는 일을 좋아했다. 어느 누가 하기 싫은 일을 하지 않으며 살 수 있을까. 그런 사람은 단 한 명도 없다. 어느 누구도 하기 싫은 일을 하지 않으며 살지 못한다. 하기 싫어도 억지로 해야 하는 것이 우리가 살아가는 인생이다. 숙명이다. 그게 인생이다. 성공한 사람들은 대체적으로 부지런하다. 성공이라는 단어에 대한 정의가 사람마다 다르겠지만 대다수 사람들이 떠올리는 성공한 사람의 공통점이다. 어떻게 보면 그와 나는 딱 하나의 차이가 있다. 그는 하기 싫어도 끝까지 해 냈고 난 그렇지 못했다. 하기 싫은 일을 하지 않는 삶은 없다. 하기 싫은 일을 어떻게 하느냐가 오히려 관건이다. 하기 싫다고 안 하면 당장은 편할지 몰라도 시간이 지나 나에게 더 큰 하기 싫은 일로 돌아온다. 심적으로, 육체적으로 같이. 아침에 일찍 일어나기 싫다. 지옥철을 타고 출근하기 싫다. 상사의 잔소리가 듣기 싫다. 억지로 어색한 모임에 참여하고 싶지 않다. 늘어지게 집에서 멍하니 시간이나 때우고 TV나 보며 보내고 싶다. 이런 것들은 전부 바램이다. 현실에서 그다지 실행 가능성이 적다. 어쩌다 잠깐 할 수 있다. 그렇기에 더욱 빛을 발한다. 하지 못한 것에 대한 동경을 직접 체험해 보니 더욱 그런 삶을 꿈꾼다. 막상 매일 같이 그런 삶을 살게되면 그마저도 새로운 하기 싫은 일이 된다. 매일같이 집에서 TV나 보며 빈둥거리면 행복할까. 어쩌다 하는 행동이 재미있고 좋은 것이지 반복되면 지루해진다. 놀랍게도 하기 싫은 일을 해 낼 때 대부분 성장한다. 습관적으로, 태생적으로 편한 걸 찾게 되고 회귀본능처럼 하게 된다. 정작 그걸 선호하더라도 불행히도 현대인에게 그럴 자유가 부족하다. 정확히 표현하면 도태된다. 꼭 성공해야 할 이유는 없어도 현대인으로 살...

이혼 보험 로코드라마

이혼 보험이라는 독특한 보험 상품이 등장했다니 놀랍습니다. 보험은 본래 예상치 못한 상황에 대비하기 위해 가입하는 상품입니다. 어떤 일이 발생했을 때 이를 미리 준비하기란 쉽지 않으므로, 평소에 조금씩 보험료를 납부하며 해결책을 마련하는 개념이죠. 이혼 보험은 이러한 기본 원리를 바탕으로 만들어진 참신한 아이디어라 할 수 있습니다.  한국은 외국에 비해 보험 상품의 다양성이 부족한 편으로 알려져 있습니다. 이혼 보험이라는 아이디어는 비록 드라마 속 설정이지만, 정말 신박하다는 느낌을 받았습니다. 특히 드라마에서 언급된 것처럼 이혼이 한 해 동안 상당히 많이 발생한다는 점을 고려하면, 충분히 상품으로서 가치가 있다는 생각이 들더군요. 보험은 필요에 따라 만들어지지만, 보험사 입장에서는 조금 다른 뉘앙스를 가집니다. 보험금을 지급하지 않는 것이 보험사에게는 가장 유리하죠. 즉, 보험료를 받고도 지급할 일이 없으면 수익이 극대화됩니다. 이러한 관점에서 보면, 이혼 보험 역시 팔기는 하지만 실제로 이혼이 발생하지 않도록 만드는 것이 보험사에게 최선의 결과일 것입니다. 드라마 이혼보험에서 묘사된 내용은 현실적인 면모를 갖추고 있었습니다. 사람들이 혹시나 모를 상황에 대비해 이혼 보험에 가입하게 되는데요. 반대로 보험사 입장에서는 가입자가 실제로 이혼하지 않도록 노력해야 하는 역설적인 상황이 펼쳐집니다. 이런 설정은 시청자들에게 흥미를 더해주는 요소로 작용했습니다. 드라마는 이혼보험을 설계하고 판매하는 과정을 중심으로 전개됩니다. 이동욱이 연기하는 노기준은 두 번의 이혼 경험을 가진 인물로 등장합니다. 첫 번째 이혼은 상대방의 비구니가 되려는 꿈을 존중하며 이루어졌고, 두 번째는 외국에서 온 상사와의 결혼 생활 중 바쁜 일상 때문에 결혼 신고조차 하지 못하고 끝난 사례였습니다. 이다희가 연기한 전나래는 노기준의 두 번째 아내였지만, 현재는 그의 파트너가 아닌 강한들(이주빈)이 주요 여성 캐릭터로 자리 잡고 있습니다. 강한들은 계리 업무를 담당하며 감성적인 성격을 ...

고객의 요트는 어디에 있는가

  다른 사람도 아닌 워런 버핏이 추천한 책이다. 내 고객의 요트는 어디에 있는가. 워런 버핏이 어떤 책을 추천하는 경우는 많지 않다. 엄청난 다독가면서도 추천한 책은 많지 않다. 다독가라고 하지만 살짝 개념은 다르다. 워런 버핏은 다독가라는 개념보다는 활자 중독자라는 표현이 좀 더 맞다. 기업과 관련된 온갖 정보를 다 읽는다. 잡지까지도 포함해서. 그러니 흔히 생각하는 책이라고 할 수는 없다. 일반인보다 많이 읽긴 하겠지만 책은 많이 읽지는 않는 듯하다. 그런 워런 버핏이 추천한 가장 유명한 책은 현명한 투자자다. 가치 투자자에게는 성경이라고 하는 벤자민 그레이엄의 책이다. 이런 책말고 이 책을 추천했으니 궁금하지 않을 수 없었다. 궁금했는데 한국에는 번역되지 않았다. 나중에 번역 된 걸 알긴 했으나 굳이 보려 하진 않았다. 그래도 좀 보는 게 어떨까하는 욕망(?)은 있었다. 다른 사람도 아닌 워런 버핏 추천아닌가. 결론부터 곧장 말하면 너무 늦게 내게 왔다. 책에 나온 내용은 뼈가 되고 살이 되는 내용은 맞다. 너무 잘 알고 있는 책이라는 점에서 늦었다고 표현했다. 이미 이런 종류 책을 많이 읽었다. 여기에 책이 출판된 게 1940년이다. 그 이후 개정판으로 내용이 좀 보강되긴 했지만 딱히 달라진 건 없는 듯하다. 그러니 올드하다. 올드할 뿐 책에서 알려주는 내용은 전부 거짓이 없다. 제목이 고객의 요트는 어디에 있는가는 여기서는 수수료를 말한다. 월스트리트는 수많은 사람이 돈을 벌기 위해 오는 곳이다. 자신이 직접 돈을 벌기 위해 오는 사람도 많이 있다. 그만큼 많이 차지하는 게 돈을 맡기로 오는 사람이다. 돈이 어느 정도 있는데 이걸 불리고 싶다. 내가 직접 주식 투자를 할 능력은 안 된다. 또는 사업 등으로 바뻐...