2017/6/27
완독. 뿌듯하다ㅋㅋ. 부분적으로 발췌해서 다시 읽어도 좋을 것 같다. 학부 때 배웠던 통계 관련 파트가 생각나기도 하고 오랜만에 자극이 되는 책이었다. 그렇다고 책 내용을 모두 이해했다고 생각하면 곤란하다.
발드는 말했다. 「갑옷을 총알구멍이 난 곳에 두르면 안 됩니다. 총알구멍이 없는 곳, 즉 엔진에 둘러야 합니다.」
발드의 통찰은 다음과 같은 간단한 질문을 던진 데서 나왔다. 사라진 총알구멍들은 어디에 있을까? 만일 피해가 비행기 전체에 골고루 분포 된다면 분명히 엔진 덮개에도 총알구멍이 났을 텐데, 그것들은 어디로 사라졌을까? 발드는 답을 알 것 같았다. 사라진 총알구멍들은 사라진 비행기들에 있었다. 엔진에 덜 맞은 비행기들이 많이 돌아온 것은 엔진에 많이 맞은 비행기들이 돌아오지 못했기 때문이다. 동체에 스위스 치즈처럼 구멍이 숭숭 뚫린 비행기들이 기지로 복귀한 경우가 많다는 사실은 동체에 입은 타격은 견딜 만하다는(따라서 견뎌야 한다는) 꽤 강력한 증거였다. 병원 회복실을 가보면, 가슴에 총알구멍이 난 사람보다 다리에 구멍이 난 사람이 더 많다. 그러나 이것은 사람들이 가슴에 총을 안 맞기 때문이 아니다. 가슴에 맞은 사람들은 회복하지 못하기 때문이다. (...) 어떤 나라가 전쟁에서 이기는 것은 상대 나라보다 좀 더 용감해서, 좀 더 자유로워서, 혹은 신의 총애를 약간 더 받아서가 아니라는 점이다. 보통은 비행기가 5% 덜 격추되는 쪽, 연료를 5% 덜 쓰는 쪽, 혹은 보병들에게 95%의 비용으로 5% 더 많은 영양을 지급하는 쪽이 이긴다. 이런 이야기는 전쟁 영화에는 나오지 않지만, 실제 전쟁은 이런 내용으로 이루어진다. 그리고 이것은 한 단계 한 단계가 다름 아닌 수학이다.
발드는 공중전에 대한 지식과 이해가 그보다 훨씬 뛰어난 장성들이 보지 못했던 것을 어떻게 볼 수 있었을까? 그것은 발드에게 수학으로 단련된 사고 습관이 있었기 때문이다. 수학자는 늘 <어떤 가정을 품고 있는가? 그 가정은 정당한가?>라고 묻는다. 이런 질문은 성가실 수 있다. 하지만 무척 생산적일 수 있다. 이 사례에서 장성들은 기지로 복귀한 비행기들이 전체 비행기에서 무작위로 추출된 표본이라는 가정을 자신도 모르게 품고 있었다. 정말로 그렇다면, 우리는 살아남은 비행기의 총알구멍 분포만 조사해도 모든 비행기들의 총알구멍 분포에 대한 결론을 끌어낼 수 있을 것이다. 그러나 우리가 스스로 그런 가설을 품고 있다는 것을 깨닫는 순간, 금세 그것이 말짱 틀린 가설이라는 것도 깨닫게 된다.(16-19p)
물론 원은 곡선으로 이루어져 있다. 하지만 우리가 발을 디딘 지표면에서 아주 좁은 구역만을 볼 때는 그것이 완벽하게 평평한 평면과 아주 비슷하듯이, 원주를 아주 작게 자른 조각은 완벽하게 곧은 직선과 아주 비슷하다.
국소적으로는 직선, 대역적으로는 곡선. 이것이 우리가 기억할 슬로건이다.(55p)
수학의 굉장한 즐거움 중 하나는 무언가를 옳은 방식으로, 바닥까지 철저히 이해했다고 느끼는 단호한 감정이다. 나는 수학을 제외하고는 정신 활동의 다른 어떤 영역에서도 그런 감정을 느껴 본적이 없다. 그리고 일단 당신이 무언가를 옳은 방식으로 할 줄 알게 되면, 이후에는 그것을 잘못된 방식으로 설명하기가 어려워진다. 좀 더 완고한 사람이라면 아예 불가능할 정도로.(70p)
나는 구구단 외우기를 폐지하자고 주장하는 일부개혁주의자들에게 동조할 수 없다. 우리가 진지한 수학적 사고를 수행할 때는 가끔 6 곱하기 8을 계산해야 할 텐데, 그때마다 계산기를 찾아야 한다면 사고에 요구되는 정신의 속도를 낼 수 없다. 단어의 철자를 일일이 찾아 가면서 소네트를 쓸 순 없는 법이다.(79p)
수학에서는 꼭 지켜야 할 위생 법칙이 하나 있다. 어떤 수학 기법을 현장에 적용하여 시험할 때는 같은 계산을 다른 방식으로 여러 차례 반복하라는 것이다. 만일 그때마다 다른 답이 나온다면, 기법에 뭔가 문제가 있는 것이다.(89p)
작은 학교들이 상위 25등을 휩쓴 것은 그들이 잘해서가 아니라 시험 점수에서 더 큰 변이를 드러내기 때문이다. 작은 학교에서는 천재가 몇 명 나타나거나 3학년 중 농땡이 치는 학생이 몇 명만 나타나도 학교 평균이 크게 흔들리는 데 비해, 큰 학교에서는 소수의 극단적인 점수들이 미치는 영향이 큰 평균에 녹아들기 때문에 전체 점수를 거의 움직이지 못한다.(97p)
이런 일화가 있다. 어느 날 당신은 볼티모어의 웬 주식 중개인으로부터 청하지도 않은 뉴스레터를 한 통 받는다. 그 안에는 어떤 주식이 대폭 상승할 거라는 팁이 적혀 있다. 일주일 뒤, 볼티모어 주식 중개인이 예측했던 대로 그 주식이 정말로 오른다. 당신은 다음 주에도 또 뉴스레터를 받는데, 이번에는 어떤 주식이 하락할 것 같다는 예상이 적혀 있다. 그 주식은 실제로 폭락한다. 이후 10주 동안 이처럼 매주 새로운 예측을 담은 정체불명의 뉴스레터가 당신에게 배달되고, 그 예측은 매번 현실로 드러난다.
마침내 11번째 주, 볼티모어 주식 중개인은 자신에게 투자하라고 당신에게 권유한다. 그리고 당연히 그는 지난 10주 연속 족집게 예측을 통해서 충분히 증명해 보인 자신의 예리한 시장 감각의 대가로 두둑한 수수료를 요구한다.
괜찮은 거래 같지 않은가? 볼티모어 주식 중개인은 뭔가 아는 게 틀림없다. 시장에 대한 전문 지식이 전혀 없는 멍텅구리가 연속 열 번이나 주가 변동을 정확히 예측한다는 건 전혀 있을 법하지 않은 일이다. (...) 한마디로, 멍텅구리가 그렇게 잘 맞힐 확률은 거의 0이다. 하지만 우리가 볼티모어 주식 중개인의 관점에서 이야기를 다시 쓰면, 상황이 달라진다. 당신이 앞에서는 미처 못 봤던 사실이 있다. 첫 주에 주식 중개인의 뉴스레터를 받은 사람은 당신 혼자가 아니었다. 주식중개인은 10,240통의 뉴스레터를 보냈다. 하지만 내용이 다 같진 않았다. 뉴스레터의 절반은 당신이 받은 것처럼 어떤 주식이 오르리라고 예측한 내용이었고, 나머지 절반은 그 반대로 예측한 내용이었다. 주식 중개인으로부터 무효한 예측을 받았던 수신자 5,120명은 두 번 다시 그로부터 소식을 듣지 못했다. 하지만 당신, 그리고 당신과 같은 내용의 뉴스레터를 받았던 5,119명은 다음 주에도 팁을 받았다. 그 뉴스레터 5,120통 중 절반은 당신과 같은 내용이었고, 나머지 절반은 반대되는 내용이었다. 그 주가 지나도, 연속 두 번 정확한 예측을 받은 수신자의 수는 2,560명이나 된다.
이런 식으로 죽 이어진다.
그렇게 10주가 지나면, 그동안 주식 시장이 어떤 판세였든지 볼티모어 주식 중개인으로부터 열 번 연속 족집게 예측을 받은 행운의(?) 수신자가 열 명 남았을 것이다. 중개인은 예리한 눈으로 시장을 주시하는 사람일 수도 있고 닭 내장을 벽에 던져서 그 흔적을 보고 주식을 고르는 사람일 수도 있지만, 어느 쪽이든 그를 천재로 여기는 수신자가 반드시 열 명은 있다. 그가 두둑한 수수료를 거둘 수 있는 수신자가 열 명은 있는 것이다. 그러나 그 열 명에게 과거의 성과는 결코 미래의 결과에 대한 보장이 되지 못할 것이다.(128-130p)
금융 회사는 뮤추얼 펀드를 출시할 때 대중에게 공개하기에 앞서 한동안 사내에서 운영해 보는데, 그 관행을 인큐베이션이라고 부른다. 인큐베이션을 겪는 펀드들의 삶은 이름과는 달리 아늑하고 안전한 것이 못 된다. 회사는 보통 한 번에 수많은 펀드들을 함께 인큐베이션하여 다양한 투자 전략과 포트폴리오 배분을 실험한다. 펀드들은 자궁 속에서 밀치락달치락 경쟁한다. 그중 괜찮은 수익률을 보이는 펀드는 이제까지 그 펀드의 실적이 얼마나 좋았는가 하는 상세한 기록과 함께 얼른 대중에게 공개되지만, 한배에서 가장 볼품없는 펀드들은 안락사 당한다. 보통은 그런 펀드가 존재했다는 기록을 공개적으로 남기지도 않을 채. (...) 눈이 뛰어나올 만한 수익률을 자랑하는 인큐베이션 펀드에 저금을 몽땅 투자한다면, 평생의 저축을 볼티모어 주식 중개인에게 투자하는 뉴스레터 수신자와 다를 바 없다. 당신은 인상적인 결과에 휘둘리는 것이지만, 중개인이 그 결과를 얻기 위해서 얼마나 많은 가능성을 시험했는지는 까맣게 모르고 있다.
이것은 내 여덟 살짜리 아들과 스크래블 단어 게임을 하는 것과도 비슷하다. 아들은 알파벳 무더기에서 뽑은 알파벳이 마음에 들지 않으면 그것을 도로 무더기에 집어넣고 다시 뽑는다. 하지만 충분히 많은 기회를 갖는다면 언젠가는 바라던 Z가 나오는 법이고, 그것은 당신이 운이 좋아서가 아니라 속였기 때문이다.
볼티모어 주식 중개인의 사기가 통하는 것은, 훌륭한 마술 트릭이 무릇 그렇듯이, 당신을 대놓고 속이려 들지는 않기 때문이다. 그 수법은 당신에게 거짓말을 하려고 들진 않는다. 참을 말하되, 당신이 그로부터 부정확한 결론을 끌어내도록 유도한다. 주식을 열 개 연속 제대로 고르거나, 마술사가 경주마 여섯 마리를 찍어서 매번 승자를 정확하게 맞히거나, 뮤추얼 펀드가 시장에서 10% 수익률을 낸다거나 하는 것은 실제로 확률이 낮은 사건이다. 다만 확률이 낮은 사건을 접했을 때 놀란 것이 당신의 실수다. 우주는 방대하기 때문에, 발생 확률이 낮은 사건에 놀랄 태세를 갖춘 사람은 언젠가 반드시 그런 사건을 만나게 된다. 확률이 낮은 사건은 많이 일어나기 때문이다. (...) 구호를 다시 읊자면, 그저 확률이 낮은 사건은 많이 일어나기 때문이다.(131-133p)
<백만 분의 일 확률>의 사건은 그 빈도보다 조금도 덜하지 않고 조금도 더하지 않는 빈도로 반드시 벌어진다. 물론 그 사건이 우리에게 벌어진다면 우리가 엄청 놀라기야 하겠지만 말이다.(134p)
<새로운 증거에 따르면, 특정 종류의 경구 피임약들은 다른 종류들에 비해 혈전증 발생 가능성을 약 두 배 높인다.> 혈전증은 장난이 아니다. 혈전증은 피가 엉긴 혈전이 정맥혈의 흐름을 방해하는 현상이다. 혈전이 혈관에서 떨어져 나와 피를 타고 돌다가 폐로 들어가면 폐색전이 되는데, 그러면 죽을 수도 있다. (...) 사람들은 당연히 혼비백산했다. 한 가정의는 경구 피임약을 먹던 자신의 환자들 중 12%가 정부 발표를 듣자마자 피임약 복용을 중단했다고 말했다. (...) CSM의 경고 덕분에 혈전증으로 인한 사망을 모면한 여성들을 생각해 보라!
그런데 그런 여성이 정확히 몇 명이나 되었을까? 확실히 알 순 없다. 하지만 CSM의 경고 결정을 지지했던 한 과학자에 따르면, 혈전증 사망이 예방된 여성의 수는 총 <약 한 명>이었을 것이라고 한다. 삼세대 피임약이 부과한 위험은 피셔의 통계학적 의미에서는 유의성이 있었지만 공중 보건적 의미에서는 그다지 중요하지 않았던 것이다.
이야기를 전달한 방식도 혼란을 가중했다. CSM은 삼세대 피임약이 혈전증 발생률을 두 배로 높인다고 발표했다. 이렇게 말하니까 상당히 심각해 보이지만, 애초에 혈전증은 아주아주 드물다는 사실을 명심해야 한다. 일세대와 이세대 경구 피임약을 복용하는 가임기 여성들 중 혈전증 위험이 있는 사람은 7,000명 중 1명 꼴이다. 물론 삼세대 피임약은 그 위험을 두 배로, 즉 7,000명 중 2명 꼴로 높이지만, 그래 봤자 아주 미미한 위험이다. 아주 작은 수는 두 배로 불려도 아주 작은 수라는 명백한 수학적 사실 때문이다. 무언가를 두 배로 불리는 것이 얼마나 좋고 나쁜가는 애초에 그 무엇이 얼마나 큰가에 달려 있다.(160-161p)
규모가 어느 정도 예상되는 현상을 감지해 내지 못하는 통계 연구를 가리켜 우리는 검정력이 낮다고 말한다. 이것은 쌍안경으로 행성을 보는 것과 마찬가지다. 그러면 위성이 있든 없든 같은 결과가 나올 테니, 구태여 해볼 필요도 없다. 망원경이 할 일을 쌍안경에게 시켜선 안 되는 것이다. 낮은 검정력의 문제는 영국의 피임약 소동과 동전의 이면 같은 관계이다. 피임약 시험처럼 검정력이 높은 연구는 자칫 실제로는 중요하지 않은 사소한 효과에 대해 걱정하게끔 만들 수 있는 데 비해, 검정력이 낮은 연구는 그저 기법이 너무 취약해서 보지 못하는 것뿐인 미세한 효과를 기각하게끔 만든다.(168-169p)
우리는 <발생 확률이 대단히 낮다>는 것을 <사실상 불가능한 일이다>는 뜻으로 여기기 쉽다. 그러다가 <사실상>이라는 단어마저 머릿속에서 점점 더 작게 말함으로써, 결국 거기에 신경 쓰지 않게 된다. 그러나 무언가가 불가능하다는 것과 확률이 대단히 낮다는 것은 전혀 같지 않다. 비슷하지도 않다. 불가능한 일은 절대 벌어지지 않지만, 확률이 낮은 일은 많이 벌어진다.(184p)
과학의 목표가 진실 발견에 있지 않다는 생각은 언뜻 황당하게 들리지만, 네이만-피어슨 철학은 사실 우리가 다른 영역들에서 사용하는 추론 기법과 그다지 멀지 않다. 가령, 형사 재판의 목적은 무엇일까? 피고가 고발당한 죄를 실제로 저질렀는지 알아내는 것이라고 답한다면 순진한 생각이다. 이 대답은 뻔히 틀렸다. 법정에는 증거 요건이란 게 있어서, 설령 배심원들이 피고의 결백이나 유죄를 정확하게 판단하는 데 도움이 될 정보라도 부적절한 방식으로 얻은 증언이라면 배심원들에게 들려줄 수 없다. 법정의 목적은 진실이 아니라 정의다. 우리에게는 규칙이 있고, 규칙은 반드시 지켜져야 한다. 우리가 피고는 <유죄>라고 말할 때, 그 정확한 말뜻은 그가 틀림없이 고발된 죄를 저질렀다는 게 아니라 그가 규칙에 따라 공명정대하게 선고를 받았다는 것이다. 우리는 어떤 규칙을 택하든 범죄자 중 일부는 풀어 주게 될 것이고 무고한 사람 중 일부는 감옥에 가두게 될 것이다. 만일 전자를 더 적게 저지르려고 애쓰면, 후자를 더 많이 저지르게 된다. 그러므로 이 기본적인 교환 관계를 어떻게 다루는 게 최선인지에 대한 사회적 합의를 반영하여 규칙을 설계하려고 애쓸 따름이다.(213p)
베이즈 추론의 사고방식에서, 당신이 증거를 본 뒤에 무언가를 얼마나 믿게 되었느냐 하는 것은 증거가 제공하는 정보에만 달린 게 아니라 당신이 애초에 그 무언가를 얼마나 믿었느냐에도 달려 있다.
이것은 심란한 말처럼 들릴 수도 있다. 과학은 객관적인 것 아니었던가? 당신은 자신의 믿음이 증거에만 의존한다고 말하고 싶지, 애초에 품었던 선입견에 의존한다고 말하고 싶진 않을 것이다. 하지만 인정하자. 누구도 실제로는 그런 식으로 신념을 형성하지 않는다. 만일 기존 약물을 살짝 변형시킨 신약이 특정 암의 성장을 늦춘다는 가설에 대해 실험에서 통계적 유의성이 있는 결과가 나온다면, 당신은 신약의 효능을 꽤 굳게 믿을 것이다. 하지만 만일 환자들을 플라스틱 스톤헨지 모조품 속에 집어넣은 실험에서 같은 결과가, 당신은 고대 구조물이 지구의 진동 에너지를 인체에 집중시켜 종양을 기절시켰다는 이론을 툴툴대면서도 마지못해 받아들이겠는가? 아닐 것이다. 왜냐하면 그것은 정신 나간 소리니까. 당신은 스톤헨지가 운이 좋았을 뿐이라고 생각할 것이다. 당신은 두 이론에 대해 서로 다른 사전 확률을 품고 있었고, 그 결과가 수치적으로는 동일한 상황인데도 증거를 다르게 해석한다.
(...)
귀무가설 유의성 검정에만 의존하여 무언가를 판단한다는 것은 대단히 비(非)베이즈주의적인 일이다. 엄밀히 말해서, 그 경우 우리는 암 신약과 플라스틱 스톤헨지를 정확히 동등하게 존중해야 할 것이다. 그렇다면 이것은 피셔의 통계학적 관점에 한 방 먹이는 결과일까? 오히려 그 반대다. 피셔가 <시기와 상황을 불문하고 늘 고정된 유의성 수준으로 가설을 기각하는 과학자란 존재하지 않는다. 과학자는 자신의 증거와 개념에 비추어 개별 사례마다 마음을 정한다>고 말했을 때, 그는 바로 과학적 추론이 순전히 기계적으로만 수행될 수 없다고, 혹은 이론적으로나마 그래서는 안 된다고 말한 것이었다. 우리가 사전에 품은 개념들과 믿음들에게도 늘 역할이 주어져야 한다고 말이다.(239-240p)
친구는 사업가 기질이 있었지만, 그렇게까지 많진 않았다. 사실은 게을렀다. 일단 80장을 팔아 초기 투자금을 회수하자, 친구는 종일 캠퍼스에서 티셔츠를 팔고 돌아다니는 일에 흥미를 잃었다. 티셔츠 상자는 친구의 침대 밑에 처박혔다.
일주일 뒤, 빨래하는 날이 왔다. 친구는 아까도 말했듯이 게을렀다. 빨래가 귀찮았다. 그런데 그때, 침대 밑에 깨끗하고 완전 새것이고 모자를 쓴 채 맥주를 꿀꺽꿀꺽 마시는 고양이가 그려진 티셔츠가 상자째 들어 있다는 사실이 떠올랐다. 빨래하는 날 입을 옷은 해결되었다.
그뿐 아니었다. 그 상자는 빨래하는 날 다음 날 입을 옷도 해결해 주었다.
그다음 날도.
덕분에 상황이 얄궂게 되었다. 주변 사람들은 모두 친구를 학교에서 제일 더러운 사람이라고 생각했다. 친구가 하루도 빼놓지 않고 매일 같은 티셔츠를 입었기 때문이다. 하지만 사실 친구는 학교에서 제일 깨끗한 사람이었다. 매일 가게에서 막 나온, 한 번도 입지 않은 새 티셔츠를 입었으니까!
이 이야기가 우리에게 추론에 관해 안기는 교훈은, 고려 대상이 되는 이론들의 범위를 전체적으로 세심하게 따져야 한다는 것이다. 이차방정식에 해가 하나 이상인 것처럼, 똑같은 관찰을 낳는 이론이 하나가 아니라 여러 개일지 모른다. 그것들을 모두 고려하지 않는다면, 우리의 추론은 심하게 빗나갈 수 있다.(246-247p)
불가능한 것을 제외하고 남은 것은 아무리 가능성이 낮아 보여도 진실일 수밖에 없다는 게 내 오랜 금언이지. 단, 그 진실이 애초에 자네가 떠올리지도 못했던 가설이 아닌 한에서.(251p)
우리는 무언가에 대한 불확실한 기분을 숫자로 표현하는 버릇이 있다. 가끔은 그게 합리적이다. 저녁 뉴스에 기상학자가 나와서 <내일 비가 올 확률은 20%입니다>라고 말할 때, 그것은 현재의 조건과 비슷한 조건을 지녔던 과거의 수많은 날들 중에서 20%는 다음 날 비가 왔다는 뜻이다. 하지만 <신이 우주를 창조했을 확률은 20%이다>라는 말은 무슨 뜻일까? 우주 다섯 개 중 하나는 신이 창조했고 나머지 네 개는 알아서 생겨났다는 뜻일까? 그럴 리는 없다. 이런 근본적인 질문에 얽힌 불확실성에 숫자를 부여하는 여러 기법들 중에서 내가 보기에 만족스러운 것은 사실 하나도 없다. 나는 숫자를 몹시 사랑하지만, 그래도 우리는 <나는 신을 믿지 않아> 혹은 <나는 신을 믿어> 혹은 그도 아니면 <나는 잘 모르겠어>라고 말하는 데 그쳐야 한다고 본다. 나는 베이즈 추론도 몹시 사랑하지만, 그래도 우리가 비정량적인 방식으로 신앙에, 혹은 신앙의 기각에 도달하는 것이 더 낫다고 본다. 이 문제에서 수학은 침묵한다.(255p)
스티글러의 논증은 온갖 종류의 최적화 문제에서 요긴한 도구로 쓸 수 있다. 정부의 낭비를 예로 들어 보자. 우리는 어느 주 공무원이 시스템을 악용해서 막대한 연금을 타냈다거나, 어느 방위 산업 계약자가 말도 안 되게 부풀린 가격을 매기고도 빠져나갔다거나, 어느 시 기관이 기능이 사라진 지 오래인데도 관성과 유력 후원자들 덕분에 혈세를 낭비하며 존속하고 있다거나, 이런 류의 기사를 한 달에 한 번은 꼭 읽는다. 2013년 6월 24일에 「월스트리트 저널」의 <워싱턴 와이어>블로그에 실렸던 다음 기사가 전형적인 사례다.
사회 보장국 감사관이 월요일에 발표한 바에 따르면, 사회 보장국은 사망한 것으로 여겨지는 미국인 1,546명에게 3100만 달러의 복지 수당을 부적절하게 지급해 왔다.
설상가상인 점은 그들에 대한 사망 증명 정보를 사회 보장국이 정부 데이터베이스에 제출했으므로, 그들이 이미 죽어서 지급을 중지해야 한다는 사실을 사회보장국도 알고 있었어야 한다는 것이다.
왜 이런 일이 지속되게 내버려 둘까? 답은 간단하다. 공항에 일찍 나가는 데 비용이 들듯이, 낭비를 없애는 데도 비용이 든다. 규칙을 준수하고 늘 경계하는 것은 가치 있는 목표이지만, 모든 낭비를 없애려는 것은 비행기를 놓칠 가능성을 깡그리 없애려고 하는 것처럼 편익을 상회하는 비용이 따르는 일이다. 블로거(이자 수학 경시대회 출신의) 니컬러스 보드로가 지적했듯이, 문제의 3100만 달러는 사회 보장국이 연간 지급하는 총 복지 수당의 0.004%에 지나지 않는다. 한마디로, 사회 보장국은 이미 누가 살았고 누가 죽었는지를 굉장히 잘 알고 있다. 그런데도 마지막으로 남은 약간의 실수까지 없애기 위해서 좀 더 노력하는 것은 값비싼 대가가 따르는 일일지 모른다. 우리가 유틸을 헤아릴 경우, 물어야 할 질문은 <왜 우리는 납세자들의 돈을 낭비하는가?>가 아니라 <납세자들의 돈을 얼마나 낭비하는 것이 바람직한가?>이다. 스티글러의 말을 빌리자면, 정부가 낭비를 전혀 하지 않는다면, 우리는 정부의 낭비를 막는 데 너무 많은 시간을 쓰고 있는 것이다.(311-312p)
골턴은 1889년에 쓴 「자연의 유전」에서 이렇게 썼다. <첫눈에는 역설처럼 보이겠지만, 이것은 이론적으로 꼭 필요한 사실이다. 그리고 성인이 된 자식의 키가 전반적으로 그 부모의 키보다 좀 더 평범하다는 것은 관찰로 분명히 확인된 사실이다.>
따라서 정신적 성취도 그래야만 한다는 것이 골턴의 추론이었다. 그리고 이 추론은 우리의 보편적 경험에 부합한다. 위대한 작곡가나 과학자나 정치 지도자의 자식이 같은 분야에서 두각을 드러내는 일은 흔히 있어도 명망 높은 그 부모만큼 뛰어난 경우는 거의 없다. 골턴은 훗날 시크리스트가 기업체의 운영에서 밝혀낼 현상을 관찰했던 것이다. 탁월함은 지속되지 않고, 시간이 흐르면 평범함이 자리를 굳히기 마련이라는 것을.(392-393p)
첫 소설로 대박을 터뜨렸던 신예 작가의 두 번째 소설이나, 데뷔 음반이 엄청나게 유행했던 밴드의 두 번째 앨범은 왜 첫 번째만큼 좋은 경우가 드물까? 흔히들 대부분의 예술가는 할 말이 하나뿐이라서 그렇다고들 하지만, 그건 틀렸다. 적어도 꼭 그것만은 아니다. 인생의 모든 것이 그렇듯이 예술적 성공은 재능과 운의 결합이고 따라서 평균으로의 회귀가 적용되기 때문이다.
다년 계약에 서명하는 러닝백들은 이후 시즌에서 평균 러닝 거리가 이전보다 짧아질 때가 많다. 어떤 사람들은 이제 그들에게 최후의 1야드까지 안간힘을 쓸 금전적 동기가 없기 때문이라고 해석한다. 물론 심리적 요인이 어느 정도 역할을 하기는 할 것이다. 그러나 그 못지않게 중요한 사실은 애초에 그들이 엄청나게 훌륭한 한 해를 보냈기 때문에 그 결과로 대형 계약을 따냈다는 점이다. 그들이 이후 시즌에 좀 더 정상적인 수준의 성과로 회귀하지 않는다면, 그것이야말로 정말 기이한 일일 것이다.(395-396p)
왜냐하면 상관관계는 추이적이지 않기 때문이다. 니아신은 높은 HDL 농도와 상관관계가 있고, 높은 HDL 농도는 낮은 심장 마비 발생률과 상관관계가 있지만, 그렇다고 해서 니아신이 심장마비를 예방한다는 뜻은 아니다. (...) 상관관계가 추이적이라면, 의학 연구는 지금보다 훨씬 쉬워질 것이다. 우리는 수십 년의 관찰과 데이터 수집을 통해서 수많은 상관관계를 알아냈다. 만일 추이성이 존재한다면, 의사들은 그 상관관계를 줄줄이 잇기만 해도 확실한 효과를 내는 개입 방법을 얻을 수 있을 것이다. 우리는 여성의 에스트로겐 수치와 낮은 심장 질환 발생률에 상관관계가 있다는 것을 알고, 호르몬 대체 요법이 에스트로겐 수치를 높인다는 것도 아니까, 호르몬 대체 요법에 심장 질환 예방 효과가 있을 것이라고 기대하기 쉽다. 실제로 지금까지는 이것이 임상적 사실로 통했다. 그러나 아마 여러분도 벌써 들었겠지만, 진실은 그보다 훨씬 더 복잡하다. (...) 현실에서는 우리가 어떤 약이 HDL이나 에스트로겐 수치 같은 생체지표에 어떤 영향을 미치는지 속속들이 알더라도, 그 약이 특정 질병에 어떤 영향을 미칠지 예측하기란 불가능에 가깝다. 인체는 어마어마하게 복잡하며, 우리가 인체에 관해서 측정할 수 있는 속성은 한 줌밖에 안 된다. 하물며 조작할 수 있는 속성은 더 적다. 연구자들은 관찰된 상관관계를 근거로 건강에 바람직한 효과를 낼 가능성이 있는 약을 이것저것 떠올린다. 그리고 실험으로 확인해 보지만, 실망스럽게도 대부분은 실패한다.(443-444p)
여느 과학 도구와 마찬가지로, 수학적 도구는 특정 종류의 현상은 감지하지만 다른 종류는 감지하지 못한다. 일반 카메라가 감마선을 감지할 수는 없는 것처럼, 상관관계 계산은 이 산포도의 하트 모양을 알아보지 못한다. 그러니 앞으로 어떤 두 자연적 혹은 사회적 현상이 상관관계가 없는 것으로 밝혀졌다는 이야기를 들을 때면 이 점을 늘 염두에 두길 바란다. 그것은 둘 사이에 아무 관계가 없다는 뜻이 아니다. 상관 계수가 감지할 수 있는 종류의 관계가 없다는 뜻일 뿐이다.(447p)
1976년과 2009년, 미국 정부는 신종 플루에 대한 대대적이고 값비싼 백신 접종 캠페인을 벌였다. 두 번 다 역학 연구자들이 당시 유행하던 균주가 파국적 전염병으로 이어질 가능성이 높다고 경고했기 때문이다. 그러나 결과적으로 두 번 다 신종 플루가 심하기는 했지만 재앙에는 한참 못 미쳤다.
이런 시나리오에서 과학을 앞질러 의사 결정을 내린 정책 입안자들을 비난하기야 쉽다. 그러나 문제는 그렇게 단순하지 않다. 틀리는 것이 늘 틀리는 것은 아니다.
어째서 그럴까? 3부에서처럼 간단히 기대값을 계산해 보면, 언뜻 역설적인 이 슬로건을 해독할 수 있다. 우리가 어떤 건강 관련 권고를 발표할까 고민한다고 하자. 예를 들면 가지가 갑작스런 심장 마비 위험을 조금 높이기 때문에 사람들에게 가지를 먹지 말라고 권고한다고 가정하자. 이 결론은 가지를 먹는 사람들이 먹지 않는 사람들보다 돌연사할 가능성이 약간 더 높다는 여러 연구 결과로부터 도출되었다. 그러나 일부 피험자들에게는 가지를 억지로 먹이고 나머지에게는 먹이지 않는 대규모 무작위 통제군 실험을 수행할 수야 없는 노릇이다. 우리는 주어진 정보만으로 때워야 하며, 그 정보는 상관관계만 보여 준다. 우리가 아는 것은 가지 애호와 심장 발작이 공통의 유전적 배경을 갖고 있다는 것뿐, 그보다 더 확실히 알 도리는 없다.
우리 결론이 옳다는 것, 그리고 가지를 먹지 말자는 캠페인이 연간 1천 명의 미국인을 살릴 수 있다는 가설에 대해서 우리가 75% 확신한다고 하자. 우리 결론이 틀릴 확률도 25% 있는 셈이다. 그리고 실제로 틀렸다면, 우리는 많은 사람으로 하여금 제일 좋아하는 야채를 포기하도록 만들고 그럼으로써 전반적으로 덜 건강한 식생활을 하도록 만든다. 그 때문에 가령 연간 200명의 추가 사망이 일어난다고 하자.
늘 그렇듯이, 기대값은 각 가능성에 그에 상응하는 발생 확률을 곱한 뒤 다 더하면 얻을 수 있다. 따라서 우리의 권고는 매년 700명을 살릴 기대값을 가진다. 그래서 자금이 빵빵한 가지 협회가 소리 높여 불평함에도 불구하고, 또한 아주 현실적인 불확실성이 존재함에도 불구하고, 우리는 권고를 대중에게 공개한다.
기억할 점은, 기대값은 말 그대로 당장 벌어질 결과를 뜻하는 게 아니라 똑같은 결정을 거듭 내렸을 때 평균적으로 벌어질 결과를 뜻한다는 것이다. 공공 보건 정책은 동전 던지기와 다르다. 딱 한 번만 할 수 있는 일이다. 그러나 우리가 평가해야 할 환경적 위험이 가지뿐만은 아니다. 어쩌면 다음에는 콜리플라워가 관절염과 관련된다는 사실이, 혹은 진동 칫솔이 자폐증과 관련된다는 사실이 우리의 주의를 끌지도 모른다. 그 경우 매번 정책적 개입으로 연간 700명을 살리는 기대값을 예상할 수 있다면, 우리는 매번 개입해야 한다. 그리고 평균적으로 매 결정 당 700명을 살리는 결과를 기대할 수 있다. 어떤 한 경우에서는 득보다 실을 더 많이 끼칠 수도 있겠지만, 전체적으로는 많은 목숨을 구할 것이다. 이월 회차에 복권을 사는 사람들처럼, 우리는 어떤 한 사례에서 잃을 위험을 감수하는 대신 장기적으로는 우리가 따리라고 거의 확신한다.
만일 스스로가 절대적으로 옳은지 확신할 수 없기 때문에 스스로에게 좀 더 엄격한 증거 기준을 적용하여 결국 아무 권고도 내리지 않는다면? 그렇다면 우리가 구할 수 있었을 목숨들을 잃게 될 것이다.(459-461p)
생명을 위협하는 건강상의 난제들에 대해서 정말로 정확하고 객관적인 확률을 부여할 수 있다면야 좋겠지만, 당연히 우리는 그럴 수 없다. 우리에게 주어진 확률은 여러 가설에 대한 우리의 신뢰도를 반영하는 혼란스럽고 애매한 수치들뿐이다. R. A.피셔가 아예 확률로 인정할 수 없다고 선언했던 확률들이다. 그러니 우리는 가지나 진동 칫솔이나 심지어 담배에 대한 캠페인의 기댓값이 정확히 얼마인지 알지 못하고, 알 수도 없다. 그러나 가끔은 그 기댓값이 양수라는 것만큼은 자신있게 말할 수 있다. 이때도 어떤 한 캠페인이 좋은 효과를 내리라고 확신한다는 뜻은 아니고, 그런 캠페인들의 효과를 다 더한 것이 장기적으로 실보다 득이 많으리라고 확신한다는 뜻이다.(461-462p)
어쩌면 여러분은 자신이 데이트할 가능성이 있는 남자들 중에서 잘생긴 남자들은 대체로 못됐고 착한 남자들은 대체로 못생겼다는 현상을 눈치챘을지도 모르겠다. 얼굴이 대칭적이면 성격이 고약해지는 것일까? 혹은 성격이 착하면 못생겨지는 것일까? 글쎄, 그럴 수도 있겠다. 그러나 꼭 그래야 하는 것은 아니다. 아래에 내가 <남자들의 거대한 정사각형>을 그려 보았다.
(그림 생략)
그리고 남자들이 이 정사각형 속에 고르게 분포한다는 가설을 세워보자. 특히 착하고 잘생긴 남자, 착하고 못생긴 남자, 못됐고 잘생긴 남자, 못됐고 못생긴 남자의 수가 대충 다 같다고 가정하자.
그런데 착함과 잘생김은 공통의 결과를 가져온다. 전체 남자들 중에서 그 남자들에게만 당신이 관심을 쏟는다는 결과다. 솔직해지자. 못됐고 못생긴 남자는 애초에 고려조차 안 하는 게 사실 아닌가. 따라서 거대한 정사각형 안에는 <봐줄 만한 남자들의 작은 삼각형>이 존재한다.
(그림 생략)
이제 이 현상의 근원이 분명해졌다. 삼각형 속에서 가장 잘생긴 남자들은 착한 사람부터 못된 사람까지 성격의 전 범위를 아우른다. 평균적으로 그들은 전체 인구의 평균만큼 착할 것이다. 그 평균 자체가 그렇게 착한 것은 아니지만 말이다. 어쨌든, 같은 맥락에서 가장 착한 남자들도 평균적으로는 평균 수준으로 잘생겼을 것이다. 그러나 못생긴 남자들 중에서 당신이 좋아하는 남자들은, 이들은 삼각형에서 아주 작은 한구석만을 차지하는데, 다들 엄청나게 착하다. 그래야만 한다. 그러지 않으면 애초에 당신 눈에 들어오지도 않을 테니까. 데이트 후보자들의 외모와 성격이 음의 상관관계를 보이는 것은 엄연히 실재하는 현상이다. 그러나 만일 남자 친구의 외모를 개선할 요량으로 그에게 못된 행동을 하라고 가르친다면, 당신은 벅슨의 오류에 빠지는 셈이다.
문학적 속물근성도 똑같은 방식으로 작동한다. 여러분은 대중적으로 인기가 많은 소설들이 다들 얼마나 끔찍한지 아는가? 그러나 그것은 대중이 질을 몰라봐서 그런 게 아니다. 여기에도 <소설의 거대한 정사각형>이 존재하고, 당신이 이름이라도 들어 본 소설은 그중에서도 인기가 많거나 훌륭하거나 둘 중 하나에 해당하여 <봐줄 만한 삼각형> 속에 드는 소설들이기 때문이다. 만일 인기 없는 소설을 무작위로 골라서 읽어본다면(나는 문학상 심사 위원을 맡은 적이 있기 때문에 실제로 해봤다)그 소설들도 인기 많은 소설들과 마찬가지로 대부분 형편없다는 걸 알 수 있을 것이다.(466-468p)
영감의 순간은 이전 몇 주 동안 의식적으로든 무의식적으로든 수행해 온 작업의 산물이고, 그 작업 덕분에 우리는 머릿속으로 드디어 여러 발상들을 연결지을 준비를 갖추게 되는 것이다. 가만히 앉아서 영감이 찾아오기를 기다리는 것은 실패의 지름길이다. 당신이 아무리 신동이라도.(534p)
수학을 오래 하다 보면 깨닫게 되는 것은(그리고 나는 이 교훈이 훨씬 폭넓게 적용될 것이라고 생각한다) 당신보다 앞선 사람은 늘 있다는 사실이다. 당장 같은 교실에 있든 아니든 말이다. 이제 막 시작한 사람은 좋은 정리를 증명한 사람을 바라보고, 좋은 정리를 증명한 사람은 좋은 정리를 많이 증명한 사람을 바라보고, 좋은 정리를 많이 증명한 사람은 필즈상을 받은 사람을 바라보고, 필즈상을 받은 사람은 수상자들 중에서도 <핵심>에 속하는 사람을 바라보며, 그런 사람은 또 언제나 죽은 사람들을 바라볼 수 있다. 거울을 보면서 <인정하자, 나는 가우스보다 똑똑해>라고 중얼거리는 사람은 세상에 한 명도 없다. 그런데도 가우스에 비하면 전부 바보인 사람들이 지난 백 년 동안 힘을 합쳐 노력함으로써 역사상 가장 풍성한 수학 지식을 일구어 냈다.
수학은 대체로 공동 사업이다. 공통의 목표를 추구하는 거대한 지적 네트워크가 만들어 낸 산물을 각자가 조금씩 더 발전시킨다.(535p)
수학은 우리에게 원칙적인 방식에 따라 확신하지 않을 방법을 알려 준다. <거참>하고 포기하고 마는 것이 아니라, <나는 확신하지 않고, 확신하지 않는 이유는 이것이며, 확신하지 않는 정도는 대충 이 수준입니다>라고 굳게 단정하도록 해준다. 혹은 더 나아갈 수도 있다. <나는 확신하지 않습니다. 그리고 당신도 확신하지 말아야 합니다>라고.(549p)
무언가를 믿는다는 것은 그것이 참임을 믿는다는 것이다. 따라서 합리적인 사람이라면 자신이 품은 믿음들 각각이 모두 참이라고 믿는다. 그러나 또한 그는 경험을 통해서 자신의 믿음들 중 일부는, 정확히 무엇무엇인지는 알 수 없지만, 결국 거짓으로 밝혀지리라고 예상해야 한다는 사실도 안다. 요컨대, 합리적인 사람은 자신의 믿음이 각각은 모두 참이라고 믿지만 그중 일부는 거짓이라고 믿는다.(554p)
낮에는 증명하고 밤에는 반증하는 습관은 수학에만 좋은 것이 아니다. 이 습관은 우리가 품은 사회적, 정치적, 과학적, 철학적 신념에 압박을 가해 보는 수단으로도 유용하다. 낮에는 우리가 믿는 것을 믿자. 그러나 밤에는 우리가 가장 귀하게 여기는 명제를 반박하려고 노력해 보자. 대충 해서는 안 된다! 가능한 최대한, 사실은 믿지 않는 명제를 믿는 것처럼 생각해 보자. 우리가 그 시도를 통해서 스스로에게 기존 신념에서 벗어나도록 설득하는 데는 이르지 못하더라도, 우리가 믿는 것을 왜 믿는지에 대해서는 훨씬 더 잘 알게 될 것이다. 증명에 한 발 더 다가갈 것이다.(561p)
수학의 교훈은 단순하다. 이 교훈에는 숫자도 나오지 않는다. 그것은 바로 세상에는 구조가 존재한다는 것, 우리는 그 일부나마 이해할 수 있으므로 감각이 안겨 주는 것을 멍하니 바라보기만 할 필요가 없다는 것, 우리의 직관은 형식이라는 외골격을 입었을 때가 입지 않았을 때보다 더 강해진다는 것이다. 또한 수학적 확실성과 우리가 일상에서 적용하는 그보다 더 부드러운 확신은 서로 다른 일이라는 것, 가능하다면 우리는 늘 그 차이를 인식하려 애써야 한다는 것이다.
여러분이 좋은 것이 더 많다고 해서 항상 더 좋아지지는 않음을 이해할 때, 혹은 일어날 법하지 않은 일도 기회가 충분히 많이 주어진다면 자주 일어난다는 사실을 명심하여 볼티모어 주식 중개인의 유혹을 물리칠 때, 혹은 가장 확률이 높은 시나리오만을 고려하는 게 아니라 가능한 모든 시나리오들을 다 떠올린 뒤 어느 것이 좀 더 확률이 높고 어느 것은 좀 더 낮은지 고려하면서 결정할 때, 혹은 집단의 신념은 개개인의 신념과 동일한 규칙을 따른다는 생각을 버릴 때, 혹은 여러분의 직관이 형식적 추론이 깔아 둔 도로들을 따라서만 내달리도록 풀어 줄 때, 여러분은 방정식 하나 안 쓰고 그래프 하나 안 그리면서도 수학을 하고 있는 것이다. 다른 수단을 동원한 상식의 연장을 수행하고 있는 것이다. 우리가 이걸 언제 써먹겠느냐고? 여러분은 태어난 순간부터 수학을 해왔고, 앞으로도 영원히 그만두지 않을 것이다. 부디 잘 사용하기를.(565p)
ㅡ 조던 엘렌버그, <틀리지 않는 법> 中, 열린책들
1. 느낀 점
2. 인상 적인 구절
3-1 틀리는 것에 대해 두려움을 느끼는지? 느낀다면 그 이유는?
3-2 실패vs성공, 실패하는 것에 대해 어떻게 생각하는지?
4. 자신이 어려워하거나 싫어하는 영역(과목)은? 그 이유는?
5. 자신이 느끼기에 충분히 비합리적인 행동이라고 생각함에도 고치지 않고 여전히 계속 하는 행동들에는 어떤 것들이 있을까?(지난주와 중복되니 쇼핑과 관련된 충동구매는 제외합시다.)