- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date | 17/12/08 01:33:43 |
Name | 다시갑시다 |
Subject | 내가 사회를 바라보는 눈 |
한 일이주 머리속에서 짬날때마다 굴리던 생각인데 몇일간 이런 저런 기폭제들이있어서 일단 써봅니다. 아이디어가 아직 머리속에 정제된것 같지는 않지만 뭐 어떻게든 되겠죠.21세기에 들어서 우리는 비로소 大데이터의 시대에 살고있습니다. 뭐 빅데이터도 빅데이터지만 인류역사상 그 어느때보다 수치로 나타난 지표들을 사용하여 우리의 삶을 표현하고 이해하는게 자연스러운 사회죠. 이 방향성 자체는 긍정적입니다. 제가 이공계라서 바이어스가 존재하지만, 느낌과 감각에 치중한 판단보다는 수에 근거한 논리를 통한 판단이 다수가 더 동의할수있는 방법일테고, 이는 더 많은 사람들이 더 복잡하게 얽혀사는 사회에서 중요한 가치니까요. 그런데... 제목: 존재성 증명 (existence proof) 출처: xkcd f(x)=g(f(0))=1이라는 관계를 | 응. 이 세상 어딘가에 | 우리는 이 숫자를 꼭 찾아야해 | 학생들이여, 칼을 들어라! 진격하자! 충족시키는 숫자 x가 존재한다 | 필연코 있어 | 그리고 없에버려야만하지 | 저... 수학수업 잘못들어온것 같은데요?? | 난 드디어 제대로된 수학수업을 찾았어 호모 사피엔스라는 종이 유전적으로 숫자라는 개념을 체화시키고있다고 보기에는 힘든점이 많다고합니다 (https://redtea.kr/?b=3&n=5531). 제가 저 티타임 글에서 언급했듯이 사실 한자릿수 숫자도 3만 넘어가면 그 개념은 천천히 습득되는것일 가능성이있고, "큰수"가 되면 이는 교과과정을 훌륭히 마무리한 성인이라해도 사실 직관적인 이해에 어려움을 겪는다는 이야기가있습니다. 아이들 교과서에 "큰수의 사칙연산" 챕터가 괜히 따로있는게 아닌거죠. 큰수의 개념의 이해에 대해서 개인적으로 흥미롭게 생각하는건, 사람은 일상에서 실물적으로 접하기 쉬운 작은 숫자들은 선형적으로 이해하는 반면에 수의 개념이 커지면 커질수록 대수로(logarithmic, 이거 번역 맞나요?) 이해하는 경향이있다고합니다. 이게 무슨 말인지 예를 들어보자면: 사과 5개와 10개의 차이랑, 사과 100 000 000개랑 100 000 005개의 차이는 5개로 똑같지만, 두 상황에서 느낌적으로 느끼는 사과 갯수의 차이가 다르다는거죠. 왜? 1억씩이나 되면은 우리는 숫자가 5 증가했을때 그 차이를 +5로 받아들이는게 아니라 +log5로 받아들여서 그런거라는거죠. log10(5)는 약 0.7입니다. 그냥 5보다 7배 정도 작은 숫자죠. y=x와 y=log10(x)의 차이는 구글에 plot y=x, y=log10(x) 해보시면됩니다. 수가 커질수록 차이가 더 많이나죠. 우리가 큰숫자를 로그로 이해하는게 꼭 나쁜건 아닙니다. 실제로 자연의 많은 법칙들은 로그에 기반한 패턴을 보여주니까요. 그렇기 때문에 우리가 수를 이런식으로 이해하는 쪽으로 진화했을수도있죠. 일상에 가까운 예를 들어보자면 소리를 제는 데시벨과 지진의 강도를 제는 릭터 스케일등이 바로 떠오릅니다. 둘다 각각 진동의 에너지에 로그를 걸어서 나오는 지표들입니다. 우리가 몇배정도 크다고 느끼는 소리에는 사실 몇십,몇백배의 에너지 차이가있는거죠. 하지만 우리몸이 그 차이를 해석하는건 선형적이기보다는 로그에 가깝기에 이게 더 자연스러운겁니다. 만약에 소리를 에너지에 선형으로 비례해서 체감한다하면... 우리의 고막이 지금보다 훨씬 튼튼했어야할수도있겠네요. 사람이라는 동물이 직관적으로 이해하는 [숫자]의 개념이란게 생각보다 꽤 복잡하고 미묘하고, 어찌보면 참 모자랄수도있다는게 중요 포인트입니다. 숫자가 지배해야하는 大데이터 시대를 맞이한 우리로서는 초큼 난감할수도있는 사실이죠. 하지만 괜찮습니다. 만물의 영장인 인간은 지구상의 그 누구도 범접할수 없는 고차원적인 사고, 논리능력을 지니고있으니까요. 안가르켜주면 숫자도 3이상 새지도 못하는 미물이지만, 훌륭한 사회와 교육을 통해서 다들 숫자 잘만새고 다니자나요! ㅠㅠ 근데 우리 사고능력도 좀 이상할수도있데요... 데이터의 분석에서 가장 중요한 수학분야는 통계일겁니다. 그리고 통계를 대표하는 수치는 바로 평균이죠. 그러니 평균에 대한 이야기를 해봅시다. 사람이란 동물이 체감하는 평균을 어림잡아보기 위해, 하드 데이터와 계산기가 없는 상황에서, 사람이란 동물은 <평균>을 얼마나 잘 계산할까요?라는 질문을 던져볼수있습니다. [전체 운전인구와 비교해보았을때, 본인의 운전실력이 어느정도 된다고 생각하세요?]라는 설문이있었습니다. 꽤 유명한 이야기라 아시는 분들도 꽤 되실것 같은데, 과반수 이상이 [그래도 내가 평균보다는 낫지요 ㅎㅎ]라고 답했다고합니다. 이거... 말이 안되자나요. 운전능력이 정규분포에서 엄청 떨어진 특이한 분포를 보이지 않는데, 대다수의 사람들이 평균보다 잘할수는 없는 노릇이니까요. 이런 상황에서는 평균의 정의가 대충 딱 중간지점이 되버리고맙니다. 심리적인 과시욕이든, 뭐든, 우리는 직관적으로 평균점을 찾는데 어려움을 겪는다는거죠. 반대로 평균을 너무 높게 예상하는 경우도 많습니다. 사회적 성취도가 높으면 높을수록 더 많이 나타난다는 사기꾼 신드롬이 (Imposter Syndrome) 이와 연결되어있다고 생각합니다. "내 주위 사람들과 비교해보았을때 내 능력은 사실 이 위치에있으면 안되는데, 내가 어떻게 어떻게 사람들을 착각하게 만들어서 분에 넘치는 과분한 대우를 받고있다. 언젠가 내 진짜 능력이 들통나서 사람들이 내 민낯을 보고 다들 날 경멸하고 난 아래로 떨어지고 말것이다."라는 불안감에 시달리며 스스로를 자책하는 케이스입니다. 달에 최초로 도달한 인간 닐 암스트롱과, 미국의 위대한 시인 마야 안젤루등이 이 사기꾼 신드롬에 시달렸던 유명인들에 포함된다고합니다. 닐 암스트롱의 경우 "난 그냥 시키는대로 가라는 곳에만 갓을뿐인데 영웅 취급을 받는다"라고 고백했다는 일화가있고, 마야 안젤루는 "난 사실 내 시들이 좋다는 생각이 들지않습니다"라는 유형의 인터뷰를 한적이있다고합니다. 운전능력 설문과는 반대로 본인의 능력은 과소평가하고 상대적으로 주위사람들의 평균적인 능력은 과대평가를하는거죠. 달의 첫 탐사 이후 버즈 알드린이 찍은 닐 암스트롱 노년의 마야 안젤루 왜 우리는 무언가의 평균을 어림잡는걸 이렇게 어려워할까요? 인관관계가 형성되는건 아니지만, 상관관계 정도로는 생각해볼만한 이야기가있습니다. 전 호모 데우스에서 읽었던 이야긴데, 사람은 특정한 이벤트를 기억할때 경험 및 감정의 총량 or 총량/시간으로 기억하기보다는 (피크 경험 + 마무리)/2로 기억한다고합니다. 책에서 나온 예를 들어서 (디테일은 제가 각색했습니다) 내시경을 할때 환자a는 5분만에 하면서 대신에 최고로 불편할때 8점 정도의 고통을 느끼고, 나올때도 급하게 나오느라 6점 정도의 불편함이였다고 해봅시다. 각 분당 고통 정도가 6, 7, 8, 7, 6이였다고하면 총 고통량은 31, 분당 고통량은 6.2가 되죠. 환자b는 9분 동안하면서 최고 고통은 역시 8점이지만, 나올때 의료진의 배려료 고통이 3밖에 안됫다고해보죠. 분당 고통이 6, 7, 7, 7, 8, 8, 7, 6, 6, 3이면, 총 고통량은 58, 분당 고통량은 6.4로 둘다 첫 환자보다 높습니다. 하지만 (피크+마무리)/2를 비교해보면, a는 (8+6)/2 = 7 vs b는 (8+3)/2=5.5입니다. 고로 본인들의 내시경 경험에 대해서 a보다는 b가 더 편한 경험으로 판단하고 기억하는 경향이있다는거죠. (이래서 의사쌤들이 진료 끝나고 사탕 주시는거라고...) 사람의 직관적 판단능력이라는게 미묘한 뉘앙스가 상당히 많은거죠. 상황에 따라서 이게 도움이 될수도있고, 도움이 안될수도있을겁니다. 하지만 우리가 사회나 큰조직 등 복잡한 시스템을 바라볼때, 인간의 이러한 경향을 의식하고있는게 훨씬 도움이 된다고 생각합니다. 인간의 직관은 주어진 정보를 해석하는데에 여러가지 꼼수를 씁니다. 제대로 꼼꼼하게 하려면 너무 힘드니까요. 꼼수는 유용할수도있습니다. 일들을 빠르게 편하게 처리할수있으니까요. 대신에 너무 쓰다보면 결국엔 한계에 도달하죠. 우리의 직관을 너무 남용해서는 안될겁니다. 그렇다면 정보의 프로세싱 능력은 그렇다치고, 그래도 우리는 우리가 받는 정보의 신뢰도라도 좋으면 문제가 덜하겠죠? 하지만 아쉽게도 개인이 받아들이는 정보의 질은 굉장히 낮을 가능성이 더 높은것 같습니다. 경험의 기억의 선별적 취사 등 바이어스는 다들 많이 아실테니까 넘기고, 조금 다른 이야기를 해보겠습니다. 친구입니다. (조금 더 정확히는 인맥이겠지만...) 던바의 숫자라는 개념이있습니다. 사람이 안정적으로 유지할수있는 인맥의 숫자에 상한선이 존재한다고하는데, 던바는 그게 약 150명 정도라고 주장합니다. 연구자에 따라서 숫자가 좀 변동하기는 하는데 많아도 300명 정도가 정말 최상한선이라고합니다. "안정적으로 유지하는 인맥"의 정의에 대해서 던바는 "바에서 뜻밖에 만낫을때 특별히 초대받지 않고서도 인사하고 이야기를 할수있는 정도의 관계"라고 말합니다. 개인적으로는 저정도가 내가 다른사람과 대화중에 그 사람의 이야기와 삶, 경험등을 인용할때 나 스스로에게 정보의 신뢰도를 그래도 어느정도 보장할수있는 하한선 즈음이라고 생각합니다. 저것보다 모르면 그냥 단편적인 소비성 일화 정도에 그치겠죠. 개인이 사회 등 큰조직에 대해서 논할때 "제 경험에는 말이죠..."라는 전제를 많이 사용합니다. 개개인이 모두 사회학적인 데이터를 지속적으로 다루는 세상이 아니니 현실적으로 어쩔수 없기에 이해는하지만, 저 전제에 담겨있는 서브텍스트 중에는 "나의 경험이 내가 언급하고자하는 사회/조직을 대표할만하다"라는 것도 포함이될겁니다. 대표성이 성립 안되면 그냥 아웃라이어 케이스여서 주요 담론에 별로 중요하지 않을 가능성이 높을테니까 애초에 언급할 가치가 확 떨어지죠. 여기서 생각해봄직한게 던바의 숫자입니다. 우리 모두가 외향적이고, 사회성이 뛰어난 인간들이라 가정하고 높게 잡아서 우리가 그래도 최소한의 정보 신뢰도를 지니고있는 사람이 300명이라고 가정해보죠. 그리고서는 한국의 문제에 연관되어있는 사람들의 수, 아니면 조금 더 작게 국내재벌의 문제에 연관되어있는 사람들의 수, 조금 더 작게? 우리 학교/회사의 문제에 연관되어있는 사람의 수와 비교를 해보세요. 한국전체의 문제라면 300명 모두가 포함될수도있지만, 내가 단편적으로 기억하는 300명의 정보로부터 5천만이 넘는 사람들의 동향을 유추해내려고하는겁니다. 앞서 언급한 인간의 부족한 직관능력으로 말이죠. 문제가 조금더 작아지면 비율이 좋아지기도하지만, 동시에 내 300명중에 이 문제에 유의미하게 언급될만한 사람의 수도 줄어들죠. 동시에 그만큼 개개인의 경험이 대표성을 띌 가능성도 줄어듭니다. 여전히 내 직관능력은 인간으로서의 한계를 지니지만요. 여기에 한가지만 더 생각을해보죠. 단순히 숫자만으로 비교해보았을때도 300명은 충분히 큰샘플 사이즈가 아닐 가능성이 높습니다. 근데 이 샘플풀이 심각한 바이어스 또한 지니고있다는게 문제죠. 던바의 숫자에 포함된 사람들은, 내가 알고, 내가 대화하기에 편한 사람들입니다. 여러 방면에서 나와 공유하는 부분이 많은 나와 비슷한 사람들로 편향되어있는거죠. 그것이 혈연, 성격, 취미, 정치적 견해, 성취향, 나이, 성별, 자산, 국적, 인종 등 우리의 인맥은 우리의 에코 챔버를 형성할수밖에 없습니다. 세상에 그 누구도 "내 지금 인맥의 분포를 한국 전체 인구분포와 비교해보았을때 고소득 노년 여성의 비율이 너무 낮으니까 싸모님을 1명 추가해 봐야겠군"이러고 인맥을 만들지는 않죠. 사실 하드 데이터를 두고 계산기를 두드리고 코드를 돌리고해도 각종 바이어스와 방법론의 한계를 포함한 다양한 이유로 분석에 오차와 한계가 존재합니다. 그런데 평소에 저런걸 할 여유가 없는 우리의 분석은 오죽하겠어요. 현실적으로 어쩔수 없기는하죠. 지금 이 글을 쓰는 저도 귀찮음을 포함한 여러 이유로 제대로된 자료검토 안했고, 고학력, 한국계 미국인, 이공계, 등의 여러 바이어스와 무지가 힘껏 내포되어있는 글을 쓰고있는겁니다. 그래도 의식은 하고 있어야겠죠. 주장이란 기본적으로 근거+논리로 형성이됩니다. 그런데 우리가 보통만드는 주장은 근거도 논리도 오차범위가 생각보다 클수있다는거죠. 기본적으로 이야기를 할때도 들을때도 그걸 한편에 생각하고있어야한다는거죠. "쟤도, 나도, 아마 틀린부분이 많은 이야기를 하고있을꺼야 ㅋㅋ" 저희 연구실의 모토는 첫 포닥이 남기고갔습니다. "연구에는 두가지 규칙이있다./There are two rules of Research 첫번째: 아무도 믿지 말아라/ Rule #1: Don't trust anybody 두번째: 첫번째 규칙을 본인 스스로에게 적용하라/ Rule#2: Apply rule #1 to yourself" 우리의 삶에서도 비슷하게 적용할수있다고 생각합니다. 일베의 "아무도 믿지마! 일베를 믿어!"는 제 모토에 상당히 가까웠지만 가장 중요한 부분을 틀렸던거죠. 전 [아무도 믿지마! 너 자신도 믿지마!] 정도로 정리하고 싶습니다. 물론 이 모토는 당연히 이 글에도 적용하셔야합니다. 빵형 얼굴에 소크라테스 얼굴 합성하면 더 적절할것 같다는 생각도... 14
이 게시판에 등록된 다시갑시다님의 최근 게시물
|