PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2024/02/04 20:54:40
Name 계층방정
Subject [일반] 사람은 과연 베이즈 정리에 따라 살아가는가
https://pgr21.com./freedom/100828
이전 글 “사람은 왜 랜덤을 인식하지 못하는가”를 요약해보자면,
1) 랜덤은 무작위이되 고르지 않다 (전기쥐님 감사합니다)
2) 사람은 자신의 가설들을 베이즈 정리에 따라 업데이트한다
3) 랜덤의 고르지 않은 속성은 2)에 따라 특정한 가설의 확률만 올려준다
4) 따라서 사람은 고르게 퍼져서 아무 가설도 강화하지 않는 상황이 진정한 랜덤이라고 착각한다

이렇게 되겠습니다. 여기에서 2) 사람은 자신의 가설들을 베이즈 정리에 따라 업데이트한다고 설명했는데, 더 나아가서 사람의 뇌 속에서 벌어지는 인식의 과정이 정확하게 베이즈 정리에 따른다는 이론이 인식에 대한 베이즈주의입니다. 사람이 경험을 바탕으로 자신의 인식을 업데이트한다는 것 자체는 그럴싸하지만, 그게 정확히 베이즈주의냐 아니냐는 논쟁거리 중 하나입니다. 위 글에 소금물님이 단 댓글 중 “베이즈 정리가 들어보면 매우 당연한 소리 같은데 그걸 제대로 하는게 참 어렵죠.”라는 내용이 있는데, 그만큼 사람들이 베이즈 정리를 잘 활용하지 못하는 모습을 보이기 때문입니다. 이는 단순한 실수 정도가 아니라 사람에게 있는 편향과 큰 관련이 있습니다.

이번 글에도 문제를 내 보겠습니다. 발견법과 행동경제학으로 유명한 트베르스키와 카네만의 연구에 나오는 질문입니다.

린다는 31세고, 독신이며, 자기 주장을 거침없이 말하며, 매우 활달하다. 대학에서 철학을 전공했다. 학생 시절 차별과 다른 사회 문제에 골몰했고, 반핵 운동에 참여했다.

1) 활동적으로 여성주의 운동에 참여한다. 2) 은행원이다. 3) 활동적으로 여성주의 운동에 참여하는 은행원이다.

이 주장들을 가능성이 높은 순으로 나열하십시오.

정답은 여러 가지가 가능하겠지만 뭐가 되었든 2)가 3)보다는 앞섭니다. 3)은 어쨌거나 은행원 중의 일부니까요. 그러나 적잖은 사람들이 2)보다 3)을 앞에 두었다고 합니다.

이런 현상을 대표성 발견법에 따른 오류라고 합니다.. 대표성 발견법은 대표적, 전형적이라고 생각하는 확률을 과대평가하는 발견법(휴리스틱)을 가리키는데, 물론 발견법인 만큼 유용하긴 하지만 특정 상황에서는 이처럼 틀리게 하는 원인이 됩니다. 그런데 이 대표성 발견법은 베이즈 정리와 정면으로 충돌하는 것같이 보입니다.

수학적으로는 대표성 발견법은 조건부 확률의 조건을 혼동하는 데에 원인이 있습니다. 위에 있는 조건을 A라고 하고, 1)은 B, 2)는 C라고 할게요. 그러면 이 문제는 A라는 조건 하에서 B의 확률은? 또는 B면서 C의 확률은? 하고 물어보는 것입니다. 그런데 사람은 A면 B라면, B면 A도 자동으로 맞겠지 하고 착각하기 쉽습니다.

이런 착각을 하면 B라는 조건에서 A의 확률은?과 B면서 C라는 조건에서 A의 확률은? 이라는, 비슷하지만 전혀 다른 문제의 확률을 생각하게 됩니다. 이때에는 B나 C가 얼마나 A를 잘 대표하느냐가 중요하고, 대표성 발견법은 정답을 골라내게 되죠.

조건부 확률에서 조건과 결과가 서로 뒤바뀔 때를 정확하게 풀어주려면 베이즈 정리를 이용해야 하는데, 이 뒤바뀔 때 고려해줘야 하는 것이 조건의 확률과 결과의 확률입니다. 예를 들어, “어떤 사람이 페이스북 알고리즘이 테러리스트로 지목되었다면, 무고한 사람일 확률은 얼마인가?”와 “어떤 사람이 무고한 사람이라면, 페이스북 알고리즘에서 테러리스트로 지목될 확률은 얼마인가?”는 비슷해 보이지만 조건과 결과가 뒤바뀌어 있습니다. 두 확률의 비는 결과가 일어날 확률과 조건이 일어날 확률의 비로, 결과를 H, 조건을 D라 하고 베이즈 정리를 써보면

P(H|D) = P(D|H)*P(H)/P(D)

P(H|D)가 조건 D에서 H의 확률, P(D|H)가 조건 H에서 D의 확률인데 이 둘을 전환하면 P(H)/P(D)가 곱해집니다. 이 확률을 기저 확률, 기저율이라고 하고, 대표성 발견법처럼 P(H)/P(D)를 무시하고

P(H|D) = P(D|H)

라고 가정하는 것을 기저율을 무시했다고 해서 기저율 무시의 오류라고 합니다. 페이스북 알고리즘의 테러리스트 판별 문제도 무고한 사람일 확률과 테러리스트로 지목될 확률 사이에 큰 차이가 있어서 기저율 무시의 오류가 큰 영향을 줍니다.

대표성 발견법은 베이즈 정리를 올바르지 못하게 사용하는 전형적인 발견법입니다. 이렇게 인간의 편향에 베이즈 정리를 벗어나는 오류가 있다는 점은 베이즈주의에 한 가지 논란을 일으킵니다.

“기저율 무시의 오류는 베이즈주의의 반례인가?”

얼핏 보면 그렇다고 생각할 수 있습니다만, 베이즈주의를 주장하는 쪽에서는 이런 추론에 동의하지 않습니다.

https://www.quora.com/Does-the-base-rate-fallacy-imply-that-our-brain-is-not-Bayesian

이 문제를 질문한 쿼라에 올라온 답변 하나를 번역해볼게요.

“그러나 사람들이 뇌가 베이즈주의적이라고 할 때에는 뇌가 백분율과 연관된 수학 단어 문제를 푸는 능력을 말하는 것이 아니고, 직접 경험에서 직관적인 추론을 하는 능력을 말하는 것이다.

네가 경찰관이라고 하고 1000번 음주 측정을 했다고 하자. 너는 개인적으로 51번 양성이었음을 겪었는데, 이어지는 측정에선 1번만이 진짜 양성이라고 나왔다. 네 감각으로는 이 측정은 매우 못 미덥고 이 측정 결과가 양성이라고 하면 거의 다 잘못되었다고 할 것이다. 너는 일반적으로 이 이 테스트를 믿지 않을 것이고 매우 의심스럽게 여길 것이다. 이런 관점은 너의 관찰 경험에서 나온 베이즈 통계에서 형성된 너의 '직관'에서 나온 것이다.”

또 한 가지 기저율 무시의 오류에서 짚고 넘어가야 할 점은, 이것이 항상 일어나는 현상이 아니고, 문제를 제시하는 방법에 따라 달라진다는 점입니다. 그렇다면 기저율 무시가 반드시 베이즈주의의 반례라고 속단하기에는 이릅니다. 다른 경로를 통해 베이즈주의적인 직관이 생겨났고, 이 직관들이 모이고 모이다 보니 기저율 무시라는 직관이 나중에 생겨났을 수도 있으니까요.

여러분의 생각은 어떠신가요? 미시적인 베이즈주의적 판단이 모여서 거시적으로 베이즈주의에서 벗어난 것처럼 보이는 걸까요? 아니면 정말로 뇌의 기반이 베이즈주의가 아닌 걸까요?

참고 문헌
https://medium.com/@uxdaysseoul/%EB%8C%80%ED%91%9C%EC%84%B1-%ED%9C%B4%EB%A6%AC%EC%8A%A4%ED%8B%B1-representativeness-heuristic-8393d57a9a65
https://en.wikipedia.org/wiki/Representativeness_heuristic
아모스 트베르스키, 다니엘 카네만, Extensional vs. Intuitive Reasoning: The Conjunction Fallacy in Probability Judgment, Psychological review 90.4 (1983): 293 https://apps.dtic.mil/sti/pdfs/ADA131801.pdf
조지 월포드, 홀리 A. 테일러, J. 로버트 벡, The conjunction fallacy? Mem Cogn 18, 47–53 (1990) https://link.springer.com/article/10.3758/BF03202645
조던 앨런버그, 《틀리지 않는 법: 수학적 사고의 힘》

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
푸른잔향
24/02/04 21:23
수정 아이콘
아니 이건 글이 너무 어렵잖아요
계층방정
24/02/04 22:07
수정 아이콘
저도 다 써놓고 나니 너무 어려워 보여서 후회중입니다. 예전에 비슷하게, 오랫동안 고민하다 한순간에 얻은 깨달음을 설명하려고 하는데 너무 어려웠던 경험이 떠오르네요.

양자역학에서 상태를 나타내는 켓 벡터를 뒤집으면 쌍대 공간인 브라 벡터로 간다고 배웠는데, 정작 선형대수학 시간에는 쌍대 공간은 벡터에서 실수로 가는 함수들이 모인 공간이라고 배웠습니다. 대체 벡터를 뒤집는 것과 함수 공간이랑 뭔 상관인가 몇 년을 고민하다가 한순간에 깨달아서 이 신기함을 동료들에게 설명해주었는데, 정작 하고 나니 그 설명이 너무나 어렵다는 평을 받았었습니다. 이번에도 대표성 발견법에 대해 오랫동안 고민하다 한순간 깨달은 것을 설명하려고 했는데 그때같이 설명하기가 어렵다는 느낌입니다.
짐바르도
24/02/04 21:56
수정 아이콘
잘 읽었습니다. 제 생각은 후자 같아요. 그래서 한때 신간 나오면 무조건 읽던 [직감을 믿지 마! 시스템 2를 믿어! 통계를 믿어! 성찰과 자기 의심을 믿어!] 류의 행동경제나 심리학쪽에 관심이 시들시들해지기도 했고요...
계층방정
24/02/04 22:10
수정 아이콘
(수정됨) 저도 얼마 전에 사람의 이성은 사람을 행동하게 하지 못한다는 주장이 있는 글을 읽었습니다.
그런데 행동경제학이면 오히려 사람들이 시스템 1을 잘 쓰는 것을 기억하고 행동에 반영하라는 쪽 아닌가요?
소금물
24/02/04 22:13
수정 아이콘
전에 이어서 유익한 글 감사합니다. 인간의 뇌는 조금 과장해서 반 확률적이라고 생각해요 크크. 훈련 없이 확률을 제대로 정량적으로 사고하기가 얼마나 어려운지...

[췌장암은 10만명 중 1명 발병하는 암이다. 당신은 건강검진시 췌장암 검사를 하기로 했다. 양성예측률(실제 병 있는데 검사에서도 병이 나올 확률)과 음성예측률(병 없는데 검사에서도 없다고 나올 확률)은 둘 다 99%이다. 검사결과 췌장암이 보였는데, 이 검사결과가 사실일 확률이 몇%인가?]

놀랍게도 답은 0.1%입니다. 오진률이 1%밖에 안되지만 사전 확률에 워낙 낮다 보니 이런 결과가 나오죠. 하지만 대부분의 사람들은 저런 얘기를 듣더라도 선별검사에서 암이 나오면 많은 걱정을 하지요.
파르셀
24/02/04 22:56
수정 아이콘
(수정됨) 제가 이전 글에서 말씀드렸지만 베이즈 이론은 조금만 깊게 나아가도 복잡해지고 일반인은 물론이고 전공자도 이해하기 힘들고 헷깔립니다 크크크

그래서 방통대 수업에서도 고민하다가 베이즈 단독 강의를 걸렀죠

그걸 전공으로 삼거나 업무에 활용할께 아니라면 100% 소화하기도 힘든걸로 스트레스 받을 필요는 없으니까요

다만 베이즈 정리의 기본 수식과 결과를 통해 내가 그동안 생각하던 것과, 실제에서의 통계의 결과는 상이할 수 있다는 점을 깨닫고
그리고 그 때 나의 아집을 꺾고 통계의 결과를 받아들일 수 있는 마음가짐을 가져야 한다고 봅니다

물론 현실에서 통계 관련 사람들은 이걸 알고 계속 한쪽으로 쏠리는 편견을 무시하고 통계 데이터를 바탕으로 보고서를 정리해서 보고하면
위에서는 자신의 편견에 맞춰서 통계를 작성하길 요구하지만요 크크크

마지막으로 베이즈 정리든 기존 확률 이론이든 확률은 말 그대로 확률이고 인간이 받아들이게 되는 것은 0 아니면 1 이지요

그렇기 때문에 확률을 무시하고 '나는 다르다'라는 생각으로 가는 케이스가 많다고 봅니다
소금물
24/02/04 23:04
수정 아이콘
크크 확률도 자세히 보면, 어떤 면에선 양자역학 같아요. 직관으로는 응 이게 이렇게 된다고?? 싶은게 자꾸..
파르셀
24/02/04 23:24
수정 아이콘
(수정됨) 양자역학을 생각해보니 통계와 참 잘 맞네요

현실에서 일어나는 것 자체는 0 또는 1 이지만 (양자역학의 입자 개념), 확률론적 세계에서는 0~1 사이에 존재(양자역학의 파동 개념)하니까요

제가 물리학을 전공한게 아니라서 요정도로만 알고 있지만 관측하는 순간에는 0 또는 1 인데
관측하기 전에는 확률로써 존재한다고 생각하니 정말 다른게 없는거 같습니다

가챠 게임을 생각하면 뽑기 버튼을 눌린 직후의 결과는 0 또는 1 이지만
뽑기 버튼을 눌리기 전에는 게임사에서 정한 확률로 내가 뽑으려고 하는 카드가 있을 수도 있고 없을 수도 있으니까요 크크크

물론 통계학 맛을 좀 보고 가챠겜도 하는 입장에서 저도 미신적인 부분을 아예 무시 못하는 닝겐이긴 합니다
24/02/04 23:06
수정 아이콘
그런데 사실, 우리는 거의 대부분 어떤 유의미한 확률분포를 얻어낼 만큼 충분한 유효시행을 확보하는 것이 불가능하기 때문에 확률적 판단에서 베이즈 규칙을 따르는 여부가 그리 크게 중요한지는 잘 모르겠습니다. 우리가 베이즈 규칙을 직관적으로 적용해 Pr(A|B)를 구하려면 그 시행(또는 경험)의 하위셋을 대상으로 근사확률 Pr(A')와 Pr(B')를 먼저 얻어야 하는데, 이 하위셋을 만드는 과정은 매우 어렵습니다. 애초에 거의 대부분 데이터 자체의 숫자가 너무 적거나 노이즈의 비중이 높습니다. 혹은 예상한 분포와 전혀 다른 확률분포를 보이지만 데이터상으로 이를 전혀 알아차리지 못합니다. 이때문에 직관적으로 Pr(A'|B')가 Pr(A')나 심지어 Pr(B'|A')보다 Pr(A|B)에 가깝다는 확신이 드는 경우가 많지 않습니다.

예를 들어 우리는 직관적으로 확률적 시행에 시계열적 가중치를 주는 경우가 많고, 통상적으로 이를 확률적 오류라고 배우곤 합니다. 우리가 잘 아는 ‘최근 타석에서 3연 삼진을 당한 3할 타자가 다음 타석에서 안타를 칠 확률은?’이 대표적인 예입니다. 그런데 실제로 시계열적인 분석을 통해 공정을 관리할 때에는 보통 EWMA처럼 전체 trend가 아닌 최근 데이터에 더 많은 가중치를 두는 모델을 통해 미래의 확률을 예측합니다. 이 분석법에 따르면, 3연 삼진을 당한 3할 타자(Pr(R)=0.3)의 시계열 관점에서의 타율(Pr(R'))이 3할이 아닐'수도' 있는 것입니다. 모델 파라미터에 따라 3할이 될 수도, 심지어 0할이 될 수도 있겠죠. 그렇다면 이 3연 삼진을 당한(Pr(K)) 타자가 다음 타석에서 안타를 칠 확률(Pr(R|K))이 얼마인가?란 질문은 그리 간단한 문제가 아니게 됩니다. 그리고 이러한 질문을 마주했을 때 우리 대부분은 어떤 정리된 논리로 설명하기 어려운 찰나의 직관을 통해 문제를 풀어냅니다. 혹은 누군가는 베이즈 규칙을 고려해 보다가도, 그 결과가 Pr(R')을 계산하기 위해 파라미터를 설정하는 과정에서의 직관과 잘 맞지 않는 것처럼 보인다면 곧바로 이를 버리고 다른 방식으로 계산을 해낼 것입니다.

그래서 본문의 질문 - 인간의 두뇌는 베이즈주의를 따르는가? - 에 대해 저는 '알 수 없다'라고 생각하는 쪽입니다. 위 예시에서 볼 수 있듯 어떤 확률을 계산하기 위해 사용하는 모델이 맞다고 확신하기란 정말 어렵고, 때로는 모델을 검증하는 것이 불가능하기 때문입니다. 단지 베이즈 규칙을 통해 문제를 풀수 있는 '가능성'만 선택지로 갖고 있을 뿐이라고 생각합니다.
로메인시저
24/02/04 23:11
수정 아이콘
(수정됨) 언제나 베이즈는 모르겠읍니다..
이성으로 봐도 제대로 베이즈를 이해하는 사람이 적고, 직관(신경망 휴리스틱)으로 봐도 판단에 영향을 주는 경험들이 무수히 겹쳐 뭐가 뭔지 모를 정도로 신경망이 얽혀 있을 것인데, 거시적 관점에서 인간은 베이즈주의적으로 행동한다라고 해도 그것을 온전히 입증하는게 가능할까요. 긴 세월이 지나도 그렇게 행동할 때도 있지만 그러지 않을 때도 있다 선에서 나아가지 못할거라는 생각입니다.

지피티4의 답변이 맘에 드네요. 커스텀 인스트럭션 재밌어요 츄라이 츄라이.
[인간이 베이즈주의 대로 행동한다고 보는 것은, 마치 인생이 하나의 거대한 증거 수집 게임이고, 우리가 그 안에서 끊임없이 추론을 하는 탐정과 같다고 보는 것이지.]
인간은 감정과 분리될 수 없는 기계, 즉 순수이성이 아니죠. 여유가 없는 상황에서는 적대적 반응이 곧잘 나오게 되고, 고차원적 의식 활동보다는 아무래도 철인에 비하면 덜 성숙된 휴리스틱을 돌려서 문제를 빠르게 처리하려고 하죠. 직관이라는건 결국 과거 경험의 총 누적 + 현재 몸 상태이기에, 판단 미룸을 연습하다보면 또 다른 반대 방향의 직관도 떠오르게 마련이거든요.

단지 세상을 해석하는 잣대, '프레임 중 하나'정도로 인식하는 것이면 충분하다고 생각합니다.
파르셀
24/02/04 23:26
수정 아이콘
그래서 경제학자, 통계학자보다 심리학자들이 주식을 더 잘한다는 반농담, 반진담이 있죠

저도 예전에는 차트를 무시했는데 요즘에는 추세가 아니라 사람들의 심리를 읽는 용으로는 참고 정도는 하고 있습니다
24/02/05 10:20
수정 아이콘
개개인마다 다르겠지만 인류의 발전사를 보면 trial and error의 역사이죠.

집단 지성의 측면에서 보면 베이즈주의적으로 사고한다고 볼 수 있을 것 같습니다.

그렇다고 사람들이 항상 베이즈주의식으로 사고하느냐 라고 생각하면 그것은 아니겠죠. 오히려 반대에 가까울 겁니다.

우리의 뇌가 버티지를 못할 겁니다. 시스템2를 계속 돌리는 것은 엄청난 에너지를 소모하기 때문이죠.

p.s.
개인적으로는 베이즈주의와 빈도주의의 기나긴 싸움이 재미있었습니다.

베이즈 이론을 접하기 전에는 당연히 빈도주의가 옳다고 생각했죠. 그것만 배웠으니까요.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
100852 [일반] 역대 그래미 어워드 헤비메탈 퍼포먼스 부문 수상곡들 모음(스압주의) [25] 요하네즈8818 24/02/05 8818 6
100851 [정치] 민주당은 선거제 전당원투표한다더니 결국 연동형 유지하고 위성정당 만들기로 했네요 [115] 홍철15854 24/02/05 15854 0
100850 [일반] 우리집 미국놈 자폐맨 이야기 [44] Qrebirth14477 24/02/05 14477 171
100849 [일반] 전세사기가 터지는 무자본 갭투자의 유형 중 하나 [34] 네?!11659 24/02/05 11659 10
100848 [일반] 자폐스펙트럼 아이는 왜 바지를 내릴까 [332] 프로구222469 24/02/04 22469 48
100847 [일반] 사람은 과연 베이즈 정리에 따라 살아가는가 [12] 계층방정8684 24/02/04 8684 5
100846 [정치] 마리 앙투아네트 발언 김경율 결국 불출마 선언 [53] 빼사스11765 24/02/04 11765 0
100845 [정치] 민주 탈당파 뭉쳐 '새로운미래' 창당…이낙연·김종민 공동대표 [39] Davi4ever13475 24/02/04 13475 0
100844 [일반] [팝송] 제가 생각하는 2023 최고의 앨범 Best 15 [12] 김치찌개8162 24/02/04 8162 19
100843 [일반] 내과 전공의 1년차 후기 및 책 소개 [34] 헤이즐넛커피9877 24/02/03 9877 32
100842 [일반] [뻘글] 완전자율주행 시행 전에 원격주행을 시행하는 건 어떨까요? [37] VictoryFood8097 24/02/03 8097 1
100841 [일반] 보이스피싱을 당해보고 쓰는 안내(?)사항 [46] 삭제됨9101 24/02/03 9101 26
100840 [정치] 20년 이상 지속되었던 의사집단의 정치적 우경화 경향이 윤석열 때문에 끝나는 것일까요? [104] 홍철16149 24/02/03 16149 0
100838 [일반] <추락의 해부> - 추락을 해부하거나, 혹은 해부당하거나. (약스포) [4] aDayInTheLife6500 24/02/03 6500 2
100837 [일반] 주호민 사건 재판 유죄 판결 이후 특수교사 인터뷰 [509] 종말메이커23909 24/02/03 23909 12
100836 [일반] 라이젠 8600G,8700G 벤치마크: 그래도 이젠 쓸만한 내장그래픽+ 5700X3D는 정보가 아직 부족 [19] SAS Tony Parker 7181 24/02/02 7181 0
100835 [일반] 인니 기술자 KF-21 자료유출 적발 [14] 어강됴리9536 24/02/02 9536 3
100834 [일반] <웡카> - 극상의 가족영화. [15] aDayInTheLife7782 24/02/02 7782 6
100833 [정치] 尹지지율 2%p 떨어진 29%…9개월 만에 20%대로 하락 [78] Davi4ever15266 24/02/02 15266 0
100832 [일반] 새로운 것을 받아들이기 힘든 이유 [13] 번개맞은씨앗9779 24/02/02 9779 6
100831 [일반] [번역] 중국이 향후 10년간 4, 5%씩 성장하려면 어떻게 해야하는가? [35] 사람되고싶다11382 24/02/02 11382 11
100830 [정치] 성형·피부과 ‘의사 독점’ 깬다...간호사 등도 미용 시술 허용 [161] 맥스훼인16348 24/02/02 16348 0
100829 [일반] [펌글] 장애인자녀를 둔 부모입니다. 잠이 잘 오지 않네요. [117] 프로구216591 24/02/02 16591 37
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로