PGR21.com
다시봐도 좋은 양질의 글들을 모아놓는 게시판입니다.
Date 2019/03/26 14:43:45
Name 여왕의심복
Subject 보건의료영역에서의 데이터 사이언티스트의 역할과 미래
안녕하세요. 가끔 이런 주제로 글 올리는 여왕의심복이라고 합니다.

제가 질문게시판에 기계학습에 대한 질문을 올렸는데, 너무 양질의 답변을 주셔서 감사의 의미로 간략하게 보건의료영역에서의 데이터사이언티스트의 역할과 미래에 대해서 간단한 글을 드리고자 합니다.

1. 간단한 소개

저는 모의과대학에서 예방의학교실 조교수이며, 건강보험 빅데이터를 다루는 연구실을 꾸리고 있습니다. 서로 다른 전공을 가진 3분의 박사급 인력과 함께 일하고 있습니다. 나름 의학연구의 방법론과 실제 연구의 최일선에 있다고 생각합니다.

2. 우리나라 보건의료에서의 데이터사이언티스트

아직까지도 보건의료영역에서는 데이터사이언티스트라는 말은 낯선말입니다. 물론 보건 통계학이라는 통계학의 한 세부영역이 존재하고 있지만 말입니다. 보건의료 현장에서는 수많은 데이터가 존재합니다. MRI, CT, 초음파와 같은 영상 데이터의 영역, CDM으로 대표되는 임상 진료기록 영역, 제가 하고 있는 건강보험 청구 자료 등이 현재 주로 다루어지는 데이터의 영역입니다. 아 유전체 영역의 데이터가 있지만, 이는 기초학문과도 밀접한 관련이 있어서 제외하겠습니다.

위에 말씀드린 세가지 영역 (1) 영상, (2) 임상진료기록, (3) 건강보험 자료가 데이터 사이언티스트가 주로 활동할 수 있는 분야입니다. 하지만 아직까지 데이터 사이언티스트가 직접 이분야로 뛰어드는 것은 어렵습니다.

3. 영상 영역

영상 영역은 현재 많은수의 대기업, 스타트업이 뛰어들고 있습니다. 이미 상당부분 구현되기도 하였구요. 우리나라는 세계적으로도 영상의학적 진단이 매우 발달한 나라입니다. CT, MRI와 초음파 자료자체가 워낙 많은 상태라 단일 상급종합병원 하나로도 충분히 좋은 성능을 보이는 결과물을 낼 수 있습니다. 따라서 여러 업체가 난립하고 있는 상황입니다.
영상 영역은 이미 경쟁이 치열하지만, 더욱 중요한 것은 얼마나 많은 영상의학과 의사와 함께 일할 수 있고, 많은 판독지를 입수할 수 있냐가 중요합니다. 따라서 새롭게 신규로 시장에 진입하시기는 매우 어려울 것으로 생각됩니다.

4. 임상진료기록

임상진료기록은 말 그대로 병원에 입원하거나 외래를 보실 때 의사들이 작성한 의무기록과 검사결과 등을 말합니다. 이를 통해서 치료결과를 예측하거나 최적의 치료조합을 찾는 연구를 수행할 수 있습니다. 하지만 여기서 몇가지 문제가 발생하는데, (1) 모든 의사, 병원의 의무기록이 같은 형태로 저장되지 않는다는 점, (2) 상당수의 의무기록이 자연어의 형태로 표현된다는 점이 대표적입니다. (1) 문제를 해결하기 위해 표준의무기록서식 도입이 추진되고 있고, 생각보다 빠르게 도입이되고 있지만, 아직까지 여러 포맷이 존재해서 약간의 조정이 필요한 상황입니다. (2)의 문제는 조금 치명적인데, 의사들마다 표현하는 방식이 조금씩 다르고, 그 다른 표현이 큰 차이로 나타날 수 있기 때문에 상당수의 자연어 처리 기술이 의료분야에 적용되었으나, 큰 성공을 거둔 것은 없습니다.

5. 건강보험 청구자료

건강보험자료는 우리나라, 대만 등만이 가능한 특수한 형태의 자료로 전국민 단일보험자를 운영하고 있는 나라에서만 가능한 데이터입니다. 우리나라의 경우 건강보험자료만 살펴봐도 거의 대부분의 인구의 상당한 의료이용을 볼수있기 때문에, 5천만명 10년짜리 코호트 연구가 가능한 환경이라고 생각하시면 됩니다. 그러나 이연구도 상당한 진입장벽이 있는데, 먼저 건강보험자료는 철저하게 연구목적이나 정책수립목적으로 사용되는 편이며, 영리목적의 자료 활용은 매우 제한적입니다. 또한 건강보험공단 서버에 물리적으로 직접 연결되어 연구를 수행해야해서 원주에 있는 공단분석실에 직접 방문해야하는 한계가 있습니다.

6. 보건의료쪽에서 데이터사이언스를 하고 싶습니다. 선생님

이런 메일을 자주 받습니다. 제가 항상드리는 대답은 비슷합니다. (1) 이곳은 아직까지 신분제가 공고한 영역이다. (2) 보건학에 대한 이해가 없다면 최소한 데이터사이언스분야에서라도 능력이 뛰어나야한다. (3) 주제를 잘잡는것이 중요하다. 다들 문장만으로도 이해를 하시겠지만 간략하게 부연드리면 보건의료쪽은 아직까지 의사출신 연구자 >>>>>>>>>>>>> 보건학 연구자 >>> 타분야 전공자입니다. 급여체계, 자리 등등 모든 조건이 차별적입니다. 또 의학적인 상황을 다루기 때문에 최소한의 의학적 지식이 있기를 바랍니다. 따라서 보건통계학 전공자가 의사 다음으로 선호됩니다. 마지막으로 잘되는 분야와 안되는 분야가 엄청나게 차이납니다. 어떻게 보면 모든 분야에서 동일한 이야기입니다.

7. 개인적인 전망

그럼에도 불구하고 현재 보건의료계열에서 데이터사이언티스트는 매우 유망합니다. SAS를 잘하신다면 보건의료를 배우시면서 일할 수 있는 자리를 찾으실 수 있을겁니다. SAS와 R을 잘하신다면 타 전공 어디보다 좋은 대우를 받으실 수 있습니다. 거기에 기계학습이나, 건강보험자료, 이미지 처리등을 할 수 있으시면 최소한 대학병원 의사정도의 대우를 받으실 수 있습니다.
  저는 최근 보건학을 전공하신 간호사 선생님, 계량경제학을 전공하신 보건계열 경험이 없으신 선생님, 통계학을 전공하고 보건학 박사과정을 하신 선생님과 일을 하고 있는데, 느낀점이 있습니다.
첫번째 의사나 보건학 전공자에게 데이터사이언스를 가르치는 것과 데이터 사이언스를 어느정도 하시는 분에게 보건학을 가르치는 것 모두 비슷하게 어렵습니다. 즉 데이터사이언스 영역에서 의사가 의료영역에서 가지는 정도의 전문성을 가지시면 충분히 경쟁력이 있습니다. 두번째 아이디어를 잘 줄 수 있는 PI를 만나야합니다. 보건의료분야에 뛰어들 생각이시라면 어디가나 그렇지만 아이디어가 좋은 사람의 아이디어를 구현하는 능력이 곧 실력입니다.  마지막으로 어딜 가나 상당한 시간의 수습기간이 필요합니다.

써놓고 보니 너무 당연한 이야기 같아서 죄송스럽습니다. 감사합니다.

마지막으로 가끔 트위치에서 연구실에 혼자있는 밤에 방송을 하고있습니다. 여왕의심복 검색하시면 평균 시청자 10명의 이상한 채널을 보실 수 있을겁니다. 감사합니다.    





* 노틸러스님에 의해서 자유 게시판으로부터 게시물 복사되었습니다 (2019-10-08 10:56)
* 관리사유 : 좋은 글 감사합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
retrieval
19/03/26 14:49
수정 아이콘
왓슨같이 인공지능 의료도 종종 보이던데 이쪽은 어떤지 혹시 알수있을까요? 글 잘봤습니다
여왕의심복
19/03/26 14:53
수정 아이콘
왓슨이 과연 인공지능이냐에 대한 본질적인 의문이 있지만, 결국 위에 말씀드린 세가지에 문헌검색 등을 포함한 알고리즘이라고 저는 생각합니다. 아직까지 인공지능이 임상의보다 좋은 결과를 보인적도 없구요. 발전할 부분이 많이 있습니다. 그러나 워낙 돈이되는 영역이고, 투자가 많아서 일은 많습니다.
retrieval
19/03/26 15:12
수정 아이콘
그렇군요. 아 그러고보니 전에 데이터구조 수업들을때 바이오인포매틱스쪽 연구하는 교수님 수업들은적 있는데 약학쪽으로도 데이터 사이언스를 응용하는게 가능한가요?
여왕의심복
19/03/26 16:34
수정 아이콘
약학이 그나마 가장 유망합니다. 자료구조가 비교적 쉬워서요.
19/03/26 16:31
수정 아이콘
인공지능 vs 임상의 평가모형은 생각해볼 것이 좀 있습니다. 예를 들어 어떤 세포 사진을 이용해서
암 중간단계인지의 판단하는 문제로 볼 때, 임상의들 사이에도 의견이 다를 수 있습니다. 또한
특정 임상의 1인의 경우에도 시간에 따라 다를 수 있습니다. 보통 이런 상황을 non-deterministic 하다고 합니다.
기계의 경우는 (항상 그런 것은 아니지만) 특정 시간 갭으로 볼 때 같은 사진에 대해서는 같은
결과를 100% 반복합니다.

만일 확실하게 Set up된 한정된 benchmark 임상 사진이 주어진다면 인공지능이 사람보다
더 나은 성능을 보일 수 있습니다. 아직도 최종평가는 결국 임상의가 하기 때문에 open data에 대해서는
임상의 결정에 좀 편향될 수 밖에 없다고 봅니다. 이런 turing test를 해보는 것이 의미가 있습니다.

어떤 임의의 임상사진에 대하여 두 개체가 판단을 합니다. 한 쪽은 사람, 한 쪽은 인공지능(정확히 말하자면 machine learning기계). 다른 제 3의 전문가가 이 둘의 진단을 관찰합니다. 한 100여개의 사진에 대하여.
이 둘 중 어는 쪽이 더 잘 판단하는 것인지를 제 3의 관찰자에게 물어본다면 무척 흥미로운 것 같습니다.

의료용 인공지능 프로그램이 과하게 부풀려지는 상황인것을 맞지만 그 원리로 볼 때
인간의 의한 진단이 기계보다 우월을 유지할 수 있는 기간을 매우 짧으리라 전망을 합니다.

인공지능 진단기를 이렇게 저는 봅니다. 아주 실력있는 의사가 하루에 병원 100군데를 돌면서
죽지도 않고 100년, 200년동안 그 경험을 쌓아가는 것과 다르지 않다고 봅니다. 이런 의사를 누가 당하겠습니까.
여왕의심복
19/03/26 16:35
수정 아이콘
영상영역은 저도 5년이내 이세돌 알파고와 같은 상징적인 사건이 발생할것같습니다.
홍승식
19/03/26 14:58
수정 아이콘
이게 잘 되면 우리는 알파고느님께 원격진료 받을 수 있는 건가요?
여왕의심복
19/03/26 16:28
수정 아이콘
크크 언젠가 의료용포드에서 에얼리언을 꺼내는 날이 오겠네요.
네잎클로버MD
19/03/26 14:59
수정 아이콘
선생님의 마지막 강의를(이제 곧 dinner다!) 들은지도 2년이 다 되어가네요. 저도 이제 1년 남았...
저는 곱창을 전공으로 하고 있으며, data science 와 딥러닝, AI 를 더 파고들어볼까 하고 이것저것 뒤적이고 있는데
영상의학과 같은 '보조적인' 데이터 사이언스 외에 임상에 '직접적으로' 영향을 미치는 영역에 대해서는 아직 패러다임이나 논의의 범위가 무한하다고 봅니다. 다만.. 이게 저도 그 앞길에 처음 서 있기 때문에 막막함이 너무나 심할 따름이지요...
여왕의심복
19/03/26 16:29
수정 아이콘
막막하실때 연락주시면 도와드리겠습니다. 저도 선배들에게 도움많이 받았습니다.
밤의멜로디
19/03/26 15:04
수정 아이콘
머신 러닝 전공자로써 코호트데이터를 만질 일이 있었는데, 임상의학 하시는 분과 시각차가 많았던 기억이 나네요. 어떤 질병은 어떤 형태로 기록이 나타나고 그런 요소들 이야기하시는데, 저희쪽은 개별적인건 필요없고 일단 넣자여서...
그리고 연구하면서 보니 이런 전국민 자료를 만질 수 있다는게 한국이 타국에 비해 관련 연구에서 앞서갈 수 있는 바탕이 되겠구나 하는 생각도 들더군요. 지금은 제약이 크게 걸려있긴 하지만...
여왕의심복
19/03/26 16:29
수정 아이콘
네 스콥이 완전히 달라서 해석할때 서로 힘듭니다 크크
셧업말포이
19/03/26 15:16
수정 아이콘
조금 다른 얘기지만,
건강보험 청구자료라는 게, 그야말로 Big data이긴 하지만 임상에 적용하기엔 계륵입니다.
왜냐하면 '청구'를 전제로 한 자료이기 때문입니다.
그놈의 삭감 때문에, 특정 진단명을 넣지 않으면 일괄적으로 비용삭감이 이루어져서 이거저거 진단명을 마구 집어넣을 수밖에 없고
결국 이를 바탕으로 분석하는 자료로 임상에 적용한다??? 는 건 굉장한 오류를 가져올 수밖에 없습니다.
말 그대로 청구자료를 분석한 것이니, 청구 행정에 써먹어야겠죠.
사업드래군
19/03/26 16:16
수정 아이콘
저도 이 얘기 하고 싶은데요. 크게 두 가지 문제가 있습니다.

예를 들어 항생제나 진통소염제를 장기간 처방하는 경우에는 위장관 보호를 위해 대개 제산제등을 같이 처방합니다.
하지만 이 경우 제산제를 위장관보호 목적으로 사용하는 것은 급여인정이 되지 않기 때문에 "위염" 이나 "위식도역류"같은 상병을 넣고 처방을 하게 됩니다.
그럴 경우 우리나라 사람들의 유병율에서 위염이나 위식도역류 같은 상병의 비율이 엄청나게 올라가게 됩니다.

다른 한 가지 문제는 의심되는 질병의 검사를 위해서도 반드시 그에 해당하는 상병명을 넣어야 하는데요.
예를 들어 갑상선기능항진증이 의심되는 환자가 있어 갑상선기능검사를 해야 할 수 있습니다.
이 경우에도 급여인정을 받기 위해서는 갑상선질환에 해당하는 질환을 넣어야 하는데요. 나중에 검사결과상 이 환자는 갑상선 기능이 정상이었다 하더라도 이미 전산상에는 이 환자의 갑상선질환 상병이 들어가 있습니다.

따라서 갑상선기능 이상환자의 유병율이 과다하게 측정될 수 있습니다.

상병명을 안 넣으면 안되냐고요? 100% 심평원에서 삭감당합니다. 뭐, 제대로 심평원이 원하는대로 넣어도 삭감당하는데요.
그래서 심평원 자료가 실제적인 자료라 믿고 연구를 진행하는 것은 매우매우 위헙합니다. 물론 너무, 엄청나게 많은 데이터가 확보돼 있어서 연구자들에겐 매혹적이고 또한 자체적인 병원의 연구데이터가 없는 의사들에겐 이만큼 좋은 자료가 없긴 하겠지만요.
19/03/26 16:19
수정 아이콘
비슷한 이유로 국내 공단자료로

소아 천식 데이터를 뽑으면

전체 소아 중 30~40%가 넘게 천식이라는 말이 있더라구요.
여왕의심복
19/03/26 16:30
수정 아이콘
이런 이유로 건보자료에서 진단명의 정확성을 검토하는 연구영역이 별도로 있습니다. 그리고 손이 많이 탄 즉 정책적 손길이 많이 닿은 분야는 건보자료를 잘 안씁니다 ㅠ
19/03/26 15:25
수정 아이콘
4. 의 문제는 미국도 아직 해결 못했다고 알고 있습니다
표준화는 시간이 꽤 걸릴 듯 합니다. 같은 병원에서조차 과마다 심지어 세부 전공마다 심하면 전공의 연차마다 쓰는 용어도 다르고 서식도 제각각인데다가 인증평가 대비 등으로 표준화를 강제해도 잘 안 따르기에...
여왕의심복
19/03/26 16:32
수정 아이콘
네 최소 10년은 걸릴 일입니다. 그나마 역설적으로 우리나라는 상급종합병원 쏠림이 심해서 연구자입장에서 다행입니다.
BibGourmand
19/03/26 15:48
수정 아이콘
저도 바이오를 하다보니 바이오인포 쪽 하는 분들과 가끔 만날 기회가 있습니다. 컴퓨터가 베이스인 분들은 바이오를 모르고, 바이오가 베이스인 저같은 사람은 컴맹이라 한쪽은 데이터 셔틀, 다른 쪽은 코더 수준인 코웍밖에 못 하는 경우가 많더라고요. 혼자서 두 분야를 다 잘하면 엄청날 것 같다는 생각은 드는데, 하나도 똑바로 못하는 주제에 둘은 언감생심이고.. 융합 분야라는 것이 그래서 어렵구나 싶었습니다. 이것도 딥러닝이니 빅데이터니 나오기 전 이야기니까, 요즘은 좀 다를까나요.
여왕의심복
19/03/26 16:32
수정 아이콘
그래서 융합기술은 조별과제와 비슷합니다.
19/03/26 16:36
수정 아이콘
임상의사 분들 다는 아니겠지만 대부분 이들에게는 mathematical science에 대한 개념이 부족합니다.
자신의 원하는 자료를 객관적인 formal 언어로 그려내지 못합니다. eigen value까지는 아니더라도
자신이 원하는 objective function이 뭔지 설명을 잘못합니다.
"의학이나 생물학이 원래 그런 것이다." 진짜 그런가요. 하여간 저도 의학전문은 아니라 잘 모르겠습니다.
BibGourmand
19/03/26 16:52
수정 아이콘
의학은 잘 모르겠습니다만, 실험을 통해 하나하나 증명하는 분자생물학 계열이라면 평소 하는 일이 mathematical science와는 거리가 멀어도 너무 멉니다. 사실상 서로 다른 언어를 쓰는 영역인데, 제대로 된 통역 없이 의사소통이 잘 되기는 어렵겠지요.
19/03/26 17:14
수정 아이콘
예, 제가 겪어본 생물, 분자생물 하시는 분들은 실험에서의 꼼꼼함을 제 1의 덕목으로 치더군요.
그게 말로는 설명하기 힘든 것이라고 저도 봅니다. 그런데 요즘은 NGS 기기의 등장이 보여주듯
무지막지한 mass experiment의 시대로 접어들어 이전의 "손재주"와 "꼼꼼함"은 물량떼기로 이길 수 있는
시절입니다. 실험이 기계화되고 대량화되면 결국은 진단과 치료는 통계기반의 수리과학 문제로
귀결되지 않을까 싶습니다. 각 병원에서 진료한 결과가 공유되고 쌓이면 이전의
자신만의 local 경험으로 "용한 의사"가 되던 시대는 종말을 맞을 겁니다.
결국 임상도 통계분석과 해석, 그리고 실전적용(임상) 이런 사이클로 가기 때문에
통계적 이해가 필수가 될 것입니다. 하지만 각 병원의 노땅 칩(Chief)들의
통계학적 수리과학적 마인드는 안습입죠. 외국 인공지능형 기계가 도입되면 싸고 질좋은 진단으로 인하여 기존의
lOCAL DATA기반의 임상의들은 고생하지 싶습니다. 물론 법적인 장치를 통하여 그것을 막겠죠. 원격의료를 막고 있듯이.
셧업말포이
19/03/26 17:22
수정 아이콘
전혀요. 임상을 잘 이해 못하시는 거 같네요.
환자를 대한 순간부터 얼굴, 말투, 용모에서 느껴지는 것만으로도 감을 잡고 시작하는 게 임상의입니다.
노련하고 유능한 의사일수록 더욱더 그렇구요.
데이터는 결국 누군가가 계량화, 수치화해서 입력해야 합니다. 그런데 이러한 것들을 모두 그렇게할 수 있다구요?
19/03/26 17:35
수정 아이콘
(수정됨) 의사 뿐만 아니라 길거리 붕어빵 장수도 인상만으로 상대방을 바로 이해하고 인식합니다.
문제는 이런 Local 감정기반의 지식은 불안정하고 불완전하고 비결정적입니다.
또 오래되면 소망적 경향으로 인하여 이전의 기억을 왜곡하기 때문에 빅데이터로 사용될 수 없습니다.

그래서 그것을 컴퓨터에, 클라우드에, 인터넷에 기록하고 관리하고 그 결과(label)를 되추적하여
update합니다. 그런데 사람은 이런 일에 매우 취약합니다. 특히 생명을 다루는 일에는 위함할 수도 있습니다.
1970년대에 운동이 고혈압 처방이라 말한 사람을 미친 사람 본득 했다고 합니다. 작은 데이타의 한계죠

상하이 자오퉁 대학 연구자들이 사진만으로 범죄자를 판별하는 러닝알고리즘을 만들었는데요,
https://www.technologyreview.com/s/602955/neural-network-learns-to-identify-criminals-by-their-faces/

같은 원리로
만일 진찰실에 들어온 환자의 사진과 동영상을 기록하고 그 환자들의 협조 정도를 labeling 하여 (이건 의사가 해야겠죠.)
기계로 돌리면 의사분들의 "감"으로만 짐작하시든 일들을 기계가 훨씬 더 정교하게 대신 할 수 있을 겁니다.
의사에게 협조하지 않을 사람을 담박에 가려내서 발 밑 신호로 전달해주지 않을까요.

바둑 명인 서봉수가 이런 말을 했습니다. 아주 오래전에.
"두텁다, 얇다, 뒷맛이 있다 없다, 행마가 무겁다, 엷다,,
이런 표현법은 결국 우리가 계산이 약하기 때문에 나오는 말들이다."

30년전에 서봉수는 알파고를 이미 알았다고 봅니다. 사람의 독특한 "감"이라는 것도 실상을
뉴런 신호를 정량화하기 힘들어서 나온 말이라고 봅니다.
그래서는 저는 사람의 "감"이라는 것을 그닥 신뢰하지 않는 편입니다.
셧업말포이
19/03/27 00:26
수정 아이콘
(수정됨) ""환자의 사진과 동영상을 기록하고 그 환자들의 협조 정도를 labeling 하여""

이런게 불가능에 가깝다는 겁니다.
체온에 높은 환자가 열이 있을까요 없을까요?
아주 쉬운 예로, 교과서적으로는 대략 37.8도 정도면 열이 있는 것으로 보지만, 막상 체온 재면 37.4~5인 사람들도 심한 발열감을 호소하기도 하고 또한 1시간 뒤에는 다시 보다 체온이 오르기도 합니다. 흔히 재는 체온이 애초에 중심체온이 아니기 때문에 부정확한 것도 있지만, 이렇게 간단한 것도 variation이 너무나 큽니다.
결국 머신러닝이라는 것 이전에, 이에 대해서 데이터화하는 작업 - 곧 인간의 받아들이는 추상화 작업이라고나 할까요 - 이 필요한 건데, 말씀대로 너무 어렵고 부정확합니다.
마치 스타2 AI에서, 기대한 건 이영호(스타2 선수 몰라서 그냥 예로 듭디나)처럼 플레이하는 인공지능이었지만 현실은 드래군 뭉치기 짤짤이만 나오던 것처럼 참혹한 결과물을 보게될 겁니다.(당분간은..)
19/03/27 01:46
수정 아이콘
그래서 PRO(patient reported outcome) 얘기가 나오는거 같습니다. 무엇보다 일단 한번 거쳐서(임상의) 해석되어 기록되면 bias가 생기니까요.
19/03/27 11:12
수정 아이콘
선생님 아주 사소한 부분인데 드래군이 아니라 추적자입니다 (;;;)
영원히 고통받는 드래군 ㅠㅠ
BibGourmand
19/03/26 17:39
수정 아이콘
모든 실험이 다 NGS처럼 자동화 가능한 건 아닙니다. 살아있는 쥐를 쓰고 살아있는 세포와 조직을 쓰는 실험을 기계가 mass experiment를 해주는 날이 온다면 제가 실업자가 될 겁니다만, 그 수준의 기계가 일개 랩에서 쓰이는 날이 온다면 지구상에 남아있는 직업이 몇이나 될까 싶습니다.
그리고 가설을 세우는 것도, 실험 조건을 이해하고 설정하는 것도, 얻어진 결과에서 biological meaning을 읽어내는 것도 아직까지는 사람의 일입니다. 미세한 실험 조건에 따라 결과가 달라지는 경우가 많고, 이건 양으로 승부볼 일이 아닙니다. 정말 모든 가지수를 다 양으로 때워 실험하고, in-vivo에서 검증까지 할 수 있다면야 말이 달라지겠지만, 그 양을 채우기 전에 랩이 파산할 겁니다.
가설을 세우고 biological meaning을 이해하는 기계가 나온다면 그건 빅데이터 따위가 문제가 아니라 강인공지능이니 아예 다른 논의가 될 테고요.
19/03/26 17:46
수정 아이콘
저도 실험동물로 검증하는 일까지 자동화되기란 힘들다고 봅니다. 다만 지금의 추세라면
그 일만을 전문으로 하는 업체가 생겨나서 그 일에 아주 숙달된 사람이 실험/검증을 싼 가격과
짧은 시간에 대신 해주지 않을꺼 합니다. (지금은 정보유츌때문에 직접 하시는 것으로 아는데
이거야 계약만 잘 하면 될거고요. )

다양한 계층의 새로운 시장이 나오지 않을까요. 녹아웃 쥐만을 파는 업체가 있는게 실험만을
해줄 업체가 나타나지 않을 법일 있을까요. 결국 과학자들에게는 숫자 데이터만 잔뜩 담긴 CD 한 장만


자본주의의 새로운 시장은 이렇게 분화와 분화를 거쳐 생기죠. 마부에서 택시 운전사에서 대리운전 택시에서
우버까지 분화되듯이./
배달될 시간이 곧 닥치리라 봅니다.
BibGourmand
19/03/26 17:57
수정 아이콘
환자 샘플을 함부로 반출할 수는 없겠지만, 그를 제외한 생물학 실험이라면 실험대행업체들이 꽤 존재합니다. 전화기와 노트북으로 랩 돌리는 세상이 올지도 모른다는 말은 가끔 친구들과 하긴 했었습니다만, 어차피 그 업체에서도 일은 사람이 하다보니 스킬과 장비가 없는 새로운 실험이 아닌 다음에야 직접 하는 쪽이 싸고 빠르고 더 믿음이 갑니다. 아직까지는 그렇습니다.
19/03/26 16:13
수정 아이콘
공단 데이터가 구슬이 서말인지...
그냥 똥이 서말인지...

엮을 수 없게 해놓은 건 분명한거 같습니다.

불나방처럼 빅데이터 빅데이터 하고 찬양하는데
데이터를 들여다볼수록 데이터별 연계나
연구는 꽉 막아놔서 ㅠㅠ
여왕의심복
19/03/26 16:33
수정 아이콘
일단 개인정보보호법부터 어떻게 해야합니다. 시민단체 반발도 워낙심해서 ㅠ
싸우지마세요
19/03/26 16:41
수정 아이콘
시사건건 기다리고 있는데 과연 돌아오시게 될런지!
여왕의심복
19/03/26 20:03
수정 아이콘
시사건건 저도 특별한 연락이 없어서 기억에서 지우는 중입니다. ㅠ
밀크공장
19/03/26 18:18
수정 아이콘
트위치에서 방송 하고 있으셨네요 구 염천교, 시사건건에서 겜잘알 설명이 참 좋았는데 나겜이 잘되사 시사건건에서 다시 봣으면 좋겠네요
여왕의심복
19/03/26 20:04
수정 아이콘
그랬으면 좋겠습니다. 감사합니다.
SuperBros
19/03/26 18:33
수정 아이콘
좋은 글 잘 읽고 갑니다.
여왕의심복
19/03/26 20:04
수정 아이콘
감사합니다!
하얀가운의노예
19/03/26 19:53
수정 아이콘
전주로 HIRA를 이용한 논문을 쓰고있습니다 모병원 임상조교수입니다 혹시 의향이 있으시다면 쪽지주신다면 좋은 작업들 같이 해봤음 합니다 좋은정리 잘보았습니다
여왕의심복
19/03/26 20:04
수정 아이콘
감사합니다. 쪽지드렸습니다.
datastudent
19/03/26 20:04
수정 아이콘
재미있는 소개글 감사합니다.
일전에 Orbef님의 글도 그랬지만 PGR에서도 유관 영역 글들을 부쩍 보게되어 이 분야에 대한 관심을 새삼 느끼게 되네요.
자연어 처리 분야의 경우, 최근 BERT라는 기법을 통해 자연어 처리 전반에 걸친 문제들의 성능이 대폭 향상된 것으로 알고 있습니다.
임상진료기록쪽이시라니 찾아보시는 것도 도움이 되지 않으실까 싶네요.

그나저나 10년 가까이 SAS, R로 관련 업무를 해온 입장에서 대학병원 의사님들의 처우가 그저 궁금할 따름입니다 :)
여왕의심복
19/03/26 20:13
수정 아이콘
네 한번 찾아보겠습니다.인건비 기준 세전 1억 넘는사람도 비일비재합니다.
19/03/26 21:40
수정 아이콘
저번에 저도 관련글을 올린 적이 있어요. 제 아들이 이쪽에 관심이 있어해서 개인적으로 궁금한 점이 많은 분야입니다. 아이가 수학은 좀 튀게 잘 하는데 다른 쪽은 상대적으로 아주 평범한 아이라, '수학적인 머리만 있으면 잘 할 수 있는 분야가 무엇일까' 하고 본인이 생각해서 내린 결론이 데이터 사이언스나 계량 경제를 해야겠다는 것이었습니다. 아이 큰 아빠 그러니까 제 형이 계량 경제로 먹고 사는 사람인데, '이 바닥이 당장은 돈을 좀 벌고는 있지만, 그렇다고 중장기 전망이 꼭 밝은 것은 아니다' 라는 조언을 주어서 요즘은 데이터 사이언스를 알아보는 중입니다.

근데 저번에 댓글들도 그렇고 이번 글도 그렇고, 해당 분야에 대한 지식이 없이 수학만 잘 해서는 크게 성과를 거두기 힘들 것 같다는 생각이 드네요. 인생 쉽지 않아요...
여왕의심복
19/03/26 21:43
수정 아이콘
아이고 저는 저먹고살기가 어려운데 ㅠ 아드님 걱정까지하시니 ㅠㅠ. 저는 데이터 사이언스는 결국 그분야에 대한 insight가 있어야한다고 생각합니다. insight가 없으면 방법론이 정말 뛰어나지 않는 이상 테크니션이상이 될수없구요.
19/03/26 21:47
수정 아이콘
제 브레인 리소스의 30% 정도는 항시적으로 "아이 걱정 백그라운드 프로세스" 가 잡아먹고 있....

간결하지만 단호한 댓글 감사합니다. 이런 조언을 하나하나 모아서 아이한테는 제 조언인 척하고 들려줘야겠어요.
19/03/27 00:42
수정 아이콘
(수정됨) '데이터' 사이언스 이기 때문입니다. 꼭 의료에 국한된 문제는 아니고 금융/경제를 하더라도 마찬가지 문제가 벌어집니다. 금융/경제를 이해해야 그 안에서 생산된 데이터들을 이해하고 다룰 수 있고, 나아가 이를 통계/기계학습이라는 tool로 분석할 수 있습니다. 이를 간과하면 일이 진행이 안됩니다. 다시 의료 문제로 돌아와서, 의료 데이터를 가지고 분석을 하려면 데이터 큐레이션 부터 해서 전처리 과정을 거쳐야 하는데 이 과정에서 데이터에 대한 이해 자체가 없으면 결과를 놓고 토론까지는 근처에도 못가고 분석 자체의 시작이 안됩니다.

적어놓고 말씀하신 글 봤는데 댓글에 좋은 내용이 많네요. 물론 기술적으로 뛰어난 테크니션 자체가 되는 것도 나쁘지 않다고 생각합니다. 이 쪽 일이 생각보다 labor intensive해서 모든 분들이 다 데이터를 직접 이해하고 다룰 필요는 없고, 데이터 수집/분석 자체의 테크닉을 제공하는 분들도 충분히 가치가 있는 영역이라고 생각합니다.
19/03/27 00:25
수정 아이콘
좋은 글 감사합니다. 저는 언급하신 3.영상영역 에서 연구하고 있는 nonMD PhD 입니다. 말씀하신 6번 내용에 매우 공감하며, 지난 학기에는 그래서 MD 선생님들 대상의 인공지능(기계학습) 강의를 하기도 했습니다. 제가 안짤리고 남아있는 동안은 매년 할 생각입니다. (그나마 아직은 선생님들께서 스스로 할 줄 모르시니 병원에서 제 역할이 있는건데 제가 제 무덤을 파고 있는거죠...) 조만간 MD 선생님들께서도 연구하고자 한다면 R/SPSS 쓰시는 것 처럼 machine learning/deep learning을 쓰실 날이 올거라고 생각합니다.
여왕의심복
19/03/27 09:39
수정 아이콘
네 저도 이제 기계학습공부를 시작했습니다. 어딘가에 뵙게되면 잘 부탁드립니다.
봉그리
19/03/27 00:37
수정 아이콘
계획하는 연구의 파일럿으로 공단표본코호트 뒤지고 있다 좋은 글 보니 반갑습니다.
아무래도 임상의로 진료 외 시간을 할애해서 데이터를 조물딱대다 보니 시간이 모자르네요.
인사이트라는 게 임상지식만 많다고 되는 게 아니라 데이터에서 뭘 뽑아낼 수 있는지까지 결합해서 알아야 되기 때문에 어려운 것 같습니다.
한 가지를 잘 하는 사람은 많아도 둘 다 잘하는 사람은 드물어서요.
그만큼 코웍이 중요하긴 한데 방법론을 모르고서는 코웍 자체가 안된다고나 할까요..
진료 한달쯤 빼고 어디 처박혀서 논문만 쓰다 나오면 좋겠다고 종종 얘기하곤 합니다. 하하.
여왕의심복
19/03/27 09:42
수정 아이콘
네 임상선생님중 이쪽부분을 이해하시는 분은 극히 드뭅니다. 공단자료를 쓰시는 것이면 제가 어느정도 도와드릴수있을겁니다.
정은비
19/03/27 01:35
수정 아이콘
한때 의료영상처리쪽 인공지능 소프트웨어만드는 스타트업에 있었는데 결국 데이터가진 대학병원 의사들이 최고갑이더라구요.
의사들끼리도 의견이 갈리는 의료 이미지 분석의 애매함과 데이터얻기가 무지 어려움, 병원마다 다른 영상상태로 인해 소프트웨어를 팔려고해도 기관마다 튜닝해야함 등등 저는 개인적으로 병원마다 제대로 상용화되긴 꽤 걸리지않을까 생각하고있습니다
여왕의심복
19/03/27 11:28
수정 아이콘
네 저도 결국 Big 5중 어떤 업체가 몇개를 먹냐가 가장 중요할 것 같습니다.
ThreeAndOut
19/03/27 02:22
수정 아이콘
데이터 사이언스 알못이 여쭙니다. 코호트가 무슨 뜻인가요?
handmade
19/03/27 11:05
수정 아이콘
사회조사분석론에서도 나오는 내용인데 같은 경험을 가진 대규모의 집단을 말하는 겁니다. 의료 쪽으로 예를 들면 맹장염(충수돌기염) 걸려본 경험이 있는 대규모의 집단을 말합니다. 의료 쪽은 안전성을 위해서 대규모의 샘플이 필요하고 빅데이터 쪽은 말 그대로 거대한 데이터를 분석해 통찰을 얻는 분야이기 때문에 양쪽에 다 걸치는게 코호트 조사인 것 같네요.
19/03/27 03:20
수정 아이콘
본문에서 김승섭 교수님 생각이 나는데..
여왕의심복
19/03/27 11:29
수정 아이콘
김승섭교수님은 해외에 연수가셔서 한국에 안계십니다. 크크 빅데이터도 잘안하시구요. 하지만 우리나라에서 가장 훌륭한 보건학 연구자라고 생각합니다.
가우리
19/03/27 10:41
수정 아이콘
좋은 글 감사합니다. 저는 데이터 엔지니어 입니다.
어느 필드나 결국 데이터가 문제고 보건의료분야에서의 어려움이 매우 잘 설명된 글인 것 같습니다.
여왕의심복
19/03/27 11:25
수정 아이콘
감사합니다. 언젠간 협업할 기회가 있기를 바랍니다.
Eulbsyar
19/10/13 20:28
수정 아이콘
데이터 분석 쪽 자체가 해당 분야 지식이 기본으로 깔려 있어야 가능하긴 하죠
20/02/03 13:04
수정 아이콘
관심있는 분야라 재밌게 봤습니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
3073 "우리가 이 시대에 있었음을, 우리의 시대를, 결코 지워지게 하지 않기 위해." [41] 신불해25244 19/04/11 25244
3072 거미들, 실험실 수난의 역사 [38] cluefake23518 19/04/12 23518
3071 제주 4.3사건에서 수 많은 사람의 목숨을 구했던 유재흥 [32] 신불해16207 19/04/04 16207
3070 아이를 어린이집에 보내고 [37] 미끄럼틀18485 19/03/27 18485
3069 e스포츠의 전설, 문호준 [47] 신불해19933 19/03/24 19933
3068 보건의료영역에서의 데이터 사이언티스트의 역할과 미래 [61] 여왕의심복14642 19/03/26 14642
3067 어디가서 뒤통수를 치면 안되는 이유... [28] 표절작곡가27186 19/03/26 27186
3066 슬픈 일일까. [12] 헥스밤14227 19/03/25 14227
3065 [기타] 카트라이더 리그 결승을 앞두고 - 여태까지의 스토리라인을 알아보자 [14] 신불해11371 19/03/19 11371
3064 (안 진지, 이미지) 과몰입과 가능성의 역사. [22] Farce12900 19/03/21 12900
3063 그, 순간. [24] 유쾌한보살12776 19/03/19 12776
3062 나폴레옹의 영 비호감 느낌 나는 사적 면모들 [26] 신불해20801 19/03/15 20801
3061 [삼국지] 도겸, 난세의 충신인가 야심찬 효웅인가 [12] 글곰12658 19/03/13 12658
3060 대한민국에서 최고 효율과 성능의 격투기는 무엇인가!? [95] 에리_921610 19/03/12 21610
3059 나는 왜 S씨의 책상에 커피를 자꾸 올려놓는가? [40] 복슬이남친동동이18328 19/03/11 18328
3058 새 똥을 맞았습니다. [61] 2214016 19/03/08 14016
3057 16개월 아기의 삼시덮밥 시리즈 [45] 비싼치킨21478 19/03/07 21478
3056 '이미지 구축' 과 '스토리텔링' 의 역사에 대한 반발 - 영국의 역사 [14] 신불해12416 19/03/05 12416
3055 21세기판 여우와 학 - 충전의 어려움 [29] 2212255 19/03/02 12255
3054 친구란 과연 ? [33] 유쾌한보살16483 19/03/02 16483
3053 참치잡이 명인의 공포. [71] 내꿈은세계정복25791 19/02/25 25791
3052 [스타2] 어윤수 결승전으로 배워보는 한자성어 [61] MiracleKid13632 19/03/05 13632
3051 [기타] 나는 사실 문명을 좋아하는 것이 아니었다 : "문명 6", "앳 더 게이트" [38] Farce16232 19/02/26 16232
목록 이전 다음
댓글

+ : 최근 6시간내에 달린 댓글
+ : 최근 12시간내에 달린 댓글
맨 위로