PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2016/11/11 14:19:40
Name 순뎅순뎅
Subject [일반] [뻘글] 프로그래머가 본 jtbc에서 입수한 파쇄기 돌린 종이 맞추기
https://pgr21.com./pb/pb.php?id=humor&no=295648


JTBC에서 입수한 파쇄된 종이 저거 양이 너무 많고 그래서 게다가 투약 결과라면 내용도 모양도 다 비슷할 것 같은데 저게 인력으로 가능하긴 할까요?

1. 인력으로 현실적으로 가능하긴 할까? 맞춰보다가 오히려 손실되어(손때, 찢어짐, 닳음) 못쓰게 될 가능성이 농후할 것 같다.
2. 조각이 n개라면 조각 A와 조각 B가 인접한 면이 있다고 잠정적으로 확정하는 데만 해도 각 조각의 한면당 4*n번의 비교를 해야 하고 생각해도 조각이 일정량이 넘어간다면 불가능할 것 같다는 생각이 드네요.

저거 어떻게 하면 좋을까 생각해 보면 프로그래머라서 다음과 같은 생각을 하게 되었습니다.

방법
1. 파쇄된 종잇조각을 일일이 쫙 편다. (다리미를 쓴다든지)
2. 각각의 조각을 모두 스캔한다.
3. 스캔 결과 파일을 컴퓨터로 돌려서 모양이 맞는 조각을 찾아서 조립한다.

컴퓨터 프로그래머 이긴 하는데이긴 한데 이미지 프로세싱 쪽에는 문외한이라 저런 쪽에 기존 라이브러리들이 어느 수준인지 몰라서 확신이 안 드네요.

이상 월급도둑이었습니다.

ps: 적고 보니 요즘 파쇄기의 성능에 따라 애초에 불가능할 가능성도 높겠네요....





통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
16/11/11 14:21
수정 아이콘
저도 이생각을 먼저 하긴 했는데.. 흐흐..
Endless Rain
16/11/11 14:21
수정 아이콘
제 기억이 맞다면
뉴스룸 영상속의 종이를 보면 파쇄가 흔히들 생각하는 파쇄기 파쇄가 아니라
가위같은걸로 조각조각 낸 파쇄인 것 같았는데.... 아마 그래서 복원이 쉽지 않았을까 싶습니다
16/11/11 14:23
수정 아이콘
스캔을 한 다음에 파일을 인터넷에 공개해서 자원봉사식으로 한다면 금방할 수도 있겠네요.
공개하는 것이 불법인지 아닌지는 모르겠지만..
16/11/11 14:25
수정 아이콘
아~ 리캡차처럼 크라우드소싱하는 방법이면 좋겠네요~
순뎅순뎅
16/11/11 14:26
수정 아이콘
그생각도 안해본건 아닌데...의료 정보라서 공개는 하면 안될것 같습니다.
율리우스 카이사르
16/11/11 14:24
수정 아이콘
크크 태웠어야지. 대기업들은 다 태운다더군요 크크
애패는 엄마
16/11/11 14:25
수정 아이콘
병원내에서 태울 수 없어서 못 태운거라고 말하더군요
기지개피세요
16/11/11 14:26
수정 아이콘
벤에플랙 영화 아르고에서 보면 저런거 맞추다가 사람 찾고 뭐 그런내용이 생각나더라구요.
아무쪼록 좋은 성과 있기를~
엘룬연금술사
16/11/11 15:55
수정 아이콘
아, 아르고 영화 좋았죠.
푸르미르
16/11/11 14:28
수정 아이콘
미드 블랙리스트에서 보면 종이 주워서 스캔 한다음에 맞춰주는 프로그램이 나오더라고요.
순뎅순뎅
16/11/11 14:29
수정 아이콘
그러게요. 있을것 같다는 생각이 강하게 들더라고요...
냐옹이
16/11/11 14:31
수정 아이콘
프로그램 있다던데유
16/11/11 14:32
수정 아이콘
때론 디지탈(?)보다 아날로그가 답인 경우도 있습니다.
AngelGabriel
16/11/11 14:32
수정 아이콘
프로그램을 직접 본 적은 없는데, 있다는 이야기까지는 귀동냥으로 들어봤던 것 같긴 합니다...

뭐, 어찌되었든 기대해보는중입니다. 과연 무슨 폭탄이 또 터질 것인지.
arq.Gstar
16/11/11 14:33
수정 아이콘
파쇄기가 병원에 있었나 모르겠어요. 정말 파쇄기로 했으면 아마 안될것 같기도 하거든요.
그냥 가위로 자른 수준이라면 모를까 음..
패닉바이
16/11/11 14:33
수정 아이콘
예전에 일본 방송에서 일본 최고 파쇄기 제조 회사 vs 외국 문서 복원팀이 대결한 방송을 본 기억이 나네요..
그때 복원팀에서 썻던 방식이 종이조각을 모조리 스캔 한 후 컴퓨터로 일일히 맞추는 방식으로 순뎅순뎅님께서 제안하신 방식과 흡사했습니다...
결국 제한시간을 넘겨 파쇄기 회사가 이기긴 했습니다만, 시간이 조금만 더 주어졌더라면 복원이 가능했었던 것으로 기억하네요..
16/11/11 14:35
수정 아이콘
알고리즘 많이 있는걸로 알고 있습니다.
조각난 도자기 유물 같은거 발굴 되면 영상 처리 이용해서 복구 한다고 하네요.
스켄 뜨는게 일이지 복원하는건 금방 될꺼 같습니다.
써니는순규순규해
16/11/11 14:40
수정 아이콘
스켄한 다음에 파쇄된 양 끝쪽 이미지의 픽셀 값들이 일치하거나 가장 비슷한 이미지들을 연결해주면 되지 않을까 싶네요.
A 의 오른쪽 끝쪽이 01110001 이고 B 의 왼쪽 끝이 01110001 이면 AB 이런 식으로요.
오차 감안하고, 비슷한것들을 여러개 골라주면 되지 않을까요?
어리버리
16/11/11 14:43
수정 아이콘
말씀하신 것처럼 조각난 종이들 쫙 펴서 스캔해서 이미지 파일로 만든 다음에 조합해주는 프로그램이 있다고 하네요.
16/11/11 14:49
수정 아이콘
사해문서같은 경우 DNA 분석까지 했죠.

"대부분의 쿰란사본은 항아리 속에서 아마포에 곱게 싸인 채 발견된 것이 아니라, 아무런 보호장치 없이 동굴바닥에 흩어져서 많은 세월을 견뎌왔기 때문에 이 수집단계를 통해 원래는 한 두루마리에 속한 조각들을 퍼즐 맞추듯이 맞추어가야 했습니다. 학자들은 육안으로 비슷한 서체, 비슷한 동물가죽의 두께 등을 기초로 하여 조각들을 모아보았지만, 이것만 갖고서는 완전한 작업을 할 수가 없었습니다. 그래서 학자들은 사본의 재질인 이 동물 가죽의 유전자 지문(DNA fingerprint)을 조사함으로써, 어떤 조각들이 하나의 동물로부터 만들어진 피지인지를 알아낼 수 있게 되었습니다."

물론 이 예시와는 약간 성격은 다릅니다만, 시간이 주어진다면 충분히 복원할 수 있는 자료라고 생각합니다.
어리버리
16/11/11 14:52
수정 아이콘
http://homepages.inf.ed.ac.uk/imurray2/projects/2013_razvan_ranca_ug4.pdf
파쇄 문서 복구 프로그램에 대한 70페이지짜리 논문입니다. 오래 전부터 컴퓨터 전공하는 사람들이 이쪽 계속 연구하고 있는거 같네요. 첫페이지에 4년차 리포트라고 하는거 보니 저기서는 장기 프로젝트로 굴러가는 듯.
자바초코칩
16/11/11 19:53
수정 아이콘
그런건 아니고, 박사 학위 논문이라 오랜기간 연구했다고 적어놓은 것 같네요.
16/11/11 14:54
수정 아이콘
샷 건 방식으로 맞추면 전체를 모두 맞출 필요 없이 전체의 5% 정도만 맞춰도 나머지가 쉽게 맞춰지면서 어느정도 해석까지 가능하지 않을까요
16/11/11 14:55
수정 아이콘
이미지 프로세싱이 나름 전공분야중 하나인데 그렇게 간단한 문제는 아닙니다. 분쇄기+조금만 더 신경썼다면 불가능에 가까울겁니다.
AngelGabriel
16/11/11 15:12
수정 아이콘
결론은 아날로그인가요...;;
16/11/11 15:18
수정 아이콘
아래 댓글보면 대충 처리한거같아서 불가능은 아닐수도??
패턴인식은 아직 인공지능이 못따라갈만큼 인간의 뇌도 아주 훌륭한지라 아날로그도 무시할건 아닙니다.
AngelGabriel
16/11/11 15:31
수정 아이콘
그야 그렇죠. 다만 아날로그는 인간이 피곤해지는데 프로그램으로 하면 기계가 피곤할 뿐이니 가능하면 프로그램이 되는거였으면 하는 바램이였습니다.(?!)
16/11/11 14:59
수정 아이콘
http://www.bobaedream.co.kr/view?code=strange&No=1630714&bm=1

이미 최모녀 이름도 찾았다는데...
16/11/11 15:28
수정 아이콘
이건 파쇄기로 돌린게 아닙니다.
향정신성의약품 대장을 파쇄기 돌렸고
고객 명단을 그냥 찢어서 버렸는데 거기 정유연-최가 적혀있었다는거죠.
새벽포도
16/11/11 15:03
수정 아이콘
병원에서 쓰는 문서양식이 정해져 있고 반복되는 단어,줄,칸,테두리까지 있으니까 일반 문서보다는 조합하기 좀더 쉽겠네요.
그런데 문제는... 조합은 쉬운 반면 문서의 고유정보인지는 헷갈릴 수 있겠네요. 비슷한게 많으니...
포포탄
16/11/11 16:16
수정 아이콘
저 군대있을때 선임이 비문을 파쇄기에 갈아버린적 있었는데 3일 밤새서 소대원들이 다 맞췄습니다. 하려면 할 수는 있어요. 말 그대로 곤죽형태로만 갈리지 않았으면...
다빈치
16/11/11 17:38
수정 아이콘
히익..
파이몬
16/11/11 17:45
수정 아이콘
그나마 선임이 그랬다니 덜 무섭군요
내일은
16/11/11 19:37
수정 아이콘
하긴 군대면...
사과씨
16/11/11 16:18
수정 아이콘
파쇄된 조각의 절단면의 잉크 묻은 부분을 도트로 간주하고 해당 도트의 간격을 패턴화해서 스캔 떠서 DB화한 다른 조각의 절단면 패턴과 대조하는 식으로 구현하면 될 것 같은데... 도트 패턴이랑 절단면의 형상을 동시에 패턴화해서 조합하면 의외로 빠르게 조합할 수도?
ADVISORY
16/11/11 16:33
수정 아이콘
저건 한효주씨한테 맡기면 금방해주실텐데 크크크
-안군-
16/11/11 16:39
수정 아이콘
스캐너의 성능만 좋다면, 생각 이상으로 정확할 가능성이 높습니다. 복잡한 인공지능 어쩌고 들어갈 것도 없어요.
이미 이미지 프로세싱을 통한 패턴인식 같은거야 상용화된지 오래고(스마트폰 앱으로도 충분합니다.)
조각 짜맞추는건, 따지고보면 QR코드 인식하는것 보다도 쉬운 일이라고 봅니다.

1. 절단면이 서로 일치하는 곳을 찾고,
2. 짜맞췄을때 양쪽의 컬러값이 매칭이 되는 경우를 찾아서 조합
이 두 가지의 프로세스 만으로도 충분할 거라고 봅니다. 거기다가, 이미 상용화(?)된 프로그램까지 있다면 금상첨화겠지요.
래쉬가드
16/11/11 18:29
수정 아이콘
QR 코드 인식보다는 훨씬 어려울것 같습니다...
이미지 프로세싱도 이미지가 있어야 하는건데 세절된 종이조각들은 이미지 정보가 적어도 너무 적으니까요.
1. 세절기의 특성상 절단면이 거기서 거기고
2. 짜맞췄을대 양쪽의 컬러값이 매칭되는 경우가 종이조각이 작다보니 많이 나와서 복구하기가 쉽지 않을것 같습니다.
게다가 종이를 한장만 복구하는것도 아니고 이게 1번 페이지에서 온건지 136번째 페이지에서 온건지도 확실치 않고
총천연색 이미지도 아니고 특징도 별로 없는 흑백 텍스트 문서이니 점점 난이도는 산으로 가겠죠.
내일은
16/11/11 19:40
수정 아이콘
기본 정보가 없는 이미지라면 시간이 엄청 걸리겠지만
기본적으로 이건 원래 문자라는 기본 정보가 있는 이미지입니다. 한글 영어에 의학용어 기본폰트에 대한 정보만 준 상태에서 시작해도(병원에서 특별한 경우 아니면 상용프로그램을 썼을테니) 난이도가 확 낮아지죠
래쉬가드
16/11/11 20:11
수정 아이콘
문자여서 더 어렵게 느껴지는데요.
종이에 씌여져 있는 문자를 인식하는 문제가 아니라 세절되어 잘게잘게 나누어진 조각에 있는 픽셀들로 원래 문서를 재구성하는 문제입니다.
이미지 프로세싱이 기본적으로는 feature point 들 즉 특징점을 중심으로 처리하는것에 다름아닌데
문자는 기본적으로 흑백이고 세절된 조각은 크기도 작아서 특징점이라고 부를만한 것도 마땅치않고 또 그게 정말 특징적이냐 하기에도 비슷비슷한 조각이 너무 많을거고
이게 어느 글자 어느 문장을 이루는 조각인지 어느 페이지에서 온건지 알기가 매우 어렵다고 생각됩니다.

저도 이쪽이 전문분야는 아니고 관련해서 연구하는 동료들이 가까이 있어서 세미나시간에 귀동냥 정도로 아는 수준이지만
제 생각에는 이미지 프로세싱 분야 난이도중에서 거의 최상위권에 속하지 않을까 하는데요.

근데 세절된 조각 크기가 얼마냐에 따라 많이 다를것같긴 하네요.
만약 세절된 조각 하나에 글자가 한두개정도 보인다
이러면 문제가 좀더 쉬워질것같고 어예 알아보지고 못하게 잘게 파쇄해버렸다 하면... 매우 어려워질것 같습니다.
자바초코칩
16/11/11 19:57
수정 아이콘
QR보다 어렵습니다.
QR코드 해독하는 거야 표준문서 던져주면 학부생 수준 엔지니어 혼자 일주일이면 만듭니다.

랜덤하게 찢기는게 아니라 균일하게 찢어지기 때문에 절단면이나 컬러값으로 각 조각들을 구분하기가 매우 어렵다는 한계가 있습니다.
16/11/12 05:00
수정 아이콘
http://gall.dcinside.com/board/view/?id=hit&no=13717

음... 이미 비슷하게 하고있는듯 합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
68588 [일반] 미 대선의 조연들 공화당. [15] minyuhee6581 16/11/12 6581 6
68587 [일반] 세월호 직후 '해경해체' 최순실이 결정 [65] 프로취미러13565 16/11/12 13565 5
68586 [일반] 투표권은 몇 살부터? [101] 성동구7201 16/11/12 7201 1
68585 [일반] 이재명 시장 인터뷰 시원시원하네요. [64] 가라한11960 16/11/12 11960 21
68584 [일반] 웹툰 추천- 금세 사랑에 빠지는 [8] 이직신6793 16/11/12 6793 0
68583 [일반] 우맹이 골계(滑稽)로 초장왕을 꾸짖다 [19] 신불해6797 16/11/12 6797 13
68582 [일반] 최순실게이트 국회긴급현안질의가 있었습니다. [37] 시네라스10488 16/11/12 10488 4
68581 [일반] 고소장을 작성하다. [12] 솔빈5998 16/11/11 5998 7
68580 [일반] 힐러리는 이런 시나리오를 상정하고 전략을 짰어야 했습니다 [45] 군디츠마라10760 16/11/11 10760 7
68579 [일반] 최경락 경위의 유서, 살아남은 자의 폭로 [10] 프로취미러10681 16/11/11 10681 18
68578 [일반] 내일 부산 서면에서도 집회가 있습니다. [2] Mance3955 16/11/11 3955 8
68577 [일반] 11월 09일, Ben님을 만나고 온 후기 [20] 언어물리9876 16/11/11 9876 3
68575 [일반] 함께 나갑시다 [76] 마스터충달13057 16/11/11 13057 62
68574 [일반] 이구아나 vs 뱀(블럭버스터급 액션 다큐??) [18] 브론즈테란6520 16/11/11 6520 2
68573 [일반] 내일 있을 촛불집회. [10] 삭제됨7321 16/11/11 7321 10
68572 [일반] 나름 최순실 이슈에 따라 선정한 걸그룹 노래 모음(주관주의) [12] 좋아요4581 16/11/11 4581 2
68571 [일반] 주진우 기자 - 사드는 최순실 작품 [56] 브론즈테란12528 16/11/11 12528 0
68570 [일반] [뻘글] 프로그래머가 본 jtbc에서 입수한 파쇄기 돌린 종이 맞추기 [42] 순뎅순뎅15315 16/11/11 15315 1
68569 [일반] 길가에 버려지다. [9] 한길순례자7163 16/11/11 7163 16
68568 [일반] 성형의사회, "대통령 7시간 의혹 밝혀야" [42] 삭제됨10894 16/11/11 10894 2
68567 [일반] 이정현, 박지원의원에게 보낸 문자 [164] Damulhanol18945 16/11/11 18945 1
68566 [일반] 카타르 월드컵 기간 중 공공장소 음주가 금지되었습니다. [28] 예니치카5952 16/11/11 5952 2
68565 [일반] [뻘글 또는 정보글] 서울카페쇼에 왔습니다. [22] 스테비아4217 16/11/11 4217 3
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로