От Ильича до Ильича
by sonnet 2006 이글루스 TOP 100 2007 이글루스 TOP 100 2008 이글루스 TOP 100 2009 이글루스 TOP 100 2010 이글루스 TOP 100 2011 이글루스 TOP 100
rss

skin by 이글루스
접사대의 활용

1. 접사대를 이용한 책 촬영

대형 도서관이면 어디나 갖추어져 있는 사진촬영용 접사대(촬영지: 국립중앙도서관)

위아래로 움직일 수 있는 카메라 고정대
이 나사를 사용해 카메라의 삼각대 고정 홈과 연결한다.


카메라 장착 모습

일부 회전 LCD가 있는 카메라의 경우, 접사대 앞에 의자를 가져다 놓고 앉은 채로도 촬영 내용 확인이 가능해 편리하다. (사진의 모델은 Pentax Optio 33LF)


세팅이 완료된 상태에서 접사촬영 진행중인 모습들
그러니까 앉아서 해야 편리


개인적인 경험에 따르면 처음 해 보는 사람도 두 시간 정도만 해 보면 200쪽(책을 펼쳐놓고 찍으므로 사진 환산 100장)을 촬영하는데 약 15분 정도가 소요되며, 이후에 이 시간은 경험이 많다고 해서 크게 단축되지 않는다. 작업하면서 최대한 편리한 자세를 찾는 것이 나름의 노하우인데, 그래도 1시간 정도 하면 팔이나 허리가 좀 뻐근해진다. 자신의 작업속도에 맞추어 한 번에 1시간 분량(약 3-5권)씩 가져다놓고 하면 된다. 그리고 도서관은 관내대출시 보통 5권 정도의 제한을 두므로 이 범위 내에서 하면 적당할 것이다.

Tip. 작업량이 많을 경우, 다른 사람들도 접사대를 사용하기 위해 기다릴 수 있으므로 기다리는 사람이 보이거든 양보의 미덕을 발휘하자. 경험적으로 보면 요일에 관계없이 오전에는 접사대를 사용하는 사람이 거의 없으며 피크 타임은 오후 3-5시이다. 따라서 작업량이 많을 경우 오전에 집중적으로 할 것을 권한다.


2.현장검사

촬영이 완료되면 책을 반납하기 전에 메모리카드를 노트북으로 옮겨 꽂고 촬영된 내용을 자신의 손에 익은 적당한 사진 뷰어(AlSee 등)를 통해 넓은 화면으로 다시 확인한다. 이 때 주의깊게 볼 부분은 다음 세 가지이다.

1) 페이지를 넘기며 촬영하는 과정에서 실수로 빠트리고 넘어간 페이지가 있는가
2) 사진이 짤리거나 많이 비스듬하게 찍히지 않았는가
3) 기타 다양한 사유(예: 광택지의 반사 등)로 알아보기 힘든 사진이 생기지 않았는가

우선 2), 3) 번은 사진 뷰어 설정을 "화면에 맞추기"로 설정하고 전체를 슬쩍 보는 것으로 충분히 알 수 있다. 그리고 1) 번은 어떤 책이든 페이지 수 표시되는 부분은 거의 같은 위치이므로 PgDn 키를 연타해 사진을 넘기면서 같은 위치에 페이지 번호가, 1,3,5,7,9,…하고 잘 연속되는지 보면 된다.

이상 항목에 저촉되는 사항을 찾았을 경우에는 문제 있는 부분을 몰아서 다시 촬영하고 책을 반납한다. 확인 과정을 생략하든가 나중에 집에 가서 하겠다고 미룰 경우, 나중에 잘못된 부분이 발견되면 최악의 경우 도서관까지 다시 나가야 하는 사태가 발생하게 된다. 따라서 반드시 책 반납 전에 노트북을 이용한 확인과정을 거치는 것이 좋다.

그리고 이렇게 촬영한 사진은 책은 책 제목으로 폴더를 만들어 한 권씩 보관해 둔다. 이것을 소홀히 할 경우 기껏 공들여 촬영한 책을 전혀 찾아볼 수 없게 될 수 있으니 요주의!

그리고 더 하고 싶은 작업이 남아있다면 추가로 책을 대출해 위 과정을 반복하면 된다.

현장검사를 얼마나 꼼꼼하게 하느냐 하는 성격적인 부분에 많이 좌우되겠지만 그 책을 촬영하는데 쓴 시간의 절반이면 충분하다. 가끔 나오는 누락분 재촬영 또는 찍힌 사진에 자신이 없어 여러 번 찍어놓았던 것 중 하나를 고르는 등의 과정이 추가되면 그만큼은 시간이 더 걸릴 수 있다.


3. 후처리(Post Processing)

필요한 책을 읽을 수 있기만 하면 된다고 생각하면 이 과정은 필요없으나, 내 경우 짜투리 시간이 남을 때마다 조금씩 해 두는 편이다. 이 과정은 꼭 도서관에서 할 필요는 없으며 나중에 집에 돌아와서 하는 것이 더 쉽다.

여기서 말하는 후처리란 광학문자인식(Optical Character Recognition; 이하 OCR)을 말하는데, 모르는 사람을 위해 간단히 말하자면 책을 촬영한 사진 파일을 텍스트 파일로 변환하는 것이라고 보면 된다.

수고롭긴 하지만 OCR을 할 경우 용량은 약 1천 분의 1까지 줄어들 수 있다. 또한 OCR된 내용은 google desktop같은 검색 프로그램을 이용해 찾아보거나 인용문이 필요할 때 손쉽게 긁어붙일 수 있는 만큼 많은 장점을 갖는다.

기본적으로는 촬영한 책을 OCR하진 않기로 한 사람이라도 OCR 프로그램을 하나 정도 갖추어 두면 편리하다. 필요할 때 몇 페이지 정도를 눈으로 보고 타이핑하는 것 보다는 OCR하는 것이 훨씬 빠르다.


ABBYY FineReader 9.0을 사용한 OCR 사례
사진 파일이 모여있는 디렉토리를 선택해서
몽땅 선택(ctrl-A)해서 Go
자동인식된 문서. 좌측의 스캔된 이미지와 우측의 텍스트로 인식된 문서를 대조해 볼 수 있다
프로그램의 도움을 받아 교정작업 진행. 상단의 스캔 이미지를 인식된 글자와 대조해볼 수 있다
교정완료된 모습

변환결과물 샘플: example.pdf

끝으로 OCR을 이용할 경우 용량을 절약하기 위해 OCR 후 원본 사진 파일을 지운다는 선택이 있는데, 필자는 가능한 지우지 말고 별도 보관하길 권한다. OCR 후 꽤 신경을 써서 proof-reading을 하더라도 나중에 잘못 인식된 단어 등이 나타날 수 있다. 원본 사진을 남겨 두었다면 필요할 때 눈으로 찾아보면 쉽게 해결할 수 있는 반면, 사진을 지워버렸으면 손쓸 도리가 없다.

Tip. 종종 모니터로 책을 보는 건 익숙하지 않고 눈에 잘 들어오지 않아 잘 보지 않게 된다는 분들을 볼 수 있는데, 그런 분들께는 조금씩 프린터로 뽑아서 보면 어떤지 한번 시험해 보시라고 권하고 싶다.
필자의 경우 대중교통을 통해 출퇴근할 때, 가방에 2매씩 모아찍기한 pdf 파일을 약 10여 매(즉 실제로는 20p분량) 정도 들고다니면서 본다. 운좋게 앉아서 간다면 잠을 보충해야겠지만, 격심한 경쟁 하에서 자리차지에 실패했을 경우의 대안(?)인 셈이다. 그리고 차에서 내리면서 읽은 부분까지는 가차없이 쓰레기통에 쑤셔박고 나온다. 필요하면 또 프린트하면 되는 문제에 불과하니까… 이렇게 하면 3~400페이지짜리 책을 지고다니면서 보는 것에 비해 가방이 월등하게 가벼워진다는 장점이 있다



4. 결론

도서관의 사진 접사대는 원래 흑백 복사기로는 대책이 없는 컬러 사진 등이 실린 책을 다루기 위해 도입된 것으로 쓰는 사람이 매우 적었다. 사실 필름 카메라 시절에 평범한 활자 책을 수십 페이지 이상 촬영한다는 것은 너무나 시간과 비용이 소모되는 일이어서 아무도 도전하지 않았다. 그러나 고성능 디카 시대인 오늘날은 전혀 다르다. 공공도서관의 현행 복사기 이용료(장당 40원)을 고려해 볼 때, 디카를 이용한 책의 접사 촬영은 촬영시간, 비용, 활용도 면에서 충분한 경쟁력이 있다.

과거의 유산(펼쳐보기)


제록스 신을 섬기던 과거 "어느 하루"의 유물들(각 책을 구분하기 위해 포스트-잇을 붙여놓았음) 디지털 카메라는 수십 개의 복사지 상자가 사라진 서재를 만들어 줄 수 있을 것인가



부록 A. 현장 준비물

  • 디지털카메라 (200만 화소 이상의 요즘 나오는 똑딱이면 대부분 무방.
    회전 렌즈 혹은 LCD가 있으면 편리, 촬영속도가 빠르고 접사관련기능이 충실하면 조금 유리)
  • 카메라용 충전지(부족하지 않을 만큼)와 메모리카드 리더(신형 노트북에는 대개 내장)
  • 노트북 (& 전원어댑터와 켄싱턴 키락)
  • 사진 뷰어 소프트웨어

부록 B. 촬영 세팅

필자는 통상적인 사진촬영엔 별 관심도 없고 카메라에 대해 잘 알지 못하기 때문에 이 부분은 어디까지나 간략한 참고 정도로 생각하시기 바란다. 촬영에 대한 조언은 환영한다.

해상도
우선 필자는 몇 년 묵은 300만화소 똑딱이 디카로 2048*1536 jpeg으로 설정해 촬영하고 있는데, 현재까지 큰 불편을 느끼지 못하고 있다. 그렇다면 좀 더 화소수가 높은 디카를 사용할 경우 더 높은 해상도를 택하는 것은 어떨까?

사진은 당연히 고해상도일수록 알아보기 좋겠지만, 결국 용량의 문제에 시달리게 된다. 500GB HDD가 10만원, 4GB짜리 SD 메모리도 2만원 정도면 충분히 구입하는 시대에 용량이 무슨 문제냐고 할지 모르겠는데, 그건 꼭 그렇진 않다. 장당 2MB짜리 사진 150장을 묶어 OCR 없이 그대로 pdf변환할 경우 책 한 권에 300MB짜리 pdf 파일이 나올 수 있으며 이렇게 거대한 이미지 덩어리 pdf는 넘겨 볼 때 무척 둔중하니까 말이다. 또한 pdf 변환하지 않고 사진 뷰어로 그냥 넘겨가며 볼 경우에도 불필요하게 큰 이미지들은 로딩시간이 길어져 불편함을 느끼게 된다.

경험적으로 볼 때 OCR을 사용하지 않고 사진을 눈으로만 볼 경우 2048*1536이면 충분한 해상도이다. OCR을 할 계획이라면 인식률을 높이기 위해 자신의 디카가 허용하는 좀 더 높은 해상도를 쓰는 것도 나쁘지 않은 선택일 것 같다.

플래쉬
위에서 본 것 같은 조명이 붙은 접사대를 사용할 경우 거의 필요하지 않다. 기본적으로 꺼두면 된다. 책 전체가 균일한 밝기로 나오지 않아 문제가 될 경우에만 플래쉬를 시험해 보면 될 듯.

초점
카메라에 내장된 접사관련 기능을 쓸 줄 안다면 AF로도 충분.

화이트밸런스
수동으로 맞출 줄 알면 맞춰서 쓰면 되고, 아니면 AWB로도 충분하다. 어지간해서는 글자 알아보는데 큰 지장은 없기 마련.

흔들림
접사대를 쓰는 제일 큰 이유. 접사대 없이 책상 위에 허리를 굽혀 직각으로 아래를 내려다본 자세로 30장만 찍어보면 실감할 것이다.
by sonnet | 2008/06/17 19:12 | | 트랙백(1) | 핑백(2) | 덧글(67)
트랙백 주소 : http://sonnet.egloos.com/tb/3788700
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Tracked from UbiSpace.net at 2009/11/09 14:08

제목 : ABBYY FineReader 10 한글 OCR 소..
최고의 OCR 성능으로 이름 있는 러시아 ABBYY사에서 한글을 포함한 전세계 186개 언어를 인식할 수 있는 OCR 소프트웨어인 FineReader 10 Professional Edition을 국내 총판 협력사인 디오텍을 통해 출시했습니다. 시험판 다운로드는 http://abbyy.diotek.co.kr/Ko/downloads/FineReader10/ 입니다. 국산 한글 OCR 엔진의 성능 개선이 답보 상태인 상황에서 FineReader 10......more

Linked at Osudy dobrého vo.. at 2008/12/23 13:50

... 오오 우월한 sonnet님~ 오오 http://sonnet.egloos.com/3788700 시간 내서 한번 배봐야 겠군.뭐 업무 차 갈수도 있는 일이고. 세상은 아주 나빠지지만은 않았어. (물론 대체로 나빠졌지만... 내가 태어나 ... more

Linked at Adagio ma non ta.. at 2010/02/16 20:32

... 접사대의 활용</a> 같은 방법을 활용하고 계시지만, 시간을 충분히 들이지 않으면 생각처럼 실천하기 쉬운 방법도 아니고 무엇보다도 우리 동네에는 "대형 도서관"이 없다 -_- ("대형 도서관이면 어디나 갖추어져 있는 사진촬영용 접사대" 라니, 역시 서울은......OTL) 여튼 그래서, 오늘 아침에 과밀화를 향해 치닫고 있는 책장을 보면서 문득 생각해본 사업 모델. 컨셉은 다량의 종이책을 관리, 검색, 활용하는 데 한계를 ... more

Commented by maxi at 2008/06/17 19:22
담주에 구케 도서관 갈건데 혹시 있나요;;저거;;

저는 그냥 손접사 촬영으로 JDW를 구해와서 ㅠㅠ
Commented by sonnet at 2008/06/17 19:39
국회도서관에도 있었던 것으로 기억합니다. 1층 엘리베이터 가는 옆에도 하나 있었던 것 같고, 대개 층마다 하나 씩은 있습니다. 저런 건.
그건 그렇고 JDW는 대개 WEB-DB를 컴퓨터 단말로 보지 않습니까? 복사카드 꽂고 프린팅해 오는 게 제일 쉬울 것 같은데...
Commented by maxi at 2008/06/17 19:45
돈아까워서....;;;


랄까 딱 한번 가본적 있는데 제가 갈때에는 사람이 밀려서 걍 찍었습니다.
Commented by sonnet at 2008/06/17 22:16
예약 시스템이 있을 텐데요. 가자 마자 예약 걸어놓고 딴 책좀 보다가 시간되면 가서 딱 뒤지면 기다리지 않아도 될 듯.
Commented by 愚公 at 2008/06/17 19:27
전자책의 실용화를 기다리겠습니다;
Commented by sonnet at 2008/06/17 19:57
저도 제가 생각하는 전자도서관 http://sonnet.egloos.com/3502497 같은 것이 생기면 이런 노가다를 안 해도 되고 좋을 것 같긴 합니다. 저 자체도 꽤 손품을 팔게 되는 일이라, 필요없는 것까지 할 수는 없죠.
Commented by theadadv at 2008/06/17 19:29
아아, 인용속도가 대단히 빠르셔서 디지털 정리 작업을 거쳤으리라 생각은 하고 있었는데, 이런 식으로 OCR 통해 저장해 두셨군요.
전자책은 카피해 저장하거나 인용이 잘 안될 때도 있어서리 불편하다고 생각했는데 말입니다.
Commented by sonnet at 2008/06/17 20:22
모든 자료를 다 OCR하는 것은 물론 아닙니다. 다만 일상생활에서 대형 공립도서관에 한번 나갔다 오는 것도 따로 시간을 빼야 할 정도로 부담이 가는 일인 만큼, 거기 가서 느긋히 책을 보게 되진 않더군요. 결국 저는 대형 공립도서관에는 책을 복사하러 가고, 읽는 건 나중에 집에 와서 하는 쪽으로 습관을 붙였습니다.
그건 그렇고 서울 같이 큰 도시에도 쓸만한 도서관은 두 개 밖에 없으니, 지방 살면 정말 대책없겠더군요.
Commented by 윤민혁 at 2008/06/17 19:45
문제는 저놈의 OCR 프로그램이... orz
Commented by sonnet at 2008/06/17 19:53
저도 OCR에 막연한 회의감을 갖고 있었는데, 좀 써보고 생각을 완전히 바꾸었습니다. 로마자 OCR은 이미 원숙의 경지에 올랐다고 생각합니다.
한글은 로마자에 비하면 상당히 구린데... 이건 쓰고 싶으면 쓰고, 말고 싶으면 말아도 될 그런 정도인 듯 합니다.
Commented by 윤민혁 at 2008/06/17 20:09
... 성능 문제가 아니라 개인이 사서 쓰기엔 비싸다는 거죠... orz 전에 파인리더를 써서 책 하나 편집을 해 봤는데 거의 완벽하게 되긴 하거든요. 근데... 정품은 너무 비싸고, 불법판으로 테스트해본 거였는데 그게 인증이 안 돼서 PDF는 끝내 못 만들었다는 것 아닙니까. orz

정품이 10만원대로 나오면 사서 쓰기라도 하겠는데, 그 정도 가격은 훌쩍 넘기니 문제지요 문제. orz
Commented by sonnet at 2008/06/17 20:26
그거야 뭐... FineReader 정도면 그 분야에서는 Photoshop 정도의 위상이라고 할 수 있으니까 단품으로 사면 비싼 건 어쩔 수 없을 듯. 예전엔 스캐너 사면 좀 후져도 번들 OCR 프로그램을 주곤 했는데 요즘은 어떤지 모르겠습니다.
Commented by 윤민혁 at 2008/06/18 16:36
제 스캐너에도 번들 OCR - 이라기보단 PDF 메이커 - 이 있긴 한데, 이게 일단 "이미지를 뜬 다음에 텍스트는 따로 인식해서 바로 검색 가능 PDF로 저장하는 스타일"이라, 용량은 별로 안 줄고 대신 텍스트만 긁어서 볼 수 있을 뿐인 괴상한 놈입니다. -_-;;; 오탈자율은 그럭저럭 만족할 만한데요. (560페이지짜리 1956년판 해군 기술교범 저화질판, 오탈자가 대략 1천 자 밑.)
Commented by 어부 at 2008/06/17 19:55
로마자는 많이 좋아졌나 보군요. 문제는 한글이...........
Commented by sonnet at 2008/06/17 20:23
한글도 왕창 할 거라면 타이핑보단 빠른 것 같습니다. 저도 국산의 최신 OCR엔진들을 골고루 테스트해 본 건 아니라 뭐라고 이야기하긴 힘들지만 말입니다.
Commented by 번동아제 at 2008/06/17 20:38
저는 문진 같은 걸로 대충 고정하고 찍는 식의 "막찰"로 찍은 책이 사십여권되는데 이건 훨씬 진보된 과학적 방법이군요.
Commented by sonnet at 2008/06/17 22:14
문진을 말씀하시니 말인데, 저 접사대도 책을 펼친 상태로 고정하기 위한 장치가 없는 건 단점인 것 같습니다. 적당한 필통이나 핸드폰 같은 것으로 문진 대신 책을 고정하기도 하는데 역시 좀 불편하더군요. 접사대 바닥에 횡으로 위치를 조정할 수 있고 책 양쪽 끝을 집을 수 있는 집게 한 쌍을 달아 주면 아주 유용할 것 같은데 말입니다.
Commented by xail at 2008/06/17 20:47
촬영시 광학줌을 하면 책 가장자리가 오목하게 되는 왜곡 현상을 줄일 수 있습니다
(많이 땡기면 많이 땡길수록 좋지만 손은 닿아야하기에..)
광학줌이 안된다면 좀 더 멀리서 고해상도로 촬영한 후 크롭하는 방법도 있지만 화질은 비교적 떨어집니다
Commented by sonnet at 2008/06/17 22:33
조언 감사합니다.
그러니까 카메라를 좀 더 멀리 두고 광학줌으로 당겨서 찍는다 이런 말씀이시지요?
Commented by xail at 2008/06/17 23:25
예 맞습니다
쉽게 말씀드리자면 렌즈의 가장자리로 갈수록 왜곡이 심해지기 때문에
되도록 렌즈의 가운데 부분을 사용해서 찍는다고 생각하시면 되겠습니다
Commented by 은혈의륜 at 2008/06/17 20:49
도서관에 별게 다있군요 'ㅅ'
Commented by sonnet at 2008/06/17 22:21
마이크로 필름 리더도 한번 써보시면 재미있으시지 않을까 합니다. 마이크로 필름도 처음 나왔을 때는 문명의 이기라고 칭찬을 받았으니 도입되었을 텐데, 지금은 그야말로 짐덩어리죠 짐덩어리.
Commented by 길 잃은 어린양 at 2008/06/17 20:52
제본을 괴악하게 해놓은 고서들은 접사대를 쓸 수가 없으니 좀 아쉽습니다.
Commented by sonnet at 2008/06/17 22:16
네, 아쉽지만 하는 수 없죠. 그래도 저것도 있는 것과 없는 것은 천지차이 아니겠습니까.
Commented by 바닷돌 at 2008/06/17 20:59
으아... 저런 물건도 있었군요 'ㅅ'; 우리 학교에는 있으려나..
Commented by sonnet at 2008/06/17 22:17
제가 가본 대학 도서관엔 대부분 다 있는 것 같더군요. 요즘 유행하는 "작은" 도서관에서는 못 본 것 같지만요.
Commented by 나츠메 at 2008/06/17 21:04
sonnet님/
윤민혁님 말씀에 동감이 갑니다. 개인적인 경험을 비추어 보면, 스캐너 사면 주는 번들 OCR은 성능이 좀 구립니다.
Commented by sonnet at 2008/06/17 22:20
번들이 그렇게 좋으면 누가 정품을 사겠습니까(웃음).
Commented by 한단인 at 2008/06/17 21:11
뭐 이런 엄청난 것이..
Commented by sonnet at 2008/06/17 22:18
저건 사실 사람들이 있는지도 모르고 봐도 뭐하는 건지 모르고 지나쳐서 그렇지 아주 오래 된 장치입니다. 저도 디카가 생기기 전에는 거의 무시했었지 말입니다.
Commented by bzImage at 2008/06/17 22:55
스캐너에 비해서는 많이 편리한가요? 오히려 괴악한 판본이야말로 접사대의 진가가 나올것 같은데...
Commented by sonnet at 2008/06/17 23:06
(대출이 안 되는) 도서관에 스캐너를 지고 가시게요? 예전에 국회도서관에 스캐너를 지고 갔다왔다는 어떤 용자의 전설을 들은 기억이 납니다.

* 품질: 스캐너가 좋습니다.
* 소음과 공간: 스캐너는 생각보다 시끄럽습니다. 도서관 안에서 노트북과 스캐너를 펼쳐놓고 작업할 공간을 찾기가 쉽지 않습니다.
* 판형: 흔한 A4스캐너에 맞지 않는 판형의 책들이 흔합니다. 도서관에선 복사기로 복사를 하고 이렇게 확보한 A4복사지를 다시 스캔하는 것은 한 가지 방법입니다.
* 촬영속도: 대개 디카가 훨씬 빠릅니다. 자동급지장치가 달린 고속 스캐너들도 많이 싸졌는데 이런 건 더더욱 부피가 크지요.
Commented by nOiZe at 2008/06/17 23:00
좋은 정보네요 ^^
Commented by sonnet at 2008/06/17 23:06
네, 읽어주셔서 감사합니다.
Commented by Empiric at 2008/06/17 23:16
리코 카메라들은 문서촬영 모드도 있더군요.
Commented by sonnet at 2008/06/18 12:29
저는 써보지 못했는데 효과가 어떤지 궁금하긴 합니다. 디카의 흑백모드를 갖고 테스트를 해 본 적이 있는데 예상과는 달리 OCR 인식률이 오히려 떨어지는 것 같더군요. 그냥 컬러가 더 나았습니다.
Commented by 극악 at 2008/06/17 23:45
국립중앙도서관에도 있던데^^; 사용하는분은 딱 한번봤네요...
디자인서적 같은걸 촬영하시던데...
나중에 제가 가지고있는 책이라도 가져가서 한번 찍고 싶군요...
Commented by sonnet at 2008/06/18 12:29
위의 사진들이 바로 국립중앙도서관 3층에서 촬용한 것입니다.
Commented by 됴취네뷔 at 2008/06/18 00:21
번들 OCR.. 다름아닌 국산 소프트로 써보다가 소프트웨어가 구린것만큼 스캐너 자체도 구려서 주저앉았던 기억이.. 200dpi에서 정상적인 화질을 보장못하는데서 우울했는지라..
Commented by sonnet at 2008/06/18 12:31
그러셨군요. 저도 집에서 10만원 미만으로 주고 산 대만제 플랫베드 스캐너를 쓰고 있는데, 그래도 300dpi 기본은 잘 되던데, 운이 좀 없으셨던 듯 싶습니다.
Commented by 로리 at 2008/06/18 03:06
부산 시립도서관에는 저게 없다는 T.T
Commented by sonnet at 2008/06/18 12:32
크.. 좀 아쉽군요. 그냥 민원이라도 한번 내 보시지 그러십니까. 저건 사실 대단히 비싼 물건도 아닐 텐데 말입니다...
Commented by Madian at 2008/06/18 09:06
꿈같은 이야기군요. 머릿속에 잘 갈무리하고 있어야겠습니다.
Commented by sonnet at 2008/06/18 12:32
하하. 나중에 직접 시험해보실 수 있을 무렵엔 더 좋은 문명의 이기가 많아질 겁니다.
Commented by 위장효과 at 2008/06/18 09:19
마지막 문구에 공감...책말고도 저와 같은 자세로 접사할 일이 자주 있는데...말씀대로 30장정도 찍으면 흔들림도 흔들림이지만 허리어깨팔목...안 쑤신데가 없지요.
Commented by sonnet at 2008/06/18 12:33
예. 그럼요. 그야말로 허리뿌러지는 사태지 말입니다.
Commented by ssn688 at 2008/06/18 10:37
페이지의 조그만 부분을 클로즈업 촬영할 게 아니라면, page full로 담는다면 의외로 접사 스펙은 특별히 따질 필요는 없을 듯합니다. 웬만하면 디카, 접사 모드에 안 들어가고도 그냥 찍는지라... 회전 LCD나 경통의 필요성은 정말 공감입니다.
예전에 (어떤 교수님이 그간에 쓴 글들을 모아서 책을 만드느라)잡지의 복사본 스캔(HP 구형 SCSI 스캐너) 뜬 파일은 아르미 4.0 번들 버전만으로도 한글 인식이 제법 잘 되었던 것으로 기억합니다만(대신 한자는 골룸입니다 OTL)... 디카로 찍은 것은 화질이 떨어지니까 역시 힘든 걸까요.
p.s. 부근에 문진을 구할 수 있는 데가 없어서 OTL
Commented by sonnet at 2008/06/18 12:39
예. 초점이 안맞으면 모를까 사실 대충 찍어도 기본은 나오기 때문에 그렇게 품질 차이에 목을 매달 것까지는 없다는 생각입니다.
오히려 저는 저 짓을 하다 보니까 유선(혹은 무선) 릴리즈가 있으면 보다 편리하겠다는 생각이 들더군요. 손을 뻗어서 셔터 눌러주는 것도 한 시간 이상 하면 뻐근하긴 한 것이 말입니다. (그런데 저 카메라는 회전 LCD가 들어가는 대신 릴리즈 지원이 안된다는 복병이 있더군요 ;;;)
Commented by ssn688 at 2008/06/18 10:40
렌즈가 영상을 담는 데에는 수차란 게 생기기 마련인데, 직선이 똑바로 나오지 않는(불룩하거나 오목해지는) 왜곡수차도 숙명이지요. '대개' 줌 렌즈에서 광각 영역은 불룩해지고(배럴 디스토션), 망원 영역은 오목(핀쿠션)해집니다.
그런데 줌 렌즈에서 특정 영역(초점거리)에선 왜곡수차가 극소화되는 럭키샷을 날릴 때가 있습니다. 망원단과 광각단 사이에서 '출현'하는데 꼭 가운데만도 아니고 제품마다 제각각이라... SLR용 교환렌즈는 이런 왜곡수차 테스트도 하는데 똑닥이들은 알아볼 기회가 별로 없어서 스스로 시험이라도 해봐야 하나 싶습니다.
Commented by sonnet at 2008/06/18 12:48
책을 촬영할 경우에는 렌즈의 왜곡 보다는 평면유지가 더 문제인 것 같습니다.
복사기를 쓸 때처럼 위에서 책을 눌러서 밀착시킬 수 없기 때문에 옆에서 봤을 때 책이 평면이 되지 못하고 ⌒⌒ 형태를 취하다보니 가운데는 볼록하고 양쪽 끝으로 갈수록 바닥을 향해 기울어지기 마련입니다. 그러니 당연히 양쪽 끝으로 갈수록 글자가 찌그러진 형태로 찍히게 되는 것이지요.
가끔 책을 펼쳐놓는데 애를 먹을 때면 유리판 같은 것으로 위에서 책을 확 눌러버릴 수 있으면 좋겠다는 생각이 들 정도입니다. ;;;
Commented by A_D_F at 2008/06/18 10:54
저는 MS오피스 사면 주는 번들 OCR을 쓰고 있는데 영어는 손글씨만 아니면 거의 100% 정확하게 인식이 되네요. 한글도 인쇄물은 그럭저럭 되는듯?
Commented by sonnet at 2008/06/18 12:56
상세한 것은 저도 잘 모르겠습니다만, 영문은 오래 전에 대부분의 제품이 수준권에 오른 반면, 동양3국 문자(CJK)는 그 복잡성 때문에 아무래도 한 수 떨어지는 것 같습니다.
Commented by 리스 at 2008/06/18 11:12
와, 좋은 정보 감사합니다^^ 먼지와 잉크에 시달리면서 복사하느라 정신적 고통에 시달리느니 차라리 괜찮은 디카를 장만해야겠어요.
Commented by sonnet at 2008/06/18 12:41
제 경험으로는 접사대를 쓸 수 있다면 디카는 싼 것도 거의 문제가 되지 않는 것 같습니다. 당장 저만 해도 4년 전에 20만원 주고 산 디카로 별 불편함 못 느끼고 잘 쓰고 있으니까요.
Commented by 로리 at 2008/06/18 14:26
복사기랑 마이크로 필름기가 있어서 일까요 T.T
Commented by sonnet at 2008/06/19 23:26
에이.. 우연의 일치겠죠.
Commented by lesis at 2008/06/19 11:31
저가형 스캐너 번들 OCR을 하나 사용해 본 결과 한글은 한 페이지에서 거의 10자 내외의 오탈자가 나오더군요. 조용히 접었습니다...;;
덧, pdf리더는 어떤 걸 사용하십니까? Foxit이 가볍던데 말입니다.
Commented by bzImage at 2008/06/19 15:36
한페이지에서 10자 내외의 오탈자 정도면 충분히 수정 가능한 수준 아닌지요?
Commented by sonnet at 2008/06/19 23:30
lesis/ 저는 그냥 어도비의 리더를 쓰고 있고, 사실 써드파티 제품을 별로 테스트해 보지 않아 뭐가 좋은지는 잘 모르겠습니다.

bzImage/ 그건 소프트웨어가 제공하는 기능에 따라 다른데, 오탈자로 의심되는 부분을 철자법검사기 기능 등과 조합해 손쉽게 찾고 교정할 수 있는 기능이 있으면, 10자 정도는 충분히 쓸만합니다. 그런 기능이 없고 몽땅 눈으로 찾아야 되면 훨씬 힘들어지지요.
Commented by 빙♡ at 2008/07/02 18:31
저도 USB에 Foxit을 넣어 다니는데 좋더군요 :)
Commented by 빙♡ at 2008/06/29 18:52
저희집에서는 점자 도서관에 엄마가 봉사활동으로 책 타이핑을 하시느라고 OCR을 써봤는데요..
90년대 후반 이후의 깨끗한 소설책 수준이면 OCR로 한글이 거의 되고, 좀 고쳐줘야 되는 정도더라고요.
저렇게 하면 정말 빠르겠네요... +_+
사실 개인적으로 읽기 위해서는 오탈자 무시하고 그냥 해볼만 한 것 같아요.

저는 저런 공 들일 정도의 독서량이 안돼서 그냥 페이퍼백을 사서 챕터별로 나눠서 읽어요 ㅋ
두꺼운 잡지나 북커버로 겉을 싸주면 책 너덜해지지도 않고 얇고 가벼워서 아무데나 항상 갖고 다니고요 ㅋ

^^잘 읽었어요~+_+
Commented by sonnet at 2008/06/29 19:32
응 그렇군. 그렇게 짬짬이 책 읽는 습관을 붙인 사람은 강자라고 할 수 있지 ;-)
나도 모든 걸 하는 게 아니고 책이 미칠 듯이 비싸거나 절판된지 오래 된 것만 골라서 해. 사실 저것도 공이 꽤 드는 일이거든.
Commented by honest at 2008/08/10 10:52
이 글을 기억해 두고 있다가, 오늘에야 이것저것 찾아봤는데, 저게 보통 copy stand 라고 불리는 것 같습니다. 비교적 만만해 보이는 제품이 아마존에서 $130 정도에 판매되고 있었고, 사실 구조가 단순해서 파이프나 나무조각 몇 개 가져다가 직접 만드는 사람도 있는 모양입니다. 발전된 형태로는 http://www.atiz.com 에서 판매하는 BookDrive DIY 나 BookSnap 같은 책 스캔 전용 기기들을 찾을 수 있었습니다. 슬쩍 보아도 atiz.com 의 제품들은.. 탐나는 것은 사실이지만 개인이 소장하기에는 (가격 면에서나 활용 면에서나) 조금 무리가 있을 것 같긴 합니다. 책을 180도 펼치지 않은 채 페이지를 평평하게 만들어서 양쪽 페이지를 따로따로 촬영하는게 매우 훌륭해 보입니다. (쓰고 나니 어쩐지 달을 가리키는 레이저 포인터를 보고 신나게 레이저 포인터 시장조사 한 것 같은 느낌이 드는군요)
Commented by sonnet at 2008/08/11 11:27
대단합니다, 세상은 참 넓군요!
하지만 어지간한 사람들이 집에 저런 명품을 들여놓았다가는, 엄처슬하에서 살아나기 쉽지 않을 듯 싶은 생각이...
Commented by ㅇㄹㅇㄴ at 2012/01/04 01:33
이거불법
Commented by choaukkk at 2012/04/26 21:36
마지막에 에디팅이나 교정작업을 무슨 프로그램으로 하나 궁금했는데, 역시 ABBYY에서 나온 FINEREADER를 쓰네요. 전 지금 11 버전을 쓰고 있는데, 정말 OCR 중에는 가장 뛰어난 인식율 가지고 있는 프로그램이 아닌가 생각됩니다. 인터페이스나, 에디팅, 다중인식도 훌륭하다고 생각되구요. 리뷰너무 잘 봤습니다. ^^
Commented by aa at 2016/03/10 13:49
저작권적으로 과도기였던 시기라 가능햇던 일이군요. 8년이 지난 지금은 불법.

- 도서관 자료복사는 저작권법에 의거하여 부분복사(1/3)만 가능
- 고서 원문 데이터베이스의 자료는 도서관 외부에서 직접 출력 가능
- 자료복사는 각 층의 복사실에서 가능하며, 외부 전문복사업체에서 복사실을 운영함
- 자료의 복사와 프린터 출력은 유료(저작권료 포함)

:         :

:

비공개 덧글

<< 이전 다음 >>