요새 구글 번역사 도구함(Google Translator Toolkit)을 본격적으로 사용해 보려고 이것저것 알아보는 중이다. 번역할 문서는 대부분 PDF로 받기 마련인데, 이 PDF를 구글 번역사 도구함에 업로드 가능한 DOC/DOCX 형식으로 변환하는 툴을 찾다가 다음과 같은 온라인 도구 두 가지를 발견했다.
하고 많은 도구들 중에서 이 두 가지 도구가 유용하고 필요한 까닭은 이렇다. 우선 Crop PDF의 경우, PDF 파일을 보면 페이지 상단과 하단에 페이지 번호나 책 제목, 챕터 제목이 반복적으로 표시되는 경우가 많은데, 이를 무시하고 변환한 후 업로드하면 불필요한 텍스트가 계속 들어간다. 그런데 Crop PDF에 PDF 파일을 올리면 본문이 실제로 표시되는 영역과 페이지 상하단의 내용이 표시되는 영역을 눈으로 확인해서 잘라내기할 영역을 마우스로 드래그해서 지정할 수 있다. 다른 Crop 도구는 별도 프로그램을 설치해야 하거나 영역을 지정하기 불편한데, 이 툴은 직관적으로 지정할 수 있어서 아주 편리하다.
두 번째로 PDF DOC 변환 툴이 유용한 이유는, PDF 파일을 단순히 DOC 형식으로 변환하는 툴은 상당히 많다. 그렇지만 막상 해보면 단락 내에서 줄이 바뀌는 부분에 줄바꿈 문자를 일일이 넣어서 모양만 그럴 듯하게 맞춰주는 경우가 대부분이다. 그래서 그런 상태로 번역사 도구함에 업로드하면 각 문장이 쪼개지는 현상이 발생한다. 그렇지만 위 사이트에서 DOC 파일로 변환해서 올리면 단락 구조를 그대로 유지한 채로 만들어주고, 또 서식도 잘 유지해 주는 편이어서 구글 번역사 도구함에서 작업하기가 상당히 수월하다.