본문 바로가기
IT STORY/소프트웨어

nPDF- PDF파일에서 이미지추출 및 텍스트추출해주는 프로그램

by 도일's 2014. 11. 13.
반응형

nPDF- PDF파일에서 이미지추출 및 텍스트추출해주는 프로그램

 

 

PDF파일을 많이들 쓰고 계시리라 생각이 됩니다.

특히 전자제품들의 설명서를 인터넷에서 다운로드 받을 경우 PDF인 경우가 거의 대부분일 정도로 널리 쓰이고 있죠.

그만큼 효율성이 높고 수정이나 편집이 어렵게 때문에 보완문서로도 활용도가 높은 것이 PDF입니다.

그러나 살다보니 어쩔수 없이 PDF파일을 수정하거나 편집해야 할 경우가 생기고 또는 PDF파일을 만들어야 하는 경우도 생기게 되는데요. 앞서 말씀드렸다시피 수정이나 편집이 상당히 어렵습니다.

PDF파일을 뷰어로 열어보았자, 인쇄,찾기 기능정도만 가능할뿐 텍스트나 이미지를 수정하는 것은 불가능하니까요.

물론 PDF파일을 텍스트문서로 변환해서 수정하거나 아니면 텍스트문서를 다시 한글이나 엑셀로 읽어드려서 편집하는 것이 가능합니다만, 텍스트문서의 특성상 이미지는 읽어드리지 못하기 때문에 PDF 파일에 포함된 이미지는 일일이 캡쳐해서 저장하고 다시 한글이나 엑셀문서로 옮겨와야만 합니다.

이미지가 한두장이라면 문제가 안되겠지만, 수십장이나 되는 이미지를 일일이 캡쳐해서 옮긴다는 것이 결코 쉬운일이 아니죠....

이럴때 필요한 것이  PDF편집 프로그램인데요. 오늘 알아볼 nPDF가 바로 그런 프로그램중에 하나입니다.

 

 

nPDF는 다양한 기능들을 제공하고 있는데요.

PDF파일 합치기, 페이지추출,페이지 회전, 암호걸기, PDF파일을 JPG 혹은 PNG와 같은 이미지파일로 변환하는 기능, 반대로 이미지 파일을 PDF로 변환하는 기능 등 PDF와 관련된 다양한 기능들을 제공하고 있습니다.

이중에서 우리가 알아볼 것은 PDF파일에서 이미지추출 및 텍스트를 추출하여 완벽한 한글문서나 엑셀문서로 변환하는 방법입니다.

 

 

 

이 두기능은 nPDF의 하단에 위치하고 있는데요.

위 빨간 박스안에 있는 이미지추출과 텍스트추출 옆의 체크박스에 체크하고 다음을 누릅니다.

 

다음 버튼을 클릭하면 위와 같은 화면이 나타나는데요. 처음에는 하단의 error 로그가 없으며, 파일선택 버튼을 클릭해서 변환하고자 하는 PDF 파일을 추가해야만 합니다.

파일을 추가한후 조금 애매한 부분이 있는데요. 실행이나 만들기와 같은 버튼을 사용하는 것이 아니라 저장버튼을 이용해 추출한 파일들을 바로 저장하도록 구성되어 있다는 것입니다.

조금 헷갈릴수도 있지만, 한번만 사용해 보시면 어렵지 않게 이용하실수 있을 정도이니 걱정하실 필요는 없구요.

 

이렇게 PDF파일에서 이미지추출 과정이 모두 끝났습니다. 다음으로 해야 할 것은 텍스트파일 추출이 되겠죠.

이과정 역시 이미지추출과정과 동일한 순서로 진행되는데요. 텍스트추출 체크박스에 체크후 다음->파일선택->저장 버튼을 클릭하면 저장하고자 하는 위치를 선택하는 창이 나타나며 원하는 이름으로 저장이 가능해 집니다.

그렇게 추출한 결과물을 한번 볼까요.

  

 

왼쪽은 PDF파일에서 이미지추출 작업을 실행한 결과물이고 오른쪽은 텍스트추출 과정을 거친 결과물입니다.

이 다음과정은 텍스트문서와 이미지 파일들을 이용해 한글이나, 엑셀파일로 만드는 작업만이 남아 있네요. 한가지 팁을 말씀드리자면 원본 PDF 파일을 프린트해서 그 파일을 보면서 이미지를 삽입하면 훨씬 빠른 시간내에 완성된 결과물을 얻을수 있을 것입니다.

또한 여러 PDF파일을 하나로 합쳐야 하지만 어떻게 할지 몰라 고민일때에도 nPDF프로그램을 사용하면 여러개의 PDF파일을 하나로 합치는 것이 가능해집니다.

 

이번시간에 알아본 것은 nPDF라는 프로그램으로 무료로 사용이 가능한 소프트웨어이지만, 기능만큼은 어느 유료 프로그램과 비교해보아도 전혀 떨어지지 않는 프로그램입니다.

혹 nPDF를 다운로드 받고자 하시는 분들은 네이버 소프트웨어나 다음자료실등에서 검색해보면 손쉽게 다운로드 받을수 있으니 참고하시길 바랍니다.

반응형