오늘은 여러개의 PDF 문서를 하나의 파일로 합치는 명령어를 소개합니다.
사용할 일이 많이 없을것 같긴 하지만 간혹 복합기 (스캐너) 를 통하여 한장씩 낱개로 저장된 PDF 문서를 합쳐야 하는경우에 유용하게 사용할 수 있습니다.
윈도우즈용도 제공하지만 PC 가 리눅스 OS 라면 더할 나위 없이 편리합니다.
설치되는 패키지는 pdftk (PDF Toolkit) 이며, PDF 파일을 다루는 데 사용되는 유명한 명령 줄 도구입니다.
리눅스 OS 에서 패키지 형태로 제공되므로 사용법도 간단합니다.
그리고 나중에 안내드릴 PyPDF2 는 짧은 Python 코드를 작성해야 하지만 Python 코드와 결합하여 동작 시킬 수 있으므로 나름대로의 서비스 구현에도 사용하기 좋습니다.
1. pdftk [link]
설치 방법은 일반 패키지 설치와 동일하며, 아래 명령 사용시 리포지토리를 통해 등록된 패키지를 다운로드 받고 설치하게 됩니다.
CentOS
# yum -y install pdftk
Ubuntu
# apt-get -y install pdftk
사용 방법은 아래와 같습니다.
형식) pdftk <파일1> <파일2> cat output <합쳐진 파일>
합치고자 하는 파일을 계속 나열해도 됩니다.
# pdftk file1.pdf file2.pdf cat output idchowto.pdf
file1.pdf / file2.pdf 파일의 내용이 idchowto.pdf 파일 하나에 합쳐졌습니다.
2. PyPDF2
또다른 방법으로 PyPDF2 라는 Python 라이브러리를 사용할 수 있습니다.
먼저, Python 과 PyPDF2 를 설치해야 합니다.
아래 명령을 사용하여 python3 과 python3-pip 를 설치합니다.
CentOS
# yum -y install python3 python3-pip
Ubuntu
# apt-get -y install python3 python3-pip
그리고 pip3 명령을 통해 PyPDF2 를 설치합니다.
# pip3 install PyPDF2
설치가 완료되면 다음과 같은 Python 스크립트를 작성합니다.
# vi sum.py
import PyPDF2 # 합칠 PDF 파일의 경로 # 새로운 PDF 파일을 저장할 경로 # PDF 합치기 print(‘PDF 파일이 성공적으로 합쳐졌습니다.’) |
위 스크립트에서 file1.pdf 와 file2.pdf 파일은 합치고자 하는 원본 PDF 파일의 경로입니다.
특정 경로에 저장되어 있다면 상대경로나 절대경로를 이용해 파일을 찾을 수 있도록 설정하면 되지만
저는 같은 디렉토리에 두었기 때문에 경로는 제외하고 파일명만 입력하였습니다.
아래와 같이 스크립트를 실행하면 지정한 파일들이 합쳐진 idchowto.pdf 파일이 생성됩니다.
# python3 sum.py
다음에도 유용한 도구가 있으면 소개해 드리겠습니다.