PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

PDF] 텍스트 복사 / 텍스트 추출 안될 때 해결법 (with Google 문서)

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

글자 복사 방지 해결법

PDF 파일이 텍스트로 저장돼 있는데도 글자 복사가 되지 않을 경우가 있는데,  PDF에 글자 복사 방지 처리가 돼 있으면 이런 문제가 발생하게 되는 것 같다. 


다들 알다시피 보통의 PDF 파일에서는 복사할 텍스트를 긁어서  Ctrl + C / Ctrl + V를 하면 쉽게 복사/붙여 넣기가 된다.

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage
일반 PDF에서의 텍스트(글자) 복사 방법


얼마 전 회사 동료가 학교 과제를 위해 전달받은 PDF 파일에서 텍스트 복사가 되지 않는다고 해서 검색하던 중,
정말 간단히 해결할 수 있는 방법을 찾게 되어 공유하고자 한다.

PDF 변환해주는 타 사이트에 파일 업로드를 할 필요 없이(대부분 이 방법을 제시해줘서 시간 낭비를 많이 했다 - 나의 검색 키워드가 잘못된 탓일지도😢)
구글 드라이브에 해당 PDF 파일 업로드 후 텍스트 추출이 가능하다.

1단계. 텍스트 복사가 안 되는 PDF 파일 구글 드라이브에 업로드

구글 드라이브에 PDF 파일을 업로드한다.

방법 1. 드라이브 화면 좌측(메뉴) 영역에서 새로 만들기 > 파일 업로드를 클릭하여 업로드
방법 2. 드라이브 화면 우측(파일 탐색) 영역에 파일을 직접 드래그(끌어다 놓기)

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage
구글 드라이브 파일 업로드 방법

2단계. 드라이브에 업로드된 파일 Google 문서로 연결

드라이브에 업로드된 파일 > 마우스 오른쪽 버튼 클릭 > 연결 앱 > Google 문서 선택

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

3단계. Google 문서에서 변환된 PDF 파일 열림

위의 단계를 거치면서 텍스트 복사 방지가 해제된 파일이 Google 문서에서 열리게 된다. (오! 구글신이시여😍 )
우와~~~~ 이제 텍스트가 복사된다~ 넘나 신나는 것!!  😆💃🎵

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

4단계. 불필요한 텍스트 제거 (Do Not Copy or Post) 후 파일 다운로드

Google 문서 상단 메뉴 파일 > 다운로드 클릭 : 워드나 PDF 형태 등 다양한 확장자로 파일 다운로드를 할 수 있다.

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage


나의 직장동료는 이 방법을 찾지 못했다면 A4 12페이지에 달하는 텍스트를 직접 타이핑하게 되었을지도 모른다.
그런 일이 일어나지 않아서 너무 다행스럽지만.... 😊

물론 저작권은 소중하지만 학교 과제 등으로 글자 복사 방지 처리된 파일을 전달받고 당황하실 분들에게 작은 도움이 되길 바란다.

과제나 프로젝트, 정보 수집을 이유로 PDF 파일을 참조하는 경우 PDF 텍스트 내용을 복사해야 하는 경우가 있습니다. 하지만 PDF 파일이 암호 보안으로 설정되어 있으면 PDF 안의 텍스트 내용이 드래그는 되지만 복사는 할 수 없게 되는데요.

사용자가 직접 타이핑을 할 수도 있지만 텍스트 양이 방대한 경우 타이핑을 하는 것은 한계가 있고 비효율적이기 때문에 PDF 복사 방지를 해제하는 편이 현실적으로 작업 능률을 올리는 방법인데 PDF 복사 방지 해제는 프로그램을 이용하는 방법과 웹 서비스를 이용하는 방법을 활용할 수 있습니다.

참고로 텍스트처럼 보이지만 이미지로 처리되어 있는 경우는 텍스트가 드래그 되지 않으며 이 경우에는 복사 방지 해제를 해도 내용을 복사할 수 없습니다.

이 경우는 이미지를 텍스트로 변환하는 OCR 기능을 이용해야 하며 아래 글에 자세히 설명이 되어 있으니 참고해 주세요.

참고 : 이미지 텍스트 추출하는 방법 – OCR

  • PDF 텍스트 잠금 해제 프로그램 NesPDF
  • 구글 드라이브 Luminpdf 활용하기
  • PDF 잠금 해제 사이트 활용하기

PDF 텍스트 잠금 해제 프로그램 NesPDF

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

NesPEF는 PDF 리더 기능과 함께 편집, 역변환 기능을 제공하고 있어 PDF 파일이 잠금 설정이 되어 있어도 쉽게 해제가 가능합니다.

개인에 한해서 무료로 사용 가능하며 회사 및 기관은 라이센스를 구매 후 사용해야하니 집에서만 사용하는 것이 좋겠죠? 32비트와 64비트 중 자신의 윈도우 환경에 맞춰 다운로드 후 설치합니다.

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

NesPDF를 실행한 다음 잠금 설정되어 있는 PDF를 불러오면 프로그램 상단의 PDF 문서 이름 끝에 ‘보안됨’ 이라는 표시가 되는데요.

보안을 풀기 위해서 상단 메뉴에서 ‘쓰기 가능한 PDF로 변환’ 버튼을 클릭합니다.

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

쓰기 가능한 PDF로 변환을 선택하면 변환 방법에 대한 옵션을 선택할 수 있는데, 옵션을 변경할 필요 없이 ‘변환’ 버튼을 클릭하면 잠금 해제가 시작되며 문서 양에 따라 시간이 조금 걸릴 수 있습니다.

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

새 창이 열리며 변환을 시작하고 변환이 끝나면 텍스트를 드래그해 복사할 수 있습니다.

구글 드라이브 Luminpdf 활용하기

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

구글 드라이브는 업로드되는 확장자에 맞춰 다양한 확장 기능을 제공하고 있는데요.

구글 드라이브에 PDF 파일을 업로드한 다음 Luminpdf로 불러오면 잠금 설정이 되어 있는 PDF 파일도 텍스트를 복사할 수 있기 때문에 프로그램을 설치하지 않아도 되는 장점이 있습니다.

구글 드라이브에 텍스트를 복사하고 싶은 PDF 파일을 업로드한 다음 업로드한 PDF 파일을 마우스 오른쪽 버튼으로 선택 후 연결 앱 > Lumin PDF를 선택합니다.

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

Lumin PDF 뷰어로 PDF를 연 후 복사하고 싶은 텍스트 영역을 드래그한 다음 키보드 단축키 Ctrl + C 를 눌러 클립보드에 복사 후 메모장이나 워드에서 Ctrl + V로 붙여넣기 하면 됩니다.

PDF 잠금 해제 사이트 활용하기

PDF 텍스트 인식 못하게 - PDF tegseuteu insig moshage

위 과정이 귀찮다면 PDF 파일을 업로드하면 잠금 해제를 해주는 사이트를 이용하는 방법도 있습니다.

PDF 잠금 해제를 해주는 사이트는 여러곳이 있는데 대표적으로 CleaverPDF와 I♥PDF가 있으며 사이트에 접속 후 ‘파일 선택’ 버튼을 클릭하고 잠금을 해제할 PDF 파일을 업로드하면 잠금 해제 처리 후 다시 PDF 파일을 다운로드 받을 수 있게 되며 PDF 파일을 다운로드 받은 다음 PDF 뷰어로 열어 원하는 내용을 복사하면 되겠습니다.