728x90 java1 Java PDF 텍스트 추출 및 특정 문자 찾기 PDF에서 텍스트를 분리하여 특정 코드를 추출하는 작업이 있었다. 일부 해외 상용 소프트웨어나 몇 가지 오픈소스를 테스트해보았는데 한국어를 지원하지 못하는 경우는 상용 소프웨어도 정상적으로 텍스트를 추출하지 못했다. 오픈 소프트웨어에서도 각각 차이가 많이 나는데 이중에서도 'Apache PDFBox'가 준수한 성능을 보여 주었다. https://pdfbox.apache.org/ Apache PDFBox | A Java PDF Library Apache PDFBox® - A Java PDF Library The Apache PDFBox® library is an open source Java tool for working with PDF documents. This project allows creatio.. 2021. 11. 7. 이전 1 다음 반응형