pdftotext 中文測試

英文測試沒問題!

中文測試需要作一些加工!

下載:Chinese/traditional: xpdf-chinese-traditional.tar.gz (794568 bytes)

將add-to-xpdfrc改成xpdfrc,並修改內容中的路徑,我的xpdfrc如下:

#—– begin Chinese Traditional support package (2004-jul-27)
cidToUnicode    Adobe-CNS1    chinese-traditional/Adobe-CNS1.cidToUnicode
unicodeMap    Big5        chinese-traditional/Big5.unicodeMap
unicodeMap    Big5ascii    chinese-traditional/Big5ascii.unicodeMap
cMapDir        Adobe-CNS1    chinese-traditional/CMap
toUnicodeDir            chinese-traditional/CMap
displayCIDFontTT    Adobe-CNS1    chinese-traditional/kaiu.ttf
#—– end Chinese Traditional support package

執行:

pdftotext -enc Big5ascii file.pdf

就可以看到file.txt中的中文字了!

Print Friendly, PDF & Email

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料