pdftotext 中文測試

英文測試沒問題!

中文測試需要作一些加工!

下載:Chinese/traditional: xpdf-chinese-traditional.tar.gz (794568 bytes)

將add-to-xpdfrc改成xpdfrc,並修改內容中的路徑,我的xpdfrc如下:

#—– begin Chinese Traditional support package (2004-jul-27)
cidToUnicode    Adobe-CNS1    chinese-traditional/Adobe-CNS1.cidToUnicode
unicodeMap    Big5        chinese-traditional/Big5.unicodeMap
unicodeMap    Big5ascii    chinese-traditional/Big5ascii.unicodeMap
cMapDir        Adobe-CNS1    chinese-traditional/CMap
toUnicodeDir            chinese-traditional/CMap
displayCIDFontTT    Adobe-CNS1    chinese-traditional/kaiu.ttf
#—– end Chinese Traditional support package

執行:

pdftotext -enc Big5ascii file.pdf

就可以看到file.txt中的中文字了!

感謝你看到這裡,很快就可以離開了,但最好的獎勵行動就是按一下幫我分享或留言,感恩喔~

點我分享到Facebook

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。