xpdfを使ってPDFから日本語抽出をする話の2017年度版

TeXで原稿を書いている。文字数を数える機能がTeXにはないので(設計思想がそもそも違うと言うか),PDFから日本語文字数をカウントする。

で,うろうろしていてこのサイトに行き着いた。

xpdfを使ってPDFから日本語抽出

基本的にこれで問題解決なんだけど,HomebrewがOS X El Capitan以降は権限周りが少し変わったらしくて,インストールされる場所が違うみたい。

ともかく,brewを再インストールしてから,xpdfを入れる。

で,日本語対応するためには/usr/local/share/xpdf/japaneseに日本語対応ファイルを入れるんだけど,pdfが/usr/local/Cellar/xpdf/に入っちゃっているので,その辺を読み直さないといけない。

xpdfrcも次のように書いたらうまくいった。

 

 

分類できない何か
日本心理学会の引用スタイルjecon_jpa.styを作った

PDFが静的でリッチではないフォーマットだ,という意見はよくわかるけど,記録として残るものは静的であ …

分類できない何か
テレビは安い

新春初売りもあるのかしれぬが、32インチのテレビ、19,000円で買えるのね。安くなったなぁ。

分類できない何か
ブログを書くためのブログ記事(RWordPress and knter)

アドカレにエントリーでもしないと,わざわざブログ書いたりしないよねー,な毎日を送っておりました。実際 …