2005年04月08日

PDFファイルから文章を抽出

今までPDF関係のフリーソフトはいくつか紹介してきました。
今回もPDFツールを紹介するのですがちょっと設定が面倒だったので、その方法もあわせて紹介します。

PDFファイルというと画像や文章を回覧するのが目的ですが、他の文書ファイルと違って気軽に編集作業はできません。まあそこまでPDFファイルを編集する必要性があるのかどうかは疑問ですが、PDFファイルから文章をテキスト形式で抽出できるフリーソフトがあったので紹介しておきます。

xdoc2txt 1.13というソフトなのですが、PDFファイル以外のソフトにも対応しているみたいです。保存先はデスクトップだと上手く作動できなかったので、適当なドライブに保存しておいて下さい。また、cryptlib.dll Ver1.00 ( crypt100.lzh / 37KB ) - パスワード無しで暗号化されたPDFを検索・表示するための追加DLL という項目が同一サイトにあるのでDLして中のcryptlib.dllファイルを本体と同一フォルダに入れてください。

さて、これで準備が整ったのですが、このままでは使えません。
実際に使う前に、まずxdoc2txt.exeのアイコンにマウスカーソルを持ってきて、右クリックから「ショートカットの作成」を選択してください。
次に作成したショートカットアイコンで、右クリック→プロパティを開き「ショートカット」の項目を選択してください。そこにリンク先(と書かれた項目があるのですが、その〜 xdoc2txt.exeに半角スペースをあけて-fと入力して〜xdoc2txt.exe -fと変更してください。
これで設定はOKです。あとは目的のPDFファイルをドラッグ&ドロップすれば文章がテキストファイルとして抽出できます。

>xdoc2txtは各種文書の構造を直接解析しているため、単独でテキストに変換できます。WORDやAcrobatなど、作成元のアプリケーションをインストールする必要はありません。

サイトでこう紹介してあったので「ファイルが見たいけどソフトが入っていない」という人なんかは使う機会があるかも。
今のところ、私はこのソフトを使う予定はありませんが、何か思いつたらまた紹介します。


banner.png
↑この記事が役に立ったという人は
応援のクリックをお願いします。
トップホーム
posted by ふりふり伝道師 at 01:39 | Comment(0) | TrackBack(0) | PDF関係
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのトラックバック
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。