GNU Core Utilities/ptx
ptx
コマンドは、入力テキストから語句のコンコーダンス(索引)を作成するためのコマンドです。GNU coreutils に含まれており、キーワードインデックスの生成やテキストの分析に使用されます。UNIX の標準には含まれていません。
基本的な使い方
編集ptx [オプション] [入力ファイル]
主なオプション(GNU coreutils版)
編集主なオプション オプション 説明 -F 文字列
フレーズの区切り文字を指定(デフォルトは空白) -G 文字列
語句の区切り文字を指定(デフォルトは空白) -M ファイル
無視する単語のリスト(ストップワード)を指定 -O
出力を ASCII コード順に並べ替えず、出現順に保持 -R
単語の並べ替えを逆順にする -W 幅
出力の各行の幅を指定(デフォルトは 72) --help
使用方法を表示
例
編集簡単なコンコーダンスを作成
編集echo "GNU の ptx コマンドはコンコーダンスを作成する" | ptx
入力テキストのコンコーダンスを作成。
ファイルからコンコーダンスを作成
編集ptx document.txt
document.txt
からキーワードインデックスを生成。
無視する単語リストを指定
編集ptx -M stopwords.txt document.txt
stopwords.txt
にリストされた単語を無視して document.txt
のコンコーダンスを作成。
出力を元の順序で保持
編集ptx -O document.txt
語句の出力順を ASCII コード順ではなく、元の順序で保持。
80 文字幅で出力
編集ptx -W 80 document.txt
出力の行幅を 80 文字に設定。
UNIX 版との違い
編集ptx
コマンドは UNIX には含まれておらず、GNU 独自のユーティリティです。そのため、FreeBSD や macOS などの UNIX 系 OS ではデフォルトで利用できません。
GNU 版を UNIX 環境で使う方法
編集ptx
を UNIX 系 OS で使用する場合は、GNU coreutils をインストールする必要があります。
FreeBSD でインストール:
pkg install coreutils gptx file.txt # GNU 版 ptx の使用
macOS(Homebrew)でインストール:
brew install coreutils gptx file.txt # GNU 版 ptx の使用
詳しくは、それぞれの環境で man ptx
または ptx --help
を確認してください。