都筑サイバーラボ

cyber technologies matter

  • フォントサイズを大きくする
  • デフォルトフォントサイズ
  • フォントサイズを小さく

テキストファイルの文字セットを判定するツール Utrac の導入とテスト

Eメール 印刷 PDF

Linux OSやCMSのプログラムの導入やテストを行っているときに、よく文字化けに直面することがあります。

そんなときに、そのファイルがどんな文字セットでできているのか知りたいですが簡単にはわからず、試行錯誤を繰り返すようなことがおおいです。

それで、たまたま見つけたUtracというコマンドラインからファイル名を指定すれば文字セットを判定してくれるツールをためしてみて、うまくうごきましたのでご紹介します。

まず、以下のサイトからプログラムをダウンロードします。

http://utrac.sourceforge.net/

これを解凍します。

私はWindowsでダウンロードをしたので解凍レンジで解凍しました。

これをUbuntuのデスクトップに解凍後のフォルダー全体をコピーしました。

そのあとのログは以下に添付します。

操作はUbuntu Desktopの端末から行います。

まず、utracのフォルダーがデスクトップ/utrac-0.3.0/utrac-0.3.0 の構造になっているのでCDを入力し/home/デスクトップ/utrac-0.3.0/utrac-0.3.0に切り替えます。

その後、管理者モードでmakeとmake installを実行します。

ubuntuの場合、sudoをコマンドの頭につけてmakeとmake installを実行します。

これだけで導入は完了します。

あとは実行ですが、導入したディレクトリーにテキストファイルを保存するか、テキストファイルの場所と名前を指定してutracコマンドを実行します。

コマンドの形式は以下のとおりです。

utrac -p ファイル名   文字セットを出力します。

utrac -i ファイル名    文字セットとファイル情報を出力します。

 

 

 

(参考ログファイル)

 

xxxx@xxxx-desktop:~$ cd デスクトップ

xxxx@xxxx-desktop:~/デスクトップ$ ls -al

drwxr-xr-x  3 xxxx xxxx  4096 2010-10-03 12:53 .

drwxr-xr-x 42 xxxx xxxx  4096 2010-10-03 12:49 ..

drwx------  3 xxxx xxxx  4096 2010-10-03 12:09 utrac-0.3.0

xxxx@xxxx-desktop:~/デスクトップ$ cd utrac-0.3.0

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0$ ls

utrac-0.3.0

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0$ cd utrac-0.3.0

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ make

gcc -c -Wall -O2 -DUT_DEBUG=1 utrac.c -o utrac.o

gcc -w -Wno-multichar -c -Wall -O2 -DUT_DEBUG=1 -DUT_CHARMAPS_FILENAME='"/usr/local/share/utrac/charsets.dat"' ut_charset.c -o ut_charset.o

gcc -c -Wall -O2 -DUT_DEBUG=1 ut_utils.c -o ut_utils.o

gcc -c -Wall -O2 -DUT_DEBUG=1 ut_loading.c -o ut_loading.o

gcc -c -Wall -O2 -DUT_DEBUG=1 ut_recognition1.c -o ut_recognition1.o

gcc -c -Wall -O2 -DUT_DEBUG=1 ut_recognition2.c -o ut_recognition2.o

gcc -c -Wall -O2 -DUT_DEBUG=1 ut_conversion.c -o ut_conversion.o

ln -sf ut_messages_en.c ut_messages.c

gcc -c -Wall -O2 -DUT_DEBUG=1 ut_messages.c -o ut_messages.o

ar rus libutrac.a utrac.o ut_charset.o ut_utils.o ut_loading.o ut_recognition1.o ut_recognition2.o ut_conversion.o ut_messages.o

ar: creating libutrac.a

gcc -c -Wall -O2 -DUT_DEBUG=1 utrac_cmd.c -o utrac_cmd.o

gcc utrac_cmd.o libutrac.a -lm -o utrac

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ su

パスワード: 

su: 認証失敗

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ sudo make install

[sudo] password for xxxx: 

strip ./utrac

mkdir -p /usr/local/bin

cp ./utrac /usr/local/bin

mkdir -p /usr/local/share/utrac

cp -f charsets.dat /usr/local/share/utrac

cp -f utrac.1 /usr/local/man/man1

 

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ utrac -p setup.log

ASCII

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ utrac -i setup.log

Filename: setup.log

Charset (sure): ASCII

EOL: CRLF (134 lines)

Size: 9921

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ utrac -i readme.txt

Filename: readme.txt

Charset (sure): UTF-8

EOL: LF (40 lines)

Size: 1988

xxxx@xxxx-desktop:~/デスクトップ/utrac-0.3.0/utrac-0.3.0$ 

最終更新 2010年 12月 24日(金曜日) 13:21  

サイト内検索

カスタム検索

広告

広告

広告3

広告

広告

ANL


広告