• twitter
  • facebook
文学・歴史資料のデジタル加工入門

awkの使い方【文学・歴史資料のデジタル加工入門8】 (木越 治)

●awkをダウンロードする

MS-DOS全盛の時代には、UNIX上で動くこまごましたツールを MS-DOS で使えるように移植したものがたくさん出回っていた。UNIXは基本的にオープンソース(=改変自由なフリーソフトで、ソースコードが公開されていた)であったため、自由に移植ができたからである。テキスト検索用の代表的なツールである「grep」にはいくつかのバージョンが出回っていたし、また、その改良版である、「cgrep」「Ygrep」 などというスグレモノもあった。MS-DOS標準のツールではできない作業を、これらのツールを組み合わせることで可能にしていたのである。このうち、

1.テキストファイル検索用ツールとしての  grep
2.テキストファイルの大量の置換に威力を発揮する sed
3.テキストデータの整形に威力を発揮する awk

の三種は、いろいろな工夫が可能だったので、仲間と情報を交換しあいながらよく利用したものである。

Windows95以後、これらのツールの一部は、Windowsに対応するよう改訂され、それなりに使われていたようだが、ハードウェア環境の劇的な変化とMS-DOS利用者の相対的な減少等の理由により、2000年以降はほとんどみかけなくなった。だから、いま、Windows 10のコマンドラインでawkを走らせようとしたら、このOSに対応しているawkプログラムをみつけることが第一の作業になる。

私の手元には、Windows XPの時代まで利用していたMS-DOS用のツールがいくつも保存してあるが、今回試してみたところ、その半分以上が動作しなかった。たいていは、

image002

というように文句を言われる。(上記の画面は、Windows XPでときどき使っていたawkの一種「jgawk」をWindows 10のコマンドラインで走らせようとしたところである)

ただ、幸いなことに、Vector のWindowsMe/98/95用ソフト/ユーティリティ/テキストファイル用/awk にある

 gawk-mbcs-win32-20051223

というのが、Windows 10のコマンドラインで動いてくれる。これはとてもありがたいことである。
この場を借りて、移植された方に心からお礼を申し上げます。

このファイルをダウンロードして解凍すると、

===========================================
2017/01/15  08:02    <DIR>          awklib
2005/07/27  03:46           250,784 ChangeLog
2003/03/06  18:11            17,992 COPYING
2005/12/23  00:24           446,464 gawk.exe
2005/02/14  11:23            53,248 igawk.exe
2005/12/23  00:25           281,631 mbc-diff
2005/07/27  03:32            79,660 NEWS
2005/12/22  23:00             7,030 readme.ja
===========================================

というふうにいろいろなファイルが出て来る。が、必要なのは、「gawk.exe」だけである。あとは、ソースコードやドキュメントの類だから、とりあえず、このファイルだけを、作業する場所(フォルダ)に移動しておけばよい*

*なお、同じVector のWindows10等ソフト/ユーティリティ/テキストファイル用/awk にある「awk支援」というのもWindows 10で動くawkの一種であるが、MS-DOS画面ではなく、Windows 上で利用するように改良してあるので、くわしい説明は省く。awkの使い方を知っていて、いちいちMS-DOS画面におりるのがめんどうという人には便利かもしれない。