awkの使い方【文学・歴史資料のデジタル加工入門8】 (木越 治)
前回の日記ファイルを作成する作業では、エクセルにGoogle Calendarのデータを取りこみ(この作業はオンラインサービスを利用)、そのあと、エディターを使ってバッチファイルを作成して、日記ファイルを作り上げるという手順を踏んだ。
今回は、カレンダーのデータから日記ファイルを作る段階で、awkを使うことにする。これを使うと、よりスマートで、もう少し融通のきく作業結果を得ることができ、このときに作成したファイル(スクリプトと呼ばれる)は、以後同様の作業をするときに流用できるので、汎用性があるという利点がある。
●awkとは?
awkというのは、もともとはUNIXにある、テキストファイルを扱うためのツールである。
インターネットを調べると、awkの正規のマニュアルの日本語訳や、コンピュータの授業用に書かれたとおぼしいawk用のマニュアル類がいくつもみつかる。しかし、理系の先生やプログラマの書いたこれらのマニュアル類は、我々文系人間には、とにかくわかりにくい。
awkはあるパターンに対して命令を実行し出力するプログラム言語である。
などと言われても、使ったことのない人には、だからなんなんだ、ということになるだろう。
私ならば、
csvファイルを読み込んで、いろいろな形式に変換して利用するときにとても便利なツールである。
という説明だけですますだろう。csv形式のファイルを変換する以外に利用したことはないし、それだけで充分に便利だからである。組み込み関数をどう使うか、というようなことは、その方面にくわしい人にまかせておけばよい。
何度も書いているが、自分のわかる範囲にあるツールをやりくりして使い、目的の作業がやれればそれで充分なのである。