• twitter
  • facebook
文学・歴史資料のデジタル加工入門

awkの使い方【文学・歴史資料のデジタル加工入門8】 (木越 治)

前回の日記ファイルを作成する作業では、エクセルにGoogle Calendarのデータを取りこみ(この作業はオンラインサービスを利用)、そのあと、エディターを使ってバッチファイルを作成して、日記ファイルを作り上げるという手順を踏んだ。

今回は、カレンダーのデータから日記ファイルを作る段階で、awkを使うことにする。これを使うと、よりスマートで、もう少し融通のきく作業結果を得ることができ、このときに作成したファイル(スクリプトと呼ばれる)は、以後同様の作業をするときに流用できるので、汎用性があるという利点がある。

●awkとは?

awkというのは、もともとはUNIXにある、テキストファイルを扱うためのツールである。

インターネットを調べると、awkの正規のマニュアルの日本語訳や、コンピュータの授業用に書かれたとおぼしいawk用のマニュアル類がいくつもみつかる。しかし、理系の先生やプログラマの書いたこれらのマニュアル類は、我々文系人間には、とにかくわかりにくい。

awkはあるパターンに対して命令を実行し出力するプログラム言語である。

などと言われても、使ったことのない人には、だからなんなんだ、ということになるだろう。
私ならば、

csvファイルを読み込んで、いろいろな形式に変換して利用するときにとても便利なツールである。

という説明だけですますだろう。csv形式のファイルを変換する以外に利用したことはないし、それだけで充分に便利だからである。組み込み関数をどう使うか、というようなことは、その方面にくわしい人にまかせておけばよい。

何度も書いているが、自分のわかる範囲にあるツールをやりくりして使い、目的の作業がやれればそれで充分なのである。