• twitter
  • facebook
文学・歴史資料のデジタル加工入門

大量置換のためのツール sed を用いて その2【文学・歴史資料のデジタル加工入門11】 (木越 治)

ともあれ、さきに掲げた検索結果のファイルを「kiku.csv」としておけば、

>sortf -t, +0 -1 +7 -8 kiku.csv

とやれば、以下のように、著者の順に並び、同一著者は発表順にソートされたものになっている。
=======================================================================

(略)
かつくらじゅいち,勝倉壽一,「菊花の約」試論─冒頭と結語の意義をめぐって─,解釈,19の9,昭和48年9月,4,1973.09,→『雨月物語構想論』(昭和52年9月、教育出版センター刊)に「第二章 二 冒頭と末尾」として修訂して収録,
かつくらじゅいち,勝倉壽一,「菊花の約」の構想,山形女子短期大学紀要,6,昭和49年3月,17,1974.03,→『雨月物語構想論』(昭和52年9月、教育出版センター刊)に「第二章 一 構想」として修訂して収録,
かつくらじゅいち,勝倉壽一,「菊花の約」末段の構想,解釈,21の7,昭和50年7月,6,1975.07,→『雨月物語構想論』(昭和52年9月、教育出版センター刊)に「第二章 三 末段の構想」として修訂して収録,
(略)
しげともき,重友毅,「菊花の約」の原話,歴史と国文学,5の5,昭和6年11月,10,1931.11,→『近世国文学考説』(昭和8年8月、積文館刊)・『重友毅著作集〈第4巻〉秋成の研究』(昭和46年5月、文理書院刊),
しげともき,重友毅,「菊花の約」と人麿の羇旅歌,国語と国文学,20の2,昭和18年2月,13,1943.02,→『雨月物語の研究』(昭和21年11月、大八洲出版株式会社刊)・『重友毅著作集〈第4巻〉秋成の研究』(昭和46年5月、文理書院刊),
(略)
=======================================================================

これを、「kiku-2.csv」として保存しておく。このデータにおいて、置換が必要なのは、$5 と $8 のフィールドであるが、残念なことに、sed や awk では、特定のフィールドだけを置換の対象にする、という作業はできない。(もしかしたらできるのかもしれないが、私の能力ではたぶん理解不可能なアクロバティックな方法を取ることになると思われる。)

友人に聞いたところ、「それは、perl でやる作業ですよ」と言われてしまった。しかし、perl は知らないし、導入するにしても、それを動かすための環境構築だけで一仕事である。そこで、裏技的になってしまうが、エクセルを利用して、当該フィールドをテキストに取り出し、それを sed で置換し、結果をExcelに貼り付ける、という方法を取ることにする。

すなわち、もとのデータを、次のようにExcelに取り込み、
置換したい巻号のフィールドと西暦年のフィールドのデータとをテキストに取り出し、漢数字に置換してから、再度貼り付けるという作戦である。すなわち、巻号($5)に関しては、
======================================

51
145
86
8の1・2
55

4の4・5・6・7・8・10・11・12
(略)

======================================
というふうに、アラビア数字を「の」でつないだものになっているから、アラビア数字は機械的に漢数字に置換し、「の」も「-」(全角ハイフン)に置換すればよい。
つまり、

y/0123456789の/〇一二三四五六七八九-/

という置換スクリプトを実行するだけである。これを、空行を含めて、そのままExcelに貼り付ければよい。また、西暦年月($8)は、
======================================

1959.06
1989.10B
1980.07B
1988.07
1998.03
1943.01
(略)

======================================
となっているが、月の情報は不要なので、「.」以下を削除してから、同じ置換スクリプトにかければよい。
なお、Excelに貼り付けるときは、上書きせずに、となりに新しい列を挿入し、そこに貼り付け、ちゃんと期待したとおりになっているか確認しつつ作業すべきである。
二つのフィールドを置換して挿入したデータは、次のようである。
これを、csv形式のままで保存し、awkでほしいフィールドを取り出すという手順になる。
前回・前々回にならって、awkスクリプトを作っていこう。
=======================================

BEGIN { FS=”,” ; ORS=”\n” }
{    print $2″「”$3″」””『”$4″』”$6″ “$10″年”
}

=======================================

結果は、

=======================================

池田弥三郎「菊花の約・その他/浅茅が宿・その他」『『日本の幽霊』(中央公論社刊)』 一九五九年
石上敏「『雨月物語』の基層─言葉をめぐる物語としての「菊花の約」─」『『近世文芸史論』(水田潤編、桜楓社刊)』 一九八九年
(略)
勝倉壽一「「菊花の約」試論─冒頭と結語の意義をめぐって─」『解釈』一九-九 一九七三年
勝倉壽一「「菊花の約」の構想」『山形女子短期大学紀要』六 一九七四年
勝倉壽一「「菊花の約」末段の構想」『解釈』二一-七 一九七五年
(略)
木越治「「菊花の約」私案」『国語通信』二六八 一九八四年
(略)
元田與市「「菊花の約」論 宗右衛門─その俗性と聖性」『日本文芸学』二一 一九八四年
元田與市「「菊花の約」の人物像─左門の孤独と悲嘆─」『日本文芸学』二二 一九八五年
元田與市「「菊花の約」考─末段と主題─」『論究日本文学』四九 一九八六年
(略)
渡部千絵「「菊花の約」の主題─信の形象─」『広島女学院大学国語国文誌』一九 一九八九年
=======================================
となる。最初の二件は単行本収録のものなので、『が二重になったりしてみっともないが、これは、もとデータの関係上やむをえないところである。最終的には、点検をかねて自分で訂正してもらうしかない。

 


 

顔写真・木越治アップロード用木越 治(きごし おさむ)

1948年生まれ
1971年 金沢大学文学部国文学科卒業
1975年 東京大学大学院博士後期課程退学。
博士(文学)

金沢大学名誉教授、元上智大学教授

〔主な著作〕
『秋成論』(ペリカン社、1995年)
『秋成文学の生成』(共編、森話社、2008年)
『上田秋成研究事典』(共著、笠間書院、2016年)
『新編浮世草子怪談集』〔江戸怪談文芸名作選〕(校訂代表、国書刊行会、2016年)

『米国議会図書館蔵 日本古典籍目録』(共編、八木書店、2003年)
『講談と評弾―伝統話芸の比較研究―』(八木書店、2010年)