• twitter
  • facebook
文学・歴史資料のデジタル加工入門

大量置換のためのツール sed を用いて その1【文学・歴史資料のデジタル加工入門10】 (木越 治)

●ちょっとだけ「青空文庫」について

青空文庫は、ご承知のように、「いろいろな人が書き表したさまざまな作品を、コンピューターで扱えるファイルの形に整え、インターネットを通して読めるように」(青空文庫のサイトより)しようという無償のプロジェクトである。理念的には、FSFあるいはGNUというプロジェクト*の影響を受けており、現在では専用のビュワーなども備わっていて、これを利用すると、縦書き・ルビ付きになり、とても読みやすい。PCよりも、タブレット端末等を利用して本を読むときにとてもよい形式である。若い人に古典をひろめていくにあたっては、かならず視野に収めておくべきサイトである。
*おおざっぱにいってしまえば、ソフトウェアを無償で提供しあおう、という運動である。この連載で取り上げてきている grep sed awk などのツールは、こういう運動のなかで、UNIXのツールをMS-DOS用に移植したものであった。

ところが、現在、このサイトで公開されている作品をみると、大部分が近代の作品である。古典文学作品では、角川文庫本の『古事記』がみつかる程度である。

もちろん、古典文学関係のテキストは、インターネットを丹念に探せば、かなり見つけることが可能である。「日本文学InternetGuide」(http://soamano.wixsite.com/nihonbungaku、作成者は天野聡一氏)等はその種のデータの所在情報をかなりくわしく収集している。

私はかなり以前から、これらのデータを利用して、『伊勢物語』『源氏物語』『古今集』というようなメジャーな作品(いま考えているのは、旧版日本古典文学大系第一期に収録されているような作品群である)を、青空文庫形式に統一し、専用ビュワーでひろく利用できるようにしたらいいのではないかと考えている。そうすれば、古典文学を読む学生が、いまより少し増えるのではないかと思っているからである。

ご承知のように、いま日本の大学の国文科・日本文学科は悲惨な状況にある。それを救うための、私なりの提言である。
ただ、ここに、ある程度の分量の古典文学作品を登録していくための作業を行うには、一人では無理である。たくさんのボランティアの強力が必要である。

さらにまた、青空文庫ビュアーで古典文学読むとき、どのような本文であるのが望ましいか、についても慎重な検討が必要である。写本や版本をそのまま翻字すればいいというものではないということはすぐにわかるだろうが、では、青空文庫に登録されている近代文学作品の例にならって、著作権の切れた古い翻字本文をそのまま登録していけばいいか、というと、それはも考慮を要する。校訂(用字や翻字態度)に問題があり、若い学生の利用にむいていないと思われるからである。

私の考えでは、古典本文は、高校の教科書に載っているように、たとえば、近世版本に頻出する「此」「是」「也」「有」「成」などの漢字などは、みな仮名に開き、漢字・仮名についても、現代文の感覚にあうように大幅に校訂するがいいのではないかと思っている。ただし、平凡社東洋文庫のように現代仮名遣いにはしない─古典本文が現代仮名遣いになっているのには非常な違和感があるので─というような方針を考えているのだが、細部に関しては、なお詰めていく必要があるだろう。

青空文庫の担当とは、古典文学の専門家(←私のことです)が独自に校訂した本文(特定の書物に基づかない、という意味)として登録することが可能かどうかについて、すでに検討してもらってあり、「問題なし」という返事をいただいている。ただ、こちらの作業が進まないので、まだ一作品も登録できずにいる状態である。

どなたか、このプロジェクトに協力してやろうという奇特な方があらわれないものであろうか?

 


 

本コラムで説明した内容は、以下のプログラムファイル、およびスクリプトを使うことで、実際にお試しいただけます。ぜひご活用ください。

1)プログラム (gawk.exe/grep.exe/join.exe/sed.exe/SORTF.EXE)

こちらからダウンロードしてください

2)スクリプトファイル (akinari.csv/q2shin.sed)

こちらからダウンロードしてください


 

顔写真・木越治アップロード用木越 治(きごし おさむ)

1948年生まれ
1971年 金沢大学文学部国文学科卒業
1975年 東京大学大学院博士後期課程退学。
博士(文学)

金沢大学名誉教授、元上智大学教授

〔主な著作〕
『秋成論』(ペリカン社、1995年)
『秋成文学の生成』(共編、森話社、2008年)
『上田秋成研究事典』(共著、笠間書院、2016年)
『新編浮世草子怪談集』〔江戸怪談文芸名作選〕(校訂代表、国書刊行会、2016年)

『米国議会図書館蔵 日本古典籍目録』(共編、八木書店、2003年)
『講談と評弾―伝統話芸の比較研究―』(八木書店、2010年)