• twitter
  • facebook
文学・歴史資料のデジタル加工入門

MS-DOSでできること・その1「コマンドを使ってみる」 【文学・歴史資料のデジタル加工入門3】 (木越 治)

●iOS、MacでWindowsのテキストを扱う

iPad を使い始めたとき、なによりも困惑したのは、Windows マシンで作ってあったテキストファイルをiPad が全く読み取ってくれなかったことであった。すべて文字化けしてしまうので、当初はやむなくすべて PDF ファイルに変換していたのである。この件に関しては1冊だけ買った iPad のマニュアル本にも全く解説がなかった

*これに限らず、世間に出回っているパソコン関係の解説本、特に入門用のものはほぼ役に立たないと考えてよい。マニュアル以上のことは書いてないし、執筆者達もたいして使い込まないまま書いているからである。そういう無駄なものに投資するより、自分でいろいろさわり、いじってみて、もし近くに詳しい人がいるならその人に聞くのが一番である。もしいなければ、ネットでわからないことを検索すればよい。Mac マシンに関しては、私ははじめて使うときからすべてこの方法ですませている。もっとも、両者ともまだ使いこなせたという段階には達していないが、それは、iPad も Mac マシンもサブマシンとしてしか使っておらず、Windows マシンのようにさまざまのソフトをインストールしたり、時には、初期状態にもどして最初から設定し直すなどのようなことをあまりしていないからである。この種のマシンは、いじっている時間と上達度は相関関係にあると考えてまちがいない。

その後、なにかの折りに、iOS 系( iPad 等の OS)やUNIX(Mac はOS X以降 BSD UNIX をベースにしている)では UTF-8 が基本の文字コードであり、テキストファイルをそちらに変換しておくと問題なく読んでくれることがわかった。以来、Windows でも UTF-8 をデフォルトに設定しているし、以前からあるテキストファイルも、頻繁に使うものは UTF-8 に変換してしまっている。秀丸では、「ファイルタイプ別の設定→その他→保存・読み込み」で、ユニコード(UTF-8)を指定すれば、つねに UTF-8 で保存されるようになる。なお、複数のテキストファイルのコードを変換するには、「Text Code Converter」をはじめいろいろなフリーソフトが提供されているのでそれらを利用するべきである。

このUTF-8の設定にしておくと、「シフトJIS」で表示できなかった漢字(第三水準・第四水準)も問題なく表示できるようになる。下記に第三・第四水準漢字の一部を掲出しておくので、自分の使っているエディターにコピーし、保存したときに問題が生じないか試してみれば、自分のエディターの文字コード設定がどうなっているかわかるはずである。

=======================================================

(第三水準漢字の一部)

俱 𠀋 㐂 丨 丯 丰 亍 仡 份
仿 伃 伋 你 佈 佉 佖 佟 佪 佬
佾 侊 侔 侗 侮 俉 俠 倁 倂 倎
倘 倧 倮 偀 倻 偁 傔 僌 僲 僐
僦 僧 儆 儃 儋 儞 儵 兊 免 兕
兗 㒵 冝 凃 凊 凞 凢 凮 刁 㓛
刓 刕 剉 剗 剡 劓 勈 勉 勌 勐
勖 勛 勤 勰 勻 匀 匇 匜 卑 卡
卣 卽 厓 厝 厲 吒 吧 呍 咜 呫
呴 呿 咈 咖 咡

(第四水準漢字の一部)

𠂉 丂 丏 丒 丩 丫 丮 乀 乇 么 𠂢 乑 㐆 𠂤 乚
乩 亝 㐬 㐮 亹 亻 𠆢 亼 仃 仈 仐 仫 仚 仱 仵 伀
伖 佤 伷 伾 佔 佘 𠈓 佷 佸 佺 佽 侂 侅 侒 侚 俦
侲 侾 俅 俋 俏 俒 㑪 俲 倀 倐 倓 倜 倞 倢 㑨 偂
偆 偎 偓 偗 偣 偦 偪 偰 傣 傈 傒 傓 傕 傖 傜 傪
𠌫 傱 傺 傻 僄 僇 僳 𠎁 僎 𠍱 僔 僙 僡 僩 㒒

=======================================================

また、以下は、マーラーの交響曲第一番第一楽章の CD の原語表記で、iTunes ではしょっちゅうお目にかかる表示である。

Mahler: Sinfonie #1 D-Dur – 1. Langsam. Schleppend. Wie Ein Naturlaut. Später: Im Anfang Sehr Gemächlich Libor Pešek: Ceský Národní Symfonický Orchestr

クラシック音楽では、英語よりもドイツ語・イタリア語の方が優勢であり、上記の曲名はドイツ語、指揮者(リボール・ペシェク)及び演奏団体(チェコ国立交響楽団)はチェコ語の表記である。こういうのも UTF-8 の設定であれば問題なく表示してくれる。

ただ、ソフトウェアによっては、「シフトJIS」以外は受け付けない仕様になっているものも少なからず存在する

*音楽ファイルの編集に利用している「SuperTagEditor 改造版」などがその典型で、使い勝手はとてもいいのだが、上記のようなファイルに対しては、読み込めないと文句を言われる。なので、クラシック関係は、やむなく「Mp3tag」の方に読み込むようにしている。