• twitter
  • facebook
文学・歴史資料のデジタル加工入門

MS-DOSでできること・その1「コマンドを使ってみる」 【文学・歴史資料のデジタル加工入門3】 (木越 治)

●文字コードの問題

ところで、注意すべきなのは、こうして「リダイレクト」してできるテキストファイルの文字コードは、MS-DOS の場合「シフトJIS」に決まっているという点である。

ただし、Windows マシンだけを使っている人は、エディターを利用している人であっても、文字コードがなにかということに関しては、あまり関心がないかもしれない。

実際、一太郎や Word で文書を作成したあと、そのファイルをテキスト形式で保存しようとすると、「シフトJIS」であることが多い

*厳密に言うと、一太郎は「シフトJIS」でしか保存できないが、Word の場合は、Windows 標準としては「シフトJIS」の設定になっているが、その他の文字コードでの保存も可能である。ただし、実際の作業としては、画面そのものをコピーしてエディターに貼り付ける方が問題は少ない。

また、csv ファイルを Excel で読み込む場合も、「シフトJIS」のファイルなら文字化けせずに読み込むが、「UTF-8」(Unicodeファイルはだいたいこの設定でよい)だと化けてしまう。Excel には、エディターのように文字コードを変換する方法がないので、この場合は、「シフトJIS」に変換してから読み込むか、第1回の時に書いたように、テキストファイルを Excel に読み込む方法を実行するしかない(ただし、この場合は、拡張子を csv ではなく txt にしておく方が問題は起きない)。

こういうのをみると、Windows のテキストファイルは、「シフトJIS」が基本とされているようで、Windows マシンだけを使っている分には問題はない。が、私は、数年前からiPadやMacマシンを併用するようになっていて、こういう設定でははなはだしく不都合が生じることがわかってきたのである。