Codepage932

このブログは何度かシステムを変更している。現在の形にするときにはログ自体の文字コードUTF-8に変更する必要があった。その変換にはiconvを使ったが、いくつかの文字は化けた。波ダッシュやローマ数字等だ。化けた箇所が機種依存文字であることには気づいていたが、そのときは深く考えずに手作業で修正した。
慣例的に機種依存文字とは呼ばれているものの、普通の日本語Windows環境では問題なく使える。Windowsではsjisの拡張としてCodepage932という文字コードセットが用意されていてこのセットの中に含まれているからだ。で、iconvでは変換元文字コードにCP932を使えば機種依存文字も含めて正確に変換できる。
このことは雑誌「UnixUser」の2005年4月号で知った。Unixを全然使わない私だが、それでも役立つ雑誌だと思う。