漢数字

漢数字を「一二三四五六七八九十」と並べても何の違和感もない。文字が現わす数値の大きさの順序だ。ところが、Unicodeの順番だと「一七三九二五八六十四」になる。Windowsのファイル名に漢数字を使うと妙な順序になるのはこれかと思って、試しに漢数字だけのファイル名で試してみると、何故か「一九五三四七十二八六」の順序になる。
Windowsのファイルシステム(NTFS)では内部の文字コードにはUnicodeを使っていると聞いているのでこの結果を見ると奇妙だ。Unicodeの符号化方式はいくつもあって複雑なのでそういうこともあるのだろうと長いものにはまかれておくけど、とりあえず順序を期待したい場面で漢数字を使ってはダメだということは意識しておく必要がありそうだ。
Document ID: 87ad4703b0e60af430630f54d2b248cc