アカウント名:
パスワード:
結局のところWindowsではUTF-8とその他のMBCSとの識別の為にUTF BOMを用いていたのだと思うのだけど、これが無くなってWindowsのその他のツールは適切に追随してくれるのだろうか。
UTF-8とそれ以外のMBCSの識別をしよう、という程度のプログラムなら、ある程度対応できると思う。というかCP932みたいなのもまだ残ってるわけだし。
BOMがあろうとなかろうとMBCSにマトモに対応してないソフトはどうしようもない。
# WindowsというかMSが開発してるツールは比較的マトモに対応してる方だと思うけどね
考え方は概ね同意なんだけど、「対応」の方向性によっては影響が大きいのが気になる。もともと、テキストのバイナリからそのテキストがShift_JISなのかUTF-8なのかは推定しかできなくて、しかも精度を上げるには内容全体をスキャンしなければならない。その切り分けを先頭のマークだけで行うようにした判断は、「英断」だった。既存でデフォルトとしてきたShift_JISのテキストファイルを正しく開け、UTF-8にはBOMが付くので超最小限のコストで判別できるからだ。
もし今後、テキストの内容によって自動判別をするのがMSのポリシーになるのだとすると、- 1GBの最後の文字だけ日本語文字が使われているテキストを判別するため、テキスト全てを読まなければならないか- 保存されたテキストが文字化けなく読み込めるかどうかは状況依存のどちらかになる。
ある種象徴的なのがPowerShellのGet-Contentで、これは現状エンコード指定なしでBOM無しUTF-8を読むことができない。これを、メモ帳でBOM無しUTF-8保存されたテキストを開けるようにしろと言われると、厄介な事になる。
おそらく最終段階の正解は、「デフォルトでは内容に関わらずUTF-8として開く」なのだろうが、これを今採用すると、今までデフォルトでShift_JISテキストが開けることを期待していたシステムが死ぬことになる。# ここで哀れなのは、「文字化けはこまる」「UTF-8 BOMは美しくない」という理由でShift_JISに流れていた人達だ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell
日本語はどうなる? (スコア:0)
結局のところWindowsではUTF-8とその他のMBCSとの識別の為にUTF BOMを用いていたのだと思うのだけど、
これが無くなってWindowsのその他のツールは適切に追随してくれるのだろうか。
Re: (スコア:0)
UTF-8とそれ以外のMBCSの識別をしよう、という程度のプログラムなら、ある程度対応できると思う。というかCP932みたいなのもまだ残ってるわけだし。
BOMがあろうとなかろうとMBCSにマトモに対応してないソフトはどうしようもない。
# WindowsというかMSが開発してるツールは比較的マトモに対応してる方だと思うけどね
Re:日本語はどうなる? (スコア:0)
考え方は概ね同意なんだけど、「対応」の方向性によっては影響が大きいのが気になる。
もともと、テキストのバイナリからそのテキストがShift_JISなのかUTF-8なのかは推定しかできなくて、
しかも精度を上げるには内容全体をスキャンしなければならない。
その切り分けを先頭のマークだけで行うようにした判断は、「英断」だった。
既存でデフォルトとしてきたShift_JISのテキストファイルを正しく開け、UTF-8にはBOMが付くので超最小限のコストで判別できるからだ。
もし今後、テキストの内容によって自動判別をするのがMSのポリシーになるのだとすると、
- 1GBの最後の文字だけ日本語文字が使われているテキストを判別するため、テキスト全てを読まなければならない
か
- 保存されたテキストが文字化けなく読み込めるかどうかは状況依存
のどちらかになる。
ある種象徴的なのがPowerShellのGet-Contentで、これは現状エンコード指定なしでBOM無しUTF-8を読むことができない。
これを、メモ帳でBOM無しUTF-8保存されたテキストを開けるようにしろと言われると、厄介な事になる。
おそらく最終段階の正解は、「デフォルトでは内容に関わらずUTF-8として開く」なのだろうが、
これを今採用すると、今までデフォルトでShift_JISテキストが開けることを期待していたシステムが死ぬことになる。
# ここで哀れなのは、「文字化けはこまる」「UTF-8 BOMは美しくない」という理由でShift_JISに流れていた人達だ