アカウント名:
パスワード:
結局のところWindowsではUTF-8とその他のMBCSとの識別の為にUTF BOMを用いていたのだと思うのだけど、これが無くなってWindowsのその他のツールは適切に追随してくれるのだろうか。
UTF-8とそれ以外のMBCSの識別をしよう、という程度のプログラムなら、ある程度対応できると思う。というかCP932みたいなのもまだ残ってるわけだし。
BOMがあろうとなかろうとMBCSにマトモに対応してないソフトはどうしようもない。
# WindowsというかMSが開発してるツールは比較的マトモに対応してる方だと思うけどね
考え方は概ね同意なんだけど、「対応」の方向性によっては影響が大きいのが気になる。もともと、テキストのバイナリからそのテキストがShift_JISなのかUTF-8なのかは推定しかできなくて、しかも精度を上げるには内容全体をスキャンしなければならない。その切り分けを先頭のマークだけで行うようにした判断は、「英断」だった。既存でデフォルトとしてきたShift_JISのテキストファイルを正しく開け、UTF-8にはBOMが付くので超最小限のコストで判別できるからだ。
もし今後、テキストの内容によって自動判別をするのがMSのポリシーになるのだとすると、- 1GBの最後の文字だけ日本語文字
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
にわかな奴ほど語りたがる -- あるハッカー
日本語はどうなる? (スコア:0)
結局のところWindowsではUTF-8とその他のMBCSとの識別の為にUTF BOMを用いていたのだと思うのだけど、
これが無くなってWindowsのその他のツールは適切に追随してくれるのだろうか。
Re:日本語はどうなる? (スコア:0)
UTF-8とそれ以外のMBCSの識別をしよう、という程度のプログラムなら、ある程度対応できると思う。というかCP932みたいなのもまだ残ってるわけだし。
BOMがあろうとなかろうとMBCSにマトモに対応してないソフトはどうしようもない。
# WindowsというかMSが開発してるツールは比較的マトモに対応してる方だと思うけどね
Re: (スコア:0)
考え方は概ね同意なんだけど、「対応」の方向性によっては影響が大きいのが気になる。
もともと、テキストのバイナリからそのテキストがShift_JISなのかUTF-8なのかは推定しかできなくて、
しかも精度を上げるには内容全体をスキャンしなければならない。
その切り分けを先頭のマークだけで行うようにした判断は、「英断」だった。
既存でデフォルトとしてきたShift_JISのテキストファイルを正しく開け、UTF-8にはBOMが付くので超最小限のコストで判別できるからだ。
もし今後、テキストの内容によって自動判別をするのがMSのポリシーになるのだとすると、
- 1GBの最後の文字だけ日本語文字