アカウント名:
パスワード:
BOMは「ゴミ」であって不要なデータが入ってくるのが無駄だと主張する人がいますが、無駄なのは文字コードの自動判別の方です。
よくある文字コードを自動判定するという動作は、ファイルの内容の一部(1KBとか)、アプリによってはファイルの全部を読んでから文字コードを判定するので非常に負荷が大きいのです。BOMなら3バイト読むだけで済みます。
そして、Unicodeに対応しているアプリであればBOMは文字コード・エンディアンの判別に使えばいいし、そうでないなら無視すればよろしい。
UTF-8のBOMがあるだけで不具合起こすアプリなんていうのは、今時そっちの方がおかしいので修正すれば
テキストファイル=RAWデータである価値が全く理解できとらんな。
余計なデータを1ビットでも付加した瞬間にそれはリッチテキストとして扱うべき存在に変貌する。
これに一票(3バイト連続って、検査するの意外と面倒だし)
RAWなら互換性も相互運用性も無視でいいね使う側が受け取ったデータ解析して適切に扱えよ、で終わる
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike
BOM有りに統一すべきだった (スコア:0)
BOMは「ゴミ」であって不要なデータが入ってくるのが無駄だと主張する人がいますが、無駄なのは文字コードの自動判別の方です。
よくある文字コードを自動判定するという動作は、ファイルの内容の一部(1KBとか)、アプリによってはファイルの全部を読んでから文字コードを判定するので非常に負荷が大きいのです。
BOMなら3バイト読むだけで済みます。
そして、Unicodeに対応しているアプリであればBOMは文字コード・エンディアンの判別に使えばいいし、そうでないなら無視すればよろしい。
UTF-8のBOMがあるだけで不具合起こすアプリなんていうのは、今時そっちの方がおかしいので修正すれば
Re:BOM有りに統一すべきだった (スコア:0)
テキストファイル=RAWデータである価値が全く理解できとらんな。
余計なデータを1ビットでも付加した瞬間にそれはリッチテキストとして扱うべき存在に変貌する。
Re: (スコア:0)
これに一票
(3バイト連続って、検査するの意外と面倒だし)
Re: (スコア:0)
RAWなら互換性も相互運用性も無視でいいね
使う側が受け取ったデータ解析して適切に扱えよ、で終わる