Re:BOM有りに統一すべきだった (#4051823) | 『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない

「『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない」記事へのコメント

記事ページを表示すべてのコメント取得

検索116コメント Log In/Create an Account

BOM有りに統一すべきだった (スコア:0)

by Anonymous Coward

BOMは「ゴミ」であって不要なデータが入ってくるのが無駄だと主張する人がいますが、無駄なのは文字コードの自動判別の方です。
よくある文字コードを自動判定するという動作は、ファイルの内容の一部（1KBとか）、アプリによってはファイルの全部を読んでから文字コードを判定するので非常に負荷が大きいのです。
BOMなら3バイト読むだけで済みます。
そして、Unicodeに対応しているアプリであればBOMは文字コード・エンディアンの判別に使えばいいし、そうでないなら無視すればよろしい。
UTF-8のBOMがあるだけで不具合起こすアプリなんていうのは、今時そっちの方がおかしいので修正すれば
- Re:BOM有りに統一すべきだった (スコア:0)
  
  by Anonymous Coward on 2021年06月16日 9時29分 (#4051823)
  
  テキストファイル＝RAWデータである価値が全く理解できとらんな。
  余計なデータを1ビットでも付加した瞬間にそれはリッチテキストとして扱うべき存在に変貌する。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    これに一票
    （3バイト連続って、検査するの意外と面倒だし）
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    RAWなら互換性も相互運用性も無視でいいね
    使う側が受け取ったデータ解析して適切に扱えよ、で終わる

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない More ログイン

「『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない」記事へのコメント

BOM有りに統一すべきだった (スコア:0)

Re:BOM有りに統一すべきだった (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド