Re:BOM有りに統一すべきだった (#4051366) | 『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない

「『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない」記事へのコメント

記事ページを表示すべてのコメント取得

検索116コメント Log In/Create an Account

BOM有りに統一すべきだった (スコア:0)

by Anonymous Coward

BOMは「ゴミ」であって不要なデータが入ってくるのが無駄だと主張する人がいますが、無駄なのは文字コードの自動判別の方です。
よくある文字コードを自動判定するという動作は、ファイルの内容の一部（1KBとか）、アプリによってはファイルの全部を読んでから文字コードを判定するので非常に負荷が大きいのです。
BOMなら3バイト読むだけで済みます。
そして、Unicodeに対応しているアプリであればBOMは文字コード・エンディアンの判別に使えばいいし、そうでないなら無視すればよろしい。
UTF-8のBOMがあるだけで不具合起こすアプリなんていうのは、今時そっちの方がおかしいので修正すれば
- Re: (スコア:0)
  
  by Anonymous Coward
  
  BOM無しUTF-8の一番の利点は既存のASCIIコードしか想定してないプログラムが修正なしで動く可能性がそこそこ有るという部分なのでBOM付きにしたらUTF-8の意味がない。
  例えば売れた時刻,品名,個数がカンマ区切りで書かれているファイルを処理するプログラムがあるとする。
  ここでファイルがBOM無UTF-8で品名にUTF-8文字が含まれていても、多くの場合プログラムの修正はいらない。でもBOM付だと修正しないと誤動作する。
  - Re:BOM有りに統一すべきだった (スコア:0)
    
    by Anonymous Coward on 2021年06月15日 18時01分 (#4051366)
    
    そのASCII互換というのはUTF-8を普及させる段階では最大のメリットと言えたでしょう。
    しかしUTF-8が一般化した現時点においては、BOMによってUTF-8であると判定できるメリットが、UTF-8非互換のプログラムを誤動作させるデメリットを上回っていると言えるでしょう。
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      3バイトも使うなら、タグでいいんじゃないかって気になるからな。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      なんだかなー
      プログラマー(not プログラム)の都合でASCIIテキストのリソースを全否定して冒頭にBOMを付けさせるのか
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      UTF-8が一般化した前提なら、そもそも判定する必要性自体がレアケースになっちゃいませんかね。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない More ログイン

「『メモ帳』標準のBOMなしUTF-8に、Windows Searchは対応していない」記事へのコメント

BOM有りに統一すべきだった (スコア:0)

Re: (スコア:0)

Re:BOM有りに統一すべきだった (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド