Re:文字コード間変換 (#1125824) | 文字エンコーディングはUTF8で本当に十分なのか？

「文字エンコーディングはUTF8で本当に十分なのか？」記事へのコメント

記事ページを表示すべてのコメント取得

検索227コメント Log In/Create an Account

文字コード間変換 (スコア:0)

by Anonymous Coward

作り手が意識することなく扱えれば、それでいいんです。。。
「～」の文字化け問題とかめんどくさー(;´Д`)
- Re:文字コード間変換 (スコア:2, 興味深い)
  
  by Anonymous Coward
  
  文字化けはUTF-8をShift_JIS中継して下手に表示しようとするから起きるんでしょ。
  UTF-8しか無ければ問題ない。
  - Re:文字コード間変換 (スコア:0)
    
    by Anonymous Coward
    
    UTF-8しか無ければ問題ない。
    
    Unicode 信者って必ずそういうけど、なんで?
    過去のデータはすべて捨てろってこと?
    - Re:文字コード間変換 (スコア:0)
      
      by Anonymous Coward
      
      シフトJIS(Shift_JISやWindows-31J)、ISO-2022-JPやCP50220からUTF-8に変換してそれをUnicode対応のフォントで表示すればどっちに割り当てられようが両方表示されるから何の問題もない。
      UTF-8をShift_JISに変換すりゃ、ない文字は見えなくなるわな。
      いつまで日本の隅っこでシフトJISなんかつついてなきゃならんのだ。
      
      メールもUTF-8でうだうだ言ってくる人はいつまで古いソフト使ってるのかね。セキュリティ大丈夫? とか、Webで半角カナは使わないでくださいっていつの時代の文字コード判定だとか思うわけだ。コード判定がやりにくくなるというより、とりあえずまじないぐらいに思ってるんでしょな。
      いちいち全角半角指定してないで、それぐらいサーバ側で変換かけろ、とか、言いたいことは山のよう。
      - Re:文字コード間変換 (スコア:0)
        
        by Anonymous Coward
        
        > Webで半角カナは使わないでくださいっていつの時代の文字コード判定だとか思うわけだ。
        
        は? いわゆる半角カナを使うべきでないというのは、文字コード判別とはまったく別の理由ですが。
        いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
        
        Re:文字コード間変換 (スコア:1)
        
        by herewe (21291)
        
        > は? いわゆる半角カナを使うべきでないというのは、文字コード判別とはまったく別の理由ですが。
        > いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
        「全角アルファベットを使うべきでない」は初めて聞きました。
        どのあたりの規格か知りたいです。
        #気分の問題じゃなかったんだ…
        
        「半角カナを使うな」は、単純に文字コードの制限だったと思うんですが。
        　8ビット目を使わないほうがいい(正しく処理できないサーバやクライアントが多かったから) → 7ビットで表現するISO-2022-JPを用意 → ISO-2022-JPには半角カナが定義されていない → 半角カナを使うな
        
        Re:文字コード間変換 (スコア:1)
        
        by kanie (911)
        
        「全角アルファベットを使うべきでない」は初めて聞きました。
        どのあたりの規格か知りたいです。
        
        少なくともUnicode Standard、JIS X 0202、JIS X 0208、JIS X 0213には、そのへんの変な文字は使うなと明記されています。
        
        Re:文字コード間変換 (スコア:1)
        
        by herewe (21291)
        
        JIS X 02～の仕様では互換性以外では「使用できない」ですよね。
        「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか？
        なんというか、MUST NOT(例外条件ありなのはMUST NOTにならないのかな?)ではなく、SHOULD NOTにあたる文言というか…
        
        因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?
        
        #探し方がへたなだけかなぁ
        
        Re:文字コード間変換 (スコア:1)
        
        by kanie (911)
        
        「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか？
        本当にちゃんと探しましたか?
        6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。
        と書いてありますが。
        因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?
        Unicode StandardといえばUnicode Standard
        
        Re:文字コード間変換 (スコア:0)
        
        by Anonymous Coward
        
        そんなピンポイントで引用されると制限の真意がつかみかねると思うので、もうちょい先まで引用したものを。
        
        JIS X 0208
        7.2 ISO/IEC 646の国際基準版(IRV)と同時に用いる場合の符号
        6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。ただし、これまでの慣用的な利用との互換性を目的としてだけ、付随書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい。
        この「異なった図形文字として用いてもよい」という表現は、ISO/IEC 2022の翻訳規格であるJIS X 0202の下記の部分を受け
        
        Re:文字コード間変換 (スコア:1)
        
        by kanie (911)
        
        要はJIS X 0208の方のラテン文字が変な文字だから使用禁止という訳ではなく、同じ文字が異なる符号で存在するので、どっちかに統一しましょうということが示されていたわけです。
        違いますよ。原因と結果が逆です。
        そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。
        ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。
        そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。
        なのでもう「全角〜」「半角
        
        Re:文字コード間変換 (スコア:0)
        
        by Anonymous Coward on 2007年03月14日 11時04分 (#1125824)
        
        そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。
        ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。
        そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。
        
        両者は同じ文字であるといいつつ、わざわざJIS X 0208/0213の方の文字を「そういう変な文字」と、あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。規格内には「そういう変な文字」もしくはそれに類する表現は無いにも関わらずです。
        
        なのでもう「全角〜」「半角〜」って呼び名はどうよと悩む意味は無さそうな感じです。
        
        そもそも使うべきではないのだから、そういう呼び名がでることは普通ありませんよね。
        
        使うべきではないですが、話に出してもダメというわけではないので、たとえば今やっている話みたいな両者の文字をあえて区別して扱わなければならない場合には、そういう呼び名を出すことに問題は無いですよね。
        
        シェア
        
        親コメント
        
        Re:文字コード間変換 (スコア:1)
        
        by kanie (911) on 2007年03月14日 11時29分 (#1125836)
        
        あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。
        
        別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。
        
        たとえば今やっている話みたいな両者の文字をあえて区別して扱わなければならない場合には、そういう呼び名を出すことに問題は無いですよね。
        
        だめですね。あなたはまだレイヤーが混ざっています。
        『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ文字が複数のコードポイントにあらわれる場合』があります。後者では半角・全角は不適です。
        
        シェア
        
        親コメント
        
        Re:文字コード間変換 (スコア:0)
        
        by Anonymous Coward
        
        別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。
        同じ文字なのだから異なる扱いをしてはいけないのにエセ技術者が——という話だったような気がしますが、それはともかくとして。両者は同じ文字であるのでどちらが変な文字という分けでもないですし、一方の文字を用いてはならない理由もJIS X 0208/0213の方が変だからという訳でもありません。そのことを知っていて何故わざわざ「変な文字」と称するのでしょう?
        『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ
        
        Re:文字コード間変換 (スコア:1)
        
        by kanie (911) on 2007年03月16日 13時27分 (#1127034)
        
        それらは分けて扱うことはできません。
        
        まったく別物ですよ。混同しているのでは?
        後者は『両者を異なった文字として用い』ない場合です。
        
        シェア
        
        親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

文字エンコーディングはUTF8で本当に十分なのか？ More ログイン

「文字エンコーディングはUTF8で本当に十分なのか？」記事へのコメント

文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:2, 興味深い)

Re:文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:1)

Re:文字コード間変換 (スコア:1)

Re:文字コード間変換 (スコア:1)

Re:文字コード間変換 (スコア:1)

Re:文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:1)

Re:文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:1)

Re:文字コード間変換 (スコア:0)

Re:文字コード間変換 (スコア:1)

スラド