by
Anonymous Coward
on 2007年03月16日 3時26分
(#1126826)
別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。
同じ文字なのだから異なる扱いをしてはいけないのにエセ技術者が——という話だったような気がしますが、それはともかくとして。両者は同じ文字であるのでどちらが変な文字という分けでもないですし、一方の文字を用いてはならない理由もJIS X 0208/0213の方が変だからという訳でもありません。そのことを知っていて何故わざわざ「変な文字」と称するのでしょう?
違います。それらは分けて扱うことはできません。ISO/IEC 646(またはJIS X 0201)とJIS X 0208(またはJIS X 0213)を同時に用いることで同じ文字が複数の符号で表される場合、慣用的な利用との互換性を目的としてだけ両者を異なった文字として用いることができるわけですが、その場合にX 0208(またはJIS X 0213)の方の文字に別の文字としての代替名称が与えられるのです。
文字コード間変換 (スコア:0)
「~」の文字化け問題とかめんどくさー(;´Д`)
Re:文字コード間変換 (スコア:2, 興味深い)
UTF-8しか無ければ問題ない。
Re:文字コード間変換 (スコア:0)
過去のデータはすべて捨てろってこと?
Re:文字コード間変換 (スコア:0)
UTF-8をShift_JISに変換すりゃ、ない文字は見えなくなるわな。
いつまで日本の隅っこでシフトJISなんかつついてなきゃならんのだ。
メールもUTF-8でうだうだ言ってくる人はいつまで古いソフト使ってるのかね。セキュリティ大丈夫? とか、Webで半角カナは使わないでくださいっていつの時代の文字コード判定だとか思うわけだ。コード判定がやりにくくなるというより、とりあえずまじないぐらいに思ってるんでしょな。
いちいち全角半角指定してないで、それぐらいサーバ側で変換かけろ、とか、言いたいことは山のよう。
Re:文字コード間変換 (スコア:0)
は? いわゆる半角カナを使うべきでないというのは、文字コード判別とはまったく別の理由ですが。
いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
Re:文字コード間変換 (スコア:1)
> いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
「全角アルファベットを使うべきでない」は初めて聞きました。
どのあたりの規格か知りたいです。
#気分の問題じゃなかったんだ…
「半角カナを使うな」は、単純に文字コードの制限だったと思うんですが。
8ビット目を使わないほうがいい(正しく処理できないサーバやクライアントが多かったから) → 7ビットで表現するISO-2022-JPを用意 → ISO-2022-JPには半角カナが定義されていない → 半角カナを使うな
Re:文字コード間変換 (スコア:1)
少なくともUnicode Standard、JIS X 0202、JIS X 0208、JIS X 0213には、そのへんの変な文字は使うなと明記されています。
Re:文字コード間変換 (スコア:1)
「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか?
なんというか、MUST NOT(例外条件ありなのはMUST NOTにならないのかな?)ではなく、SHOULD NOTにあたる文言というか…
因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?
#探し方がへたなだけかなぁ
Re:文字コード間変換 (スコア:1)
本当にちゃんと探しましたか?
と書いてありますが。
Unicode StandardといえばUnicode Standard
Re:文字コード間変換 (スコア:0)
そんなピンポイントで引用されると制限の真意がつかみかねると思うので、もうちょい先まで引用したものを。
この「異なった図形文字として用いてもよい」という表現は、ISO/IEC 2022の翻訳規格であるJIS X 0202の下記の部分を受け
Re:文字コード間変換 (スコア:1)
違いますよ。原因と結果が逆です。
そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。
ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。
そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。
Re:文字コード間変換 (スコア:0)
両者は同じ文字であるといいつつ、わざわざJIS X 0208/0213の方の文字を「そういう変な文字」と、あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。規格内には「そういう変な文字」もしくはそれに類する表現は無いにも関わらずです。
Re:文字コード間変換 (スコア:1)
別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。
だめですね。あなたはまだレイヤーが混ざっています。
『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ文字が複数のコードポイントにあらわれる場合』があります。後者では半角・全角は不適です。
Re:文字コード間変換 (スコア:0)
同じ文字なのだから異なる扱いをしてはいけないのにエセ技術者が——という話だったような気がしますが、それはともかくとして。両者は同じ文字であるのでどちらが変な文字という分けでもないですし、一方の文字を用いてはならない理由もJIS X 0208/0213の方が変だからという訳でもありません。そのことを知っていて何故わざわざ「変な文字」と称するのでしょう?
違います。それらは分けて扱うことはできません。ISO/IEC 646(またはJIS X 0201)とJIS X 0208(またはJIS X 0213)を同時に用いることで同じ文字が複数の符号で表される場合、慣用的な利用との互換性を目的としてだけ両者を異なった文字として用いることができるわけですが、その場合にX 0208(またはJIS X 0213)の方の文字に別の文字としての代替名称が与えられるのです。
Re:文字コード間変換 (スコア:1)
まったく別物ですよ。混同しているのでは?
後者は『両者を異なった文字として用い』ない場合です。