アカウント名:
パスワード:
UTF-8しか無ければ問題ない。
過去のデータはすべて捨てろってこと?
「全角アルファベットを使うべきでない」は初めて聞きました。 どのあたりの規格か知りたいです。
少なくともUnicode Standard、JIS X 0202、JIS X 0208、JIS X 0213には、そのへんの変な文字は使うなと明記されています。
「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか?
本当にちゃんと探しましたか?
6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。
と書いてありますが。
因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?
Unicode StandardといえばUnicode Standard
そんなピンポイントで引用されると制限の真意がつかみかねると思うので、もうちょい先まで引用したものを。
JIS X 0208 7.2 ISO/IEC 646の国際基準版(IRV)と同時に用いる場合の符号6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。ただし、これまでの慣用的な利用との互換性を目的としてだけ、付随書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい。
JIS X 0208 7.2 ISO/IEC 646の国際基準版(IRV)と同時に用いる場合の符号
6.5.1で規定する漢字集合とISO/IEC 646の国際基準版とを同時に用いる場合、ISO/IEC 646で規定される図形文字と同じ図形文字は用いてはならない。ただし、これまでの慣用的な利用との互換性を目的としてだけ、付随書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい。
この「異なった図形文字として用いてもよい」という表現は、ISO/IEC 2022の翻訳規格であるJIS X 0202の下記の部分を受け
要はJIS X 0208の方のラテン文字が変な文字だから使用禁止という訳ではなく、同じ文字が異なる符号で存在するので、どっちかに統一しましょうということが示されていたわけです。
違いますよ。原因と結果が逆です。
そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。 ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。 そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。
なのでもう「全角〜」「半角
両者は同じ文字であるといいつつ、わざわざJIS X 0208/0213の方の文字を「そういう変な文字」と、あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。規格内には「そういう変な文字」もしくはそれに類する表現は無いにも関わらずです。
なのでもう「全角〜」「半角〜」って呼び名はどうよと悩む意味は無さそうな感じです。 そもそも使うべきではないのだから、そういう呼び名がでることは普通ありませんよね。
なのでもう「全角〜」「半角〜」って呼び名はどうよと悩む意味は無さそうな感じです。
そもそも使うべきではないのだから、そういう呼び名がでることは普通ありませんよね。
使うべきではないですが、話に出してもダメというわけではないので、たとえば今やっている話みたいな両者の文字をあえて区別して扱わなければならない場合には、そういう呼び名を出すことに問題は無いですよね。
あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。
別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。
たとえば今やっている話みたいな両者の文字をあえて区別して扱わなければならない場合には、そういう呼び名を出すことに問題は無いですよね。
だめですね。あなたはまだレイヤーが混ざっています。 『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ文字が複数のコードポイントにあらわれる場合』があります。後者では半角・全角は不適です。
同じ文字なのだから異なる扱いをしてはいけないのにエセ技術者が——という話だったような気がしますが、それはともかくとして。両者は同じ文字であるのでどちらが変な文字という分けでもないですし、一方の文字を用いてはならない理由もJIS X 0208/0213の方が変だからという訳でもありません。そのことを知っていて何故わざわざ「変な文字」と称するのでしょう?
『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ
それらは分けて扱うことはできません。
まったく別物ですよ。混同しているのでは? 後者は『両者を異なった文字として用い』ない場合です。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ソースを見ろ -- ある4桁UID
文字コード間変換 (スコア:0)
「~」の文字化け問題とかめんどくさー(;´Д`)
Re:文字コード間変換 (スコア:2, 興味深い)
UTF-8しか無ければ問題ない。
Re:文字コード間変換 (スコア:0)
過去のデータはすべて捨てろってこと?
Re:文字コード間変換 (スコア:0)
UTF-8をShift_JISに変換すりゃ、ない文字は見えなくなるわな。
いつまで日本の隅っこでシフトJISなんかつついてなきゃならんのだ。
メールもUTF-8でうだうだ言ってくる人はいつまで古いソフト使ってるのかね。セキュリティ大丈夫? とか、Webで半角カナは使わないでくださいっていつの時代の文字コード判定だとか思うわけだ。コード判定がやりにくくなるというより、とりあえずまじないぐらいに思ってるんでしょな。
いちいち全角半角指定してないで、それぐらいサーバ側で変換かけろ、とか、言いたいことは山のよう。
Re:文字コード間変換 (スコア:0)
は? いわゆる半角カナを使うべきでないというのは、文字コード判別とはまったく別の理由ですが。
いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
Re:文字コード間変換 (スコア:1)
> いわゆる全角アルファベットを使うべきでないというのと同じです。規格ぐらい読みなさい。
「全角アルファベットを使うべきでない」は初めて聞きました。
どのあたりの規格か知りたいです。
#気分の問題じゃなかったんだ…
「半角カナを使うな」は、単純に文字コードの制限だったと思うんですが。
8ビット目を使わないほうがいい(正しく処理できないサーバやクライアントが多かったから) → 7ビットで表現するISO-2022-JPを用意 → ISO-2022-JPには半角カナが定義されていない → 半角カナを使うな
Re:文字コード間変換 (スコア:1)
少なくともUnicode Standard、JIS X 0202、JIS X 0208、JIS X 0213には、そのへんの変な文字は使うなと明記されています。
Re:文字コード間変換 (スコア:1)
「全角アルファベットを使うべきでない」という仕様は無いと考えていいでしょうか?
なんというか、MUST NOT(例外条件ありなのはMUST NOTにならないのかな?)ではなく、SHOULD NOTにあたる文言というか…
因みに、Unicode Standardの「そのへんの変な文字は使うな」はJIS X 0221での禁止ということでしょうか?
#探し方がへたなだけかなぁ
Re:文字コード間変換 (スコア:1)
本当にちゃんと探しましたか?
と書いてありますが。
Unicode StandardといえばUnicode Standard
Re:文字コード間変換 (スコア:0)
そんなピンポイントで引用されると制限の真意がつかみかねると思うので、もうちょい先まで引用したものを。
この「異なった図形文字として用いてもよい」という表現は、ISO/IEC 2022の翻訳規格であるJIS X 0202の下記の部分を受け
Re:文字コード間変換 (スコア:1)
違いますよ。原因と結果が逆です。
そもそも同じ名前のついた同じ文字なのだから、本当は内部での扱い(検索など)や表示で区別をしてはいけないんです。
ところがその辺をよく分かってないエセ技術者が、別の文字として扱っちゃったわけですね。
そういう世間の事情をくんで、JISでは1997年だったかの版で互換性のために代替名称として存在だけは認め、さらに『そういう変な文字は使うな』と明記したわけです。
Re:文字コード間変換 (スコア:0)
両者は同じ文字であるといいつつ、わざわざJIS X 0208/0213の方の文字を「そういう変な文字」と、あたかもJIS X 0201の文字とは別の文字のように呼ぶ理由は何でしょう。規格内には「そういう変な文字」もしくはそれに類する表現は無いにも関わらずです。
使うべきではないですが、話に出してもダメというわけではないので、たとえば今やっている話みたいな両者の文字をあえて区別して扱わなければならない場合には、そういう呼び名を出すことに問題は無いですよね。
Re:文字コード間変換 (スコア:1)
別の文字として扱う場合の話なのですから、別の文字として扱うことに何も問題はないですね。
だめですね。あなたはまだレイヤーが混ざっています。
『代替名称を使って別の文字とみなす場合』だけではなく、『一つの符号化方式で複数の文字集合を扱った場合に、同じ文字が複数のコードポイントにあらわれる場合』があります。後者では半角・全角は不適です。
Re:文字コード間変換 (スコア:0)
同じ文字なのだから異なる扱いをしてはいけないのにエセ技術者が——という話だったような気がしますが、それはともかくとして。両者は同じ文字であるのでどちらが変な文字という分けでもないですし、一方の文字を用いてはならない理由もJIS X 0208/0213の方が変だからという訳でもありません。そのことを知っていて何故わざわざ「変な文字」と称するのでしょう?
Re:文字コード間変換 (スコア:1)
まったく別物ですよ。混同しているのでは?
後者は『両者を異なった文字として用い』ない場合です。