> A number of Internet sites utilize platforms that are not based upon > the traditional 8-bit byte or octet. One such platform is the PDP-10, > which is based upon a 36-bit word. On these platforms, it is > wasteful to represent data in octets, since 4 bits are left unused in > each word. The 9-bit nonet is a much more sensible representation.
俺エンコード (スコア:1, 興味深い)
まさにその発想で作られた俺エンコードの例
Re:俺エンコード (スコア:2, 興味深い)
提案していたはずだ。フランス語に出てくるゴミが付いたようなアルファベットを1バイトに
格上げする代わり、漢字は4バイトになるやつだった。幸い、国際社会の良識(?)によって
葬り去られたことは言っておかなければならない。
UTF-8とUTF-16の二本立てという現状が定着するまでに、ナショナリズムを背景とする綱引き
がさんざん行われたことは覚えておくべきだし、今さら最適なエンコードを提案するような
フェーズではない、ということも覚えていて欲しいことではある。
Re:俺エンコード (スコア:1, おもしろおかしい)
ただし、4月1日付のRFCなのが・・・。
Re:俺エンコード (スコア:1)
漢字が4バイトになるというのは間違いで、バイト数は伸びない代わり、UTF-8が持っている
大きな長所がこのエンコーディングでは損なわれる、と言う方が正しい。
Re:俺エンコード (スコア:0)
> the traditional 8-bit byte or octet. One such platform is the PDP-10,
> which is based upon a 36-bit word. On these platforms, it is
> wasteful to represent data in octets, since 4 bits are left unused in
> each word. The 9-bit nonet is a much more sensible representation.
ものすごい理由付けでワラタ。PHP-10とくるか・・・
Re:俺エンコード (スコア:0)
あの時代はコンピューターの先カンブリア期みたいなもんだ。