百度、「不自然言語処理コンテスト」を開催 76
ストーリー by hylom
私の日本語も時々不自然です 部門より
私の日本語も時々不自然です 部門より
あるAnonymous Coward 曰く、
百度が「不自然言語処理コンテストなるコンテストを開催するそうだ。
「不自然言語処理」なる言葉、タレコミ子は初めて耳にしたが、
みさなん こんちには!ァタシは六本木住みのBaidu、ョロシクです。
Baidu.jp 不 自 然 言 言吾 処 王里 コンテスト 告知なう
賞金を用意してみなさんのご応募をお待ち(ryのような、「間違っていても読める、読みづらく書きづらいのに使われている、あるいは短くて書きやすいけど知らない人には伝わらない表現」を処理することをそう呼ぶのだそうだ。
コンテストでは不自然言語を使ったコミュニケーションを豊かにするサービスや作品、プログラムなどを募集、グランプリには賞金10万円が進呈されるとのこと。百度からは素材として絵文字入りウェブコーパスが提供されているほか、各種公開APIなどの利用も可。締め切りは7月20日。審査員には東大特任講師の荒牧英治氏やPerlユーザーにはおなじみサイボウズ・ラボの竹迫良範氏が名を連ねている。また、7月25日には表彰式とともに交流会やライトニングトークも行われるとのこと。
その1 (スコア:3, おもしろおかしい)
Copyright (c) 2001-2014 Parsley, All rights reserved.
Re:その1 (スコア:4, すばらしい洞察)
いや、でも百度の本社が有る国の人達は、
「日本語の漢字の読み方って、訳が判らん」
とか思ってるよーな気がする。
Re:その1 (スコア:1, 興味深い)
昔の留学生が、一見簡単そうな「漢文」(=古典漢語)を受講して、「書き下し文」の読み方に目を剥いた話があります。
# 今だったら「繁体字」にも音を上げるかも
コーパス (スコア:1)
リンク先を見ると、ウェブから抽出されたコーパスが提供されているんですが、
自然言語解析用語「Nグラム」の「グラム」を、いわゆる機種依存文字の
グラムを使ってあらわすのはどうかと思う。質量の意味じゃないですからね…。
Re:コーパス (スコア:1)
グラムはもちろんのこと、「バ㌍タ」ぐらいは読めないと、予選落ちレベルな気がしますね。
「㍉㍑㌢㌧㌢㌧」は厳しいか?
# 「ミリリットルセンチトンセンチトンって何ですか!」禁止
だめじゃん、最初のコメントでストーリーを終了させちゃあ (スコア:0)
Re: (スコア:0)
(中国語のピンイン表記だとまんまBaiduだからしょうがないんじゃあ…)
(無粋なツッコミだけど、ボケも無粋だからいいよね)
百度ェ・・・ (スコア:0)
プログラム言語ありなの? (スコア:1)
プログラム言語ありなら White space language で終わるでしょ。
どう考えても。
※
Re:プログラム言語ありなの? (スコア:4, 興味深い)
こんちには みさなん おんげき ですか? わしたは げんき です。
この ぶんょしう は いりぎす の ケブンッリジ だがいく の けゅきんう の けっか
にんんげ は もじ を にしんき する とき その さしいょ と さいご の もさじえ あいてっれば
じばんゅん は めくちちゃゃ でも ちんゃと よめる という けゅきんう に もづいとて
わざと もじの じんばゅん を いかれえて あまりす。
どでうす? ちんゃと よゃちめう でしょ?
ちんゃと よためら はのんう よしろく
Re:プログラム言語ありなの? (スコア:2)
すげーーー、
読めるわ。
もとの けきゅんうの そーす よしろく
------ nori2
Re:プログラム言語ありなの? (スコア:5, 参考になる)
一年前に 話題になったときに 調たべものです [srad.jp] が 「There was never a study at Cambridge University.」 [dailytelegraph.com.au]だ そうで (斜め読みなので 読み違えていたかも しれませんが)。
#元を 辿っていたら 2003年の本家記事 [slashdot.org]までは 辿りついていました。
↑「調たべものです」は“先生きのこ現象”で「調べたものです」と読み替えられない人の方が多いと予想
Re:プログラム言語ありなの? (スコア:2)
>わざと もじの じんばゅん を いかれえて あまりす。
「あまりす。」だけは読めなかった
Re:プログラム言語ありなの? (スコア:2, 参考になる)
"Aoccdrnig to a rscheear at an Elingsh uinervtisy, it deosn't mttaer in waht oredr the ltteers in a wrod are, the olny iprmoatnt tihng is taht frist and lsat ltteer is at the rghit pclae. The rset can be a toatl mses and you can sitll raed it wouthit porbelm. Tihs is bcuseae we do not raed ervey lteter by it slef but the wrod as a wlohe".
意訳:
いりぎす の けきゅんう にるよと ことば の じばゅんん を なべからてえも さしいょ と さいご だけ たしだく なんでれらいば もないんだく よしらるめい
それは こばとを よとむき ぜんぶ でなはく いちぶ を よかんるでいら らけしいど これを よのむは かたなじゃんんい と おうもよ
1を聞いて0を知れ!
Re:プログラム言語ありなの? (スコア:2)
みんな本当に読めるの?
Re:プログラム言語ありなの? (スコア:1)
Re:プログラム言語ありなの? (スコア:2, 参考になる)
もろにあると思う。
不慣れな言語は一字づつ追うけど、慣れてくるとはしょれる部分が分かってきて、
飛ばして読み始める、って特性を利用しているはずだから。
Re:プログラム言語ありなの? (スコア:1)
慣れもですが、並べ方によっても読みやすさは変わるのです。
こっちはそれなりに読みやすいかと思います。
Accondirg to a rcseareh at Cabmridge Univtrsiey, it dseon't mettar in waht oredr the letters in a wrod are. The olny inportamt tihng is taht the fisrt and lsat letter be in the rihgt pcale.
The rset can be a tatol mses and you can slitl raed it wothiut probelm. Tihs is bscauee the hamun mnid deos not raed erevy letetr by iestlf, but the wrod as a wohle.
1を聞いて0を知れ!
Re: (スコア:0)
一応読めた(気がする)ので反応してみました
Re:プログラム言語ありなの? (スコア:1)
掲示板でアングラな内容をやりとりするのにも使われているようですね
出会い系だとか、違法にアップロードされたコンテンツだとか
当局が興味持ちそうです(どの国の?)
Re:プログラム言語ありなの? (スコア:4, 興味深い)
私もそれがちょっと気になります
というか、共産党政権批判の隠語をあぶりだそうという当局の企みがあるような気がして
新人。プログラマレベルをポケモンで言うと、コラッタぐらい
Re: (スコア:0)
マジで何の問題もなく読めるから恐ろしい・・・。
人間の認識方法って変だな。余り真面目にやってないのか?
Re:プログラム言語ありなの? (スコア:2, 興味深い)
>余り真面目にやってないのか?
人間の情報処理は、
・正確さを犠牲にした高速処理(瞬間的な反応で生き残りをかける)
・データをいい加減に圧縮して高速処理(同上)
*逆に、あとから適当なデータを付加して展開したりもする(適当なでっち上げ)
・進化の過程で場当たり的に増築した事による迂遠な回路(非効率的)
などがごっちゃに入り交じった非常に汚くて不正確で場合によっては低速な処理系です。
能力獲得の過程や、過去の環境中では役に立つものだったりもしますが、現在では無用だったり悪影響があったりという回路もいくつもあります。
Re:プログラム言語ありなの? (スコア:1)
そのいい加減さが、コンピュータや機械で代替出来ない処理系のため、人間が必要とされる仕事もあるんですよね。
ジャガイモと土の塊を分別する仕事とか。
#壮大なストーリ。空転するアイディア。
Re:プログラム言語ありなの? (スコア:1)
でもアサリと石を分別できないこともしばしば.
Re: (スコア:0)
俺の脳みそってこんなにすごかったんだ
Re:プログラム言語ありなの? (スコア:5, おもしろおかしい)
>俺の脳みそってこんなにすごかったんだ
こんなにすごくいい加減だったんだ、
ということですね。
Re:プログラム言語ありなの? (スコア:1)
なぜか4文字の語の置換は読みにくい
新人。プログラマレベルをポケモンで言うと、コラッタぐらい
Re: (スコア:0)
いや、不自然言語さを競うコンテストじゃないんで。
Re: (スコア:0)
「※」を「ただしイケメンに限る」と読ませる。
Re: (スコア:0)
よくbotと勘違いされます (スコア:1)
短くて書きやすいけど知らない人には伝わらない表現 (スコア:1)
# アタマの中に「| tar zc - |」←なパイプがあって、
# バイナリ出力が苦でない人が/.にはきっといるはず!?
総括せねばなるまい (スコア:1, おもしろおかしい)
勹廾千ュ—言吾 (スコア:0)
クサチュー語変換ページを、古典として登録してあげるといいかもね。
昔、2chのトップページからリンクされてたよね…。
そんなの、難解バカボンにでも訊け (スコア:0)
ぐぐると色々あるけど、とりあえずはこんなの。
http://www-hep.phys.s.u-tokyo.ac.jp/~yujitach/diary/nanba.html [u-tokyo.ac.jp]
「言語処理」と言うから (スコア:0)
#そうだとしても優勝する自信がないのでAC
自分のところで開発できないから (スコア:0)
ぅゎょぅι゛ょっょぃ (スコア:0)
Re:ぅゎょぅι゛ょっょぃ (スコア:2)
不埒な男がょぅι゛ょに対して悪行に及ぼうとしたが
そのょぅι゛ょがたまたまマーシャルアーツマスターで
仮借ない制裁を加えられてしまったというような場合だと思います。
Re:ぅゎょぅι゛ょっょぃ (スコア:1)
ドアを開けたらいきなり跳び蹴りを食らって、HPをごっそり削られたんですね、わかります。
-------- tear straight across --------
Re: (スコア:0)
Re: (スコア:0)
Re: (スコア:0)
ヒエログリフ (スコア:0)
全然わからんが説明を受ければ一応理解できる
ここまで (スコア:0)
本人含め。
Re:ここまで (スコア:2, おもしろおかしい)
走召糸色木亥火暴
Re:ここまで (スコア:1)
また一つ、ニンゲンの言語能力の凄さが証明されるのであった。
なんだ (スコア:0)
方言とか (スコア:0)
>短くて書きやすいけど知らない人には伝わらない表現
け
ん
どさ
えさ