ChatGPT 開発の背後にはケニアの労働者による人力作業 72
ストーリー by headless
人力 部門より
人力 部門より
注目を集める OpenAI の対話向け言語モデル ChatGPT だが、その開発には 1 時間 2 ドル以下で働くケニアの労働者が多数かかわっていたという
(TIME の記事、
Windows Central の記事、
The Register の記事)。
ChatGPT の前に OpenAI が開発した GPT-3 は高精度な文章生成能力を示していたが、学習に使用した素材の関係で一般的な使用に向かない有害なコンテンツを生成することもあった。このような失敗を繰り返さないためには、ヘイトスピーチや暴力、性的虐待といった有害なコンテンツを回避する AI が必要になる。そのため、OpenAIではインターネットのダークサイドから抽出した数万件のテキストスニペットへのラベル付けを米サンフランシスコの Sama とにアウトソーシングした。Sama はケニアやウガンダ、インドで労働者を雇い、IT 企業からの依頼を受けてデータにラベル付けを行う企業だ。
Sama は 2021 年 11 月から作業を開始したが、TIME がインタビューした Sama の従業員によれば暴力や性的虐待などを生々しく描いたテキストにラベル付けする作業は拷問のようだったという。2022 年 2 月には別プロジェクトとして性的および暴力的な画像を収集する作業のパイロットプログラムも開始したが、契約時に言及のなかった違法なコンテンツの収集を要求された Sama は作業を打ち切り、他のプロジェクトもすべて終了するとOpenAI に通告。同月、予定より早く契約を打ち切ることになった。
Sama は従業員のトラウマになるような作業を続けさせたくなかったと説明するが、TIME が 2 月 14 日に発行した Facebook の過酷なコンテンツモデレーションに関する記事で作業を請け負う企業として Sama が紹介されたことも関係しているという。記事が出てから 3 日後、Sama はルフトハンザ航空の子会社 zeroG から契約を打ち切られており、これを契機として OpenAI との契約を打ち切ることにしたようだ。
Sama は自然言語処理とコンテンツモデレーションをやめてコンピュータービジョンに注力する計画を進めており、今年 1 月 10 日には Facebook のコンテンツモデレーションを含むセンシティブなコンテンツにかかわる業務をすべて打ち切ると発表している。Sama がやめても AI システムのために人力でデータにラベル付けする需要はなくならない。大量の人力作業とスクレイピングデータを必要とすることは根本的な問題だが、OpenAI が対処しているようには見えないと AI 倫理が専門の Andrew Strait 氏は述べている。
ChatGPT の前に OpenAI が開発した GPT-3 は高精度な文章生成能力を示していたが、学習に使用した素材の関係で一般的な使用に向かない有害なコンテンツを生成することもあった。このような失敗を繰り返さないためには、ヘイトスピーチや暴力、性的虐待といった有害なコンテンツを回避する AI が必要になる。そのため、OpenAIではインターネットのダークサイドから抽出した数万件のテキストスニペットへのラベル付けを米サンフランシスコの Sama とにアウトソーシングした。Sama はケニアやウガンダ、インドで労働者を雇い、IT 企業からの依頼を受けてデータにラベル付けを行う企業だ。
Sama は 2021 年 11 月から作業を開始したが、TIME がインタビューした Sama の従業員によれば暴力や性的虐待などを生々しく描いたテキストにラベル付けする作業は拷問のようだったという。2022 年 2 月には別プロジェクトとして性的および暴力的な画像を収集する作業のパイロットプログラムも開始したが、契約時に言及のなかった違法なコンテンツの収集を要求された Sama は作業を打ち切り、他のプロジェクトもすべて終了するとOpenAI に通告。同月、予定より早く契約を打ち切ることになった。
Sama は従業員のトラウマになるような作業を続けさせたくなかったと説明するが、TIME が 2 月 14 日に発行した Facebook の過酷なコンテンツモデレーションに関する記事で作業を請け負う企業として Sama が紹介されたことも関係しているという。記事が出てから 3 日後、Sama はルフトハンザ航空の子会社 zeroG から契約を打ち切られており、これを契機として OpenAI との契約を打ち切ることにしたようだ。
Sama は自然言語処理とコンテンツモデレーションをやめてコンピュータービジョンに注力する計画を進めており、今年 1 月 10 日には Facebook のコンテンツモデレーションを含むセンシティブなコンテンツにかかわる業務をすべて打ち切ると発表している。Sama がやめても AI システムのために人力でデータにラベル付けする需要はなくならない。大量の人力作業とスクレイピングデータを必要とすることは根本的な問題だが、OpenAI が対処しているようには見えないと AI 倫理が専門の Andrew Strait 氏は述べている。
偉大になった人工無能 (スコア:2)
ChatGPTって入力した文章に対する「回答」しか喋ってくれなくて、
雑談とかはできない。
「目はありますか?」「お腹はすきますか?」とか聞くと
「私はプログラムなので物理的な目や間隔を持っていません」
って返してくる。データ少佐かよ。
期待したのは様々なテキストセットから人間の価値観をす理論してるのか、
と思ったけど、ただ返答がコンピュータとは思えないまともな文章だっただけのような、
魂を宿らせることはなくて、そこは今回の労働者にやらせたんだな。
いまの企業はなるべくサポート費をかけたくないから、
全然使えないAIチャットをやらせて、次にオペレータチャットになる。
(電話かけてもオペレータチャットのURLをSMSで送ってくる)
ここでの質問とオペレータの返答がテキストセットに使われたら、いい具合員なるかもしれない。
#それより今まで問い合わせがあったことを全部質問と回答に載せたり、
#購入した直後で自分の利用状況がウェブでの照会に反映されてないときは、
#何もできないオペレータに「ちょっと待ってください」って言わせるんじゃなくて、
#照会ページに「購入してから3日後に範宴されます」って書いとくだけだと思う。
Re:偉大になった人工無能 (スコア:2, すばらしい洞察)
多分この記事で言ってるのは、AIチャットボットが問題のある文章を生成するケース、例えば「あるいは、
(犯罪行為)をするという方法が考えられます。当局の摘発を逃れるため、(残虐行為)をお勧めします…」
のような回答を返してしまうケースじゃないかな。
そういうケースは学習データや出力サンプルに対して人力で「問題発言度」を設定したり、そもそもデータを
省くという方法があるだろうけど、その処理に残虐な表現を区分けするバイトが集められたんだろう。
Re: (スコア:0)
ミスタースポックと喋ってるみたいな感じね
出だしがひどい (スコア:1)
その開発には 1 時間 2 ドル以下で働くケニアの労働者が多数かかわっていたという
あからさまな炎上狙いじゃない
The Register の記事 [theregister.com]
のリンク貼っといて
ドルの価値
「明確にするために、サマは月に26,600から40,000ケニアシリング(209ドルから322ドル)を支払っています。これはケニアの最低賃金の2倍以上であり、生活賃金をはるかに上回っています」とサマの広報担当者はThe Registerに語った.
(Google翻訳)
への言及なしに
コンテンツ内容の問題へつなげて悪感情を誘導すんのはいかがなもんか
/*
フェアトレードはやり方次第で逆効果
現地の物価や治安を悪化させかねない
なので賃金としては穏当
加えて差額を人道支援に当てるなどしていたら99点
100%正解の100点はない
*/
Re:出だしがひどい (スコア:2)
Re: (スコア:0)
TIME だと $1.32-2 は手取りと明記されてるけど、
フロントの最低賃金 $1.52 は手取りじゃないのでは?
Re:出だしがひどい (スコア:1)
Re: (スコア:0)
実際安いんだとしてもどれぐらい安いのか判断できる情報は必要だろ。
それがなくて暗に日本の基準と比較させてるなら誘導と言われても仕方ない。
Re:出だしがひどい (スコア:1)
Re: (スコア:0)
まぁ騒いでいるのはアメリカはマックのバイトが1000万円もらってるのに、日本は貧乏になったと言ってるような人たちでしょう。
Re: (スコア:0)
「日本が貧乏になった」は事実だろ。。。
バイトやビッグマック指数で比較するのは微妙なところだが。
Re: (スコア:0)
「周囲についていけない」のは事実ですが「貧乏になった」というのは疑問ですね。
Re: (スコア:0)
貧富って相対的なものだから「周囲についていけない」と「貧乏になった」は正しいんじゃないか。
幸せと思いこんでいれば幸せって宗教の方なら知らんけども。
素晴らしい貢献 (スコア:1)
アフリカへの募金活動って50年以上やってるんでは。
今でも続いているのは募金活動の人は問題を根本的に解決する気が無いのかと憶測してしまう。豪邸に住んでる人が呼びかけ人ならなおさら。
仕事を与えてスキルを身に着けさせるってのは、まさに魚を与えず、魚の釣り方を教えるってやつ。
Re: (スコア:0)
> 今でも続いているのは募金活動の人は問題を根本的に解決する気が無いのかと憶測してしまう。
そりゃ悪がなくなったら正義の味方は失業してしまうから。
Re: (スコア:0)
「問題を根本から解決する」人と「目の前の人を助ける」人が同じでないといけないということでしょうか
募金に限らず世の中の大多数の人々の行いを否定しかねないご高説
ネットの陰から言うのは楽でいいですね
Re:素晴らしい貢献 (スコア:1)
>「目の前の人を助ける」人が同じでないといけないということでしょうか
その言葉の定義は解釈が広すぎるので、コメントすることはありません。
募金団体 に絞っていえば、彼らは知恵を絞って根本的に解決するアクションを起こさないといけない。
今回の ChatGPTはわずか1,2年で枠組みこしらえたんですよね。漫然とお金を渡している募金団体をしり目に。
Re:素晴らしい貢献 (スコア:1)
仕事を与えるってのが、根本的解決の一つです。
今回のはいい例です。リモートで出来る仕事はアフリカの人も参加できる。
日本語よりも (スコア:0)
韓国語のAIの方が先に進歩したりして
倫理的な配慮が不要で安上がりな北朝鮮人を使えるから
Re: (スコア:0)
そんなところに発注したら、変なプロパガンダを仕込まれそうで嫌。
Re: (スコア:0)
金正恩「人民が退廃的な資本主義のプロパガンダに汚染される!」
Re: (スコア:0)
韓国人たちが北朝鮮を言葉の通じる安価な労働力だとか市場として見るようになったら日本にとっては脅威になるな。
Re:日本語よりも (スコア:1)
「安価な労働力」は有利に働くだろうけど、市場としてはどうなんだろうね?
韓国約5,163万人に対して、約2,578万人。
購買力が極めて弱い貧困層が一緒になるわけだけど、それが市場として有利に働くようになるのに何年かかるのか。
南北朝鮮よりは経済格差的にマシだった東西ドイツですら、統一後30年でまだ経済格差があるって話だし。
この問題が、韓国の足を引っ張ることは十分にあり得る。
Re: (スコア:0)
それまで韓国人を雇用していたのが北朝鮮人になって韓国から北朝鮮に金が流出して、
韓国の失業者数が増加して韓国経済衰退するんじゃない?
Re: (スコア:0)
倫理的な配慮が不要ということなら、AIの出力への倫理的な配慮の方をなしすれば、今回のようなラベル付け要員が不要になるから問題が解消するのでは?
AIは制約無くのびのびスクスク育てよう。
倫理的な問題は政治で解決できる (スコア:0, 興味深い)
時給2ドル以下という給料が悲惨なのかどうなのかはしらないけど、
どこかの島国住民じゃないんだから、よりましな仕事があるならそちらに転職するだろう。
それをしないということはレッテル貼り作業というのはその地域では魅力的な作業というわけで
根本的にはそれだけ周りの環境がそれだけ酷だということだろう。
ウイグルしかり、ひどい作業が職業として成り立つのは政治的に見捨てられた民族にそれしか与えられていないということで、
倫理的な理由で仕事を取り上げアフターフォローがないのは見殺すほうがよいというはんだんなのだろうか?
Re:倫理的な問題は政治で解決できる (スコア:2, すばらしい洞察)
かつてのアメリカ南部の農場主の言い分そのまま
Re:倫理的な問題は政治で解決できる (スコア:2, 参考になる)
全く同じ事を、
・かつての奴隷制度支持者
・チベットやウイグル弾圧・労働させてる中国政府や企業
・日本へ実習生扱いで出稼ぎに来て劣悪な労働環境で働かせている企業や制度支持者
とかが言っているのだよな……。
で、それが今どのように批判されているか(批判されるようになったか)を理解できずに恥知らずにも再放言するとか。
歴史教育、というか義務教育の敗北なんかね。
Re:倫理的な問題は政治で解決できる (スコア:1)
というか、近代の資本主義社会に住む人々の8割くらいは、普段から言ってる事だと思う。
「給料安くてキツくて我慢できない?じゃあ転職するしかないじゃん。転職しなさいよ」って。
知らんけど。
Re: (スコア:0)
なるほど、かつての奴隷輸出国は今ではすべてが先進国で、チベット・ウイグル地区では弾圧は無くなったのですね!
見ない・関わらないを続ければ勝手に良くなるわけでもなし、福祉がどうだとかアフターフォローがどうだとかの話も無く、過去の過ちと同じだからNGと画一的に判定するということは、その後彼ら彼女らとその子孫に降りかかる不幸(現代の人種格差から解ることだけど)は悪い事ではないというのだね?
# 白人によるプランテーションを悪として排除した結果、
# ジンバブエで何がおきたのか
Re: (スコア:0)
???
自覚のある犯罪者なら、犯した罪がどう社会を毀損したか知ってるから、他人の罪を非難できるわけでしょ?
だから先に足を洗った元奴隷輸入国や輸出国の宗主国は、こうして良心に基づいて後進国を攻撃するわけでしょ?
それに対してダブスタ論だかどっちもどっち論だか知らんけど、批判者の方を批判するって言うのは、
「奴隷制には問題が無い」という擁護を張ることに相当するでしょ? それはAIでも理解して当然のことでしょ?
何でそんな擁護すんの? いや、何でも何もただ反発してるだけだから知らない訳分かってないってのは分かるよ?
何でそんなに向上心が無いの?
Re: (スコア:0)
ジンバブエは白人による搾取に苦しめられた多数を占める黒人が白人の大地主らから資産を没収したんだよね。
それに怒った米英が経済制裁を加えたので経済が崩壊した。
要するに白人先進国による貧しい植民地国の弾圧なんだよ。
黒人による自立が失敗したわけではなく、米英に潰されただけだよ。
貧しい有色人種の国はおとなしく白人の資産家たちに搾取されてろってこと。
米英も中国のウイグル搾取に対して偉そうには言えないよな。
技能実習生から搾取する日本もな。
「この中で罪のない者のみが石を投げよ!」
と言われて、罪があるくせに石を投げまくっているのが欧米日…。
補足すると、反米国家のイラン、ベネズエラももともとは資源大国で豊かな国なんだけど、欧米の利権を没収したから米英に弾圧されてる。
Re:倫理的な問題は政治で解決できる (スコア:1)
> それに怒った米英が経済制裁を加えたので経済が崩壊した。
これだけはダウト。ジンバブエの経済が崩壊したのは、ノウハウを持った人々を追い出したためと、大地主の土地を貧農に分割して配布したからです。
現代の農業でそれをやれば、生産力が下がるのは当然です。人種は関係ありません。
農業生産高自体の激減しているので、明らかに経済制裁は関係ありません。
Re: (スコア:0)
革命無罪ではないだろう。
独立した多くの国は、接収したインフラや産業の対価を対外債務として計上しているよ。
>ジンバブエは白人による搾取に苦しめられた多数を占める黒人が白人の大地主らから資産を没収したんだよね。
ムガベ乙
毛沢東とその後継者、チャベスとその後継者、数多の独裁者は己が手で人民を殺したのだ。
どうして見逃せよう。
Re: (スコア:0)
> ・かつての奴隷制度支持者
> ・チベットやウイグル弾圧・労働させてる中国政府や企業
> ・日本へ実習生扱いで出稼ぎに来て劣悪な労働環境で働かせている企業や制度支持者
上記の人々は、暴力または制度で離職を自由にできない人々であって、このケースのような単純に賃金が先進国から相対的に低いだけのこの人々とは全く違うでしょう。
「奴隷」という言葉を軽々しく使う言説は多くの場合信用できないね。
Re:倫理的な問題は政治で解決できる (スコア:1)
まあケニアでは、時給2ドルはなかなか良い待遇らしいわな
GIGAZINEの記事:https://gigazine.net/news/20230119-openai-used-kenyan-workers/
指摘のツイート:https://twitter.com/spcohn/status/1615712336697860096
Re:倫理的な問題は政治で解決できる (スコア:1)
本当に報道したかったのは気の狂ったネットの文章をちゃんと読んだ上でNG判定させられて気が狂った人の話なんだけど
「AI発展の裏で過重労働で搾取される後進国」の方が受けが良いからタイトルだけそっち方面に寄せてるってわけ
Re: (スコア:0)
高待遇でも突然無職になっては一時に過ぎないわけで
拷問な作業の療養に消えて終わりそう
Re: (スコア:0)
かつてはFacebookなどのSNSの従業員でもやっていた(今でもやってる?)投稿されたコンテンツのチェック作業が精神的に過酷だという話なのでは?
エロ、グロ、暴力というようなコンテンツのラベリングのために、実際にそれを目にしたり読んだりしなければならない。
多少ならば耐えられるだろうけれど、仕事として毎日終日やっていたら精神的におかしくなる。
それでAIになってもらうのだろうけど、AIにやってモラタメには最初に人間がラベリングしなくてはならない。
これは政治的な問題ではないと思う。
うまいやり方を考えないといけないと思う。
Re: (スコア:0)
政治的な問題も十分視野に入るでしょ
これが気になる (スコア:0)
>契約時に言及のなかった違法なコンテンツの収集を要求された
なんのために?
Re: (スコア:0)
アメリカ国内で学習目的の画像の収集が認められるだけでも超法規的なのに、収集したものを海外に送信するとなるとハードルが高すぎたのでしょう。それで収集から要求することにした、と。
AIの裏は実は人間がいた (スコア:0)
自動改札機の中は人がいるとか自動販売機の中は人がいるとかそんな都市伝説はあったかもしれないが
Re: (スコア:0)
自動券売機の裏には人がいるみたいですけどね。
Re: (スコア:0)
> 自動改札機の中は人がいる
タモリさんが入ってるのは、おっさんなら見たことありますよね。
Re: (スコア:0)
AIの裏に人は居ないが、AI作るのには大量に人がいるんだよ。特にDeepLearningには。
自動運転関連なんて、教師データを作るために膨大な単純作業やテスト作業が必要。
アジアやアフリカの一部の国では、AI関連はかなり稼ぎのいい仕事になってる。
Re: (スコア:0)
限定ジャンケンの箱の中には黒服がいたぞ
Re: (スコア:0)
銅像の中にハナ肇
Re: (スコア:0)
中に人が入ってた自動機械といえば、チェスロボットの「ターク(トルコ人)」 [wikipedia.org]
結局どうするのが倫理的なの? (スコア:0)
OpenAIの社員がラベリングするのが、倫理的なわけ?
1. やばいことは覚えさせないAI→かまととAI爆誕
2. テキストをラベリングするAIを開発→AIが可哀想というAI人権運動発生
3. ラベリングが不要な仕組みを開発→できるの?
# 知らないことを知らないままでいると知ったかAIになるんじゃないのかなぁ