はじめに
弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤表記として「視覴」という不適切な表現を使用してしまい、深くお詫び申し上げます。
こうした過ちが再発しないよう、今後はファクトチェックの強化に努めるとともに、AIエンジンを用いて作成された用語集については、編集スタッフがより丹念にレビューし事実確認を行う体制を強化して参ります。
皆様にはご不便とご迷惑をおかけしましたことを重ねてお詫び申し上げます。引き続きご愛顧いただきますよう、何卒よろしくお願い申し上げます。
今回発端となったツイート
怖ぇー、chat gpt使ってたら「視覴」という見慣れない言葉を吐き出したので検索したところ、ヒットするサイトがほとんど直近日付のAI出力された文章だった
— フガクラ (@fugakura) June 7, 2023
これっていわばAIのハルシネーションが生み出した存在しない単語なのでは…? pic.twitter.com/TVXWcNlVWh
Twitterの方々の見解
「視覴」という言葉は、手元の国語辞典アプリでは引っ掛からなかった。「存在しない単語だ」とは言い切れないが、非常に利用頻度が低いとは言える。
— 守屋恵一『ChatGPT 120%活用術』発売中@ デジタル系ライター・編集者 / 仕事垢 (@moriyakeiichi) June 8, 2023
また、「覴」は漢和辞典アプリでは引っ掛からなかった。こちらは文字が存在することから、存在はしている。
なお、中日辞典でも検索不能だった。 https://t.co/SREm2qDh8F
https://t.co/Oh6KrRoKlb
— がっしー (@watagasi_) June 8, 2023
これフガクラさんにも話したけど引用とかでも一切その話が出てこないので有り得そうな原因について言うと、openAIが公開しているtokenizerに「視」「覴」という文字を入力してみると、それぞれのtoken idが[17358, 244]と[17358, 112]で被ってるので、そのセンかもねという
2020年頃の記事もあるので、AIというよりは、pdfや画像からの文字起こしか、文字コードのバグで生まれてAIに学習されたものなのでは https://t.co/9ct7e6neoK
— nekojita (@nek0jita) June 8, 2023
ChatGPTが「視覴」という存在しない単語?を作り出して普通に使っている可能性があるらしい。
— 吉永龍樹(ヨシナガタツキ@僕秩) (@dfnt) June 8, 2023
言語は流動的なものなので、今後AIが産んだ単語が人間社会に根付くこともあるんだろう。SFっぽくて面白いな。 https://t.co/Fff6Yeux89
下記のブログで2023年から出現し始めて、しかもChatGPTも併用されてる気配がある。
— すら@bluesura (@bluesura) June 8, 2023
"以下はChatGPTによるインフルエンサーマーケティングの説明です。"
"彼らと協力することで、その価値を具体的に視覴化し、消費者に届けることが可能になります。"
ブログ – 山月記経営研究所 https://t.co/Oo6scOg61s pic.twitter.com/pG1GH30GKN
それ以降、視覴って言葉がどんどんGoogle検索結果にインデックスされていってて、めちゃくちゃAIの言葉の影響を受けてる。めちゃくちゃ面白い!!!!!!!!!!!!!!!! pic.twitter.com/Mu9wlEH9VU
— すら@bluesura (@bluesura) June 8, 2023
ChatGPTで使えるプロンプト
「本当ですか?」と確認するとChatGPTは自身である程度のファクトチェックを行います(本当ですか?)。その上で本当に本当か、人が考える必要があります。本当って誰が決めるのだろうという想いになってきました。「間違っていました」というGPTの回答も「本当ですか?」と聞く人に合わせた最適解に寄せにいっているだけだとしたら、GPTに感情はないらしく(本当ですか?)、これからまた「間違っていますよ」「合っているよ」「〇〇な意味だよ」と複数人の見解を再学習し、GPTの回答はさらに個別最適化され、解釈の沼にはまってしまいそうです?便利だけど言語(特に日本語)が煩わしくなってきました(本当です)。
まとめ
AIが生み出した単語?プレシンギュラリティ到来じゃん、、って思った矢先、私どもの推敲の甘さがその流れに加担していた訳で、AIの取り扱いには注意が必要です。