対話型AI(人工知能)サービス「ChatGPT」の最新モデル「GPT-4o」は、まるで人間と話すかのようにリアルタイムで滑らかに会話ができる。開発会社の米OpenAIが披露した動画では、GPT-4oと会話するほか、AIが笑ったり歌ったりする機能を紹介した。
ここまで自然に話せるAIが実用レベルだと、顧客からの電話に応対するコールセンターのような仕事にとって代わる日は近いのではないか。
「置き換えないという選択を取る理由はない」
GPT-4oの性能は「GPT-4 Turbo」と匹敵するうえ、文章や音声、動画の処理速度を向上させた。AIとチャットするときの応答時間が大幅に短縮し、音声入力に対する応答速度も人間の反応速度とほとんど同じだ。
「GPT-4oレベルであれば、人から置き換わると思います」
『生成AIで世界はこう変わる』(SB新書)の著者で、東京大学のAI研究者・今井翔太氏はこう語る。GPT-4oは即座に応答でき、人間以上の知識を持っている。今後、GPT-4o などのAIに社内情報を追加学習させることが可能になれば、それに従って話すことができるとの見解を示した。
今井氏によれば、カスタマーサービスは教育コストがかかる一方で、離職率が高い。AIを使った方が、顧客満足度が高まるという研究結果もある。「資本家視点で考えると、置き換えないという選択を取る理由はありません」。
セラピストや接客業も生成AIに?
GPT-4oを使ったリアルタイム翻訳も可能ではないか、と期待する声も多い。GPT-4oを含め素早く音声出力できる生成AIは、今後ビジネスにどのような影響を与えるのか。
今井氏は、しゃべりながらプロンプトを入力できるようになれば、生成AIを社内導入している会社の生産性は上がるだろうと推測する。メモやタスク管理などの機能を持つサービス「Notion」や、ファイル共有サービス「Googleドライブ」などに散らばった社内知識を統合するために生成AIを導入する企業もあったが、プロンプトのテキスト入力が面倒で利用しない従業員も多かったという。
過去の研究によれば、AIがセラピストや接客業などを担うことに否定的な意見も多かったと今井氏。だが、GPT-4oは感情的な表現ができるため、人間の感情がベースになる仕事もAIが担うようになるのではないかとみている。
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx