目次

ChatGPTに見て、聞いて、話せる機能が追加


OpenAI社はChatGPTに新たな機能を追加することを発表しました。

・画像をChatGPTに読み込ませ、画像に関する会話をすることができるようになります。(画像認識機能)

・ChatGPTとチャット形式ではなく、実際に「会話(ボイスチャット)」ができるようになります。(音声認識機能+読み上げ機能)


こちらの機能追加により、さらに日常的にChatGPTを利用することができます。

例えば、旅行先の観光地スポットの写真をとり、ChatGPTに読み込ませ、土地や建物の背景など実際にあなたが知りたいことを、会話形式で知ることができます。他には、冷蔵庫の中の写真を読み込ませ、何を作ったらいいのか等の相談をChatGPTできます。

画像や音声の利用にあたり、ChatGPTのようなAIモデルを利用する上でのリスクが増えたと捉える方もいらっしゃるかと思います。OpenAI社の目指す姿は、利便かつ安全であることです。

ChatGPT側からの発声はあくまでもボイスチャットでのみ利用可能で、なりすましの音声生成はできないよう利用形式が限定されています。画像についても、モデルテスト、アルファテストを通して、安全に利用するための調整をしました。

正式発表はまだですが、ChatGPT Plus、もしくは、Enterpriseを利用されている方は、直近2週間後から利用できるようになる予定です。

画像生成AIモデルの発表から、直近で様々な新機能リリースしていて、OpenAI社/AIモデルの技術的な進化がとても速いなと感じています。技術進化に遅れることなく、これからも最新情報をピックアップし、お届けできたらと思います!!!


 

この記事を書いた人

森 信之介
テクニカルマーケターとして、ブログ執筆、セミナー講師を行っております!