コンテンツにスキップ

「GPT-4o」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
Nakasyou0 (会話 | 投稿記録)
m 文末の統一
修正など
タグ: モバイル編集 モバイルウェブ編集 改良版モバイル編集
 
1行目: 1行目:
{{要改訳|date=2024年6月}}
{{Rough translation|英語}}
{{Infobox Software
{{Infobox Software
| 名称 = Generative Pre-trained Transformer 4 Omni (GPT-4o)
| 名称 = Generative Pre-trained Transformer 4 Omni (GPT-4o)
15行目: 17行目:
| 公式サイト = {{URL|https://openai.com/index/hello-gpt-4o}}
| 公式サイト = {{URL|https://openai.com/index/hello-gpt-4o}}
}}
}}
'''GPT-4o''' ('''GPT-4 Omni''') は、[[OpenAI]] によって作られた多言語対応かつマルチモーダルな [[GPT (言語モデル)|GPT]] である。
'''GPT-4o''' ('''GPT-4 Omni''') は、[[OpenAI]]によって作られた多言語対応かつマルチモーダルな[[GPT (言語モデル)|GPT]]である。


2024年5月13日の配信で OpenAI CTO である [[ミラ・ムラティ]]によって発表され、その日にリリースされた<ref name="TechCrunch">{{Cite web |author=Wiggers |first=Kyle |date=2024-05-13 |title=OpenAI debuts GPT-4o 'omni' model now powering ChatGPT |url=https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/ |access-date=2024-05-13 |website=TechCrunch |language=en-US}}</ref>
2024年5月13日の配信でOpenAIのCTOである[[ミラ・ムラティ]]によって発表され、その日にリリースされた<ref name="TechCrunch">{{Cite web |author=Wiggers |first=Kyle |date=2024-05-13 |title=OpenAI debuts GPT-4o 'omni' model now powering ChatGPT |url=https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/ |access-date=2024-05-13 |website=TechCrunch |language=en-US}}</ref>


GPT-4o は無料で使用することができるが、制限が存在する。[[ChatGPT]] Plus のユーザーは、制限が5倍に緩和される<ref>{{Cite web |author=Field |first=Hayden |date=2024-05-13 |title=OpenAI launches new AI model GPT-4o and desktop version of ChatGPT |url=https://www.cnbc.com/2024/05/13/openai-launches-new-ai-model-and-desktop-version-of-chatgpt.html |access-date=2024-05-14 |website=CNBC |language=en}}</ref>
GPT-4oは無料で使用することができるが、制限が存在する。[[ChatGPT]] Plusのユーザーは、制限が5倍に緩和される<ref>{{Cite web |author=Field |first=Hayden |date=2024-05-13 |title=OpenAI launches new AI model GPT-4o and desktop version of ChatGPT |url=https://www.cnbc.com/2024/05/13/openai-launches-new-ai-model-and-desktop-version-of-chatgpt.html |access-date=2024-05-14 |website=CNBC |language=en}}</ref>


GPT-4o はテキスト、画像、音声を入力および生成することが可能である<ref>{{Cite web |author=Claburn |first=Thomas |title=OpenAI unveils GPT-4o, a fresh multimodal AI flagship model |url=https://www.theregister.com/2024/05/13/openai_gpt4o/ |access-date=2024-05-18 |website=The Register |language=en}}</ref>
GPT-4oはテキスト、画像、音声を入力および生成することが可能である<ref>{{Cite web |author=Claburn |first=Thomas |title=OpenAI unveils GPT-4o, a fresh multimodal AI flagship model |url=https://www.theregister.com/2024/05/13/openai_gpt4o/ |access-date=2024-05-18 |website=The Register |language=en}}</ref>


[[アプリケーションプログラミングインタフェース|API]] では、[[GPT-4|GPT-4 Turbo]] の半分の価格で2倍の速度で使用できる<ref name="TechCrunch" />
[[アプリケーションプログラミングインタフェース|API]]では、[[GPT-4|GPT-4 Turbo]]の半分の価格で2倍の速度で使用できる<ref name="TechCrunch" />


音声入力には最短232ミリ秒で応答でき、平均320ミリ秒で人間の応答時間に近い応答が可能である<ref>{{Cite web|url=https://openai.com/index/hello-gpt-4o/|title=Hello GPT-4|website=OpenAI|access-date=2024-06-08}}</ref>。
音声入力には最短232ミリ秒で応答でき、平均320ミリ秒で人間の応答時間に近い応答が可能である<ref>{{Cite web|url=https://openai.com/index/hello-gpt-4o/|title=Hello GPT-4|website=OpenAI|access-date=2024-06-08}}</ref>。


== 背景 ==
== 背景 ==
もともと、GPT-4oはLarge Model Systems Organization's ([[LMSYS]]) のチャットボットとして、 gpt2-chatbot、im-a-good-gpt2-chatbot、im-also-a-good-gpt2-chatbot の3つの異なるモデルとしてひそかにリリースされた<ref>{{Cite web |author=Edwards |first=Benj |date=2024-05-13 |title=Before launching, GPT-4o broke records on chatbot leaderboard under a secret name |url=https://arstechnica.com/information-technology/2024/05/before-launching-gpt-4o-broke-records-on-chatbot-leaderboard-under-a-secret-name/ |access-date=2024-05-17 |website=Ars Technica |language=en-us}}</ref>
もともと、GPT-4oはLarge Model Systems Organization's ([[LMSYS]]) のチャットボットとして、gpt2-chatbot、im-a-good-gpt2-chatbot、im-also-a-good-gpt2-chatbotの3つの異なるモデルとしてひそかにリリースされた<ref>{{Cite web |author=Edwards |first=Benj |date=2024-05-13 |title=Before launching, GPT-4o broke records on chatbot leaderboard under a secret name |url=https://arstechnica.com/information-technology/2024/05/before-launching-gpt-4o-broke-records-on-chatbot-leaderboard-under-a-secret-name/ |access-date=2024-05-17 |website=Ars Technica |language=en-us}}</ref>


2024年5月7日には、[[サム・アルトマン]]は「im-a-good-gpt2-chatbot」と[[ツイート]]した。これは、これらのモデルが[[A/Bテスト]]されている新しいモデルであることの確認として解釈された。。<ref>{{Cite web |author=Zeff |first=Maxwell |date=2024-05-07 |title=Powerful New Chatbot Mysteriously Returns in the Middle of the Night |url=https://gizmodo.com/powerful-new-gpt2-chatbot-mysteriously-returns-1851460717 |access-date=2024-05-17 |website=Gizmodo |language=en}}</ref>
2024年5月7日には、[[サム・アルトマン]]は「im-a-good-gpt2-chatbot」と[[ツイート]]した。これは、これらのモデルが[[A/Bテスト]]されている新しいモデルであることの確認として解釈された<ref>{{Cite web |author=Zeff |first=Maxwell |date=2024-05-07 |title=Powerful New Chatbot Mysteriously Returns in the Middle of the Night |url=https://gizmodo.com/powerful-new-gpt2-chatbot-mysteriously-returns-1851460717 |access-date=2024-05-17 |website=Gizmodo |language=en}}</ref>


== 能力 ==
== 能力 ==
GPT-4oは、音声、多言語、画像認識ベンチマークで最先端の結果を達成し、また音声音声認識と翻訳に関する分野で新記録を樹立した<ref>{{Cite web |author=van Rijmenam |first=Mark |date=13 May 2024 |title=OpenAI Launched GPT-4o: The Future of AI Interactions Is Here |url=https://www.thedigitalspeaker.com/openai-gpt4o-future-ai-interactions/ |access-date=17 May 2024 |website=The Digital Speaker}}</ref><ref>{{Cite web |author=Daws |first=Ryan |date=2024-05-14 |title=GPT-4o delivers human-like AI interaction with text, audio, and vision integration |url=https://www.artificialintelligence-news.com/2024/05/14/gpt-4o-human-like-ai-interaction-text-audio-vision-integration/ |access-date=2024-05-18 |website=AI News |language=en-GB}}</ref> また、GPT-4oは、Massive Multitask Language Understanding(MMLU)ベンチマークで88.7というスコアを取得した。GPT-4は86.5である<ref name="Hello GPT-4o">{{Cite web |title=Hello GPT-4o |url=https://openai.com/index/hello-gpt-4o/ |website=OpenAI |access-date=2024/6/7}}</ref>
GPT-4oは、音声、多言語、画像認識ベンチマークで最先端の結果を達成し、また音声音声認識と翻訳に関する分野で新記録を樹立した<ref>{{Cite web |author=van Rijmenam |first=Mark |date=13 May 2024 |title=OpenAI Launched GPT-4o: The Future of AI Interactions Is Here |url=https://www.thedigitalspeaker.com/openai-gpt4o-future-ai-interactions/ |access-date=17 May 2024 |website=The Digital Speaker}}</ref><ref>{{Cite web |author=Daws |first=Ryan |date=2024-05-14 |title=GPT-4o delivers human-like AI interaction with text, audio, and vision integration |url=https://www.artificialintelligence-news.com/2024/05/14/gpt-4o-human-like-ai-interaction-text-audio-vision-integration/ |access-date=2024-05-18 |website=AI News |language=en-GB}}</ref>また、GPT-4oは、Massive Multitask Language Understanding(MMLU)ベンチマークで88.7というスコアを取得した。GPT-4は86.5である<ref name="Hello GPT-4o">{{Cite web |title=Hello GPT-4o |url=https://openai.com/index/hello-gpt-4o/ |website=OpenAI |access-date=2024/6/7}}</ref>


GPT-3.5やGPT-4は、音声認識をする際に異なるモデルを使用している。一方GPT-4oは言語モデルとして voice-to-voice に対応しているため、応答をほぼより速く生成することができる<ref name="Hello GPT-4o" /> しかし、[[サム・アルトマン]]は2024年5月15日に、GPT-4oのこの機能はまだChatGPTに搭載されていないため、従来の方法が使用されている可能性があるとした。。<ref>{{Cite news |date=2024-05-16 |title=OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman |url=https://timesofindia.indiatimes.com/technology/tech-news/watch-samsung-makes-fun-of-apple-says-we-would-never-crush-creativity/articleshow/110172573.cms |access-date=2024-05-18 |newspaper=The Times of India |issn=0971-8257}}</ref>
GPT-3.5やGPT-4は、音声認識をする際に異なるモデルを使用している。一方GPT-4oは言語モデルとしてvoice-to-voiceに対応しているため、応答をほぼより速く生成することができる<ref name="Hello GPT-4o" />しかし、[[サム・アルトマン]]は2024年5月15日に、GPT-4oのこの機能はまだChatGPTに搭載されていないため、従来の方法が使用されている可能性があるとした<ref>{{Cite news |date=2024-05-16 |title=OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman |url=https://timesofindia.indiatimes.com/technology/tech-news/watch-samsung-makes-fun-of-apple-says-we-would-never-crush-creativity/articleshow/110172573.cms |access-date=2024-05-18 |newspaper=The Times of India |issn=0971-8257}}</ref>


GPT-4o は50以上の言語に対応していて<ref name="TechCrunch">{{Cite web |author=Wiggers |first=Kyle |date=2024-05-13 |title=OpenAI debuts GPT-4o 'omni' model now powering ChatGPT |url=https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/ |access-date=2024-05-13 |website=TechCrunch |language=en-US}}</ref> これは世界の言語話者の97%以上に及んでいると OpenAI は主張している<ref>{{Cite web |author=Edwards |first=Benj |date=2024-05-13 |title=Major ChatGPT-4o update allows audio-video talks with an “emotional” AI chatbot |url=https://arstechnica.com/information-technology/2024/05/chatgpt-4o-lets-you-have-real-time-audio-video-conversations-with-emotional-chatbot/ |access-date=2024-05-17 |website=Ars Technica |language=en-us}}</ref> ミラ・ムラティは、2024年5月13日のOpenAIの配信において、モデルにイタリア語を伝え、それを英語とイタリア語に翻訳することで、モデルの多言語能力を実証していた。さらに、
GPT-4oは50以上の言語に対応していて<ref name="TechCrunch">{{Cite web |author=Wiggers |first=Kyle |date=2024-05-13 |title=OpenAI debuts GPT-4o 'omni' model now powering ChatGPT |url=https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/ |access-date=2024-05-13 |website=TechCrunch |language=en-US}}</ref>これは世界の言語話者の97%以上に及んでいるとOpenAIは主張している<ref>{{Cite web |author=Edwards |first=Benj |date=2024-05-13 |title=Major ChatGPT-4o update allows audio-video talks with an “emotional” AI chatbot |url=https://arstechnica.com/information-technology/2024/05/chatgpt-4o-lets-you-have-real-time-audio-video-conversations-with-emotional-chatbot/ |access-date=2024-05-17 |website=Ars Technica |language=en-us}}</ref>ミラ・ムラティは、2024年5月13日のOpenAIの配信において、モデルにイタリア語を伝え、それを英語とイタリア語に翻訳することで、モデルの多言語能力を実証していた。


さらに、GPT-4o の新しいトークナイザーは、特にラテンアルファベットに基づいていない言語などに使用するトークンが少ないという特徴がある。そのため、それらの言語を使用するときのコストを抑えることができる{{R|"Hello GPT-4o"}}
さらに、GPT-4oの新しいトークナイザーは、特にラテンアルファベットに基づいていない言語などに使用するトークンが少ないという特徴がある。そのため、それらの言語を使用するときのコストを抑えることができる{{R|"Hello GPT-4o"}}


GPT-4o は2023年10月までの学習データを保有している<ref name=":0">{{Cite web |title=Models - OpenAI API |url=https://platform.openai.com/docs/models/gpt-4o |access-date=17 May 2024 |website=OpenAI}}</ref><ref name=":1">{{Cite web |author=Conway |first=Adam |date=2024-05-13 |title=What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free |url=https://www.xda-developers.com/gpt-4o/ |access-date=2024-05-17 |website=XDA Developers |language=en}}</ref> さらに、12万8000(128k)トークンのコンテキスト長に対応していて、<ref name=":0" /> また2048トークンまでを出力できる<ref name=":1" />
GPT-4oは2023年10月までの学習データを保有している<ref name=":0">{{Cite web |title=Models - OpenAI API |url=https://platform.openai.com/docs/models/gpt-4o |access-date=17 May 2024 |website=OpenAI}}</ref><ref name=":1">{{Cite web |author=Conway |first=Adam |date=2024-05-13 |title=What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free |url=https://www.xda-developers.com/gpt-4o/ |access-date=2024-05-17 |website=XDA Developers |language=en}}</ref>さらに、12万8000 (128k) トークンのコンテキスト長に対応していて、<ref name=":0" /> また2048トークンまでを出力できる<ref name=":1" />


2024年5月現在、[[カルフォルニア大学バークレー校]] Large Model Systems Organization (LMSYS) [[イロレーティング]]ベンチマークに含まれている<ref>{{Cite web |author=Franzen |first=Carl |date=2024-05-13 |title=OpenAI announces new free model GPT-4o and ChatGPT for desktop |url=https://venturebeat.com/ai/openai-announces-new-free-model-gpt-4o-and-chatgpt-for-desktop/ |access-date=2024-05-18 |website=VentureBeat |language=en-US}}</ref>
2024年5月現在、[[カルフォルニア大学バークレー校]]のLarge Model Systems Organization (LMSYS) [[イロレーティング]]ベンチマークに含まれている<ref>{{Cite web |author=Franzen |first=Carl |date=2024-05-13 |title=OpenAI announces new free model GPT-4o and ChatGPT for desktop |url=https://venturebeat.com/ai/openai-announces-new-free-model-gpt-4o-and-chatgpt-for-desktop/ |access-date=2024-05-18 |website=VentureBeat |language=en-US}}</ref>


=== 音声に関する論争 ===
=== 音声に関する論争 ===
GPT-4o の声として、Breeze, Cove, Ember, Juniper, Sky を提供した。リリースされた後にこのうちの Sky の声が、 [[スカーレット・ヨハンソン]] に似ているとされた。5月14日、エンターテインメント・ウィークリー誌は、この類似点は意図的なものなのかどうかを記述した<ref>{{Cite web |author=Stenzel |first=Wesley |date=May 14, 2024 |title=ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose? |url=https://ew.com/chatgpt-talking-ai-sounds-just-like-scarlett-johansson-in-her-8648678 |access-date=2024-05-21 |website=Entertainment Weekly |language=en}}</ref> 2024年5月18日には、ヨハンソンの夫である Colin Jost が、 [[サタデー・ナイト・ライブ]]でそれに関するジョークを言った<ref>{{Cite web |author=Caruso |first=Nick |date=2024-05-20 |title=Scarlett Johansson Says She Was ‘Shocked, Angered and in Disbelief’ After Hearing ChatGPT Voice That Sounds Like Her — Read Statement |url=https://tvline.com/news/scarlett-johansson-chatgpt-voice-openai-snl-joke-1235243988/ |access-date=2024-05-21 |website=TVLine |language=en-US}}</ref> 5月20日、OpenAIはSkyを無効にし、「ChatGPT、特にSkyの声をどのように学習したかについて質問をもらった。私たちは、それらに対処しながら、Skyの使用を一時停止している」と声明を出した<ref name=":2">{{Cite web |date=May 19, 2024 |title=How the voices for ChatGPT were chosen |url=https://openai.com/index/how-the-voices-for-chatgpt-were-chosen/ |website=OpenAI |access-date=2024/6/7}}</ref>
GPT-4oの声として、BreezeCoveEmberJuniperSkyを提供した。リリースされた後にこのうちのSkyの声が、 [[スカーレット・ヨハンソン]]に似ているとされた。5月14日、エンターテインメント・ウィークリー誌は、この類似点は意図的なものなのかどうかを記述した<ref>{{Cite web |author=Stenzel |first=Wesley |date=May 14, 2024 |title=ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose? |url=https://ew.com/chatgpt-talking-ai-sounds-just-like-scarlett-johansson-in-her-8648678 |access-date=2024-05-21 |website=Entertainment Weekly |language=en}}</ref>2024年5月18日には、ヨハンソンの夫であるColin Jostが、 [[サタデー・ナイト・ライブ]]でそれに関するジョークを言った<ref>{{Cite web |author=Caruso |first=Nick |date=2024-05-20 |title=Scarlett Johansson Says She Was ‘Shocked, Angered and in Disbelief’ After Hearing ChatGPT Voice That Sounds Like Her — Read Statement |url=https://tvline.com/news/scarlett-johansson-chatgpt-voice-openai-snl-joke-1235243988/ |access-date=2024-05-21 |website=TVLine |language=en-US}}</ref>5月20日、OpenAIはSkyを無効にし、「ChatGPT、特にSkyの声をどのように学習したかについて質問をもらった。私たちは、それらに対処しながら、Skyの使用を一時停止している」と声明を出した<ref name=":2">{{Cite web |date=May 19, 2024 |title=How the voices for ChatGPT were chosen |url=https://openai.com/index/how-the-voices-for-chatgpt-were-chosen/ |website=OpenAI |access-date=2024/6/7}}</ref>


スカーレット・ヨハンソンは、2013年にスパイク・ジョーンズのSF映画「Her」に主演し、女性の声の賢いバーチャルアシスタントであるサマンサを演じた。
スカーレット・ヨハンソンは、2013年にスパイク・ジョーンズのSF映画「Her」に主演し、女性の声の賢いバーチャルアシスタントであるサマンサを演じた。


GPT-4oのリリースの前のプロモーションの一環として、サム・アルトマンは5月13日に「Her」とをツイートした<ref>{{Cite web |date=May 13, 2024 |title=her |url=https://x.com/sama/status/1790075827666796666?lang=en |access-date=2024-05-21 |website=X (formerly Twitter)}}</ref><ref name=":3">{{Cite news |last=Allyn |first=Bobby |date=May 20, 2024 |title=Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice |url=https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-compared-to-scarlett-johansson-in-the-movie-her |newspaper=NPR}}</ref>
GPT-4oのリリースの前のプロモーションの一環として、サム・アルトマンは5月13日に「Her」とをツイートした<ref>{{Cite web |date=May 13, 2024 |title=her |url=https://x.com/sama/status/1790075827666796666?lang=en |access-date=2024-05-21 |website=X (formerly Twitter)}}</ref><ref name=":3">{{Cite news |last=Allyn |first=Bobby |date=May 20, 2024 |title=Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice |url=https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-compared-to-scarlett-johansson-in-the-movie-her |newspaper=NPR}}</ref>


OpenAIは、それぞれの声は雇われた声優によるものだと主張し、具体的には、「スカイの声はスカーレット・ヨハンソンの真似ではなく、別のプロの声優が声優自身の自然な話し声を使って作ったものだ」と主張した{{R|":2"}} OpenAIはすでに2023年9月に、ChatGPTアシスタントの近々登場する新しい会話バージョンはスカーレット・ヨハンソンに似せることを意図したものではないと主張した。
OpenAIは、それぞれの声は雇われた声優によるものだと主張し、具体的には、「スカイの声はスカーレット・ヨハンソンの真似ではなく、別のプロの声優が声優自身の自然な話し声を使って作ったものだ」と主張した{{R|":2"}}OpenAIはすでに2023年9月に、ChatGPTアシスタントの近々登場する新しい会話バージョンはスカーレット・ヨハンソンに似せることを意図したものではないと主張した。


CTOのミラ・ムラティ氏は、その声について分からないので、実際にスカーレット・ヨハンソンの声を聞きに行かなければならなかったと述べた。OpenAIはさらに、ヨハンソンに連絡する前に声優を募集したと主張した<ref name="wp">{{Cite news |last=Ovide |first=Shira |title=Perspective {{!}} Exactly how stupid was what OpenAI did to Scarlett Johansson? |url=https://www.washingtonpost.com/technology/2024/05/21/chatgpt-voice-scarlett-johansson/ |newspaper=Washington Post |date=30 May 2024}}</ref> <ref name=":3">{{Cite news |last=Allyn |first=Bobby |date=May 20, 2024 |title=Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice |url=https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-compared-to-scarlett-johansson-in-the-movie-her |newspaper=NPR}}</ref>
CTOのミラ・ムラティ氏は、その声について分からないので、実際にスカーレット・ヨハンソンの声を聞きに行かなければならなかったと述べた。OpenAIはさらに、ヨハンソンに連絡する前に声優を募集したと主張した<ref name="wp">{{Cite news |last=Ovide |first=Shira |title=Perspective {{!}} Exactly how stupid was what OpenAI did to Scarlett Johansson? |url=https://www.washingtonpost.com/technology/2024/05/21/chatgpt-voice-scarlett-johansson/ |newspaper=Washington Post |date=30 May 2024}}</ref><ref name=":3">{{Cite news |last=Allyn |first=Bobby |date=May 20, 2024 |title=Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice |url=https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-compared-to-scarlett-johansson-in-the-movie-her |newspaper=NPR}}</ref>


この事件に対して人々は、ヨハンソンが以前、マーベル映画『[[ブラック・ウィドウ]]』のストリーミング配信をめぐる契約違反で[[ウォルト・ディズニー社]]を訴えて和解した経緯との類似点を指摘した。この和解でヨハンソンは4000万ドルほどを手にしたと推測されている<ref>{{Cite web |date=2024-05-21 |title=Scarlett Johansson took on Disney. Now she’s battling OpenAI over a ChatGPT voice that sounds like hers |url=https://ca.finance.yahoo.com/news/scarlett-johansson-took-disney-now-130511407.html |access-date=2024-05-21 |website=Yahoo Finance |language=en-CA}}</ref><ref>{{Cite news |last=Pulver |first=Andrew |date=2021-10-01 |title=Scarlett Johansson settles Black Widow lawsuit with Disney |url=https://www.theguardian.com/film/2021/oct/01/scarlett-johansson-settles-black-widow-lawsuit-disney |access-date=2024-05-21 |newspaper=The Guardian |language=en-GB |issn=0261-3077}}</ref>
この事件に対して人々は、ヨハンソンが以前、マーベル映画『[[ブラック・ウィドウ]]』のストリーミング配信をめぐる契約違反で[[ウォルト・ディズニー社]]を訴えて和解した経緯との類似点を指摘した。この和解でヨハンソンは4000万ドルほどを手にしたと推測されている<ref>{{Cite web |date=2024-05-21 |title=Scarlett Johansson took on Disney. Now she’s battling OpenAI over a ChatGPT voice that sounds like hers |url=https://ca.finance.yahoo.com/news/scarlett-johansson-took-disney-now-130511407.html |access-date=2024-05-21 |website=Yahoo Finance |language=en-CA}}</ref><ref>{{Cite news |last=Pulver |first=Andrew |date=2021-10-01 |title=Scarlett Johansson settles Black Widow lawsuit with Disney |url=https://www.theguardian.com/film/2021/oct/01/scarlett-johansson-settles-black-widow-lawsuit-disney |access-date=2024-05-21 |newspaper=The Guardian |language=en-GB |issn=0261-3077}}</ref>


また、5月21日にはワシントンポストの Shira Ovide 記者がテクノロジー企業による「most bone-headed self-owns」(最も間抜けな自己所有)のリストを発表し、ヨハンソンの不同意にもかかわらずヨハンソンに似た声を採用し、その後類似点を否定した決定は6位にランクされた<ref name="wp">{{Cite news |last=Ovide |first=Shira |title=Perspective {{!}} Exactly how stupid was what OpenAI did to Scarlett Johansson? |url=https://www.washingtonpost.com/technology/2024/05/21/chatgpt-voice-scarlett-johansson/ |newspaper=Washington Post |date=30 May 2024}}</ref> 5月24日、[[ポリティコ]]のデレク・ロバートソン氏は「massive backlash (大規模な反発)」について書き、「世界で最も有名な映画スターの一人の声を盗用することは、 AI への過度の依存についての警告となるこの映画に関連しているが、すぐに世論をサム・アルトマン氏の主張に引き戻すのに役立つ可能性は低い」と結論付けた<ref>{{Cite web |url=https://www.politico.com/news/magazine/2024/05/22/scarlett-johansson-sam-altmans-washington-00159507 |title=Sam Altman’s Scarlett Johansson Blunder Just Made AI a Harder Sell in DC - POLITICO |access-date=2024/6/7}}</ref>
また、5月21日にはワシントンポストのShira Ovide記者がテクノロジー企業による「most bone-headed self-owns」最も間抜けな自己所有のリストを発表し、ヨハンソンの不同意にもかかわらずヨハンソンに似た声を採用し、その後類似点を否定した決定は6位にランクされた<ref name="wp">{{Cite news |last=Ovide |first=Shira |title=Perspective {{!}} Exactly how stupid was what OpenAI did to Scarlett Johansson? |url=https://www.washingtonpost.com/technology/2024/05/21/chatgpt-voice-scarlett-johansson/ |newspaper=Washington Post |date=30 May 2024}}</ref>5月24日、[[ポリティコ]]のデレク・ロバートソン氏は「massive backlash(大規模な反発」について書き、「世界で最も有名な映画スターの一人の声を盗用することは、 AI への過度の依存についての警告となるこの映画に関連しているが、すぐに世論をサム・アルトマン氏の主張に引き戻すのに役立つ可能性は低い」と結論付けた<ref>{{Cite web |url=https://www.politico.com/news/magazine/2024/05/22/scarlett-johansson-sam-altmans-washington-00159507 |title=Sam Altman’s Scarlett Johansson Blunder Just Made AI a Harder Sell in DC - POLITICO |access-date=2024/6/7}}</ref>

== 関連記事 ==


== 関連項目 ==
* [[LLaMA]]
* [[LLaMA]]
* [[ChatGPT]]
* [[ChatGPT]]
* [[GPT-4]]
* [[GPT-4]]
* [[GPT-3.5]]
* [[OpenAI]]
* [[OpenAI]]


== 出典 ==
== 出典 ==
<references />
<references />

[[Category:OpenAI]]
[[Category:OpenAI]]
[[Category:2024年のソフトウェア]]
[[Category:2024年のソフトウェア]]

2024年6月12日 (水) 01:48時点における最新版

Generative Pre-trained Transformer 4 Omni (GPT-4o)
開発元 OpenAI
初版 2024年5月13日 (2か月前) (2024-05-13)
前身 GPT-4 Turbo
種別
ライセンス プロプライエタリ
公式サイト openai.com/index/hello-gpt-4o
テンプレートを表示

GPT-4o (GPT-4 Omni) は、OpenAIによって作られた多言語対応かつマルチモーダルなGPTである。

2024年5月13日の配信でOpenAIのCTOであるミラ・ムラティによって発表され、その日にリリースされた[1]

GPT-4oは無料で使用することができるが、制限が存在する。ChatGPT Plusのユーザーは、制限が5倍に緩和される[2]

GPT-4oはテキスト、画像、音声を入力および生成することが可能である[3]

APIでは、GPT-4 Turboの半分の価格で2倍の速度で使用できる[1]

音声入力には最短232ミリ秒で応答でき、平均320ミリ秒で人間の応答時間に近い応答が可能である[4]

背景[編集]

もともと、GPT-4oはLarge Model Systems Organization's (LMSYS) のチャットボットとして、gpt2-chatbot、im-a-good-gpt2-chatbot、im-also-a-good-gpt2-chatbotの3つの異なるモデルとしてひそかにリリースされた[5]

2024年5月7日には、サム・アルトマンは「im-a-good-gpt2-chatbot」とツイートした。これは、これらのモデルがA/Bテストされている新しいモデルであることの確認として解釈された[6]

能力[編集]

GPT-4oは、音声、多言語、画像認識ベンチマークで最先端の結果を達成し、また音声音声認識と翻訳に関する分野で新記録を樹立した[7][8]。また、GPT-4oは、Massive Multitask Language Understanding(MMLU)ベンチマークで88.7というスコアを取得した。GPT-4は86.5である[9]

GPT-3.5やGPT-4は、音声認識をする際に異なるモデルを使用している。一方GPT-4oは言語モデルとしてvoice-to-voiceに対応しているため、応答をほぼより速く生成することができる[9]。しかし、サム・アルトマンは2024年5月15日に、GPT-4oのこの機能はまだChatGPTに搭載されていないため、従来の方法が使用されている可能性があるとした[10]

GPT-4oは50以上の言語に対応していて[1]、これは世界の言語話者の97%以上に及んでいるとOpenAIは主張している[11]。ミラ・ムラティは、2024年5月13日のOpenAIの配信において、モデルにイタリア語を伝え、それを英語とイタリア語に翻訳することで、モデルの多言語能力を実証していた。

さらに、GPT-4oの新しいトークナイザーは、特にラテンアルファベットに基づいていない言語などに使用するトークンが少ないという特徴がある。そのため、それらの言語を使用するときのコストを抑えることができる[9]

GPT-4oは2023年10月までの学習データを保有している[12][13]。さらに、12万8000 (128k) トークンのコンテキスト長に対応していて、[12] また2048トークンまでを出力できる[13]

2024年5月現在、カルフォルニア大学バークレー校のLarge Model Systems Organization (LMSYS) イロレーティングベンチマークに含まれている[14]

音声に関する論争[編集]

GPT-4oの声として、Breeze、Cove、Ember、Juniper、Skyを提供した。リリースされた後にこのうちのSkyの声が、 スカーレット・ヨハンソンに似ているとされた。5月14日、エンターテインメント・ウィークリー誌は、この類似点は意図的なものなのかどうかを記述した[15]。2024年5月18日には、ヨハンソンの夫であるColin Jostが、 サタデー・ナイト・ライブでそれに関するジョークを言った[16]。5月20日、OpenAIはSkyを無効にし、「ChatGPT、特にSkyの声をどのように学習したかについて質問をもらった。私たちは、それらに対処しながら、Skyの使用を一時停止している」と声明を出した[17]

スカーレット・ヨハンソンは、2013年にスパイク・ジョーンズのSF映画「Her」に主演し、女性の声の賢いバーチャルアシスタントであるサマンサを演じた。

GPT-4oのリリースの前のプロモーションの一環として、サム・アルトマンは5月13日に「Her」とをツイートした[18][19]

OpenAIは、それぞれの声は雇われた声優によるものだと主張し、具体的には、「スカイの声はスカーレット・ヨハンソンの真似ではなく、別のプロの声優が声優自身の自然な話し声を使って作ったものだ」と主張した[17]。OpenAIはすでに2023年9月に、ChatGPTアシスタントの近々登場する新しい会話バージョンはスカーレット・ヨハンソンに似せることを意図したものではないと主張した。

CTOのミラ・ムラティ氏は、その声について分からないので、実際にスカーレット・ヨハンソンの声を聞きに行かなければならなかったと述べた。OpenAIはさらに、ヨハンソンに連絡する前に声優を募集したと主張した[20][19]

この事件に対して人々は、ヨハンソンが以前、マーベル映画『ブラック・ウィドウ』のストリーミング配信をめぐる契約違反でウォルト・ディズニー社を訴えて和解した経緯との類似点を指摘した。この和解でヨハンソンは4000万ドルほどを手にしたと推測されている[21][22]

また、5月21日にはワシントンポストのShira Ovide記者がテクノロジー企業による「most bone-headed self-owns」(最も間抜けな自己所有)のリストを発表し、ヨハンソンの不同意にもかかわらずヨハンソンに似た声を採用し、その後類似点を否定した決定は6位にランクされた[20]。5月24日、ポリティコのデレク・ロバートソン氏は「massive backlash(大規模な反発)」について書き、「世界で最も有名な映画スターの一人の声を盗用することは、 AI への過度の依存についての警告となるこの映画に関連しているが、すぐに世論をサム・アルトマン氏の主張に引き戻すのに役立つ可能性は低い」と結論付けた[23]

関連項目[編集]

出典[編集]

  1. ^ a b c Wiggers (2024年5月13日). “OpenAI debuts GPT-4o 'omni' model now powering ChatGPT” (英語). TechCrunch. 2024年5月13日閲覧。
  2. ^ Field (2024年5月13日). “OpenAI launches new AI model GPT-4o and desktop version of ChatGPT” (英語). CNBC. 2024年5月14日閲覧。
  3. ^ Claburn. “OpenAI unveils GPT-4o, a fresh multimodal AI flagship model” (英語). The Register. 2024年5月18日閲覧。
  4. ^ Hello GPT-4”. OpenAI. 2024年6月8日閲覧。
  5. ^ Edwards (2024年5月13日). “Before launching, GPT-4o broke records on chatbot leaderboard under a secret name” (英語). Ars Technica. 2024年5月17日閲覧。
  6. ^ Zeff (2024年5月7日). “Powerful New Chatbot Mysteriously Returns in the Middle of the Night” (英語). Gizmodo. 2024年5月17日閲覧。
  7. ^ van Rijmenam (2024年5月13日). “OpenAI Launched GPT-4o: The Future of AI Interactions Is Here”. The Digital Speaker. 2024年5月17日閲覧。
  8. ^ Daws (2024年5月14日). “GPT-4o delivers human-like AI interaction with text, audio, and vision integration” (英語). AI News. 2024年5月18日閲覧。
  9. ^ a b c Hello GPT-4o”. OpenAI. 2024年6月7日閲覧。
  10. ^ “OpenAI GPT-4o: How to access GPT-4o voice mode; insights from Sam Altman”. The Times of India. (2024年5月16日). ISSN 0971-8257. https://timesofindia.indiatimes.com/technology/tech-news/watch-samsung-makes-fun-of-apple-says-we-would-never-crush-creativity/articleshow/110172573.cms 2024年5月18日閲覧。 
  11. ^ Edwards (2024年5月13日). “Major ChatGPT-4o update allows audio-video talks with an “emotional” AI chatbot” (英語). Ars Technica. 2024年5月17日閲覧。
  12. ^ a b Models - OpenAI API”. OpenAI. 2024年5月17日閲覧。
  13. ^ a b Conway (2024年5月13日). “What is GPT-4o? Everything you need to know about the new OpenAI model that everyone can use for free” (英語). XDA Developers. 2024年5月17日閲覧。
  14. ^ Franzen (2024年5月13日). “OpenAI announces new free model GPT-4o and ChatGPT for desktop” (英語). VentureBeat. 2024年5月18日閲覧。
  15. ^ Stenzel (2024年5月14日). “ChatGPT launching talking AI that sounds exactly like Scarlett Johansson in 'Her' — on purpose?” (英語). Entertainment Weekly. 2024年5月21日閲覧。
  16. ^ Caruso (2024年5月20日). “Scarlett Johansson Says She Was ‘Shocked, Angered and in Disbelief’ After Hearing ChatGPT Voice That Sounds Like Her — Read Statement” (英語). TVLine. 2024年5月21日閲覧。
  17. ^ a b How the voices for ChatGPT were chosen”. OpenAI (2024年5月19日). 2024年6月7日閲覧。
  18. ^ her”. X (formerly Twitter) (2024年5月13日). 2024年5月21日閲覧。
  19. ^ a b Allyn, Bobby (2024年5月20日). “Scarlett Johansson says she is 'shocked, angered' over new ChatGPT voice”. NPR. https://www.npr.org/2024/05/20/1252495087/openai-pulls-ai-voice-that-was-compared-to-scarlett-johansson-in-the-movie-her 
  20. ^ a b Ovide, Shira (2024年5月30日). “Perspective | Exactly how stupid was what OpenAI did to Scarlett Johansson?”. Washington Post. https://www.washingtonpost.com/technology/2024/05/21/chatgpt-voice-scarlett-johansson/ 
  21. ^ Scarlett Johansson took on Disney. Now she’s battling OpenAI over a ChatGPT voice that sounds like hers” (英語). Yahoo Finance (2024年5月21日). 2024年5月21日閲覧。
  22. ^ Pulver, Andrew (2021年10月1日). “Scarlett Johansson settles Black Widow lawsuit with Disney” (英語). The Guardian. ISSN 0261-3077. https://www.theguardian.com/film/2021/oct/01/scarlett-johansson-settles-black-widow-lawsuit-disney 2024年5月21日閲覧。 
  23. ^ Sam Altman’s Scarlett Johansson Blunder Just Made AI a Harder Sell in DC - POLITICO”. 2024年6月7日閲覧。