美國(guó)人工智慧研究實(shí)驗(yàn)室OpenAI在5/13舉辦線上發(fā)表會(huì),由OpenAI的技術(shù)總監(jiān)米拉穆拉蒂(Mira Murati)主持,推出新模型。GPT-4o的來(lái)自全能模型,能接受文字、聲音和圖像3種格式的輸入,最快更能夠在232毫秒內(nèi)回應(yīng),等同人類(lèi)反應(yīng)時(shí)間。最重要的是,拉穆拉蒂也宣布GPT-4o將免費(fèi)提供給所有用戶。
GPT-4o亮點(diǎn)|1. 擬真對(duì)話還能算數(shù)學(xué)
GPT-4o平均反應(yīng)時(shí)間是320毫秒,最快則可在232毫秒內(nèi)回應(yīng),與人類(lèi)的對(duì)話反應(yīng)時(shí)間相似,因此使用者與GPT-4o對(duì)話時(shí),無(wú)需等待延遲時(shí)間就能獲得即時(shí)回答。反應(yīng)時(shí)間縮短,GPT-4o能夠以更自然、就像人類(lèi)的聲音進(jìn)行互動(dòng),也能模仿機(jī)器人的語(yǔ)氣,或模擬人類(lèi)說(shuō)睡前故事,甚至也會(huì)唱歌。除了語(yǔ)音技術(shù)提升外,也進(jìn)化視覺(jué)化技術(shù),透過(guò)鏡頭能帶著使用者一步一步解開(kāi)數(shù)學(xué)題。
GPT-4o亮點(diǎn)|2.感測(cè)使用者情緒
GPT-3.5與GPT-4,是以三個(gè)獨(dú)立的模型構(gòu)成與使用者的對(duì)話,第一個(gè)模型將音訊轉(zhuǎn)換為文字,第二個(gè)模型輸出成文字,最后一個(gè)模型將文字轉(zhuǎn)換回音訊,這樣繁瑣的過(guò)程會(huì)讓GPT無(wú)法觀察到語(yǔ)調(diào)及情感等等。因此OpenAI特別在GPT-4o模型上進(jìn)行調(diào)整,輸入和輸出都由同一神經(jīng)網(wǎng)路處理后,能感測(cè)到使用者的,即使是對(duì)話過(guò)程中打岔GPT-4o,它也能迅速接上。
GPT-4o亮點(diǎn)|3.即時(shí)翻譯語(yǔ)言
GPT-4o語(yǔ)音技術(shù)的提升,不只在反應(yīng)速度與情緒感知,更能夠即時(shí)翻譯語(yǔ)言。在發(fā)表會(huì)上,米拉穆拉蒂與多模態(tài)與尖端研究部門(mén)主管Mark Chen分別以義大利文和英文交談,GPT-4o迅速將內(nèi)容翻譯成雙方各自的語(yǔ)言,展示強(qiáng)大的即時(shí)翻譯能力。
GPT-4o亮點(diǎn)|4.所有用戶免費(fèi)
米拉穆拉蒂宣布GPT-4o模型將開(kāi)放所有用戶免費(fèi)使用,針對(duì)付費(fèi)用戶則有5倍的容量上限,而預(yù)計(jì)未來(lái)幾周推出的GPT-4o alpha版,具有新版語(yǔ)音模式,將提供給ChatGPT Plus用戶。原先只有ChatGPT Plus用戶能使用的,也在GPT-4o免費(fèi)開(kāi)放后,同步免費(fèi)。除此之外,Mac用戶也有桌面版ChatGPT App可以使用, Windows用戶的版本則將在今年推出。
延伸閱讀:
【V V Vision數(shù)位潮】妳的ChatGPT無(wú)法通靈,別過(guò)度依賴(lài)AI!Threads加入NBA即時(shí)賽況更新!搜尋球隊(duì)就能掌握比分,關(guān)注賽事零時(shí)差Threads是什么?怎么用?10大功能懶人包,年輕Z世代愛(ài)用的文字版IG