港股概念追蹤 | ChatGPT重磅更新!將推出新的語(yǔ)音和圖像功能 機(jī)構(gòu):AI技術(shù)持續(xù)迭代再翻新一頁(yè)(附概念股)
摘要: 獲悉,9月26日消息,OpenAI宣布,在接下來(lái)的兩周內(nèi)將在ChatGPT中向Plus和Enterprise用戶推出語(yǔ)音和圖像。語(yǔ)音將在iOS和Android上推出,圖像將在所有平臺(tái)上提供。
獲悉,9月26日消息,OpenAI宣布,在接下來(lái)的兩周內(nèi)將在ChatGPT中向Plus和Enterprise用戶推出語(yǔ)音和圖像。語(yǔ)音將在iOS和Android上推出,圖像將在所有平臺(tái)上提供。國(guó)盛證券分析稱,ChatGPT即將開放圖生文及語(yǔ)音對(duì)話功能,AI技術(shù)持續(xù)迭代再翻新一頁(yè)。二級(jí)市場(chǎng)方面,今日Chatgpt概念走強(qiáng),A股海天瑞聲(688787.SH)、萬(wàn)興科技(300624)(300624.SZ)均收20%漲停板。
據(jù)OpenAI介紹,新的語(yǔ)音功能由一個(gè)新的文本到語(yǔ)音模型提供支持,該模型能夠從文本和幾秒鐘的語(yǔ)音樣本生成“類似人類的音頻”。OpenAI似乎還認(rèn)為該模型的潛力不止于此,其正在與流媒體音樂(lè)服務(wù)平臺(tái)Spotify合作,將播客翻譯成其他語(yǔ)言,同時(shí)保持播音者的聲音。合成語(yǔ)音有許多有趣的用途,而OpenAI可能會(huì)成為該行業(yè)的重要組成部分。
圖像搜索方面,有點(diǎn)類似于Google Lens的功能,用戶拍攝自己感興趣的任何東西的照片,ChatGPT去嘗試了解用戶在詢問(wèn)什么,并做出相應(yīng)的回應(yīng)。用戶還可以使用應(yīng)用程序的繪圖工具幫助明晰自己的訴求,或配合圖像進(jìn)行說(shuō)話或?qū)懭雴?wèn)題。
結(jié)合官方發(fā)布的視頻和博客,華泰證券總結(jié)了新版ChatGPT超預(yù)期的多模態(tài)能力:
1)支持用戶同時(shí)上傳多張圖像,并以自然語(yǔ)言的方式提問(wèn),ChatGPT將結(jié)合文字與圖像多模態(tài)進(jìn)行理解和回答,幫助用戶分析日常生活中的問(wèn)題和工作中的圖表等復(fù)雜數(shù)據(jù)。
2)ChatGPT手機(jī)App內(nèi)置了繪圖工具,支持用戶標(biāo)注圖像中的具體對(duì)象,讓ChatGPT聚焦性的推理作答。
3)賦予了ChatGPT語(yǔ)音輸出能力,結(jié)合之前已集成的Whisper語(yǔ)音識(shí)別能力,實(shí)現(xiàn)了ChatGPT和用戶的完整語(yǔ)音對(duì)話,并支持5種音色。
華泰證券研報(bào)指出,大模型向智能終端側(cè)部署是模型應(yīng)用的重要方向之一。本次ChatGPT更新,完整的語(yǔ)音和多模態(tài)識(shí)圖能力率先在手機(jī)端實(shí)現(xiàn),而PC端的語(yǔ)音功能將被延后,智能終端對(duì)多模態(tài)的支持能力優(yōu)勢(shì)開始顯現(xiàn)。從OpenAI官方介紹視頻和文檔看,多模態(tài)ChatGPT已能夠較為全面的覆蓋用戶的生活和工作場(chǎng)景。未來(lái)隨著模型多模態(tài)能力的迭代完善,或能賦能機(jī)器人(300024)、汽車等更加復(fù)雜的智能終端,AGI更進(jìn)一步。
除OpenAI之外,國(guó)內(nèi)外各大廠也不斷迎來(lái)行業(yè)利好。7月13日,網(wǎng)信辦等七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》。8月31日起,百度文心一言、訊飛星火等大模型正式向公眾開放。9月5日,WPS AI正式面向社會(huì)開放,率先應(yīng)用在WPS智能文檔。

9月21日,微軟舉行了秋季發(fā)布會(huì),在發(fā)布會(huì)上微軟宣布將于本月26日發(fā)布Windows 11的下一個(gè)大更新23H2,據(jù)介紹本次系統(tǒng)更新將會(huì)有超過(guò)150項(xiàng)新功能,包括新的人工智能驅(qū)動(dòng)的Windows Copilot功能。
中泰證券指出,人工智能新一輪十年級(jí)的技術(shù)和產(chǎn)業(yè)革命大幕已經(jīng)拉開,短期調(diào)整并不影響產(chǎn)業(yè)的長(zhǎng)期投資機(jī)會(huì),當(dāng)前海外已經(jīng)開始進(jìn)入商業(yè)落地階段,ChatGPT、Midjourney等現(xiàn)象級(jí)爆品出現(xiàn),微軟、Adobe、Salesforce、Zoom等軟件巨頭亦紛紛推出商業(yè)化產(chǎn)品,靜待數(shù)據(jù)的持續(xù)驗(yàn)證;國(guó)內(nèi)短期看算力最確定,模型訓(xùn)練拉動(dòng)訓(xùn)練算力需求,未來(lái)應(yīng)用大規(guī)模興起亦會(huì)拉動(dòng)推理算力需求,大模型仍處于群雄逐鹿、快速迭代階段,未來(lái)空間大且會(huì)格局收斂,應(yīng)用端長(zhǎng)期空間最大,廠商百花齊放。
相關(guān)概念股:
百度集團(tuán)-SW(09888):8月16日,據(jù)百度首席技術(shù)官王海峰介紹,百度旗下的深度學(xué)習(xí)平臺(tái)“飛槳”已擁有800萬(wàn)開發(fā)者,服務(wù)22萬(wàn)家企事業(yè)單位,同時(shí)基于飛槳?jiǎng)?chuàng)建了80萬(wàn)個(gè)模型。在大模型的效率提升方面,通過(guò)飛槳端到端自適應(yīng)混合并行訓(xùn)練技術(shù)以及壓縮、推理、服務(wù)部署的協(xié)同優(yōu)化,文心大模型訓(xùn)練速度達(dá)到原來(lái)的3倍,推理速度達(dá)到原來(lái)的30多倍。
阿里巴巴-SW(09988):阿里達(dá)摩院牽頭推出魔搭社區(qū)ModelScope社區(qū)首批上架超300個(gè)模型,其中中文模型超過(guò)100個(gè),覆蓋了視覺(jué)、語(yǔ)音、自然語(yǔ)言處理、多模態(tài)等 AI 主要領(lǐng)域,覆蓋主流任務(wù)超過(guò)60個(gè),均全面開源并開放使用。
商湯-W(00020):商湯科技在此前舉辦的技術(shù)交流日活動(dòng)上分享了以“大模型+大算力”推進(jìn)AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,并公布了商湯在該戰(zhàn)略下的“日日新SenseNova”大模型體系,推出自然語(yǔ)言處理、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種大模型及能力。同時(shí)還展示了AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成等一系列生成式AI模型及應(yīng)用。
模型,ChatGPT,OpenAI






