新聞中心
News Center
11月26日消息,美國(guó)芯片制造商英偉達(dá)當(dāng)?shù)貢r(shí)間周一展示了一種能生成音樂(lè)和音頻的人工智能新模型。這種人工智能模型主要面向音樂(lè)、電影和視頻游戲的制作人,可以修改聲音并產(chǎn)生新奇音效。
英偉達(dá)目前是全球最大的人工智能系統(tǒng)芯片和軟件供應(yīng)商。公司表示,雖然這項(xiàng)名為“Fugatto”(Foundational Generative Audio Transformer Opus 1縮寫(xiě))的技術(shù)有發(fā)展?jié)摿?,但目前還沒(méi)有公開(kāi)發(fā)布這項(xiàng)技術(shù)的計(jì)劃?!癋ugatto”與Runway等初創(chuàng)公司和Meta等大科技公司展示的技術(shù)類(lèi)似,能夠根據(jù)文本提示內(nèi)容生成音頻或視頻。不過(guò),英偉達(dá)的新模型有自己的獨(dú)到之處:其可以根據(jù)文本描述生成特定音效和音樂(lè),比如讓小號(hào)發(fā)出像狗叫一樣的新奇聲音?!癋ugatto”與其他人工智能技術(shù)的不同之處在于,能夠消化和修改現(xiàn)有音頻。例如,它可以將鋼琴演奏的一段旋律轉(zhuǎn)換成人聲演唱,或者改變錄制音頻中的口音以及表達(dá)出來(lái)的情緒。
英偉達(dá)的新模型是用開(kāi)源數(shù)據(jù)訓(xùn)練的。公司表示,仍在討論是否以及如何公開(kāi)發(fā)布這項(xiàng)技術(shù)。
生成式人工智能模型的開(kāi)發(fā)者仍在探索如何防止用戶(hù)濫用技術(shù),比如該怎么杜絕用戶(hù)生成虛假信息或創(chuàng)造出受版權(quán)保護(hù)的角色、造成侵犯版權(quán)的行為等等。同樣,OpenAI和Meta也沒(méi)有宣布他們計(jì)劃什么時(shí)候向公眾發(fā)布能生成音頻或視頻的模型。