123,123

<bdo id="yw8g2"></bdo>

<bdo id="yw8g2"></bdo><center id="yw8g2"><tr id="yw8g2"></tr></center>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

英偉達發(fā)布全新 AI 音頻模型 Fugatto

2024-11-26 11:21

編譯/前方智能

英偉達近日推出了一款名為 Fugatto（全稱為 Foundational Generative Audio Transformer Opus 1）的 AI 音頻模型。這款模型不僅能通過文字提示生成音樂和音效，還能對現(xiàn)有音頻進行修改和轉(zhuǎn)換，創(chuàng)造出前所未有的聲音組合。

圖源：英偉達

據(jù)英偉達介紹，F(xiàn)ugatto 具備多項獨特功能，比如可以將鋼琴演奏的音樂轉(zhuǎn)換為人聲演唱，能夠調(diào)整語音的口音和情緒，甚至可以創(chuàng)造出"尖叫的薩克斯"或"犬吠般的小號聲"等超現(xiàn)實音效。該模型采用了創(chuàng)新的 ComposableART 技術(shù)，能夠?qū)⒂?xùn)練過程中分別出現(xiàn)的音頻特征進行組合，從而產(chǎn)生全新的聲音效果。

在技術(shù)層面，研究團隊使用了來自全球多個開源數(shù)據(jù)集的約 2000 萬個音頻樣本進行訓(xùn)練，形成了一個擁有 25 億參數(shù)的大規(guī)模模型。該項目由來自印度、巴西、中國、約旦和韓國等多個國家的研究人員共同開發(fā)，這種多元化的團隊構(gòu)成也使得模型在處理多語言和多重口音方面表現(xiàn)出色。

英偉達應(yīng)用深度學(xué)習(xí)研究副總裁 Bryan Catanzaro 表示，生成式 AI 技術(shù)將為音樂、游戲和普通創(chuàng)作者帶來全新的創(chuàng)作可能性。不過，考慮到生成式技術(shù)可能帶來的潛在風(fēng)險，英偉達目前尚未計劃對外發(fā)布這項技術(shù)。

原文標題 : 英偉達發(fā)布全新 AI 音頻模型 Fugatto

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

4日10日
立即報名>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
4日10日
立即報名>> OFweek 2026（第十五屆）中國機器人產(chǎn)業(yè)大會
4月17日
立即報名 >> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
精彩回顧
立即查看>> 【線下會議】OFweek 2025（第十屆）物聯(lián)網(wǎng)產(chǎn)業(yè)大會
精彩回顧
立即查看>> 12月16-17日 AMD 嵌入式峰會
精彩回顧
立即查看>> 恩智浦創(chuàng)新技術(shù)峰會

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號

感谢您访问我们的网站，您可能还对以下资源感兴趣：

999精品视频在这里

日本黄色网站无马赛克免费看亚洲福利精品亚洲乱码日产精品BD 国产99视频精品免视看7

<bdo id="swi0u"><rt id="swi0u"></rt></bdo>