摄影之友网
  • 首页
  • 摄影新闻
  • 作品欣赏
  • 摄影技巧
  • 器材评测
  • 让建站和SEO变得简单

    让不懂建站的用户快速建站,让会建站的提高建站效率!

    器材评测你的位置:摄影之友网 > 器材评测 > 英伟达携全新AI模子“颠覆”音频界:可创作音乐、修改东谈主声
    英伟达携全新AI模子“颠覆”音频界:可创作音乐、修改东谈主声
    发布日期:2024-11-26 09:34    点击次数:115

    财联社11月26日讯(裁剪 黄君芝)据报谈,英伟达(Nvidia)建造了一种新式东谈主工智能(AI)模子,不错创造声息后果,更动东谈主的发音方式,并使用当然语言请示生成音乐。

    这个模子被定名为Fugatto,即Foundational Generative Audio Transformer Opus 1,是一个商榷神志。英伟达示意,它不会布告任何发布这项技艺的探求,但它可能会对从音乐、文娱到翻译功绩等行业产生鄙俚的影响。

    英伟达期骗深度学习商榷副总裁Bryan Catanzaro在禁受采访时示意:“Fugatto最令东谈主欣喜的处所在于,它领有一个模子,你不错条款它以某种方式发出声息,这确切灵通了你对它期骗范围的思象。”

    他进一步线路说,市集上的其他模子,有些不错合谚语音,有些不错为音乐添加音效,但Fugatto沿途齐不错作念到。Catanzaro说,不错将其视为视频和图像生成模子(如Stability AI的Stable Video Diffusion或OpenAI的Sora)的一种补充。

    “这里最基本的改造是……咱们约略使用语言合成音频,我以为,这为东谈主们不错用来创造惊东谈主音频的器具开采了新的出路。”他补充说。

    字据英伟达的说法,Fugatto是第一个具有新兴特质的基础模子,这意味着它约略夹杂流程考研的元素,并解任“解放花样的指示”。

    具体而言,该模子不错通过圭臬的翰墨请示生成音频,也不错照管您上传的音频文献。是以,若是你有一个东谈主言语的文献,你不错把阿谁东谈主的话翻译成另一种语言,同期让它听起来像他的声息。你也不错遴荐一个简短的音调,让它听起来像管弦乐饰演,或者在音乐中添加不同的节奏。

    此外,你也不错上传一个文档,让模子用你心爱的任何声息诵读。更紧迫的是,你不错告诉模子发出带多情谊重量的声息。

    不外,Catanzaro也补充说,这种模子并不老是竣工的。况兼,就像生成图像和视频的模子相同,Fugatto也会催生艺术家、音响工程师和关联界限东谈主员的担忧。但Catanzaro指出,他的本意是但愿这项技艺能匡助音乐家。

    “我但愿这是艺术家探索的新器具。”“我以为音频一直是一个富足奏效的探索界限。你知谈,当咱们取得新的音频器具时,或然咱们会取得新的音乐花样。”他说。

    海量资讯、精确解读,尽在新浪财经APP

    包袱裁剪:于健 SF069



    Powered by 摄影之友网 @2013-2022 RSS地图 HTML地图

    Copyright Powered by365站群 © 2013-2024