当前位置:首页 > 人工智能 > >

微软推出人工智能模型CoDi 能够处理任意输入模式并生成任意模态的内容

微软推出人工智能模型CoDi 能够处理任意输入模式并生成任意模态的内容
2023-07-11 09:49:39 来源:IT之家

  微软近日发布新闻稿,推出了名为可组合扩散模型(CoDi),这是一种独特的、基于可组合扩散的人工智能模型,其设计目标是互动和生成多模态内容。

  微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。

  

 

  CoDi 采用了独特的可组合生成策略,在扩散过程中对齐多模态,从而生成相互交织的模式,更重要的是,CoDi 能够处理任意输入模式并生成任意模态的内容。

  

 

  CoDi 由 Microsoft Azure 认知服务研究团队与北卡罗来纳大学教堂山分校合作开发,也是 Microsoft 项目 i-Code 的一部分,该项目使用人工智能来增强人机交互。

  在此附上 CoDi 项目官方介绍链接,感兴趣的用户可以深入阅读。

关键词:

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻