当前位置:首页 > 人工智能 > >

腾讯宣布开源混源文字转图像大模型

腾讯宣布开源混源文字转图像大模型
2024-05-16 17:03:49 来源:聚焦媒体网

5月14日,腾讯宣布旗下混元文转图大模型全面升级开源。它已在拥抱脸平台和Github上发布,包括完整的模型,如模型权重、推理代码和模型算法,供企业和个人开发者免费商业使用。

据了解,这是业内首个以中文为母语的DiT架构文本到图像的开源模型,支持中英文双语输入和理解,参数大小达15亿。升级后的混元文本转图像大模型采用了与索拉一致的DiT架构,不仅支持文生图,还可以作为视频等多模态视觉生成的基础。

升级后的浑源文本到图像模型采用了基于Transformer(简称DiT)的扩散模型架构,具有更强的可扩展性。参数越多,性能越强,有助于提高视觉模型生成的有效性和效率。这也是之前流行的索拉产品背后的关键技术。

腾讯文转图团队负责人陆庆林表示:“腾讯对浑源文转图的发展理念是务实的,坚持从实践中来,回到实践中去。这次我们对最新一代模型进行了全面开源,希望与业界分享腾讯在文转图领域的实践经验和研究成果,共同构建中国文转图模型的开源生态系统,加快行业大规模模型的发展。”

目前,腾讯的混元文本到图像模型已经达到了15亿个参数。评估数据显示,最新的腾讯混元文本到图像模型与前代相比提高了20%以上,远远超过了开源的稳定扩散模型。在目前开源的文本到图像模型中,它的整体性能最好,达到了国际领先水平。

关键词:腾讯 人工智能

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻