腾讯发布了一种新的人工智能(AI) 模型,称为 InstantMesh,可以使用静态照片渲染 3D 对象。新的人工智能模型是对该公司旧版Instant3D框架的升级,现在结合使用多视图扩散模型和基于大型重建模型(LRM)架构的稀疏视图重建模型。腾讯还开源了 InstantMesh 模型,并为爱好者提供了预览应用程序来测试其功能或生成和导出 3D 渲染。
腾讯在 arXiv 上发布了其研究论文的预印本。值得注意的是,arXiv 不进行同行评审,因此很难说该模型是否经过评估。不过,该公司已经在 Hugging Face 上开源了该 AI 模型,以便开发者可以测试其效率。对于爱好者来说,还有一个应用程序视图可供使用,他们可以在其中添加照片并观看它变成 3D 渲染。我们在 Gadgets 360 测试了该平台,发现渲染在 10 秒内创建完成,正如该公司声称的那样。然而,渲染的质量感觉相当低。一位X(以前称为X)用户发布了使用AI模型的视频,您可以看到下面的结果。
谈到人工智能模型背后的技术,该公司使用两种不同的架构——多视图扩散模型和 LRM 架构。前者帮助处理输入图像并生成图像中不可见的不同维度,LRM 构建可以在 3D 环境中体验的轨道视图对象。
据腾讯介绍,InstantMesh解决了3D渲染领域的Janus问题。Janus 问题是 3D 渲染空间中的一种现象,由于模型必须“想象”参考对象的不同侧面并创建它们,因此它会创建对象的多个规范视图,而不是内聚的 3D 对象。该公司通过使用经过稳定扩散微调的新颖视图生成器解决了这个问题。
该研究论文还分享了与不同现有模型(包括最近推出的Stability AI 的 Stable Video 3D)相比的基准分数。根据分数,InstantMesh 在 Google 扫描对象 (GSO) 和 OmniObject3D (Omni3D) 轨道视图上的表现优于 SV3D。SV3D 在 Omni3D 基准测试中的几个参数中表现更好,这些参数与输出的分辨率相对应,但腾讯表示这是故意的。该公司解释说:“我们认为,感知质量比忠实性更重要,因为‘真正的小说观点’应该是未知的,并且在以单个图像作为参考的情况下具有多种可能性。”
关键词:腾讯 AI模型 InstantMesh
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.comTechCrunch网站报道指称,OpenAI计划与前Twitter (现在的X)印度负责人Rishi Jaitly洽谈合作,藉此协助OpenAI与印度政府就人工智能
4月12日,据资料显示,马斯克旗下人工智能初创公司xAI正寻求30亿至40亿美元融资,该公司估值或达180亿美元。知情人士透露,硅...
特斯拉公司近日在北美的部分门店展示了其首款人形机器人 Optimus 的模型,纽约市的特斯拉门店已经收到了一台 Optimus...
日本最大连锁便利商店日本Seven Eleven,将开始运用生成式人工智能(AI)改善产品企划效率,为零售业导入新方法。 日...
7月6日,2023世界人工智能大会(WAIC)在上海开幕,吸引了行业的目光。手机中国从大会上获悉,华为昇腾AI全球开发者现已超...
Meta 现推出了一个名为 Code Llama 的 AI 编码工具,号称最先进的大型编码语言模型。 该模型基于 Llama 2 大型语言模型打
ChatGPT免费用户注意了,未来使用CahtGPT时,可能会出现广告,除非你升级至ChatGPT Plus会员。 ChatGPT首席财务官Sarah Friar于近
社交媒体巨头 Meta 公司(原 Facebook)周二宣布,将向研究人员开放一种新的类人人工智能模型的部分组件,该模型可以比...
全球科技公司HCLTech和数字工作流程公司 ServiceNow 周四宣布建立合作伙伴关系,为企业提供新的生成人工智能 ( genAI ) 主导的解决方
近段时间ChatGPT带火了AI领域,尤其是极为聪明的对话逻辑和知识体系,简直秒杀了以往的AI助手等产品。 根据最新消息,...
据路透社报道,日本一家名为 Tsubame Industries 的新创公司日前开发出一款高 4 5 米的机器人,其拥有酷似高达的外形,配备 4
日前,珠海市魅族科技有限公司申请了两个新商标,分别名为魅 GPTFlymeGPT,国际分类均为 09 类-科学仪器,商标状态为...
OpenAI在今3月中旬推出可混合输入、增加图像识别能力的全新GPT-4大型语言模型之后,稍早于其第一届开发者大会上公布名为G...
为了应对日益增长的 AI 生成图像的问题,谷歌 DeepMind 团队今日推出了一款名为 SynthID 的工具,可以在 AI 生成的图像中嵌入
微软正在将其Copilot AI升级为OpenAI的最新AI型号——GPT-4 Turbo和DALL-E 3。还有一个新的代码解释器即将推出,它还...
为一个新的游戏伙伴做好准备!谷歌DeepMind推出了SIMA,这是一个正在训练成为游戏中队友的大型语言模型。SIMA代表可扩展、可指...
亚马逊经过数月的沉默之后,于今天正式推出了生成式 AI 产品 Bedrock。它将和 OpenAI 的 ChatGPT、微软的必应聊天(Bing Chat)、
Spotify 在今年 2 月于北美市场推出了由 AI 驱动的测试版DJ功能,据外媒 Engadget 表示,Spotify 目前正打算将该服务扩展到全
AI 作画工具 Midjourney 日前更新了 5 2 版本,主要带来了Zoom out功能,可以模拟相机的超广角、中长焦效果,为图像添加不同焦段
去年宣布推出旗下文心(ERNIE)大型自然语言模型,以及文心一言 (ERNIE Bot)人工智能聊天机器人之后,百度在稍早于深圳举办的Create 2024
华尔街日报引述消息指称,苹果目前正与Meta洽谈人工智能模型合作,一如先前在Apple Intelligence服务率先与OpenAI的GPT-4o合作,并且
OpenAI 推出了 SearchGPT,这是一种将 AI 与实时网络数据相结合的新搜索原型。它提供对话式搜索,提供直接答案和明确的来源归属。
在今日举行的 2023 年华为云数字文娱 AI 创新峰会上,华为云全球 Marketing 与销售服务总裁石冀琳表示,华为云将在后续推出盘古
OpenAI的ChatGPT聊天机器人最近发生故障,引发了人们对谷歌对话式AI竞争对手Gemini的兴趣激增。QR Code Generator 的数据显示,6 月 4
特斯拉表示,Optimus Gen 2人形机器人即将发布。Optimus Gen 2配备了新的手和脚力感应功能,以及其他改进。它的所有手指都有触觉感