在 2023 年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 SegGPT(Segment Everything In Contex)。
▲ 图源 Arxiv
据称,SegGPT 模型是智源通用视觉模型 Painter 的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(Prompt)完成分割任务。
▲ 图源 Arxiv
SegGPT 也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的 ID,进行自动追踪。
经过查询知悉,此前 Meta 也发布了其基于 AI 的 Segment Anything Model (SAM)模型 ,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出 SEEM 模型,通过不同的视觉提示和语言提示,一键分割图像、视频。的小伙伴们可以从这里访问模型的论文链接。
关键词:
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.com王小川旗下百川智能今日发布 Baichuan-13B 大模型,号称130 亿参数开源可商用。 ▲ 图源 Baichuang-13B GitHub 页面
为一个新的游戏伙伴做好准备!谷歌DeepMind推出了SIMA,这是一个正在训练成为游戏中队友的大型语言模型。SIMA代表可扩展、可指...
微软宣布将与数字病理学提供商 Paige 合作,建立世界上最大的基于图像的人工智能模型,用于识别癌症。 新闻稿显示,...
Adobe宣布针对旗下PDF阅读器Reader,以及PDF编辑软件Acrobat增加人工智能助理服务(AI Assistant),让使用者能更快读取、理解,并且分享PDF
天舟文化在分析师会议上表示,自研的 AI 工具 Yoo action 即将发布,通过 AI 算法和混合变形骨骼绑定,无标记动捕生成 数字人
全球科技公司HCLTech和数字工作流程公司 ServiceNow 周四宣布建立合作伙伴关系,为企业提供新的生成人工智能 ( genAI ) 主导的解决方
DeepMind 联合创始人 Mustafa Suleyman 去年从谷歌离职后,创办了机器学习公司 Inflection AI。该公司于近日推出了名为 Pi 的
5月10日消息,据外媒报道,据网络流量数据网站SimilarWeb统计,OpenAI旗下ChatGPT的全球访问量在4月份再创新高,达到17 ...
正如前几天所预期的那样,Nvidia 在今天的 GTC 2024 活动上展示了其新 GPU——Blackwell 一代的第一款 GPU。据称,英伟达最新AI芯片
百川智能发布Baichuan2-53B 闭源大模型,全面升级了Baichuan1-53B的各项能力。Baichuan2-53B不仅数学和逻辑推理能力提升显著,还通过
今年在Google I O 2024期间宣布推出全新开源模型Gemma 2,并且在日前正式向开发者、研究人员提供对应270亿组参数版本...
近期不少人工智能技术业者被指责以不当方式,撷取大量网站内容、影片作为其人工智能模型训练使用,而人工智能技术初创Ant...
近日一家名为 Throwflame 的公司推出了一款配备喷火器的机器狗,能够喷出长达 9 米的火焰,令人惊恐。这款机器狗被称为Thermonator
日前微软研究人员展示了 LLaVA-Med 模型,该模型主要用于生物医学方面的研究,可根据 CT、X 光图片等推测出患者的病...
华为近日发布了OceanStor A310 深度学习数据湖存储与FusionCube A3000 训 推超融合一体机商用 AI 存储新品,官方称这两款产
openKylin 操作系统 1 0 版本今日正式发布,适配支持 X86、ARM、RISC-V 架构的个人电脑及平板及教育开发板,支持调用 AI 大模型
微软稍早宣布与NASA (美国国家航空暨太空总署)合作打造名为「EarthCopilot」的聊天机器人,让各类地球科学资料内容可以...
特斯拉表示,Optimus Gen 2人形机器人即将发布。Optimus Gen 2配备了新的手和脚力感应功能,以及其他改进。它的所有手指都有触觉感
亚马逊经过数月的沉默之后,于今天正式推出了生成式 AI 产品 Bedrock。它将和 OpenAI 的 ChatGPT、微软的必应聊天(Bing Chat)、
在此次re:Invent 2023大会上,AWS宣布与英伟达扩大合作,通过导入下一代GPU、CPU与人工智能软件,推动生成式人工智能创...
在 ChatGPT 的核心团队中,不乏清华大学毕业进入 OpenAI 的开发者,就在 GPT-4 发布的同一天,清华大学顶尖的 NLP 团队,也公
OpenAI 首席执行官 Sam Altman 表示,他的公司正在寻求微软公司进一步资金支持,来开发通用人工智能 (AGI)。 Altman在接受英
近日,美图公司旗下AI数字人生成工具DreamAvatar上线,首期推出AI演员数字人服务,以AI驱动为核心,服务于视频内容创作、...
Menteebot 是 Mentee Robotics 的新产品,它是一款专为家庭或商业用途设计的人类大小的机器人,将人工智能技术提升到了一个全新的水平
腾讯发布了一种新的人工智能(AI) 模型,称为 InstantMesh,可以使用静态照片渲染 3D 对象。新的人工智能模型是对该公司旧版Instant3D框
小米于 2022 年推出了其首款人形机器人 CyberOne,据报道该机器人配备了高功率密度执行器。它加入了该公司的 Cyber 系列机器
谷歌日前已经发布 Android 16 开发者版本,通过调查代码外媒《Android Authority》发现,谷歌或有意通过 Gemini 取代 Google