美国斯坦福大学一AI团队5月29日发布了一个名为《Llama3-V》的多模态大模型,宣称只需500美元,就可训练出一个性能可与GPT4-V媲美的模型。 随后,该模型被指抄袭,与中国清华系大模型相似度极高。对此,斯坦福回应抄袭清华系大模型,目前,Llama3-V已被团队撤下,其中一名成员Aksh Garg也公开道歉。
据报道,斯坦福大学AI团队近期在社交平台X上,发布了一个名为Llama3-V的多模态大模型。 Llama3-V不仅在社交媒体上迅速蹿红,还一度冲上了HuggingFace趋势榜首页。
斯坦福AI团队成员先前在X上,发布「Llama3-V」多模态的大模型。
然而,一名网友发现,该团队发布的Llama3-V和中国大模型MiniCPM-Llama3-V 2.5有极高的相似度,后者是由中国大模型初创企业「面壁智能」和「清华大学自然语言处理实验室」共同推出的。
网友还在面壁智能GitHub的项目下放出了一系列证据。 该网友表示,「这两个模型的结构、代码、配置文件都一模一样,只有变量名被替换了。」
随后,面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应,「MiniCPM-Llama3-V 2.5在研发时,内置了一个彩蛋,就是对『清华简』的识别能力,而Llama3-V模型居然也有一模一样的能力。」
报道指出,清华简是清华大学于2008年7月收藏的一批战国竹简,为战国中晚期文物。 刘知远透露,识别清华简是MiniCPM-Llama3-V 2.5的实验功能,「训练影像是最近从出土文物中扫描并标注,且尚未公开发布。」
两个模型在辨识的表现上,正确的结果基本上一致,错误的情况也相当相似。 遭到大量质疑后,这位斯坦福团队成员已删除他们在X上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。
李大海3日在声明中表达了对此事的深切遗憾,并指出,尽管从某种程度上看,这种模仿可以被视为他们的成果得到了国际团队的某种认可,但他更强调应该构建一个开放、协作且充满信任的科技社群环境。 他进一步强调,他们希望团队的努力和优秀工作能吸引更多人的注意和认可,但并非以这种被模仿甚至抄袭的方式。
由于抄袭几乎是非常明确,Llama3-V团队的两位成员Siddharth Sharma和Aksh Garg于4日在社交平台上,向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。
斯坦福回应抄袭清华系大模型,Aksh表示,「首先,我们要向MiniCPM原设计者道歉。 我、Siddharth Sharma,以及Mustafa一起发布了Llama3-V,ustafa为这个项目编写了代码,但从昨天起就无法联系他。 未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。 对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。」
关键词:AI
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.com亚马逊网络服务计划与GPU制造商英伟达合作推出Project Ceiba超级计算机。 该系统将配备 16,384 个 GH200 NVL32 Grace Hopper
亚马逊在本周的 AWS re:Invent 2023 大会上推出了其基于云的工具套件的重大改进,利用生成式 AI 的强大功能来增强网络安全和代
Yotta Data Services 在印度推出了基于 GPU 的云。 GPU 云作为 Yotta Shakti Cloud 平台的一部分提供,在 Nvidia GPU
12月20日最新消息,2023百度云智大会·智算大会今日盛大举办,成为关注焦点。这次大会汇聚了来自全球范围内的顶尖专家和行业...
量子计算公司 Rigetti 推出了 Novera QPU,这是该公司首个商用量子处理单元 (QPU)。 Novera QPU 在加利福尼亚州弗里蒙特的
在2023 AfricaCom大会的运营商云转型峰会上,华为运营商IT Marketing与解决方案销售总监孙寻寻发表了主题演讲,发布了...
在不断发展的人工智能领域,谷歌通过其最新版本 Gemini 1 5 Pro 不断突破可能的界限。 这种尖端模型拥有增强的跨各种模...
纽约州州长 Kathy Hochul举行了州经济发展听证会,正式宣布特斯拉计划在布法罗的 Gigafactory 集群建造下一台 Dojo 超级计算机。Hoch
美国斯坦福大学一AI团队5月29日发布了一个名为《Llama3-V》的多模态大模型,宣称只需500美元,就可训练出一个性能可与GPT...
中国生数科技联合清华大学研发的影片生成AI大模型Vidu近日在北京发表,它支持一键生成长达16秒,分办率高达1080P的高画质影片...
Microsoft 和 Oracle 已达成一项多年协议,以支持 AI 服务的增长,特别是优化的 AI 模型,以支持 Microsoft 的 Bing 对话搜
量子计算初创公司 Extropic 已筹集 1410 万美元种子资金,用于构建基于物理的人工智能计算机。 该初创公司于去年由 Alphabet
人工智能云基础设施公司 CoreWeave 出售了其业务的少数股权。 这轮 6 42 亿美元的少数股权投资由 Fidelity Management and
AMD 宣布推出其 MI300 加速器和处理器,以帮助推动生成式 AI 的进步。 该公司表示,AMD Instinct MI300X 和 AMD Instinct
英特尔的 Gaudi3 AI 加速器将于 2024 年上市,它将与维谛技术合作开发两相液体冷却。 这些系统将采用泵送两相 (P2P) 冷却
GENCI 使用 AMD 最新的 APU 升级了位于法国的 Adastra 超级计算机。 Adastra 由蒙彼利埃 CINES 主办和运营,于 2023 年
Rashika Ramlal,AWS 非洲区域经理 随着南非工业继续数字化发展,亚马逊网络服务 (AWS) 正在扩大其在南非的足迹,相信云技术是第四
谷歌推出了其 TPU AI 芯片系列的略微更新版本,即 Cloud TPU v5p。 该公司还宣布了AI Hypercomputer,这是一种基于云的超级