当前位置:首页 > 云计算 > >

斯坦福回应抄袭清华系大模型 AI团队承认并道歉:撤下Llama3-V

斯坦福回应抄袭清华系大模型 AI团队承认并道歉:撤下Llama3-V
2024-06-05 14:09:00 来源:聚焦媒体网

  美国斯坦福大学一AI团队5月29日发布了一个名为《Llama3-V》的多模态大模型,宣称只需500美元,就可训练出一个性能可与GPT4-V媲美的模型。 随后,该模型被指抄袭,与中国清华系大模型相似度极高。对此,斯坦福回应抄袭清华系大模型,目前,Llama3-V已被团队撤下,其中一名成员Aksh Garg也公开道歉。

  据报道,斯坦福大学AI团队近期在社交平台X上,发布了一个名为Llama3-V的多模态大模型。 Llama3-V不仅在社交媒体上迅速蹿红,还一度冲上了HuggingFace趋势榜首页。

  斯坦福AI团队成员先前在X上,发布「Llama3-V」多模态的大模型。

  然而,一名网友发现,该团队发布的Llama3-V和中国大模型MiniCPM-Llama3-V 2.5有极高的相似度,后者是由中国大模型初创企业「面壁智能」和「清华大学自然语言处理实验室」共同推出的。

  网友还在面壁智能GitHub的项目下放出了一系列证据。 该网友表示,「这两个模型的结构、代码、配置文件都一模一样,只有变量名被替换了。」

  随后,面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应,「MiniCPM-Llama3-V 2.5在研发时,内置了一个彩蛋,就是对『清华简』的识别能力,而Llama3-V模型居然也有一模一样的能力。」

  报道指出,清华简是清华大学于2008年7月收藏的一批战国竹简,为战国中晚期文物。 刘知远透露,识别清华简是MiniCPM-Llama3-V 2.5的实验功能,「训练影像是最近从出土文物中扫描并标注,且尚未公开发布。」

  两个模型在辨识的表现上,正确的结果基本上一致,错误的情况也相当相似。 遭到大量质疑后,这位斯坦福团队成员已删除他们在X上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。

  李大海3日在声明中表达了对此事的深切遗憾,并指出,尽管从某种程度上看,这种模仿可以被视为他们的成果得到了国际团队的某种认可,但他更强调应该构建一个开放、协作且充满信任的科技社群环境。 他进一步强调,他们希望团队的努力和优秀工作能吸引更多人的注意和认可,但并非以这种被模仿甚至抄袭的方式。

  由于抄袭几乎是非常明确,Llama3-V团队的两位成员Siddharth Sharma和Aksh Garg于4日在社交平台上,向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。

  斯坦福回应抄袭清华系大模型,Aksh表示,首先,我们要向MiniCPM原设计者道歉。 我、Siddharth Sharma,以及Mustafa一起发布了Llama3-V,ustafa为这个项目编写了代码,但从昨天起就无法联系他。 未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。 对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。」

关键词:AI

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻