斯坦福回应抄袭清华系大模型 AI团队承认并道歉：撤下Llama3-V

2024-06-05 14:09:00 来源：聚焦媒体网

　　美国斯坦福大学一AI团队5月29日发布了一个名为《Llama3-V》的多模态大模型，宣称只需500美元，就可训练出一个性能可与GPT4-V媲美的模型。随后，该模型被指抄袭，与中国清华系大模型相似度极高。对此，斯坦福回应抄袭清华系大模型，目前，Llama3-V已被团队撤下，其中一名成员Aksh Garg也公开道歉。

　　据报道，斯坦福大学AI团队近期在社交平台X上，发布了一个名为Llama3-V的多模态大模型。 Llama3-V不仅在社交媒体上迅速蹿红，还一度冲上了HuggingFace趋势榜首页。

　　斯坦福AI团队成员先前在X上，发布「Llama3-V」多模态的大模型。

　　然而，一名网友发现，该团队发布的Llama3-V和中国大模型MiniCPM-Llama3-V 2.5有极高的相似度，后者是由中国大模型初创企业「面壁智能」和「清华大学自然语言处理实验室」共同推出的。

　　网友还在面壁智能GitHub的项目下放出了一系列证据。该网友表示，「这两个模型的结构、代码、配置文件都一模一样，只有变量名被替换了。」

　　随后，面壁智能首席科学家、清华大学长聘副教授刘知远在知乎上回应，「MiniCPM-Llama3-V 2.5在研发时，内置了一个彩蛋，就是对『清华简』的识别能力，而Llama3-V模型居然也有一模一样的能力。」

　　报道指出，清华简是清华大学于2008年7月收藏的一批战国竹简，为战国中晚期文物。刘知远透露，识别清华简是MiniCPM-Llama3-V 2.5的实验功能，「训练影像是最近从出土文物中扫描并标注，且尚未公开发布。」

　　两个模型在辨识的表现上，正确的结果基本上一致，错误的情况也相当相似。遭到大量质疑后，这位斯坦福团队成员已删除他们在X上官宣模型的推文，并将该项目在Github和HuggingFace上的库一并删除。

　　李大海3日在声明中表达了对此事的深切遗憾，并指出，尽管从某种程度上看，这种模仿可以被视为他们的成果得到了国际团队的某种认可，但他更强调应该构建一个开放、协作且充满信任的科技社群环境。他进一步强调，他们希望团队的努力和优秀工作能吸引更多人的注意和认可，但并非以这种被模仿甚至抄袭的方式。

　　由于抄袭几乎是非常明确，Llama3-V团队的两位成员Siddharth Sharma和Aksh Garg于4日在社交平台上，向面壁MiniCPM团队正式道歉，并表示会将Llama3-V模型悉数撤下。

　　斯坦福回应抄袭清华系大模型，Aksh表示，「首先，我们要向MiniCPM原设计者道歉。我、Siddharth Sharma，以及Mustafa一起发布了Llama3-V，ustafa为这个项目编写了代码，但从昨天起就无法联系他。未被告知或意识到OpenBMB（清华团队支持发起的大规模预训练语言模型库与相关工具）之前的任何工作。对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。」

关键词：AI

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

投诉邮箱:Email：133 46734 45@qq.com