近日有网友爆料称Mistral公司涉嫌通过”蒸馏”技术剽窃DeepSeek模型。
据推特网友透露消息源显示:某位已离职女性员工向公司全员发送邮件举报内部黑幕事件中最受关注的是其最新模型疑似直接采用DeepSeek训练成果却对外宣称通过强化学习取得突破性进展并刻意篡改基准测试数据以掩盖真相。
作为欧洲地区备受瞩目的开源AI企业Mistral自成立以来凭借卓越性能赢得行业赞誉尤其在多语言处理和推理能力方面表现突出这使得此次曝光事件引发强烈震动。
早在今年6月就有技术博主通过”语言指纹”分析发现Mistral-small-3.2与DeepSeek-v3存在显著相似性而此前2月网络上还曾出现过”DeepSeek堪称中国版Mistral”的调侃如今剧情反转竟演变为技术成果倒置局面堪称讽刺至极。
具体分析显示推特博主Sam Peach通过统计模型生成文本中的高频词汇及词组组合构建特征集后运用分层聚类算法生成相似性图谱发现Mistral-small-3.2与DeepSeek-v3在图谱中呈现异常接近态势这种高度趋同特征极难由独立训练自然形成从而佐证了蒸馏技术应用的可能性。
尽管该技术本身属于行业通用方法但关键问题在于企业是否存在刻意隐瞒事实误导公众的行为——据举报人所述公司刻意将蒸馏成果包装成强化学习成功案例并操纵测试数据误导行业认知。
值得注意的是该事件对Mistral造成的冲击远超普通争议因其作为欧洲AI领域领军企业创立于2023年的法国巴黎由前Google DeepMind与Meta资深科学家联合组建团队并在今年8月估值达到百亿美元规模正推进新一轮十亿级美元融资进程。
自成立以来其开源战略始终是核心竞争力先后推出轻量化模型及编程专用模型等产品线并开发出对标ChatGPT的LeChat聊天机器人系统集成多语言推理与图像编辑等多项创新功能。
目前Mistral官方尚未对此事作出回应仅于日前发布新版本Medium V3.1模型引发舆论持续关注业界普遍呼吁相关方尽快澄清事实明确技术来源正当性维护行业健康发展生态。(注:原文未提及具体人物全名及完整证据链细节因爆料人社交平台隐私设置限制部分信息暂未公开)
评论列表 (0条):
加载更多评论 Loading...