令人惊讶的是最新登顶SOTA的开源大模型竟出自一家外卖公司——美团此次发布的Longcat-Flash-Chat不仅实现开源自研双突破,在国内外技术社区引发热议。
该模型在多项关键指标上表现突出:工具调用能力超越DeepSeek-V3.1与Qwen3 MoE-2507,在编程测试中与Claude4 Sonnet持平;
其创新架构设计更展现出独特优势。
技术报告揭示了美团对大模型研发的深刻理解:通过DSMoE混合专家架构结合MLA动态计算机制,在保证性能的同时显著降低参数规模——560B参数量的Longcat-Flash-Chat较DeepSeek-V3.1(671B/A37B)和Kimi-K2(1T/A32B)分别减少16%总参数量与40%激活参数量。
其核心创新包括”零计算专家”机制(恒等映射输入避免冗余计算)与跨层快捷连接(通过流水线重排提升计算通信重叠效率),配合超参数迁移策略与确定性计算框架,在30天内完成20T token预训练并实现98.48%集群可用率。
实际测试中该模型展现出强大推理能力:面对全国一卷数学压轴题精准推导出正确解法;
在复杂SVG矢量图生成任务中完整呈现卡尔文循环示意图;
甚至能识破改编版”薛定谔猫”谜题陷阱——当题目明确给出死猫前提时直接指出逻辑矛盾而非延续量子态假设(对比O3仍沿用传统解答路径)。
回溯美团AI布局可见战略前瞻性:2023年王慧文创立光年之外并组建顶尖团队;
次年GN06团队推出情感陪伴产品Wow及图像生成应用妙刷;
2024年研发投入达211亿元位列国内科技企业第一梯队,并明确三层架构推动AI落地——从Longcat API调用量半年增长68%可见其内部应用成效显著。
这种以业务场景驱动的研发模式贯穿始终:从无人配送积累的自动驾驶经验到零售场景中的智能助手实践(如问小袋、米鲁),美团正通过具身智能投资(宇树机器人等)与算法创新构建全栈AI能力体系。
此次开源不仅是技术突破更标志着这家”送外卖”公司已深度转型为科技驱动型平台企业——正如其CEO王兴所言:”我们正在将AI转化为生产力工具重塑每个业务环节”。(试用地址及官方链接详见原文末尾)
评论列表 (0条):
加载更多评论 Loading...