清晨打开群聊便发现讨论异常热烈。
此次引发热议的对象正是备受关注的 DeepSeek V3.1 模型。
有用户指出该模型在文本生成过程中会突然无故混入”极”字字符(包括繁体与简体形式)。
根据相关技术帖披露的信息显示,在火山引擎、chutes 等第三方 API 平台已出现该问题的实际案例:当开发者调用模型执行代码编写或数据处理等常规操作时,在输出结果中会突然出现「极」字字符。
这一意外字符不仅导致代码编译失败、JSON 格式错乱等问题频发,在技术社区引发广泛吐槽。
初期推测多认为故障源于第三方服务端在模型量化部署或硬件配置上的差异。
但经过实测验证发现,在官方 Playground 平台同样存在该现象——尽管触发概率相对较低。
技术专家通过深度分析揭示了潜在原因:在模型词表中”极”字对应的 token ID 为 2577 号码位,而常用符号省略号(…)占据着相邻的 2576 号码位。
这种空间布局引发了两种可能性猜测:其一可能是训练数据存在未被过滤的异常字符污染;
其二可能是模型通过参数优化找到了某种捷径机制,在特定情境下错误选择相邻 token 进行输出。
更具挑战性的是该 bug 存在累积效应——一旦触发异常字符插入后,在后续对话交互中「极」字出现频率呈现显著上升趋势。
当前受影响最严重的场景包括:代码生成环节因意外汉字导致编译报错;
API 调用时破坏 JSON 等结构化数据格式;
学术写作过程中破坏文本的专业严谨性等关键场景均面临严峻考验。
DeepSeek 官方团队需尽快介入排查这一突发性缺陷问题。
附带说明:文中提及的第四张配图来自海外论坛讨论截屏(具体是否关联同一批次反馈尚待核实),反映出该问题已引发国际开发者群体的关注与讨论。
评论列表 (0条):
加载更多评论 Loading...