作者丨陈巍博士排版丨宇宙编辑部本文作者为 @陈巍博士,首发于知乎,经作者授权后转载于特工宇宙公众号。以下为正文:DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE(混合专家)架构,并在开源世界产生了较大的影响力。特别是 2025 年 1 月开源的 DeepSeek-R1,模型性能可挑战 OpenAI 闭源的 o1 模型。随着热度的提升,DeepSeek
作者丨陈巍博士排版丨宇宙编辑部本文作者为 @陈巍博士,首发于知乎,经作者授权后转载于特工宇宙公众号。以下为正文:DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE(混合专家)架构,并在开源世界产生了较大的影响力。特别是 2025 年 ...