SEMI大半导体产业网

1月22日消息，1月20日，幻方量化旗下AI公司DeepSeek发布DeepSeek-R1模型，并同步开源模型权重。

据介绍，DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

值得注意的是，DeepSeek不仅将R1模型的训练技术全面公开，还额外蒸馏了6个小模型并开放给社区，以便用户能够借此基础训练出更多样化的AI模型。

DeepSeek-R1模型正式发布