1月22日消息,1月20日,幻方量化旗下AI公司DeepSeek发布DeepSeek-R1模型,并同步开源模型权重。
据介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
值得注意的是,DeepSeek不仅将R1模型的训练技术全面公开,还额外蒸馏了6个小模型并开放给社区,以便用户能够借此基础训练出更多样化的AI模型。
1月22日消息,1月20日,幻方量化旗下AI公司DeepSeek发布DeepSeek-R1模型,并同步开源模型权重。
据介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
值得注意的是,DeepSeek不仅将R1模型的训练技术全面公开,还额外蒸馏了6个小模型并开放给社区,以便用户能够借此基础训练出更多样化的AI模型。