DeepSeek-R1-Distill
-
DeepSeek-R1-Distill-Qwen-7B模型介绍及部署教程
DeepSeek-R1-Distill-Qwen-7B是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于DeepSeek-R1的推理能力,通过蒸馏技术将推理…
DeepSeek-R1-Distill-Qwen-7B是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于DeepSeek-R1的推理能力,通过蒸馏技术将推理…