很抱歉,当前没有启用javascript,网站无法正常访问。请开启以便继续访问。小红书开源首个大模型 预训练未使用合成数据
2025年06月10日 09:09:04
【小红书开源首个大模型 预训练未使用合成数据】《科创板日报》10日讯,小红书开源了首个大模型dots.llm1,小红书方面告诉《科创板日报》,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。(记者 张洋洋)
3.15W+特别声明:文章内容仅供参考,不构成投资建议。投资者据此操作风险自担。