Qwen1.5-MoE By AiBard123 March 29, 2024 - 2 min read 阿里巴巴一款小型 MoE 模型,只有 27 亿个激活参数,但性能与最先进的 7B 模型(如 Mistral 7B 和 Qwen1.5-7B)相匹配 read more