通义千问发布Qwen1.5-110B 首款超1000亿参数模型

发布时间：2024年05月18日

102

通义千问发布Qwen1.5-110B 首款超1000亿参数模型， Qwen1.5-110B是Qwen1.5系列中的新成员，也是该系列首个拥有超过1000亿参数的模型。

该模型在基础模型评估中表现出色，与Meta-Llama3-70B相媲美，并在聊天模型评估（包括MT-Bench和AlpacaEval 2.0）中表现出色。模型支持多语言，包括英语、中文、法语、西班牙语等，上下文长度可达32K令牌。

模型特性

模型质量 Qwen1.5-110B 在基础语言模型的一系列评估中表现突出，与 Meta-Llama3-70B 和其他 SOTA 语言模型（如 Mixtral-8x22B）相比，展现了至少具有竞争力的基础能力。此外，模型的尺寸增加是相对于72B模型性能提升的主要原因。

聊天模型评估 在 MT-Bench 和 AlpacaEval 2.0 的聊天模型基准测试中，110B 模型相较于先前发布的 72B 模型有显著改进，持续的评估提升表明，更强大、更大的基础语言模型可以在不过多改变训练后配方的情况下，带来更好的聊天模型。

Qwen1.5是Qwen2的测试版，是一个基于Transformer架构的仅解码器语言模型，预训练在大量数据上。与之前的Qwen模型相比，改进包括：

如果你想要了解关于智能工具类的内容，可以查看智汇宝库，这是一个提供智能工具的网站。
在这你可以找到各种智能工具的相关信息，了解智能工具的用法以及最新动态。