近日,基准测试平台Chatbot Arena发布了最新的大模型盲测排名。10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其Qwen2.5-72B-Instruct大语言模型在榜单中位列第十,是前十名中唯一的中国模型。此外,通义千问的视觉语言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的开源大模型。

阿里通义开源模型Qwen2.5进入大模型盲测全球前十

Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十

与此同时,基于Qwen系列的衍生模型在全球开源社区中的数量已突破7.43万,超过了Llama系列的7.28万,成为全球最大的生成式语言模型家族。在Hugging Face社区的开源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。

Chatbot Arena由开放研究机构LMSYS Org推出,是目前全球顶尖的大模型测试平台。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。(袁宁)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

阿里通义开源模型Qwen2.5进入大模型盲测全球前十
Tags:
- THE END -
打赏
本文由 @ 修订发布于 2024-09-29 15:01:27
本文来自投稿,不代表本站立场,如若转载,请注明出处:/tech/tansuo/5542.html
评论 (共 条评论,人围观)