AI最前线 篇五十五:比肩GPT4!阿里巴巴Qwen-72B和Qwen-Audio开源为国争光
阿里巴巴近期发布的两款人工智能模型,Qwen-72B和Qwen-Audio,代表了中国在大型AI模型领域的重要进展。以下是这两款模型的一些关键信息:
Qwen-72B模型:这是一个基于3T tokens高质量数据训练的720亿参数模型。Qwen-72B在多个权威基准测评中取得了开源模型中的最佳成绩,部分测评中甚至超过了GPT-3.5和GPT-4。它在英语任务上的MMLU基准测试中取得了开源模型最高分,在中文任务上的C-Eval、CMMLU、GaokaoBench等基准得分超越了GPT-4。Qwen-72B也在数学推理(GSM8K、MATH测评)和代码理解(HumanEval、MBPP等测评)方面表现突出。
Qwen-Audio模型:这是一个结合了Qwen-7B和OpenAI的Whisper-large-v2音频编码器的音频大模型。Qwen-Audio能够感知和理解各类语音信号,如人声、自然声、动物声、音乐声等。它可以对音频进行理解,甚至基于音频进行文学创作、逻辑推理、故事续写等。
全尺寸开源和生态开放策略:Qwen-72B和Qwen-Audio的开源是阿里云在通义千问系列中的第三次开源行动。此前,阿里云已经开源了Qwen-7B和Qwen-14B等模型。通过这些开源行为,阿里云希望在AI时代成为最开放的大模型,共同推进大模型生态的建设。这些模型不仅为开发者提供了更多选择,还推动了AI技术的进一步发展和应用。
应用和发展前景:Qwen-72B模型在多个方面的优异性能,如长文本理解、指令遵循、工具使用等技能的优化,使其成为一个强大的AI工具。这使得Qwen-72B能够更好地被下游应用集成,为企业和科研机构提供了开发商业应用和进行AI相关科研的可能性。
总的来说,Qwen-72B和Qwen-Audio的发布展示了中国在大型AI模型领域的重要进步,不仅在技术上取得了显著成就,还推动了整个行业的开源和生态发展。
关于阿里巴巴发布Qwen-72B和Qwen-Audio的初始信息,来源于GIGAZINE的文章:
Qwen的官方GitHub README文件提供了额外的细节:
关于Qwen-72B和Qwen-Audio的发展、能力以及阿里巴巴的战略和AI模型生态系统的更多信息,来源于新浪财经的文章:
Sina Finance Article on Qwen.
AI-Bot.cn on Qwen Models.
Gitee上的一篇文章简要提到了Qwen-7B作为阿里巴巴AI模型系列的重要性:
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~