通义千问发布全新代码专家模型CodeQwen1.5

通义千问于昨晚公开了其全新的代码专家模型CodeQwen1.5，这一模型建立在Qwen语言模型的基础上，拥有70亿参数，采用先进的GQA架构，并经过大约3万亿个代码词元的预训练。值得一提的是，CodeQwen1.5支持多达92种编程语言，且能处理长度高达64K的上下文输入。

在多个关键领域，包括代码生成、长序列建模、代码修改及SQL 应用能力上，CodeQwen1.5均展现了出色的表现，为开发者带来了更高的工作效率，同时简化了软件开发的流程。

特别在代码生成领域，CodeQwen1.5的性能已经超越了众多规模更大的模型，显著缩小了与GPT-4等顶尖模型在编码能力上的差距。通过HumanEval和MBPP的严格评估，CodeQwen1.5在各项性能指标上均获得了优异的成绩。

此外，根据LiveCodeBench的评估结果显示，CodeQwen1.5在解决LeetCode、AtCoder和CodeForces等编程竞赛平台上的问题时，展现出了强大的泛化能力，尽管其训练数据中包含了LeetCode的内容。

除了精通Python，CodeQwen1.5还支持多种其他编程语言。在涵盖8种主流语言的MultiPL-E评估中，CodeQwen1.5的多语言编程能力得到了充分验证。对于代码模型而言，长序列处理能力至关重要，而CodeQwen1.5通过专门设计的长序列代码数据训练，成功实现了对最长64K输入序列的支持。

在实际应用中，CodeQwen1.5在SWE Bench测试中的卓越表现尤为引人注目。它能够深入理解代码库，并生成能够通过单元测试的代码，从而有效解决了实际软件开发中遇到的难题。

在代码修改方面，CodeQwen1.5同样展现出了卓越的能力。在CodeEditorBench的四个维度——调试、转换、切换和润色上，均取得了最佳效果。

作为一个智能的SQL专家，CodeQwen1.5能够通过自然语言直接查询数据库，大大降低了非专业编程人员与高效数据交互的学习难度。在Spider和Bird这两个广受欢迎的文本到SQL基准测试中，CodeQwen1.5的性能与GPT-4不相上下，充分体现了其在SQL领域的强大实力。

作为Qwen1.5开源家族的重要成员，CodeQwen1.5目前已兼容多种平台和工具，包括Transformers、vLLM、llama.cpp和Ollama等。开源社区对CodeQwen1.5的发布充满了期待，相信它将在代码助手、Code Agent等方面为社区做出重要贡献，并在未来的代码智能化建设中扮演关键角色，成为名副其实的AI程序员。