PolyLM是一个多语言大语言模型,旨在解决当前LLM研究中的以下空白和限制,为推进该领域提供全面且创新的解决方案。
涵盖18种最常用语言。 PolyLM 精通全球主要非英语语言,如西班牙语、俄语、阿拉伯语、日语、韩语、泰语、印度尼西亚语和中文等。它是对现有开源模型的完美补充,包括:(1 ) LLaMA,其中英语在整个数据集中占主导地位。 (2) BLOOM,无法解决大量人口使用的语言,例如日语、韩语和泰语。 更好的多语言指令跟随能力。我们建议使用 MULTIALPACA 来补充 ALPACA 和 CHINESEALPACA,使法学硕士能够更好地遵循多语言指令,特别是来自非英语母语人士的指令。 表现强劲。与模型大小相似的流行多语言法学硕士相比,PolyLM 在各种任务上表现出了出色的性能,包括 QA、理解和生成。
官网
https://github.com/DAMO-NLP-MT/PolyLM
[…] 地址:PolyLM – 阿噜噜同学 (arlulu.com) […]