Chinese-LLaMA-Alpaca-2

AI大事件
23年11月3日
编辑

阿噜噜同学阿噜噜小站

本项目基于Meta发布的可商用大模型 Llama-2 开发，是中文LLaMA&Alpaca大模型的第二期项目，开源了 中文LLaMA-2基座模型和Alpaca-2指令精调大模型。这些模型 在原版Llama-2的基础上扩充并优化了中文词表，使用了大规模中文数据进行增量预训练，进一步提升了中文基础语义和指令理解能力，相比一代相关模型获得了显着性能提升。相关模型 支持FlashAttention-2训练， 支持4K上下文并可通过NTK方法最高扩展至18K+。

本项目主要内容：

– 🚀 针对Llama-2模型扩充了 新版中文词表，开源了中文LLaMA-2和Alpaca-2大模型 – 🚀 开源了预训练脚本、指令精调脚本，用户可根据需要进一步训练模型 – 🚀 使用个人电脑的CPU/GPU快速在本地进行大模型量化和部署体验 – 🚀支持 🤗transformers , llama.cpp , text-generation-webui , LangChain , privateGPT , vLLM 等LLaMA生态 – 目前已开源的模型：Chinese-LLaMA-2（7B/13B）, Chinese-Alpaca-2（ 7B/13B）(更大的模型可先参考一期项目)

官网

https://github.com/ymcui/Chinese-LLaMA-Alpaca-2

{{userData.name}}已认证

Chinese-LLaMA-Alpaca-2

本站如果侵犯你的利益，请务必携带权利证明请发送邮箱到doraera@163.com ，我们会第一时间为您处理。

谷歌面向商家推出生成式 AI 工具，可一键生成卖家秀或提升图片画质

[AI周报]更新的模型，更强的模型

阿噜噜小站

左邻右舍

关注交流