BiLLa是开源的推理能力增强的中英双语LLaMA模型。模型的主要特性有:
- 较大提升LLaMA的中文理解能力,并尽可能减少对原始LLaMA英文能力的损伤;
- 训练过程增加较多的任务型数据,利用ChatGPT生成解析,强化模型理解任务求解逻辑;
- 全量参数更新,追求更好的生成效果。
因个人精力有限,我未能将BiLLa与当前主流的开源大模型进行充分的对比评测。以下是经过有限的评测分析得出的结论:
- BiLLa-7B-LLM 中英语言建模能力显着优于 Chinese-LLaMA-7B ;
- BiLLa-7B- SFT 中文推理能力显着优于 BELLE-LLaMA-Ext-7B 等模型;
- 由GPT4打分,BiLLa-7B-SFT 在英文指令上得分显着高于 ChatGLM-6B ,中文得分持平,但解题与代码得分更高。
官网:
https://github.com/Neutralzz/BiLLa
[…] 地址:BiLLa – 阿噜噜同学 (arlulu.com) […]