书生·浦语大模型包含三大类:

 

书生*浦语20B开源大模型性能

全面领先相近量级的开源模型(包括Llama-33B、Llama2-13B以及国内主流的7B、13B开源模型)以不足三分之一的参数量达到Llama2-70B水平

截屏2024-01-04 21.45.20

 

从模型到应用:

截屏2024-01-04 21.53.31

 

书生*浦语全链条开源开放体系

 

1、数据

多模态融合精细化处理价值观对齐
万卷包含文本、图像和视频等多模态数据。涵盖科技、文学、媒体、教育和法律等多个领域。该数据集对模型的知识内容、逻辑推理和泛化能力的提升有显著的效果万卷经过语言筛选、文本提取、格式标准化、数据过滤和清洗(基于规则和模型)、多尺度去重和数据质量评估等精细数据处理环节,能够很好地适应后续模型训练的要求在万卷的构建过程中,研究人员注重将数据内容与主流中国价值观进行对齐,并通过高算法和人工评估的结合提高语料库的纯净度。

补充:Opendatalab提供开放数据

 

2、预训练

 

3、微调

截屏2024-01-05 13.03.47

 

4、评测

截屏2024-01-05 13.08.15

OpenCompass:

全方位评测,性能可复现。80 套评测集,40 万道题目。

6 大维度:

  1. 学科:初中考试、中国高考、大学考试、语言能力考试、职业资格考试
  2. 语言:字词释义、成语习语、语义相似、指代消解、翻译
  3. 知识:知识问答、多语种知识问答
  4. 理解:阅读理解、内容分析、内容总结
  5. 推理:因果推理、常识推理、代码推理、数学推理
  6. 安全:偏见、有害性、公平性、隐私性、真实性、合法性

截屏2024-01-05 13.09.30

 

5、部署

 

LMDeploy:

全链路部署,性能领先,每秒生成 2000+ tokens。提供大模型在 GPU 上部署的全流程解决方案,包括模型轻量化、推理和服务。

 

6、智能体

大语言模型的局限性:

截屏2024-01-05 13.36.52

Lagent 是一种轻量级智能体框架:

 

多模态智能体工具箱AgentLego