一,什么是大语言模型
大语言模型(以下简称 LLM)可以被认为是一个拥有人类世界各个领域知识的百科全书,用户提问,LLM 可以查阅自己的知识库,并为用户生成答案。
LLM 通过对海量文本和代码数据集进行训练,获得了对广泛主题的深入理解。它们可以访问和处理的信息量远远超过任何人类个体。
LLM 拥有的知识包括:
- 事实和数据:历史事件、科学发现、地理信息等。
- 概念和理论:来自各个领域的理论、原则和概念。
- 语言和文化:不同语言、文化和社会的细微差别。
- 技术技能:编程、数据分析、机器学习等。
LLM 可以利用这些知识来执行各种任务,例如:
- 回答有关任何主题的问题
- 生成文本、翻译语言、编写代码
- 总结长篇文本
- 提供见解和建议
二,LLM不擅长的领域
1,真实世界实时信息
虽然 LLM 拥有广泛的知识,但重要的是要注意它们并不是完美的。它们可能会受到训练数据中存在的偏见的影響,并且可能生成不准确或虚假的信息。同时,LLM 知识是静态的,知识库截止到某一时点(比如Gemini Pro 知识库截止 2023 年 11 月),目前大部分模型不具有直接调用搜索引擎的能力,所以无法获取当前世界实时的一些信息,包括:
- 某个学校的实时信息,如快递站几点关门等
- 个人隐私信息,如学号、身份证号等
- 实时社会热点新闻
2,学术领域专业性较强的问题
LLM 的特点是知识范围广、覆盖面全,但是对于大大部分较深的学术领域无法做出准确回答或者无法回答,除非经过知识库投喂训练的 LLM
三,LLM擅长的领域
不同模型的能力侧重点不同
- GPT系列的模型在自然语言和代码能力上取了平衡
- 谷歌的 Gemini 系列模型的代码算法能力较强,自然语言能力一般,建议信科的同学使用
- 通义千问效果和 GPT3.5差不多