人工智能与认知系统
欢迎来到我的数字大脑中的人工智能部分。本空间致力于追踪大型语言模型(LLM)、智能体工作流、集成协议以及测试框架的快速演变格局。
1. 现代大型语言模型(LLM)
当前人工智能的发展由专有前沿模型和高能力开源权重模型共同推动:
- 专有前沿模型:
- Gemini 1.5 Pro / Flash:以其原生多模态能力和巨大的 200万词元上下文窗口 而闻名,这改变了我们处理长文 档研究和代码库分析的方式。
- Claude 3.5 Sonnet:在软件开发、编码辅助和推理任务方面处于领先地位,展现出高空间推理和逻辑能力。
- GPT-4o / o1:OpenAI 的多模态和推理模型,专为复杂的_多步骤规划_和_思维链执行_而设计。
- 开源权重生态系统:
- Llama 3 / 3.1 / 3.2:Meta 的旗舰开源模型,支持高达 4050 亿参数和 128k 上下文窗口,支持前沿级能力的本地部署。
- Gemma 2:谷歌的轻量级、高性能开源模型(90 亿和 270 亿参数),针对本地开发和效率进行了优化。
2. 智能体工作流与架构
我们正在从简单的“系统提示与响应”式聊天转向自主智能体,它们能够规划、反思并与工具交互。
智能体的核心组件:
- 规划:
- 任务分解:将复杂请求分解为更小、更易管理_的子目标_(例如,思维链、思维树)。
- 自我反思:分析工具输出,并在计划失败时纠正方向。
- 记忆:
- 短期记忆:上下文中的对话历史。