Skip to main content

大模型时代:少数底座,海量应用

无论是PC还是手机时代,提供操作系统的公司始终寥寥无几,但基于其上的应用却数以万计。大模型的发展也会遵循这一规律——真正提供大模型产品与服务的厂商不会很多,但应用将会极其丰富多样。大模型的价值在于与产业深度结合,推动数据飞轮的形成。因此,与其在模型规模上“内卷”,不如在应用创新上“卷”,这才是大模型发挥最大效用的关键。

四种演进中的应用开发模式

为了满足不同行业与场景的多样化需求,大模型的应用开发模式逐渐演变为四种:提示词工程、RAG、业务执行Copilot,以及自主规划与执行的智能体

  • 提示词工程是最基础的交互方式
  • RAG通过外部检索增强生成内容的质量
  • Copilot则能辅助用户完成复杂任务,如自动编程
  • 智能体更是具备自主学习与决策的能力,是大模型进入生产力场景的最佳形态。

从静态到动态、从单模态到多模态、从简单任务到复杂任务、从手动编排到自动化学习,这一演进大幅提升了开发的便利性与实用性,也为未来更广泛的产业应用打开了空间。

应用场景象限:如何选择合适的开发模式

为了帮助用户提升资源利用率,百度智能云提出了“应用场景象限图”。其中,纵轴代表外部知识需求,横轴代表模型适应性要求

  • 若两者都低,可直接使用预训练大模型并结合提示词工程即可;
  • 若外部知识需求高但适应性要求低,则RAG是合适方案;
  • 若外部知识需求低但适应性要求高,可以通过微调优化模型;
  • 而当两者都高时,则需要结合微调、RAG和智能体等更复杂的方式来开发。

这种分类方式,让企业在面对不同应用场景时有了清晰的技术选型路径。

提示词工程的意义与流程

在大模型应用中,提出好问题往往比回答更重要。提示词工程就是通过设计自然语言指令,引导模型生成符合需求的结果。它的开发流程分为五个阶段:准备测试用例、设计初版提示词、评估效果、优化提示词以及最终交付。提示词的开发和大模型的开发需要结合进行,以保证应用效果。

提示词的构成与优化技巧

一个提示词通常包含人设/角色、任务、输出要求、上下文和示例五类元素,这些要素能帮助大模型更好地理解需求。优化提示词时可以通过三种方式提升质量:

  1. 其一,明确指令,避免冗余输出;
  2. 其二,细化范围,确保结果精确匹配需求;
  3. 其三,采用链式思考(逐步推理),帮助模型完成复杂任务。 根据任务不同,可以选择零样本或少样本方式提升效果。

应用场景与实践案例

提示词工程可广泛应用于信息提取、问答、文本分类、角色扮演、文本生成和代码生成等场景。比如某传媒企业就利用提示词工程解决了新闻分类和简报生成的难题:通过信息聚类、时间抽取和排序,再由大模型生成简报,显著提升了内容整合的效率和规范性。案例表明,模糊的提示词会导致输出笼统,而精准的提示词能大幅提升质量,减少沟通和调试成本。

  • 业务决策类:需权衡选项、评估风险、选择最优解;提示词:任务目标+决策选项+评估标准;慢思考推理性策略:逻辑推演和量化分析
  • 数据分析类:需深度理解数据/信息、发现模式或因果关系;提示词:问题+数据/信息+分析方法;慢思考推理性策略:触发因果链推导与假设验证
  • 逻辑验证类:需检查逻辑自洽性、数据可靠性或方案可行性;提示词:结论+验证方法+风险点;慢思考推理性策略:自主设计验证路径并排查矛盾
  • 任务执行类:需完成具体操作(代码/计算/流程);提示词:任务需求+步骤约束+执行内容;慢思考推理性策略:自主优化步骤,兼顾效率与正确性

DeepSeek与提示词的新关系

DeepSeek-R1等慢思考推理型大模型的出现,让提示词的设计看似不再复杂。例如,传统大模型需要长篇指令才能写出一篇“小红书笔记”,而DeepSeek仅凭一句“写一篇春节抢火车票的小红书笔记”就能输出完整内容。

但这并不意味着提示词失效:一方面,慢思考推理模型并非适用于所有场景;另一方面,即使在使用这类模型时,规范、精确的提示词依然能进一步提升输出质量。

检索增强开发实战

RAG(检索增强生成)是企业级大模型应用的关键,它通过结合自有知识库,有效减少幻觉,让模型更懂业务。百度智能云提供的企业级RAG支持无限容量的知识库存储,能在1.5秒内输出答案,并允许解析、切片、向量化、召回、排序等环节灵活配置,保证安全性与稳定性。其流程分为数据准备(文档提取、切分、向量化、入库)和应用阶段(用户提问、检索、提示词注入、生成答案)。

在政务咨询场景中,单位通过构建私有知识库实现了智能问答助手,做到100%私域数据安全、98%一次性准确率,大幅减轻一线压力;在媒资管理中,澎湃新闻利用2700万篇、350亿字的庞大知识库进行RAG检索,保证了新闻内容的权威性和安全性,当问题超出知识库范围时模型会拒答,从而确保结果可控可靠。这些实践显示,RAG已成为企业将大模型应用落地的重要抓手。

助手类Copilot的开发实战

助手类Copilot是一种介于RAG和智能体之间的应用形态,主要用于增强用户工作流程、减轻重复性劳动,适合自动化需求不高但需要信息整合和决策支持的场景。以供电行业为例,传统的扩新装统计和日志报告需要人工逐步拆解和汇总,效率低且重复性强。通过百度智能云千帆AppBuilder平台,结合NL2SQL、知识问答、数据查询、图表生成等能力,可以让所长直接用自然语言查询数据库,实时生成报告,大幅提高管理效率。在矿山供电运维中,企业将专业知识、经验与大模型结合,构建资深助手,解决了知识沉淀和故障定位的难题,最终实现知识获取成本下降70%、人力成本下降20%、运维成本下降30%、故障停电时间缩短30%。这些案例显示,助手类Copilot能够有效提升行业运维和管理的智能化水平,成为企业实现高效协同的重要工具。

智能体的开发实战

智能体被认为是人工智能原生时代最主流的应用形态,既有低门槛也具备高上限,正在成为内容、信息和服务的新载体。用户只需用自然语言描述需求,就能在“无代码编程+多智能体协作+多工具调用”的支持下,3分钟生成应用、1小时快速迭代。

例如,父母提出“孩子不爱吃蔬菜怎么办”,平台便能自动生成“儿童饮食小管家”智能体,并支持发布和分享。智能体形态丰富,包括公司类、角色类、工具类和行业类,从开发角度又可分为“自主规划智能体”和“工作流智能体”。前者依靠大模型自主思考与回复,后者则将企业复杂流程转化为灵活智能体,结合大模型的意图理解和泛化能力,像专家一样处理复杂任务。低门槛意味着人人都能做应用,高天花板则保证了智能体在企业与个人场景中都能发挥巨大价值。

自主规划智能体:人工智能手机应用案例

基于大模型开发的人工智能手机应用,让手机从传统的信息检索与命令执行工具,升级为具备理解和决策能力的智能助理,能够结合用户语音输入和上下文动态适配生活场景,实现高度个性化的响应。以“肯德基点餐助手”为例,用户只需一句话即可完成从菜单获取到下单、再到订单信息发送至微信群的全流程。这一过程通过大模型驱动智能体调用组件实现,包括获取菜单、点餐助手、微信消息发送等功能,并由超级手机助手在终端App中完成启动、点击和信息处理。

工作流智能体:一小时培养“金牌销售”

车险续保流程复杂,销售人员不仅要长期跟进客户,还要熟悉涵盖三个阶段、八个环节的大量文档和子流程,传统培养一名合格的金牌销售往往需要一到两年。以往的对话机器人因缺乏拟人度、流畅性和应变能力,难以胜任这一高要求场景。借助大模型平台,企业可以在一小时内创建一个具备完整售前宝典知识的工作流智能体。通过配置和调节每个节点,该智能体能够快速上线,并灵活部署在百度搜索、微信公众号、企业官网或业务系统中,实现标准化、智能化的销售服务,大幅缩短培养周期并提升客户体验。