2025 QCon Shanghai 上海 - 简短见闻
关于上海 2025 年的 QCon 会议
2025 QCon Shanghai 大会主题是:大模型正在重新定义软件 Large Language Model Is Redefining The Software,可以认为本次峰会约等于 AI/LLM 峰会。
官方站点:https://qcon.infoq.cn/2025/shanghai,会议日程以及材料参考:
- https://qcon.infoq.cn/2025/shanghai/schedule (日程以及 PPT,有些不提供 PPT 下载)
- https://www.infoq.cn/video/album (视频陆续发布,有些不提供)
可以从四个大的方向去看会议的组织和业界的思考:
- 底层超级数据中心相关
- 多模态据处理相关(摄入、处理、训练、管理和治理等等)
- AI/LLM 相关的安全和隐私
- 大模型(LLM)、智能体(Agent) 和智能体化应用(Agentic Application)的发展演进,和在各行各业的运用
Day 1 - 10 月 23 号
23 号上午日程
- 开场致辞
- 从 AI Infra 到 Agentic Infra:智能体时代的基础设施革新
- Next-Generation Software Development: Challenges, Best Practices, and Future Trends:推荐,AWS 的观点在 AI Agent 以及 AI IDE 和研发方法论等,主要是三个重点 1)新兴技术:Coding Agent 和 Formal Verification Coding ;2)Agent 协助下的研发方法:Spec-driven-development ;3)下一代技能:更好的沟通交流和结构化的输出,为人类和 AI 所能理解(给 AI 提效)
- 让 AI 不止回答问题:企业级 Agentic AI 重构智能生产力
23 号下午日程
- 混沌工程与全链路压测:如果本身方向和软件测试相关,推荐看看国内大厂蚂蚁是如何做全链路压测的,以及相关的流程体系和平台
- 基础设施开源技术架构的挑战与未来
- 从一流技术到一流管理:软性的东西,无论对错,推荐读读,也思考一下对方的观点,很多时候无关对错,是所在的环境以及位置决定了当下的想法和思考
- 大模型推理工程实践
- AI 与跨端的高效融合:推荐,特别是前端选手们可以好好看看
- 企业级Agentic AI - 从数据和大模型到企业智能解决方案专场:Snowflake 专场
- The Next AI IDE:重构开发想象力解决方案专场:推荐,Coding Agent - Kiro 和其他,都在谈 Spec-Driven-Development (SDD),可以看到这是业界的一些共识做法,推荐这个文章 Understanding Spec-Driven-Development: Kiro, spec-kit, and Tessl
Day 2 - 10 月 24 号
24 号上午日程
- Agentic AI:智能体化的 AI 的方方面,内容很多很杂,个人有兴趣推荐挑着看看
- 加速与反哺:AI 时代的可观测实践:基于大模型、智能体、和智能体化应用如何构建可观测性平台,也有大模型训练过程中如何观测底层基础设施
- 多模态融合技术与创新应用
- 具身智能:当 AI 学会“动手思考”
- Data Infra for AI:多模态数据湖的底层技术平台的研发和方向(比如:字节和阿里云),如果是研发相关,或对这一块有兴趣,可以看看
- AI 双引擎:业务增长与安全重构:有安全相关的话题,如果是该领域的,推荐看看
24 号下午日程
- Agentic AI:和上午主题类似,下午的几个话题更贴近研发
- 加速与反哺:AI 时代的可观测实践:和上午主题类似,如果该方向,强烈推荐挑一些看看
- AI 中间件:加速智能应用开发
- 从“炫技”走向“实用”的 AI 产品
- 大模型驱动的智能数据分析:推荐喜马拉雅基于多智能体架构和技术构建 ChatBI 的分享
- 火山引擎 AI Coding 技术实践:字节火山引擎专场,如果是研发方向可以看看
- HarmonyOS 开发者技术分论坛
Day 3 - 10 月 25 号
25 号上午日程
- AI 搜索技术的深水区
- Vibe Coding:推荐,Coding Agent/Vibe Coding 相关
- 端侧大模型的创新与应用
- 大模型驱动的制造革命:推荐第一个 session,关于行业(也特别提了汽车行业)在采用 AI 方面的一些现状,从咨询的视角
- 金融大模型的工程化实践
25 号下午日程
- AI 搜索技术的深水区
- AI4SE:软件研发提质增效实践:强烈推荐,AI 如何促进软件研发提质和增效,从需求相关的知识工程、到研发、代码审查和运维,分别阐述了在研发整个生命周期中如何利用大模型和 AI Agent(AI 不是万能,但是科技浪潮下没有考虑是万万不能的)
- 模型训练与微调
- AIGC 重塑内容新生产力
- 大模型安全:当 AI 学会欺骗 AI:安全相关,如果是该领域,推荐看看
小结
- 超级计算中心蓬勃发展(包括硬件和软件,以及物理设施和电力),NeoCloud 众多玩家
- 多模态数据和相关技术的演进,促进从结构化数据走向多模态数据的价值挖掘
- 隐私和安全有了新的命题
- 企业都在各个方向上积极尝试各类大模型(通过自训练、微调或 RAG)、以及自研智能体和智能体化应用
数据中心和 NeoCloud
大模型训练和推理对于算力的需求包括对算力的有效管理,催生了超级数据中心(超节点)的爆发式增长,NeoCloud 方向上已经有好几个大的玩家:CoreWeave, Nebius, 和 Applied Digital 等等,国内还是以几个大厂为主,但是数据中心的需求(包括电力)也在大规模增长中。
A "neocloud" is a new generation of cloud provider specializing in high-performance computing (HPC) and artificial intelligence (AI) workloads, differentiating itself from traditional hyperscale clouds by focusing on raw GPU power. These providers offer optimized infrastructure, often through a GPU-as-a-Service (GPUaaS) model, that is built for demanding tasks like AI model training and inference, providing faster, more flexible, and potentially more cost-effective solutions for AI-specific needs.
这一层离我有点远,如果有兴趣可以进一步推荐听听这个播客了解一下数据中心发展:E212|AI数据中心的万亿大基建时代:美国GDP增长全靠它 - 硅谷101
- “2025年上半年,美国GDP增长几乎全部来自于数据中心与信息技术。”
- “如果去掉信息技术与软件,美国GDP增长率仅有0.1%。” ——哈佛大学经济学家杰森·弗曼(Jason Furman)多模态数据和多模态数据湖发展
- 为什么多模态数据如此重要?大模型的发展,统一了数据的处理(An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale这个论文作为开端),实现了文生图和文生视频,对企业来说,有强烈诉求(当然业界也在推动“鼓吹”)挖掘更多多模态数据的价值,从结构化数据(当然过去也提半结构化、非结构化数据,不同数据处理方式是不同的)走向多模态数据价值挖掘,采用和过去不同的技术手段
- 基于 Lance 构建多模态数据湖是国内大厂都在走的技术方向(没具体了解过 Snowflake 的技术路线)
隐私和合规
•治理(隐私合规方面)
•运行时的安全(内容和信息安全、权限控制等等)
•使用时的透明性
•技术上的更多管理和治理的实现,会和目前的技术手段不一样,比如:Agent 的权限,MCP 服务的认证授权,AI 流量的治理等等(推荐一篇文章:Envoy AI Gateway 现已支持 Model Context Protocol,可以看到 Envoy 推出了 AI Gagteway,也在持续增强,可以对 MCP 做治理/管控)
更多也可以参考 Agentic AI and Security
LLM, Agent and Agentic Application
结合大模型不断增强和演进,如何构建上面的体系以及产品应用,通过 QCon 可以看到:
- 模型层的微调和外挂(RAG),当然不少大厂也有自己训练模型,但更多是微调和 RAG
- Agent(从 Prompt Engineering 到 Context Engineering,从单 Agent 到多 Agent,从 Supervisor 到 Swarm 多 Agent 架构,演进到不断自主学习进化型)
- 应用层(研发,运营,运维,企业增强自身产品和客户)方面依托模型和 Agent 的构建,单点上(MR review)、某些点(Coding Agent,SREAgent)、某方面端到端(知识工程)的探索尝试,是一个一定的趋势和共识,上层的更多应用构建,其实和企业自身情况密切相关,不能一概而论
巨头崛起
上面谈了不同的 4 层或 4 个方向,单纯从大模型看是最贴近数据中心层,但是从现实来看,无论是那家大模型公司,都是从底层到上层进行“通吃”,联合不同厂商建数据中心、合作定向采购 XPU(GPU、TPU、DPU、PPU ...)、不断训练新一代大模型、推出各类上层的 Agent 或 C 端/B 端应用。
下图来自 https://x.com/aakashg0/status/1987368814665998372, 说的是 Google 是唯一的全栈,但是可以看到不同的巨头都在往全栈奔赴。(下图中 4 层的定义和我上面的 4 层说法有些差异):

最后,传统企业在 AI 时代如何选择?个人的一些想法如下:
- 利用 AI/LLM,对内提质和提效,对外提升客户,端到端全链路思考,但一定不是全面铺开
- 不需要训练自己企业的大模型
- 需要有微调模型,结合 RAG,打造懂企业自身的 Agent;不是一个 Agent 解决所有问题,而是多个 Agent 解决不同问题;模型和 Agent 不只是面向软件研发,可以深入制造工厂
- 对于多模态数据,需要思考多模态数据到底能给我们带来什么样的价值?企业内部如何统一处理多模态数据其实更多是组织架构和内部政治的挑战,需要内部从业务场景出发的推动,业务驱动数据来提供更多的价值
- 需要考虑组织架构和管理体系的演进,以及工程化管理的重新思考,特别是单点上要争取早日尝试,提质为首要目标,提效(以及提量)是提质的结果和 AI 时代的必然 ,组织体系、研发流程和工程管理是演进成功的关键,如果只是试图从工具和技术层面解决,一定只是单点上的突破,重要但不应该是企业 的终极目标;过程中,人的角色如何界定,是不是要打破更多的边界,去掉既定角色,向着人人都是 Builder 演进为端到端的结果负责?
- 利用 AI 提升客户体验,是个难题,相比解决内部的制造和工程问题,不要只是狭隘的理解直接面对客户就是提升客户体验,其实提升内部服务质量和效率一样是提升客户体验