用「晨间简报」学会 Codex:六个可复制的使用层级
2026-05-20
2026-05-25 0

过去两年,AI已经从"加分项"变成了"必选项"。
不只是大厂,二线公司、甚至传统行业的测试团队都在要求:"能熟练使用AI工具提效"。
更关键的是,面试的玩法也变了。现在的技术面试早就跳出了 “考 AI 零散知识点” 的阶段。面试官不会再问 “你知道哪些 AI 测试工具” 这类浅层问题,而是把AI 玩法揉进业务场景、技术方案设计,甚至开放性问题里 ——考查的是你对AI的理解深度和实际应用能力。
现在行业里人人都在说 “转 AI 测试”,仿佛这是软件测试行业在AI 时代下的唯一出路。
但我始终觉得,与其跟风喊口号,不如先沉下心来想清楚:我们常说的 AI 测试,到底是什么?它和我们做了很多年的传统测试,核心差异到底在哪?
这篇内容,我们就来回归本质,把这事儿掰开揉碎讲清楚。
很多人一听到"AI测试",第一反应是:"哦,就是用ChatGPT、Cursor、Claude Code 这些AI 工具生成测试用例呗。"
这只是AI测试的冰山一角,而且是最浅的那一角。
我面试过不少号称"做过AI测试"的候选人,问他们具体怎么做的,回答基本就三类:
这三类都对,但都不完整。就像你问"什么是汽车",有人说"能跑的东西",有人说"有四个轮子的",有人说"烧油的"——都对,但都没触达本质。
首先得明确,AI 测试从来不是 “用 AI 替代测试工程师”,这是我接触下来发现很多人最容易走进的误区。
在我看来,AI 测试本质上是把人工智能的技术思路和方法,融入到软件测试的全生命周期里 —— 从测试需求分析、用例设计,到用例执行、缺陷定位,再到回归测试优化,用技术手段解决传统测试里效率低、覆盖不全、重复性工作多的问题。它不是对传统测试的否定,而是在原有体系上的补充和升级。
说到传统测试,相信做过的人都深有体会:
而 AI 测试的核心价值,在我看来就是 “降低技术门槛、解放人力,聚焦核心”。
比如用 AI 生成测试用例,它能基于业务逻辑和历史缺陷数据,快速覆盖到人工容易忽略的边缘场景,还能根据需求变更自动调整用例,省去了我们手动梳理、编写的大量时间;
再比如用 AI 做自动化测试的脚本维护,传统自动化脚本一旦界面或接口变更就容易失效,AI 能通过视觉识别、语义理解自动适配变更,减少我们反复修改脚本的工作量;
还有缺陷定位,AI 能分析测试日志、代码提交记录,快速定位到可能出问题的代码模块,比我们人工逐行排查效率高得多。
我认为,AI测试应该包含三个层面,这三个层面构成了一个完整的AI测试能力模型:
定义:用AI工具提升传统测试活动的效率和质量。
典型场景:
核心价值:提效。
让测试人员从重复性劳动中解放出来,把时间花在更有价值的分析和设计上。
局限:AI只是工具,测试策略、质量标准、风险评估仍然由人把控。AI生成的内容需要人工审核,不能直接信任。
定义:对AI模型、AI应用、AI服务进行质量验证和风险评估。
什么是AI 系统,可以简单理解为,凡是集成了AI 能力的应用,都可以称之为AI 系统。比如各类AI 助手(豆包、DeepSeek、ChatGPT)、AI 客服、智能推荐、嵌入式AI(自动驾驶、智能音箱)等。
典型场景:
核心价值:保障AI产品的质量。
AI系统的输出是概率性的、不确定的,传统测试的"输入A→输出B"的确定性逻辑在这里失效了。
关键挑战:
定义:AI不仅是辅助工具,而是测试活动的核心决策者,能够自主规划测试策略、生成测试数据、执行测试、分析结果。
AI驱动的测试 = 以AI为核心引擎,能够自主完成"测试策略制定 → 测试设计 → 测试执行 → 结果分析 → 策略优化"全链路的测试范式。
典型场景:
核心价值:智能化、Agent 化。
从"人设计测试"进化到"AI设计测试",从"被动执行"进化到"主动发现"。
传统测试的流程一般是这样子的:
代码语言:javascript需求 → 人工设计用例 → 人工执行 → 人工分析 → 人工决策AI驱动的测试流程是闭环的:
代码语言:javascript系统反馈 → AI感知 → AI决策 → AI执行 → AI分析 → AI优化策略 → 下一轮
↑_________________________________________________↓人在这个闭环中的角色:设定目标、定义边界、审核关键决策、处理异常情况。
当前阶段:AI 驱动的测试还处在早期,目前大部分场景是"人机协作",AI提供建议,人做最终决策,完全自主的AI测试目前还在研究和试点阶段。
在软件测试工作中,AI 驱动测试的常见场景(供开拓思路):
传统做法:测试负责人根据经验,决定"测什么、怎么测、用什么工具"。
AI驱动做法:
传统做法:人根据需求文档,逐条编写测试用例。
AI驱动做法:
比如:
传统做法:人配置环境、触发执行、坚控进度。
AI驱动做法:
传统做法:人看测试报告,逐条分析失败原因。
AI驱动做法:
比如:
传统做法:测试团队定期复盘,人工优化流程。
AI驱动做法:
很多人问:这三种形态,我该学哪个?
我的答案是:这不是选择题,是递进关系。
代码语言:javascript第一层:AI辅助测试(现在就能用)
↓ 打好基础
第二层:测试AI系统(当前市场最缺人)
↓ 深入理解AI
第三层:AI驱动的测试(未来方向)现实情况是:
为了讲清楚AI 测试与传统测试之间的区别,我列了一个对比表,但先声明:这不是"AI测试取代传统测试"的意思,而是"AI测试扩展了传统测试的边界"。
对比维度 | 传统测试 | AI测试 |
|---|---|---|
测试对象 | 确定性系统:输入A→输出B | 概率性系统:输入A→输出可能是B、C、D |
质量判断标准 | 对与错(Pass/Fail) | 好与坏(相关性、准确性、安全性、公平性) |
测试用例设计 | 基于需求文档,人工设计 | AI辅助生成 + 人工审核,或AI自主探索 |
断言方式 | 精确匹配:assertEquals(expected, actual) | 模糊匹配:语义相似度、人工评估、A/B测试 |
缺陷定义 | 功能不符合预期 | 幻觉、偏见、不安全、不符合论理 |
测试数据 | 人工构造或从生产环境脱敏 | 合成数据、对抗样本、Prompt注入样本 |
测试工具 | JMeter、Selenium、Postman | LangChain、LangSmith、专用LLM评估框架 |
技能要求 | 业务理解 + 测试设计 + 工具使用 | 以上全部 + AI原理理解 + Prompt工程 + 风险评估 |
职业发展 | 功能测试→自动化测试→测试开发 | AI测试工程师→AI测试架构师→AI质量负责人 |
其中,最核心的几个关键区别:
传统测试的世界里,1+1必须等于2。如果等于3,就是Bug。
AI测试的世界里,模型回答"1+1约等于2"可能是对的(取决于上下文),但回答"1+1等于3"也可能是对的(如果上下文是"在某种特殊代数体系中")。
怎么判断这个回答的质量?这是AI测试的核心难题。 (别着急,后续会有专门的教程详细介绍)
传统测试的断言是二元的:通过/失败。
而,AI测试的评估是多维的:
这些维度往往需要用人工评估 + 自动指标 + A/B测试综合判断。
传统测试验证的是"功能有没有实现"。
AI测试验证的是"AI在未知场景下会怎么表现"。比如:
这些都不是"功能"层面的问题,而是"行为"层面的风险。
我面试过一个五年经验的测试工程师,技术底子很好,自动化框架搭得漂亮。但聊到AI测试时,他坚持认为:"AI测试就是用AI工具帮我写脚本,核心还是那些测试理论。"
我反问了他一个问题:
"如果你要测试一个AI客服机器人,用户问'怎么取消订单',AI回答'您可以点击订单页面的取消按钮'。这个回答看起来正确,但实际上用户当时处于'已发货'状态,取消按钮根本不存在。这个场景,你的传统测试框架怎么覆盖?"
他沉默了。
这就是区别所在:传统测试基于"已知需求"设计用例,AI测试必须覆盖"未知场景下的行为风险"。
如果你正在考虑往AI测试方向转,我的建议是:
第一步(现在就能做):把AI辅助测试用起来
第二步(进阶):深入理解测试AI系统
第三步(高阶):探索AI驱动的测试
如果你还不会这些,也别怕,这只是帮你提前打一个预防针,这些后续在「AI 进化社」中,都会有相应的专栏教程详细介绍。
写在最后,我也想强调一下,AI 测试并不是万能的,更不是要取代测试工程师。
比如涉及到业务逻辑的核心决策、用户体验的主观判断、合规性的严谨校验,这些依然需要我们测试人员基于对业务的理解、对用户的洞察来把控 ——AI 能提供数据和思路,但最终的判断和决策,还是要靠人。
我见过有些团队盲目追求 “全 AI 测试”,把所有测试环节都交给 AI,结果反而因为 AI 对业务场景的理解不透彻,出现了大量无效测试、误判缺陷的情况,反而拖慢了项目进度。
AI测试并不是单纯的传统测试的"升级版",也不是"用AI工具做传统测试"。AI 测试 它是一个新的测试范式,需要新的思维方式、新的评估维度、新的技能栈。
理解这一点,是你转型AI测试的第一步。
其实说到底,AI 测试和传统测试的核心目标是一致的 —— 都是为了保障软件质量,只是实现的手段和效率不同。
对于测试从业者来说,与其纠结 “要不要转 AI 测试”,不如换个思路:把 AI 当成提升自己工作效率的工具,而不是需要追赶的 “风口”。
不用害怕自己学不会 AI 相关的知识,也不用盲目跟风学各种工具,而是结合自己的工作场景,思考 “哪些环节能用 AI 提效”、“AI 能解决我当前工作中的哪些痛点”。
比如:
一步步落地,一点点验证,让 AI 真正服务于自己的工作,而不是被技术牵着走。
软件测试行业从来不是一成不变的,从手工测试到自动化测试,再到如今的 AI 测试,本质上是技术发展推动的行业升级。
但无论技术怎么变,对业务的理解、对质量的敬畏、对问题的思考能力,永远是测试人员最核心的竞争力。
AI 只是工具,能把我们从繁琐的重复劳动中解放出来,但真正决定测试质量的,还是使用工具的人。