用「晨间简报」学会 Codex:六个可复制的使用层级
2026-05-20
2026-05-24 0
很长一段时间以来,被AI干懵了,各种模型、工具、技术百花齐放,学都学不过来。去年下半年制定的AI应用实践及写作计划,也在不断变化,以至于很久没有更新文章。

下班回家后,回想今天有两件事儿给我留下深刻影响:
1、上午听同事用dify把nuclei的POC转化为Bas的POC,当时工作流很长,模型能力不行导致多了很多节点做检查;
2、中午在和领导吃饭时,大家兴致勃勃的聊起大模型,其中的boss说我们不会用大模型导致自己很累。
对于后者,我一时来了兴趣,抱着今晚熬大夜的想法,准备好好分析一下,于是找大模型聊起来。对于整个过程,我觉得比较有意思,所以就都记录下来,配合自己的总结直接拿出来分享。(内容以和大模型的聊天为主,结合到网络安全相关工作内容和个人困惑,个人觉得过程挺有意思,建议参照下面的目录跳着读一读~)
【提示词】我现在使用AI感到很累人,所以梳理了主要的工作内容以进行场景化分析:
1、安全分析场景:使用AI写网络安全事件分析总结、给我们的启发和建议 2、应急响应场景:使用AI写漏洞排查脚本 3、产品设计场景:使用AI做竞品分析、写PRD图、写前端demo演示页面 4、团队周报场景:用于分析、汇总其他人周报,写团队周报 5、漏洞挖掘场景:用AI+提示词或skills做代码审计 |
|---|
总之,目前给我的感觉是:信息量太大,自己成为瓶颈了。以前需要一天完成的工作,现在可能就1-2小时,然后AI不断输出内容,我就不断的去看、看都看不过来,头大了
PS:目前都是用的国内大模型,没有用过外顶级大模型,不知道和大模型是否有关系?
你现在的模式大概率是:
你给提示 → AI 吐出一大篇 → 你逐字审阅修改 → 再生成 → 再审阅……
这样你的认知负荷没有减少,反而增加了“鉴别AI输出质量”的新负担。
要切换成:
你定标准和边界 → AI 按模板/结构化要求产出 → 你只审核关键异常点 → 通过即交付
换句话说,你要把“看内容”的工作也外包给AI,你只做“例外管理”。
assert 测试或 pytest 用例和预期结果。你跑一下测试,绿了就直接用,出错时才深入看。有影响,但不是根本原因。 国外顶尖模型在“遵循复杂指令”“结构化输出一致性”“长文本的逻辑紧密度”上确实更强一些,能让你更容易实施上面的“模板化、异常化”要求。但是,你目前头大的核心是人机交互的工作流设计问题,而非模型能力不足。即便换成GPT-4o或Claude 3.5,如果仍然采用“吐一堆你看一堆”的模式,你依然会累。
可以先在国内模型上试这些结构化提示,如果发现模型不能稳定保持格式,或经常忽视“只给异常”的指令,那时再考虑切换模型来获得更好的指令遵循能力。目前很多国内模型也支持 JSON 模式或严格的格式要求,可以去尝试利用。
当你感到“被AI淹没”时,其实不是AI做得不够多,而是你还没有教会它如何替你“筛选和压缩”信息。领导说得对——让AI工作,你做决断。现在的工作,就是花一点时间把上面的减负方法固化成你的常用提示模板,大约一周后,体感就会截然不同。
【提示词】你的分析部分有问题,比如应急响应场景,AI写出来之后,我立刻就去服务器上做测试了,根据测试结果来调整,根本就没有逐句去看脚本代码。
AI 生成脚本 → 立刻上服务器测试 → 根据测试结果调整 → (可能多轮迭代)
您已经跳过了“阅读代码”的耗时环节,直接进入验证循环。这是一种非常务实的高级用法,说明您已经把AI当作一个“可执行的方案生成器”,而非“文档生成器”。
在这种模式下,累的原因很可能不是“看的内容太多”,而是 “试错循环太快、太密集”,以及决策判断的频率急剧升高。
具体来说:
简单说,您不是被信息淹没,而是被高密度的修正循环耗尽了心力。
要打破这种循环,关键是把测试-观察-判断这个闭环里的一部分工作也交给AI,让它能提前考虑到环境因素,或者能指导您如何快速消化测试结果。您可以尝试以下四种策略:
不要只让AI给脚本,而是要求它同时给出:
这样您测试时,看到的不再是需要绞尽脑汁分析的底层报错,而是已经被AI预判过的、带有明确指引的信息,决策速度会快得多。
拿到脚本后,先不运行,而是追加一个提示:
“假设你是运维工程师,即将在CentOS 7上运行这个脚本,请预判最可能出现的三个错误,并直接给出修复后的完整脚本版本。”
这相当于让AI替您完成第一轮的“测试-失败-修改”。您拿到的是已经自我修正过的版本,直接测试它,多数情况下一两次就能通过。您的心态会从“修车工”变成“试驾员”,轻松很多。
当测试真的失败了,不要立刻开始新一轮对话,这样太碎。您可以采用“批量处理”:
把多轮零散的“你一句我一句”变成结构化的“一次提交,一次决策”,能极大减少切换损耗。
针对经常写的脚本类型(如日志分析、进程检查、批量取证),您可以事先做一个包含上述要求的系统提示词模板,例如:
“你是一个负责编写安全应急脚本的工程师。每次生成脚本时,必须做到:1. 首行注释写明用途和运行风险;2. 内置环境依赖检查;3. 所有外部命令使用绝对路径;4. 操作前输出详细预览并要求确认;5. 附带一条一键撤销命令。同时,用单独一段写出在标准CentOS7上运行的预期输出样例。”
把这个模板固定为某个对话或项目笔记,一次打磨,长期复用,就免去了每次都要重新交代的精力。
您其他四个场景的“累”,可能也存在类似的错位——我上次一概而论地认为您在看大段文字,但也许您已经用了更高效的方式,只是仍然被其他形式的“高频交互”消耗。举例:
如果能针对每个场景,也像应急响应一样,把您的实际交互步骤简单说一说,我可以帮您定制类似“闭环减负”的策略,让AI替您多走几步,把您从高频决策点上解放出来。
再次为之前的误解致歉。您的实践其实已经走在很前面了,只是需要再补上一步——不让AI在信息层面给您留作业,而是让它把作业做到“您只需点头或摇头”的程度。这和您领导说的“让AI替你工作”完全一致,您只是需要把工作边界再往AI那边推一推,把自己从循环里抽出来。
【提示词】你有点矫枉过正了,我补充下你可能说的有问题的场景:
1、漏洞挖掘:我不是全文看,而是看生成漏洞利用链、有POC的漏洞
2、团队周报:生成之后我需要看全部,然后根据汇报着重点、关注点、事情详情情况来做调整或修改
从当前的聊天来看,我累的原因,自评估是:和AI的协作关系(生成的PRD、事件报告全看)、工作内容变多(效率提升后,干得更多了)、用脑过度(总是在思考逻辑关系、正确性)。
您目前的协作模式类似“AI起草,您终审全稿”,这会让您的大脑陷入一种持续的“校对+验证”模式。要破局,必须把AI输出的默认状态从“可能有问题”调整到“可信交付”,您只处理少数异常。
具体方法:
梳理出您在各类产出中极少出错、风险可控的模块,明确告知AI这些部分无需您确认。
在得到长文稿后,追加一条指令:
“将以上内容与你最开始的版本做对比,列出所有你做了实质性修改的地方,并简述修改理由。”您只需浏览这份差异报告,快速定位改动点,判断AI的修正逻辑是否合理。这样就从审阅几千字变成审阅几十个字的改动摘要。
让AI主动标出它不确定的部分。在系统提示里设定:
“在输出中,用【存疑:……】标注任何你认为需要我确认的推断、数据或逻辑环节。其余部分视为你已有高度信心。”您阅读时,眼睛优先扫描这些【存疑】标记,心里就会有个底:没标的我可以快过。
效率提升后工作量自动蔓延,这是经典的“杰文斯悖论”。您需要给自己设定人工界限,让AI的快适应您的节奏,而不是您追着它跑。
具体方法:
比如“AI生成的完整文档,每天我只深度处理2份,其余一律只做【异常扫描】。”超额的需求采用“堆积+批量处理”模式:把AI生成的初稿先放入一个文件夹,设定每天下午4点集中花30分钟批量过一遍,只标记需修改处,不改细节,第二天早上统一反馈。这样把碎片化的审阅合并,大幅降低切换成本。
当AI生成物到达您的“够用”标准时,立刻用指令终结:
“这份已满组教付要求,请生成最终版本并编号存档,不再接受优化建议。”这既是给AI的指令,也是给自己的心理暗示——可以结束了。
既然效率提升了,您可以主动和领导沟通:我现在可以用同样时间处理更多任务,但我建议把节省出的时间投入到“高风险事项的深度研判”或“架构优化”上,而不是简单增加文书产出。让领导看到您从“产得多”转向“判得准”,这符合您的安全专家角色。
您感到用脑过度的核心,在于您一直在脑内运行“AI输出的验证程序”。必须把一部分验证逻辑外包给AI本身,让您从“思考是否正确”切换到“裁判两个选项哪个更好”。
具体方法:
对于一个重要产出,直接开两个AI对话(或用同一个对话但明确要求切换立场):
制作一个适用于任何输出的通用审阅提示:
“请对以上内容执行以下检查:1. 是否存在因果倒置?2. 是否存在假设不成立?3. 是否存在数据前后矛盾?4. 是否存在遗漏的关键场景?输出用三列表格:问题类型、具体位置、建议修正。”把这个提示作为您的“审阅助手”,每次拿到产出先跑一遍,您就获得了AI替您完成的逻辑分析报告。您的任务简化为:看这份报告,判断哪些是真正需要改的。
对于常规决策(比如PRD里某个按钮的优先级),可以给出选项让AI建议:
“综合用户画像和业务目标,A和B两个方案你建议选哪个?列出三个最关键的决策依据。”您只需点头或摇头,必要时追问一个why,而不用从零构建论证。
一句话总结:您累,是因为您还在用工业时代“手艺人-工具”的关系来对待AI。真正高效的协作,是让AI替您完成所有“预备思考”,您只做那个最后拍板的“决策者”。
从上面的过程不难看出,大模型非常擅长文字和推理,多轮沟通后才可能得到自己想要的答案。这是交互的过程,也是可以理清楚自己问题的必经之路。如果问题简单或清楚,直接写全背景和要求,得到想要的答案会更快。
这是本篇文章诞生的导火索,我也很认可大模型给出的答案:
主动限速为大脑减负,适当的慢下来,不再贪多图快;
把工作交给AI做的同时让它来检查,我负责验收结果;
个人角色从AI的校验员转为指挥官,只做决策类的事。
在和大模型聊的过程中,也涌现出很多“累人”的原因,肯定有一条是适合你的