
原视频链接:Codex Full Course 2026
YouTube URL:https://www.youtube.com/watch?v=KXIdYEdOPys
目录
- 一、核心结论:Codex 不只是聊天框
- 二、项目目录是工作流的中心
- 三、多聊天协作:一个聊天只负责一个产物
- 四、文件预览与自然语言迭代
- 五、Skill、Plugin 和 MCP:把能力封装起来
- 六、自动化适合做“草稿”,不要直接放飞
- 七、先搭最小闭环,再做效果
- 八、设计质量需要人类把关
- 九、一套可复用的 Codex 工作流
- 十、总结
一、核心结论:Codex 不只是聊天框
视频里最值得记住的一点是:Codex 的价值不只在“让模型回答问题”,而在于它把聊天、文件、项目、插件、技能、预览和自动化放到同一个工作流里。
传统聊天工具的中心是对话。你问一句,它答一句。结果主要停留在聊天历史里。
Codex 的中心更接近一个本地项目目录。每个聊天都可以绑定一个文件夹,Agent 可以在里面创建文档、表格、网页、App、PPT、视频工程,甚至继续读取和修改这些真实文件。
这会改变使用方式:
- 不是让 Agent “给我一个答案”,而是让它产出一个可以打开、检查、迭代的文件。
- 不是把所有需求塞进一个聊天,而是让多个聊天分别负责不同产物。
- 不是一次性提示词结束任务,而是用计划文件、预览、截图和验证结果持续纠偏。
所以,Codex 更像是一个 Agent-native 的工作台,而不是一个更强的聊天窗口。
二、项目目录是工作流的中心
视频建议先创建一个总目录,再为每个主题或产品创建独立项目。例如:
Codex Projects/
├── Codex Desktop Research/
├── My New Business/
└── Chorus/
每个项目目录下面可以有多个聊天。聊天本身不会作为文件存进目录,但 Agent 生成的文件会落在这个项目里。
这种组织方式很重要,因为它解决了三个问题。
第一,产物不会散落。Excel、Word、PPT、React 页面、Swift 工程、Remotion 视频,都可以在项目目录里找到。
第二,同一个项目里的聊天可以围绕同一批文件继续工作。比如先生成一个 codex desktop features.xlsx,再开一个新聊天,用 @文件名 引用它,让 Agent 检查是否遗漏了功能。
第三,项目目录天然适合长期迭代。即使某个聊天结束了,文件仍然在本地;即使项目从侧边栏移除,本地目录也没有消失。
我理解这里的关键不是“文件夹管理癖”,而是给 Agent 一个稳定边界。Agent 知道自己该在哪里读写,人也知道去哪里验收结果。
三、多聊天协作:一个聊天只负责一个产物
视频后半段最核心的方法论是多任务并行。
一个复杂产品不应该由一个聊天从头做到尾。更合理的方式是拆成多个相对独立的聊天:
Plan
Mobile Design
iOS App
Database / Supabase
Web Landing Page
Launch Video
Investor Deck
X Automation
每个聊天只负责一个明确产物。这样做有几个好处:
- 上下文更干净,不容易互相污染。
- 失败范围更小,一个视频任务失败不会影响数据库任务。
- 可以并行运行多个 Agent。
- 每个任务的验收标准更清楚。
视频中的 Chorus 示例就是这种模式:同一个产品,同时推进 iOS App、网页、投资人 Deck、发布视频和社交媒体自动化。人不再盯着一个 Agent 等结果,而是串行下发任务、并行回收产物。
这里有一个前提:每个任务提示词必须像一个完整任务包。它至少要包含目标、上下文、约束和验证方式。
例如,启动一个 iOS 项目时,不要一开始就要求完整 App,而是先让它创建最小可运行版本:
请创建一个名为 Chorus 的 Swift mobile app。
现在只需要在屏幕中央显示 "Hello, this is Chorus"。
不要做其他功能。完成后打开 Xcode 项目。
这类提示词的特点是范围小、验收明确、失败容易定位。
四、文件预览与自然语言迭代
Codex 的一个重要优势是文件预览。
Agent 生成 Excel、Word、PPT、网页或视频后,可以直接在右侧打开预览。然后继续用自然语言修改同一个文件。
比如表格工作流可以是:
- 让 Codex 搜索某个主题。
- 要求它把结果整理成
.xlsx。 - 在预览里打开表格。
- 发现某一列没用,再让它删除。
- 继续要求补充来源、排序或改格式。
这和普通聊天最大的区别是:每一轮修改都落在真实文件上,而不是只停留在回答文本里。
同样的方法也适用于设计和视频。视频里经常用截图反馈问题,例如按钮重叠、动画方向错误、视频帧位置不对。对于 Remotion 这类视频工作流,反馈甚至可以精确到秒数、frame 和坐标:
在 3 秒位置,请镜头放大到 "Learning about skills" 这个组件,
然后转成全屏文档视图,展示 10 个热门技能。
鼠标点击位置错了。目标 toggle 大约在 x=1000, y=610,
而现在鼠标落在 x=1040, y=540。请修正。
这说明 Agent 交互不只靠文字。截图、坐标、帧数、草图和预览结果,都是上下文。
五、Skill、Plugin 和 MCP:把能力封装起来
视频里把 Skill、Plugin 和 MCP 放在一起讲。它们名字不同,但实践上可以统一理解为:让 Agent 获得新能力的方式。
一个实用区分是:
| 概念 | 更接近什么 | 适合解决什么问题 |
|---|---|---|
| Skill | 可复用工作流 | 固定格式写作、报告生成、API 工作流 |
| Plugin | 可安装工具能力 | Gmail、Calendar、Figma、Vercel 等外部服务 |
| MCP | 外部系统连接协议 | Supabase、设计工具、数据库、自定义服务 |
如果不清楚某个插件能做什么,视频里的方法很直接:直接问 Codex。
@Figma 请告诉我你可以用这个插件做哪些事情。
列出所有能力,并说明适合的使用场景。
这个方法比凭感觉猜接口更可靠。因为 Agent 可以先枚举工具能力,再把任务映射到合适工具。
视频中最有代表性的 Skill 例子是 YouTube Researcher。作者经常需要分析 YouTube 频道,于是把流程封装成技能:
- 输入频道。
- 拉取最新视频。
- 获取 transcript、缩略图和表现数据。
- 总结每个视频内容。
- 分析哪些 hook 表现好。
- 生成 Word 报告。
抽象成通用模式就是:
重复任务 -> 搜索可用 API -> 选择服务 -> 获取 API key -> 封装 Skill -> 新 session 测试 -> 接入自动化
这个思路很适合自己的日常工作。只要某个任务每周、每月重复出现,就值得考虑封装。
六、自动化适合做“草稿”,不要直接放飞
视频里有两个很典型的自动化场景。
第一个是 Calendar + Gmail:每周五下午汇总本周日历事件,并通过邮件发给自己。
第二个是 Typefully:每天研究并生成 3 条 X / Twitter 草稿。
我觉得后者更能体现安全边界。社交媒体内容不适合一开始就自动发布,更适合先生成 draft。这样 Agent 负责收集、整理和初稿,人保留最后审核权。
比较稳妥的自动化原则是:
- 初期只生成草稿,不直接发布。
- 第一次必须用明显测试内容验证链路。
- 涉及 API key 时不要录屏展示。
- 密钥泄露后立即 rotate。
- 自动化运行后要检查真实后台,而不是只看 Codex 说完成。
自动化不是把人从流程中完全移除,而是把重复的准备工作交出去,把判断权留在人手里。
七、先搭最小闭环,再做效果
这期视频里所有复杂项目都有一个共同模式:先做最小闭环。
比如:
- App 先做 Hello World。
- 视频先做 test video。
- Web 先能提交表单。
- Deck 先生成初版。
- Skill 先测试 API。
- 数据库先确认表和数据真实存在。
这个顺序比“直接做最终效果”稳定得多。
以 Landing Page 为例,作者没有让 Codex 从零实现完整表单系统,而是使用 Tally 收集 waitlist:
- 在 Tally 创建表单。
- 复制 embed code。
- 让 Codex 创建 React 页面并嵌入表单。
- 本地打开页面。
- 输入测试邮箱提交。
- 到 Tally 后台确认 submission 出现。
这里最关键的是最后一步。用户路径必须真实跑通,不能只看页面长得像。
同样,Supabase 数据库也不能只看 App 里出现了内容,还要去 Table Editor 检查表、字段和写入数据是否真实存在。
Agent 可以生成很多东西,但“是否真的工作”仍然要靠验证闭环。
八、设计质量需要人类把关
视频里也有一个现实判断:Codex 很适合项目编排、文件操作、多任务推进和工程实现,但默认设计质量不一定总是最好。
常见问题包括:
- 组件重叠。
- 背景渐变过重。
- PPT 文字太多。
- Landing Page 视觉不够克制。
- 视频转场节奏不自然。
解决方式不是期待一次提示词变完美,而是给更具体的反馈。比如提供截图、圈出问题、说明坐标、要求减少文字、保持风格一致。
视频中作者还会在 Codex 项目目录里运行 Claude Code,用它处理设计-heavy 的修改:
claude --dangerously-skip-permissions
这个命令本身有风险,只适合可信工作区。它体现的思路更重要:不必把所有事情都押在一个工具上。Codex 可以负责工作台和工程编排,其他模型或工具可以负责视觉 polish,最后再由人做验收。
九、一套可复用的 Codex 工作流
把整期视频压缩后,我认为最值得复用的是下面这套流程:
重复任务或产品想法
-> 创建项目目录
-> 写计划 Markdown
-> 拆成多个聊天
-> 每个聊天负责一个产物
-> 先做最小可运行版本
-> 打开真实文件或服务后台验证
-> 用截图/预览/日志继续反馈
-> 高频流程封装成 Skill
-> 稳定流程再做自动化
对应到日常使用,可以从一个很小的任务开始,而不是直接做完整产品。
例如:
- 每周论文阅读总结。
- 每月 YouTube 或博客内容复盘。
- 自动整理某个项目的 issue 和 PR。
- 从会议记录生成行动项。
- 把实验结果同步成报告。
先让 Agent 产出一个真实文件,再围绕文件迭代;先让自动化生成草稿,再由人审核。这比直接要求它“全自动完成一切”更稳。
十、总结
这期视频真正有价值的地方,不是展示 Codex 有多少功能,而是展示了一种新的工作组织方式。
在这种方式里,项目目录是中心,聊天是任务单元,文件是可验证结果,插件和技能是能力扩展,自动化是长期杠杆。
人类的角色也随之变化:不再是逐行执行者,而是任务拆解者、上下文提供者、约束制定者和最终验收者。
Codex 能提高效率,但前提是你给它清晰边界、可检查产物和真实验证。没有这些,Agent 只是更快地产生不确定输出;有了这些,它才更像一个能长期协作的工程工作台。