简单用 Codex 整理 A-Level 真题试卷

下面是一份最新的 2026年1月 International A-Level Further Mathematics 的 Further Pure Mathematics 3 的国际区试卷

截屏2026-05-16 下午9.33.25.webp

截屏2026-05-16 下午9.33.16.webp

截屏2026-05-16 下午9.33.10.webp

截屏2026-05-16 下午9.33.02.webp

截屏2026-05-16 下午9.32.56.webp

截屏2026-05-16 下午9.36.23.webp

可以看到，每道题都是单独一页，并且还有单独的答题区，因此非常适合让codex自动识别并且对真题进行分类：将同一种考点的题放在同一份pdf中，并制作它的答案。

Codex 最终为我生成了8个分类PDF。（由于我有环境洁癖，所以我很担心它乱动我的环境，因此我在 AGENTS.md 中让它每轮结束都汇报对依赖或环境的使用或修改情况）

本轮使用 GPT-5.5 模型，思考强度为最大。接下来，我还让它根据题的顺序分别整理每组题的答案（下载好的 Mark Scheme）。

下面是上面那套卷子的 MS 的样式：

截屏2026-05-16 下午10.21.42.webp

截屏2026-05-16 下午10.21.59.webp

截屏2026-05-16 下午10.21.50.webp

事实证明，它在这种简单工作上很得心应手，输出结果如下：

截屏2026-05-16 下午9.59.40.webp

经过我的手动复核，没有发现任何一个 PDF 拼接错误，并且答案也完全是按照题的顺序来的，不得不感叹codex的强大。在这个任务中，我觉得不光体现的是codex操作文件的能力，更多是GPT-5.5对于数学的深入理解和强大推理能力。

一点其他内容

从年初开始，随着 Openclaw 破圈，社交媒体上似乎掀起了一股“全民 Vibe Coding 热潮“，无数人都去尝试各类工具，我自然也去尝试了一下。实际上，从去年开始，我就一直尝试各类 vibe coding 工具，从 vscode 侧边栏插件开始，经过 cursor，直到现在的 claude code、codex、antigravity 和 trae CN。不过，事实上我缺的从来都不是工具，而是受到现实的制约，其中最主要的是 ------ 钱。

其中，Anthropic 公开将中国列为敌对国家，大批封禁中国用户。早期大家还可以靠 IP 纯净度来暂时躲避封禁，但这招现在已经行不通。由于我也没什么太多的需求，因此觉得没有什么倒腾 Claude 的意义，就一直在寻找替代方案。

国产的 Coding Plan 我也没抢到，并且我算了一下，GLM 的 Coding Plan 也得 140 人民币，而 Chatgpt Plus 也就 20 美元，似乎并不怎么划算。

当然，我一直没有为任何模型付款是因为我作为高中生一不赚钱，我不为任何人打工，因此我买不起；二也没什么项目要写，也用不着花这么多钱，所以就一直用的免费计划。一些小的问题我尝试过用 Trae 免费模型排队解决，稍微复杂点的问题我会选择用 Codex 的免费额度。

后来，随着 Deepseek V4 Pro 的发布，由于梁文峰叔叔卖的token实在是太便宜了，我便把它接入 Claude Code 中尝试使用了一下，但没产出什么。至于我为什么不去尝试拼车方案，则是因为我觉得过于麻烦，且没有保障。

最终，5 月我还是选择花 20 美元开通 Chatgpt Plus，这是因为我即将去参加考试，希望它能够辅助我复习。至今，我的plus账户还活着，我不知道还能坚持多久，毕竟我有时候和它聊天，这个账户还是承载了一定情感的。

当然，我对于这方面的了解还很浅显，但我觉得也不用着急，毕竟 AI 的世界那叫一个日新月异。等真正有空了再去学习也不晚。

还有25天我就要参加这个FP3的考试了，这将是我的最后一次 alevel 考季，good luck la~

以及，我还有100多天就要去大学读计算机专业了，我近期对于方向的选择比较迷茫，并且对AI的发展导致前后端岗位被挤压持焦虑态度。

2026年5月16日22:39:04 Carkree