下面是一份最新的 2026年1月 International A-Level Further Mathematics 的 Further Pure Mathematics 3 的国际区试卷






可以看到,每道题都是单独一页,并且还有单独的答题区,因此非常适合让codex自动识别并且对真题进行分类:将同一种考点的题放在同一份pdf中,并制作它的答案。
Codex 最终为我生成了8个分类PDF。(由于我有环境洁癖,所以我很担心它乱动我的环境,因此我在 AGENTS.md 中让它每轮结束都汇报对依赖或环境的使用或修改情况)

本轮使用 GPT-5.5 模型,思考强度为最大。接下来,我还让它根据题的顺序分别整理每组题的答案(下载好的 Mark Scheme)。
下面是上面那套卷子的 MS 的样式:



事实证明,它在这种简单工作上很得心应手,输出结果如下:

经过我的手动复核,没有发现任何一个 PDF 拼接错误,并且答案也完全是按照题的顺序来的,不得不感叹codex的强大。在这个任务中,我觉得不光体现的是codex操作文件的能力,更多是GPT-5.5对于数学的深入理解和强大推理能力。
一点其他内容
从年初开始,随着 Openclaw 破圈,社交媒体上似乎掀起了一股“全民 Vibe Coding 热潮“,无数人都去尝试各类工具,我自然也去尝试了一下。实际上,从去年开始,我就一直尝试各类 vibe coding 工具,从 vscode 侧边栏插件开始,经过 cursor,直到现在的 claude code、codex、antigravity 和 trae CN。不过,事实上我缺的从来都不是工具,而是受到现实的制约,其中最主要的是 ------ 钱。
其中,Anthropic 公开将中国列为敌对国家,大批封禁中国用户。早期大家还可以靠 IP 纯净度来暂时躲避封禁,但这招现在已经行不通。由于我也没什么太多的需求,因此觉得没有什么倒腾 Claude 的意义,就一直在寻找替代方案。
国产的 Coding Plan 我也没抢到,并且我算了一下,GLM 的 Coding Plan 也得 140 人民币,而 Chatgpt Plus 也就 20 美元,似乎并不怎么划算。
当然,我一直没有为任何模型付款是因为我作为高中生一不赚钱,我不为任何人打工,因此我买不起;二也没什么项目要写,也用不着花这么多钱,所以就一直用的免费计划。一些小的问题我尝试过用 Trae 免费模型排队解决,稍微复杂点的问题我会选择用 Codex 的免费额度。
后来,随着 Deepseek V4 Pro 的发布,由于梁文峰叔叔卖的token实在是太便宜了,我便把它接入 Claude Code 中尝试使用了一下,但没产出什么。至于我为什么不去尝试拼车方案,则是因为我觉得过于麻烦,且没有保障。
最终,5 月我还是选择花 20 美元开通 Chatgpt Plus,这是因为我即将去参加考试,希望它能够辅助我复习。至今,我的plus账户还活着,我不知道还能坚持多久,毕竟我有时候和它聊天,这个账户还是承载了一定情感的。
当然,我对于这方面的了解还很浅显,但我觉得也不用着急,毕竟 AI 的世界那叫一个日新月异。等真正有空了再去学习也不晚。
还有25天我就要参加这个FP3的考试了,这将是我的最后一次 alevel 考季,good luck la~
以及,我还有100多天就要去大学读计算机专业了,我近期对于方向的选择比较迷茫,并且对AI的发展导致前后端岗位被挤压持焦虑态度。
2026年5月16日22:39:04 Carkree