SummerOneTwo
diff --git a/‎CHANGELOG.md‎
Lines changed: 17 additions & 14 deletions b/‎CHANGELOG.md‎
Lines changed: 17 additions & 14 deletions
diff --git a/‎CLAUDE.md‎
Lines changed: 127 additions & 73 deletions b/‎CLAUDE.md‎
Lines changed: 127 additions & 73 deletions
@@ -5,23 +5,26 @@ All notable changes to this project will be documented in this file.
 The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
 
-## [Unreleased]
+## [1.0.0] - 2026-04-30
 
 ### Features
 
-- 新增题目契约 `autocode.json`（manifest）与 `src/autocode_mcp/workflow/` 读写模型，`problem_create` 自动初始化 manifest 与 `tutorial.md` 草稿。
-- `workflow_guard.py` 重构为表驱动门禁，补充 `problem_verify_tests`、`interactor_build`、`solution_analyze`、`validator_select` 的流程约束，并识别交互题路径。
-- 新增审计工具：
-  - `solution_audit_std`
-  - `solution_audit_brute`
-- `solution_analyze` 增强输出：`claimed_complexity`、worst/average、`memory_estimate`、`risk_notes`、`recommended_stress_params`。
-- `stress_test_run` 支持 `stress_profiles` 多轮对拍配置并返回 profile 报告。
-- `problem_verify_tests` 支持 `wrong_solution_kill` 检查类型，验证错解是否被测试点杀掉。
-- 新增 CLI：`autocode-verify`，用于快速校验题目 manifest 基础完整性。
-- 新增验证技能与只读审计 Agent：
-  - skills: `idea-feasibility`、`solution-complexity-audit`、`stress-strategy`、`testdata-quality`、`statement-audit`
-  - agents: `autocode-idea-auditor`、`autocode-solution-auditor`、`autocode-package-auditor`
-- 新增 `examples/` 下三个金样例目录：`exact-sample`、`checker-sample`、`interactive-sample`。
+- **Plugin-first 出题工作流**
+  - README、CLAUDE.md、默认 workflow agent 与 workflow skill 重新整理为 Claude Code plugin 主路径，优先面向出题人解释 AI 出题常见风险与 AutoCode 的验证门禁。
+  - `workflow_guard.py` 重构为表驱动门禁，补充 `problem_verify_tests`、`interactor_build`、`solution_analyze`、`validator_select` 的流程约束，并识别交互题路径。
+- **题目契约与快速校验**
+  - 新增 `autocode.json` manifest 与 `src/autocode_mcp/workflow/` 读写模型，`problem_create` 自动初始化 manifest 与 `statements/tutorial.md` 草稿。
+  - 新增 CLI：`autocode-verify`，用于快速校验题目 manifest、题面和题解路径完整性。
+  - 新增 `examples/` 下三个 manifest 样例目录：`exact-sample`、`checker-sample`、`interactive-sample`。
+- **解法与复杂度审计**
+  - 新增 `solution_audit_std`、`solution_audit_brute`，用于审计标准解质量、复杂度风险和 brute 是否适合作为对拍 oracle。
+  - `solution_analyze` 增强输出：`claimed_complexity`、worst/average、`memory_estimate`、`risk_notes`、`recommended_stress_params`。
+- **对拍与测试数据质量**
+  - `stress_test_run` 支持 `stress_profiles` 多轮对拍配置并返回 profile 报告。
+  - `problem_verify_tests` 支持 `wrong_solution_kill` 检查类型，验证错解是否被测试点杀掉。
+- **只读审计 Agent 与 Skills**
+  - 新增 skills：`idea-feasibility`、`solution-complexity-audit`、`stress-strategy`、`testdata-quality`、`statement-audit`。
+  - 新增 agents：`autocode-idea-auditor`、`autocode-solution-auditor`、`autocode-package-auditor`。
 
 ## [0.9.0] - 2026-04-29
 
 
@@ -1,10 +1,20 @@
 # CLAUDE.md
 
-此文件为 Claude Code (claude.ai/code) 在此代码仓库中工作时提供指导。
+此文件为 Claude Code / Cursor Agent 在本仓库工作时提供项目级指导。
 
-## 项目概述
+## 项目定位
 
-AutoCode 是一个 Claude Code plugin，默认以远程仓库安装使用；仓库内部同时包含 `autocode-mcp` 这个 MCP server 实现。它基于论文《AutoCode: LLMs as Problem Setters for Competitive Programming》实现竞赛编程出题辅助能力，并提供 Validator-Generator-Checker 工作流约束。
+AutoCode 是一个 **Claude Code plugin**，面向竞赛编程出题工作流。仓库内部同时包含 `autocode-mcp` MCP server，但对外主路径是远程 plugin 安装，而不是单独本地 MCP 配置。
+
+它要解决的核心问题不是“让 AI 直接写完一道题”，而是把 AI 生成的题面、解法、validator、generator、checker/interactor、对拍、测试数据和 Polygon 打包放进可验证、可审计、会阻止跳步的流程。
+
+重点风险：
+
+- AI 题面含糊、样例错误或题解不一致。
+- 标准解有隐藏 bug，复杂度判断过于乐观。
+- brute 不能作为可靠 oracle。
+- 测试数据覆盖不到边界、极限、TLE 和错解杀伤。
+- 生成最终数据后未重新验证就打包。
 
 ## 开发命令
 
@@ -26,96 +36,140 @@ claude plugin validate .
 
 # 运行 MCP Server（本地开发/测试）
 uv run autocode-mcp
+
+# 校验题目 manifest
+uv run autocode-verify examples/exact-sample
+
+# 构建并检查分发包
+uv build
+uv run twine check dist/*
 ```
 
 ## 项目结构
 
-```
+```text
 AutoCode/
-├── .claude-plugin/       # Claude plugin manifest
-├── agents/               # Claude plugin agent definitions
-├── hooks/                # Claude hook config
-├── scripts/              # Hook/runtime helper scripts
-├── skills/               # Claude plugin skills
-├── src/autocode_mcp/     # MCP server 源代码
-│   ├── tools/            # MCP 工具实现
-│   ├── templates/        # 内置模板资源
-│   ├── prompts/          # 工作流提示词
-│   └── utils/            # 工具函数
-├── tests/                # 测试用例
-├── .mcp.json             # 本地 MCP 接入配置
-├── settings.json         # Claude plugin settings
-└── pyproject.toml        # 项目配置
+├── .claude-plugin/        # Claude plugin manifest
+├── agents/                # Claude plugin agent definitions
+├── hooks/                 # Claude hook config
+├── scripts/               # Hook/runtime helper scripts
+├── skills/                # Claude plugin skills
+├── examples/              # manifest/examples smoke samples
+├── src/autocode_mcp/      # MCP server 源代码
+│   ├── cli/               # autocode-verify 等 CLI
+│   ├── tools/             # MCP 工具实现
+│   ├── templates/         # 内置模板资源
+│   ├── workflow/          # autocode.json manifest 模型
+│   ├── prompts/           # 工作流提示词
+│   └── utils/             # 编译、运行、资源限制等工具函数
+├── tests/                 # 测试用例
+├── .mcp.json              # 本地 MCP 接入配置（开发/兼容用）
+├── settings.json          # Claude plugin 默认 agent
+└── pyproject.toml         # Python package / scripts
 ```
 
 ## 工具列表
 
-| 工具 | 描述 |
+AutoCode 当前暴露 20 个 MCP 工具：
+
+| 分组 | 工具 |
 |------|------|
-| file_read | 读取文件 |
-| file_save | 保存文件 |
-| solution_build | 构建解法 |
-| solution_run | 执行解法 |
-| solution_analyze | 分析解法复杂度 |
-| solution_audit_std | 审计标准解实现质量 |
-| solution_audit_brute | 审计暴力解实现质量 |
-| validator_build | 构建校验器 |
-| validator_select | 选择最佳校验器 |
-| generator_build | 构建生成器 |
-| generator_run | 运行生成器 |
-| checker_build | 构建检查器 |
-| interactor_build | 构建交互器 |
-| stress_test_run | 压力测试 |
-| problem_create | 初始化题目 |
-| problem_generate_tests | 生成测试数据 |
-| problem_cleanup_processes | 清理生成残留进程 |
-| problem_verify_tests | 验证测试数据质量 |
-| problem_validate | 验证题面样例 |
-| problem_pack_polygon | 打包为 Polygon 格式 |
+| 文件 | `file_read`, `file_save` |
+| 解法 | `solution_build`, `solution_run`, `solution_analyze`, `solution_audit_std`, `solution_audit_brute` |
+| Validator | `validator_build`, `validator_select` |
+| Generator | `generator_build`, `generator_run` |
+| Checker / Interactor | `checker_build`, `interactor_build` |
+| Stress | `stress_test_run` |
+| Problem | `problem_create`, `problem_validate`, `problem_generate_tests`, `problem_cleanup_processes`, `problem_verify_tests`, `problem_pack_polygon` |
 
 ## 题目目录结构
 
 `problem_create` 初始化后的目录布局：
 
-```
+```text
 <problem_dir>/
-├── solutions/          # 解法
-│   ├── sol.cpp         # 标准解
-│   └── brute.cpp       # 暴力解
-├── files/              # 辅助程序
-│   ├── gen.cpp         # 生成器
-│   ├── val.cpp         # 校验器
-│   ├── checker.cpp     # 检查器（可选）
-│   ├── interactor.cpp  # 交互器（可选）
-│   └── testlib.h       # testlib 头文件
-├── statements/         # 题面
-│   └── README.md
-└── tests/              # 生成的测试数据
- ├── 01.in
- ├── 01.ans / 01.out（由 answer_ext 控制）
- └── ...
+├── autocode.json
+├── solutions/
+│   ├── sol.cpp
+│   └── brute.cpp
+├── files/
+│   ├── gen.cpp
+│   ├── val.cpp
+│   ├── checker.cpp
+│   ├── interactor.cpp
+│   └── testlib.h
+├── statements/
+│   ├── README.md
+│   └── tutorial.md
+└── tests/
+    ├── 01.in
+    ├── 01.ans / 01.out
+    └── .autocode_tests_manifest.json
 ```
 
-## 出题工作流程
+## 强制工作流
+
+该顺序由 `hooks/hooks.json` 和 `scripts/workflow_guard.py` 实际强制执行。
+
+1. `problem_create`
+2. `solution_build(solution_type="sol")`
+3. `solution_build(solution_type="brute")`
+4. 解法审计：`solution_analyze`、`solution_audit_std`、`solution_audit_brute`
+5. 非交互题：`validator_build(accuracy >= 0.9)`；交互题：`interactor_build`
+6. `generator_build`
+7. `stress_test_run(completed_rounds == total_rounds)`
+8. 需要特殊判题时：`checker_build(accuracy >= 0.9)`（非交互）
+9. `problem_validate(validation_passed)`
+10. `problem_generate_tests(generated_test_count > 0)`
+11. `problem_verify_tests(passed)`
+12. `problem_pack_polygon`
+
+关键门禁：
+
+- `brute` 必须在 `sol` 之后构建。
+- `validator_build` 没有有效 `accuracy` 不算通过。
+- 交互题不可运行 `validator_build` / `checker_build`，应使用 `interactor_build`。
+- 最终测试生成后会清除旧的 `tests_verified`，必须重新跑 `problem_verify_tests`。
+- `problem_pack_polygon` 前必须完成最终测试验证。
 
-1. 初始化题目目录 (`problem_create`)
-2. 构建标准解 (`solution_build`, `solution_type=sol`)
-3. 构建暴力解 (`solution_build`, `solution_type=brute`)
-4. 构建校验器 (`validator_build`, accuracy >= 0.9)
-5. 构建生成器 (`generator_build`)
-6. 运行压力测试 (`stress_test_run`, completed_rounds == total_rounds)
-7. 按需构建检查器 (`checker_build`, accuracy >= 0.9)
-8. 生成测试数据（`problem_generate_tests`, generated_test_count > 0，支持 `answer_ext`；最终 extreme/tle 至少占一半；候选不足时尽量满足；长任务中断可 `resume=true` 续跑）
-9. 验证测试数据 (`problem_verify_tests`, passed)
-10. 打包 Polygon (`problem_pack_polygon`)
+## Agent 与 Skill
 
-该顺序会被 [hooks/hooks.json](/c:/userProgram/program/AutoCode/hooks/hooks.json) 和 [scripts/workflow_guard.py](/c:/userProgram/program/AutoCode/scripts/workflow_guard.py) 实际强制执行。
+默认 Agent：
+
+- `agents/autocode-workflow.md`：主流程协调与门禁执行。
+
+只读审计 Agent：
+
+- `agents/autocode-idea-auditor.md`：立项前审查题意是否可判定、可验证、可生成。
+- `agents/autocode-solution-auditor.md`：std/brute 复杂度、正确性假设和对拍策略审计。
+- `agents/autocode-package-auditor.md`：打包前检查题面、测试、错解杀伤和 manifest 一致性。
+
+核心 Skills：
+
+- `skills/autocode-workflow/SKILL.md`
+- `skills/idea-feasibility/SKILL.md`
+- `skills/solution-complexity-audit/SKILL.md`
+- `skills/stress-strategy/SKILL.md`
+- `skills/statement-audit/SKILL.md`
+- `skills/testdata-quality/SKILL.md`
+- `skills/problem-validate/SKILL.md`
+
+## Manifest
+
+每个题目应维护 `autocode.json` 作为人类和 CI 都可读的题目契约。模型位于 `src/autocode_mcp/workflow/`，模板位于 `src/autocode_mcp/templates/autocode.json`。
+
+快速校验：
+
+```bash
+uv run autocode-verify <problem_dir>
+```
 
 ## 关键约束
 
-- 包管理强制使用 `uv`（绝对禁用 pip/poetry/conda）
-- 对外分发形态优先是 Claude plugin，不是单独的本地 MCP 配置
-- 默认主路径是远程 plugin 安装；本地模式只用于开发、测试、验证
-- `hooks/` 只放 hook 配置，hook 逻辑脚本放在 `scripts/`
-- 模板资源统一放在 `src/autocode_mcp/templates/`，不要再在仓库根目录维护一份重复模板
-- C++ 标准使用 C++20（需要 GCC 10+）
+- 包管理强制使用 `uv`；不要引入 pip/poetry/conda 流程。
+- 对外文档优先描述 Claude Code plugin；MCP server 是实现与开发入口。
+- 默认主路径是远程 plugin 安装；本地模式只用于开发、测试、验证。
+- `hooks/` 只放 hook 配置，hook 逻辑脚本放在 `scripts/`。
+- 模板资源统一放在 `src/autocode_mcp/templates/`。
+- C++ 标准使用 C++20（需要 GCC 10+）。
+- 本项目会编译并执行 AI 生成代码，只能在本地可信环境使用。