abtest๋ ์ปค๋ฎค๋ํฐ/๋ฌ๋ ํ๋ก๊ทธ๋จ ์ด์ ํ๊ฒฝ์์ ์คํ์ ์ค๊ณํ๊ณ ํด์ํ๊ธฐ ์ํ ๋ฌธ์ ์ค์ฌ ํ๋ก์ ํธ๋ค.
์ด ํ๋ก์ ํธ๋ ์ด์์ ์ธ ๋๋ค A/B ํ
์คํธ๋ฅผ ์งํฅํ๋, ์ค์ ์ด์์์๋ ๊ธฐ์ ๋จ์ ๋น๊ต๊ฐ ์ค์ฌ์ด ๋๋ ํ๊ฒฝ์ ์ ์ ๋ก ํ๋ค. ๋ฐ๋ผ์ ๋ณธ ๋ฌธ์ ์ธํธ๋ randomized A/B test์ cohort-based comparative experiment๋ฅผ ๊ตฌ๋ถํด์ ์ค๋ช
ํ๋ค.
๋ณธ ํ๋ก์ ํธ์ ์คํ ํ๊ฐ๋ ๋๋ค A/B ํ ์คํธ๊ฐ ์ด๋ ค์ด ์ด์ ํ๊ฒฝ์ ๊ณ ๋ คํ์ฌ, ๊ธฐ์ ๋จ์ cohort ๋น๊ต๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ํํ๋ค. ํต์ฌ ์ฑ๊ณผ๋ ์์ฃผ์จ์ North Star Metric์ผ๋ก ๋๊ณ , Funnel ๋ถ์์ผ๋ก ๋จ๊ณ๋ณ ์ดํ์ ํ์ ํ๋ฉฐ, Retention ๋ถ์์ผ๋ก ์ง์ ์ฐธ์ฌ๋ฅผ ์ธก์ ํ๋ค. ์ต์ข ํจ๊ณผ ํ๋จ์ Bayesian ๊ธฐ๋ฐ ํ๋ฅ ํด์์ ์ค์ฌ์ผ๋ก ์ํํ๊ณ , ํ์ ์ Sequential Testing๊ณผ CUPED๋ฅผ ๋ณด์กฐ์ ์ผ๋ก ํ์ฉํ๋ค.
์ง๊ธ๋ถํฐ๋ ๋ฌธ์๋ฅผ ํต์ฌ 7๊ฐ + ๋ถ๋ก ๊ตฌ์กฐ๋ก ์ฝ๋ ๊ฒ์ ๊ถ์ฅํ๋ค.
docs/01_FOUNDATIONS.md: ์คํ ์ฒ ํ, ํต๊ณ ๊ธฐ์ด, test design์ ์ ๋ฌธ ๋ฌถ์docs/02_EXPERIMENT_POLICY.md: ์คํ ๋ฑ๋ก, ์น์ธ, ๋ฐ์ดํฐ/์ฐธ์ฌ์/๊ฒฐ๊ณผ ํ์ฉ ์ ์ฑ ๋ฌถ์docs/03_METRICS.md: metric ์ ์์ KPI ์ฐ์ ์์docs/04_VALIDITY_AND_TRUST.md: peeking, SRM, novelty, network effect, ํ์ง ๋ฆฌ์คํฌdocs/05_ADVANCED_METHODS.md: ratio metrics, multiple testing, variance reduction, sequential testingdocs/06_PLATFORM_SCHEMA.md: ๋ฐ์ดํฐ ์คํค๋ง์ ํต๊ณ ์ปฌ๋ผ ์ค๊ณdocs/07_OPERATIONS_AND_DECISIONS.md: ์ด์ ์ฒดํฌ๋ฆฌ์คํธ์ ์ต์ข ํ๋จ ๊ธฐ์ค
docs/COMMUNITY_BENCHMARKS.md: ์ธ๋ถ ์ฌ๋ก์ ๋ฒค์น๋งํฌdocs/V1_SCOPE_AND_GAPS.md: ํ์ฌ ๋ฒ์ ์ ๊ฒ๊ณผ v1 ์ฐ์ ์์docs/REFERENCE_MAP.md: ๊ธฐ์กด ์ธ๋ถ ๋ฌธ์์ ์ ๊ทธ๋ฃน ๋ฌธ์์ ๋งคํdocs/archive/: ์์ ์ ์ธ๋ถ ๋ฌธ์ ์์นด์ด๋ธ
docs/01_FOUNDATIONS.mddocs/02_EXPERIMENT_POLICY.mddocs/03_METRICS.mddocs/04_VALIDITY_AND_TRUST.mddocs/06_PLATFORM_SCHEMA.mddocs/07_OPERATIONS_AND_DECISIONS.mddocs/05_ADVANCED_METHODS.md
community-abtest/
โ
โโโ CLAUDE.md โ Claude Code ์ง์
์ (๋งฅ๋ฝ + ํ๋จ ์์น)
โโโ .mcp.json โ MCP ์ค์ (docs/ ๋ง์ดํธ)
โ
โโโ .claude/
โ โโโ agents/
โ โ โโโ abtest-analyst.md โ ํ๋จ ์์น + Syneidesis ๊ฐญ ์ถ์
โ โโโ skills/
โ โโโ experiment-register/ โ ์คํ ๋ฑ๋ก & ์น์ธ ์ฒดํฌ๋ฆฌ์คํธ
โ โโโ metrics-definition/ โ ์งํ ์ ์ & ์ฐ์ ์์
โ โโโ experiment-design/ โ ์คํ ์ค๊ณ ์ํฌํ๋ก์ฐ
โ โโโ validity-check/ โ SRM, peeking, network effect ์ ๊ฒ
โ โโโ knowledge-audit/ โ ์ง์ ๊ฒ์ฆ ๋ฃจํ (autoresearch ํจํด)
โ โโโ experiment-decision/ โ ship/hold/rollback/need_more_data ํ์
โ โโโ advanced-analysis/ โ CUPED, sequential, ratio metrics
โ
โโโ docs/ โ MCP๋ก ๋ง์ดํธ๋๋ ์ง์ ๋ฒ ์ด์ค
โ โโโ 01_FOUNDATIONS.md
โ โโโ 02_EXPERIMENT_POLICY.md
โ โโโ 03_METRICS.md
โ โโโ 04_VALIDITY_AND_TRUST.md
โ โโโ 05_ADVANCED_METHODS.md
โ โโโ 06_PLATFORM_SCHEMA.md
โ โโโ 07_OPERATIONS_AND_DECISIONS.md
โ โโโ SKILL_GUIDE.md โ Skills ํ์ฉ ๊ฐ์ด๋
โ โโโ archive/ โ ์ธ๋ถ ๋ฌธ์ ์๋ณธ
โ
โโโ scripts/ โ ๊ฒฐ์ ๋ก ์ ๊ณ์ฐ ์คํฌ๋ฆฝํธ (ํ์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ง ์ฌ์ฉ)
โ โโโ calc_sample_size.py โ ์์ฃผ์จ ๊ธฐ๋ฐ ํ๋ณธ ํฌ๊ธฐ ๊ณ์ฐ (Cohen's h)
โ โโโ check_balance.py โ ๊ณต๋ณ๋ ๊ท ํ ๊ฒ์ฌ (SMD)
โ โโโ bayesian_calc.py โ Bayesian P(T>C) ๊ณ์ฐ (Beta-Binomial)
โ โโโ stratification_check.py โ ์ธตํ ๋ถ์ ๊ฐ๋ฅ ์ฌ๋ถ (์
๋น 20๋ช
๊ธฐ์ค)
โ
โโโ experiments/ โ ์คํ ๋ฑ๋ก์ ์ ์ฅ์
โโโ TEMPLATE.md โ ์คํ ๋ฑ๋ก์ ํ
ํ๋ฆฟ
โโโ 12ki_w7_magical_week.md โ 12๊ธฐ W7 Magical Week ์ค์คํ
์ด ๋ ํฌ๋ Claude Code์ ํจ๊ป ์ฌ์ฉํ ์ ์๋๋ก Agent + Skills๊ฐ ๊ตฌ์ฑ๋์ด ์๋ค.
์๋ ๋ ๊ฐ์ง๊ฐ ์ค์น๋์ด ์์ด์ผ ํ๋ค:
- Node.js โ MCP ์๋ฒ ์คํ์ฉ
- jq โ Hook ์คํฌ๋ฆฝํธ JSON ํ์ฑ์ฉ
# jq ์ค์น (Windows)
winget install jqlang.jq
# jq ์ค์น (Mac)
brew install jq์ดํ ์ด ๋ ํฌ ๋๋ ํ ๋ฆฌ์์ claude๋ฅผ ์คํํ๋ฉด MCP๊ฐ ์๋์ผ๋ก ./docs๋ฅผ ๋ง์ดํธํ๋ค.
git clone <this-repo>
cd community-abtest
claudeabtest-analystโ ์คํ ๋ถ์ ์ ๋ฌธ๊ฐ. ํ๋จ ์์น๊ณผ Syneidesis(๊ฐญ ์ถ์ ) ํจํด์ด ๋ด์ฅ๋์ด ์๋ค.
| Skill | ํธ๋ฆฌ๊ฑฐ ์์ |
|---|---|
experiment-register |
"์คํ ์์ ์ ์ ๋ญ ํด์ผ ํด" |
metrics-definition |
"์งํ ์ด๋ป๊ฒ ์ ์ํด", "guardrail ๋ญ๋ก ์ก์" |
experiment-design |
"์คํ ์ค๊ณํด์ค", "์ํ ์ฌ์ด์ฆ ๊ณ์ฐ" |
validity-check |
"SRM ์์ฌ๋ผ", "์ด ์คํ ๋ฏฟ์ด๋ ๋ผ?" |
knowledge-audit |
"์ด ๋ด์ฉ ๋ง์?", "์ ๋ ผ๋ฌธ ์ ์ฉ ๊ฐ๋ฅํด?" |
experiment-decision |
"๊ฒฐ๊ณผ ์ด๋ป๊ฒ ๋ด", "์ด๊ฑฐ ์ฌ๋ ค๋ ๋ผ?" |
advanced-analysis |
"CUPED ์จ์ผ ํด?", "sequential testing ๊ฐ๋ฅํด?" |
Skills๋ ์์๋๋ก ์ฐ๊ฒฐ๋์ด ์๋ค: experiment-register โ experiment-design โ validity-check โ experiment-decision
์ค์ ์คํ ๋ฑ๋ก์๋ experiments/ ํด๋์ ์ ์ฅํ๋ค.
experiments/12ki_w7_magical_week.md: 12๊ธฐ W7 Magical Week ์ฐธ์ฌ ํจ๊ณผ ์ค์คํ ํ๊ฐ
๊ธฐ์กด ์ธ๋ถ ๋ฌธ์๋ docs/archive/๋ก ์ด๋ํด ๋ณด๊ดํ๋ค. ์์ผ๋ก๋ ์ ๊ทธ๋ฃน ๋ฌธ์๋ฅผ ๊ธฐ์ค์ผ๋ก ์ฝ๊ณ , ์ธ๋ถ ๋ฌธ์๋ ํ์ํ ๋๋ง ์ฐธ๊ณ ํ๋ ๊ตฌ์กฐ๋ฅผ ๊ถ์ฅํ๋ค.