NexusCore

Multi-agent AI development framework with multi-tier quality gates

NexusCore is an autonomous multi-agent system where 14 specialized AI agents collaborate across the entire software development lifecycle — from requirements analysis to architecture design, code generation, testing, and quality assurance. Features intelligent LLM routing across 8 providers and a 2-tier quality gate system.

NexusCore は、ソフトウェア開発ライフサイクル全体を支援する自律型AIエージェント群を統合したフレームワークです。要件分析からアーキテクチャ設計、コード生成、テスト、品質保証まで、各フェーズを専門エージェントが担当します。

UI Screenshots

Code Generation	Review	Workflow

特徴

マルチエージェントシステム

14の専門エージェントが協調動作し、開発プロセス全体を自動化します。

エージェント	担当領域
Architect	アーキテクチャ設計
Coder	コード生成
Debugger	エラー修正・デバッグ
Tester	テスト自動生成
Guardian	多層品質ゲート
Requirement	要件分析・仕様化
Postmortem	失敗分析・事後検証
Knowledge Curator	ナレッジ管理
Policy	ポリシー適用
Constitutional Council	ガバナンス・意思決定
Mutation Tester	テストスイート強度測定
Planner	実装計画
Context	プロジェクトコンテキスト管理

LLMルーティング（2層構成）

各タスクに最適なLLMを自動選択し、コストと品質のバランスを最適化します。

ティア	プロバイダー	モデル	用途
品質	OpenAI / Anthropic / Google	GPT-5.5 / Sonnet 4.6 / Gemini 3.1 Pro	コード生成・推論・設計
軽量	GLM / MiniMax / DeepSeek / Moonshot	GLM-5.1 / MiniMax M2.7 / DeepSeek / Moonshot	チャット・分類・分析

Task → LLM Router → [GPT-5.5 | Sonnet 4.6 | Gemini 3.1 Pro | GLM-5.1 | DeepSeek | Moonshot | MiniMax]
                      ↕
                 Budget Manager（日次上限・フォールバック制御）

多層品質ゲート

2段階の品質検証で、高品質なコードを保証します。

Tier 1 - 静的解析: カバレッジ80%+ / Pylint 8.0+ / Mypy / Bandit
Tier 2 - 動的テスト: ミューテーションテストによるテストスイート強度測定

ガバナンス自動化

CR（Change Request）管理: 仕様書ベースの開発フロー
Authority Runner: 権限レベルに応じた段階的実行制御（HUMAN_CONTROLLED / PARTIALLY_AUTONOMOUS / FULLY_AUTONOMOUS）
Spec-driven開発: docs/spec/ 配下でCR仕様書を管理

なぜNexusCoreを作ったか

AIコーディングツール（Claude Code, Cursor等）が普及する中で、「AIエージェントの出力をどう品質担保するか」 が最大の課題だと考えました。NexusCoreは、AIに実装を委ねつつ、人間が評価関数として機能する — そのためのインフラとして設計しました。

27種のタスクを自動分類し、最適なLLMにルーティング
予算管理（NPE） で日次上限・コスト超過を自動制御
12種のポリシーエンジン でセキュリティ・パフォーマンス問題を自動検出
4,895テストケース でシステム動作を継続検証

アーキテクチャ

User / Developer
       ↓
   Orchestrator
       ↓
  ┌──────────────┐
  │ Agent Layer   │
  │ 14 Specialized Agents
  └──────┬───────┘
         ├→ LLM Router ──→ [GPT-5.5 | Sonnet 4.6 | Gemini 3.1 | GLM-5.1 | DeepSeek | Moonshot | MiniMax]
         │       ↕
         │   Budget Manager
         └→ Quality Gates
              ├→ Tier 1: Coverage / Pylint / Mypy / Bandit
              └→ Tier 2: Mutation Testing

API構成

レイヤー	フレームワーク	役割
公開API	FastAPI (`/api/v1/*`)	外部統合向けREST API。OpenAPI仕様・SDK自動生成対応
Web UI	Gradio	統合UI（コード生成→修正→テスト→履歴）
SaaS管理UI	Flask (`/projects/`, `/dashboard/`, `/logs/*`)	ブラウザ向けHTML管理画面（DB直接アクセス）
OAuth認証	FastAPI (`/api/v1/auth/*`)	GitHub OAuth認証（Starlette Authlib）

SDK自動生成: OpenAPI仕様書から Python / TypeScript 向けSDKを生成（make sdk）
認証: API Key認証（POST /api/v1/api-keys で発行）+ GitHub OAuth（ブラウザUI向け）

Flask UI と FastAPI API の責務分離について

Flask管理UI（webapp/）はFastAPIへの移行対象外です。 理由:

レスポンスが全てインラインHTML — APIとしてのJSON提供はFastAPI（api/routes/）が担当。Flask UIは人間向けブラウザ画面のみ
データアクセスがDB直叩き — FastAPI routesを経由せず、SQLAlchemyで直接クエリ。API層とUI層の責務分離
Gradio UI（ui/）が別ルートで存在 — コード生成→テスト→履歴の統合フローはGradio、プロジェクト管理やログ閲覧はFlask HTML UI

今後のリファクタリング計画で「Flask→FastAPI移行」という項目が上がった場合、移行すべきはAPI的機能（OAuth認証等）のみ。HTML画面は移行不要です。

プロジェクト状況

指標	値
テスト数	4,895 テストケース（CI自動検証）
エージェント数	14専門エージェント
LLMプロバイダー	8プロバイダー（OpenAI, Anthropic, Google, GLM, MiniMax, DeepSeek, Moonshot, Local）
品質ゲート	2層（静的解析 + 動的テスト）
CI	GitHub Actions（push/PR時自動テスト + セキュリティスキャン）

Roadmap

SaaS化: マルチテナント対応・サブスクリプション課金
エージェントプラグインシステム: サードパーティエージェントの追加機構
リアルタイムコラボレーション: WebSocketベースのマルチユーザー同時編集
セルフホスト対応: Docker Compose / K8s Helm Chart提供
多言語対応: UI・エージェントプロンプトの国際化

プロジェクト構成

NexusCore/
├── src/nexuscore/
│   ├── agents/              # AIエージェント（14専門エージェント + BaseAgent）
│   ├── analyzer/            # コード解析（AST, 依存グラフ）
│   ├── api/                 # FastAPI公開API（/api/v1/*）
│   ├── audio/               # 音声入力（Whisper統合）
│   ├── cli/                 # CLIツール
│   ├── config/              # 設定・憲法ローダー・ポリシー
│   ├── core/                # オーケストレーター, リトライポリシー, セッション管理
│   ├── diff/                # コード差分の意味的解析
│   ├── eval/                # JSON構造出力評価
│   ├── governance/          # CR仕様管理
│   ├── guard/               # 品質ゲート・自動レビュー・ポリシーエンジン
│   ├── integration/         # GitHub PR連携
│   ├── llm/                 # LLM統合レイヤー（Router, Budget, Providers）
│   ├── modules/             # 機能モジュール（Whisper等）
│   ├── npe/                 # 予算・ポリシー・ガードエンジン
│   ├── orchestrator/        # 実行管理（Authority Runner, 状態管理）
│   ├── services/            # Self-Healing Service, パッチ適用
│   ├── trace/               # 実行トレース
│   ├── ui/                  # Gradio統合UI
│   ├── utils/               # コード分析, Git操作, 差分生成, テスト戦略
│   └── webapp/              # Web UI (Flask, レガシー)
│
├── tests/                   # テストスイート（agents/api/core/等で構造化）
├── docs/                    # ドキュメント群
│   ├── governance/          # 統治ルール
│   ├── overview/            # ビジョン, アーキテクチャ, ロードマップ
│   ├── spec/                # CR仕様書（Spec-driven開発）
│   └── api/                 # API契約, エラーコードカタログ
├── tools/                   # scaffold_cr.py, update_ci_safe_lock.py
└── sdk/                     # 自動生成SDK (Python / TypeScript)

クイックスタート

前提条件

Python 3.12+
pip
Git
最低1つのLLMプロバイダーAPIキー（下記参照）

インストール

git clone https://github.com/fukukei23/NexusCore.git
cd NexusCore

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate

pip install -r requirements.txt
cp .env.template .env
# .env に最低1つのLLM APIキーを設定:
#   OPENAI_API_KEY     - GPT-5.5 (コード生成・推論)
#   ANTHROPIC_API_KEY  - Claude Sonnet (レビュー・設計)
#   GEMINI_API_KEY     - Gemini 3.1 Pro (分析)
#   GLM_API_KEY        - GLM-5.1 (軽量タスク・デフォルト)
#   MINIMAX_API_KEY    - MiniMax M2.7 (軽量タスク)
#   DEEPSEEK_API_KEY   - DeepSeek (コード生成)
#   MOONSHOT_API_KEY   - Moonshot (チャット)

基本的な使用例

from nexuscore.agents import CoderAgent

coder = CoderAgent()

result = coder.execute_llm_task(
    prompt="Pythonで二分探索を実装してください"
)
print(result)

テスト実行

# テスト実行
python -m pytest tests/ -v

# カバレッジ付き
python -m pytest tests/ --cov=src/nexuscore --cov-report=html

使用技術

カテゴリ	技術
言語	Python 3.12+
AI/LLM	OpenAI GPT-5.5, Anthropic Claude Sonnet 4.6, Google Gemini 3.1 Pro, GLM-5.1, MiniMax M2.7, DeepSeek, Moonshot
API	FastAPI（公開API）+ Flask（管理UI）
テスト	pytest, pytest-cov, カスタムミューテーションテスト
品質	pylint, mypy, bandit
Web UI	Gradio
VCS	GitPython

ドキュメント

ドキュメント	内容
アーキテクチャ	システムアーキテクチャ詳細
プロジェクト概要	ドキュメント体系インデックス
技術アーキテクチャ	NexusOSモデル, エージェント構成
開発者ガイド	環境構築・運用ガイド
ガバナンス	プロジェクト統治ルール
API仕様	API仕様インデックス
CRテンプレート	仕様書テンプレート
CI戦略	Safe/Full テスト分離
完了レポート	作業進捗・完了履歴一覧
変更履歴	バージョン別変更履歴

コントリビューション

リポジトリをフォーク
フィーチャーブランチ作成 (git checkout -b feature/amazing-feature)
変更をコミット (git commit -m 'Add amazing feature')
プッシュ (git push origin feature/amazing-feature)
プルリクエスト作成

品質基準: カバレッジ80%+ / Pylint 8.0+ / ミューテーションスコア70%+

ライセンス

Apache License 2.0 - 詳細は LICENSE を参照してください。

謝辞

OpenAI - GPT-5.5
Anthropic - Claude Sonnet 4.6
Google AI - Gemini 3.1 Pro
Zhipu AI - GLM-5.1
DeepSeek - DeepSeek
MiniMax - MiniMax M2.7
Moonshot AI - Moonshot
pytest - テストフレームワーク

Name		Name	Last commit message	Last commit date
Latest commit History 239 Commits
.claude		.claude
.cursor		.cursor
.github		.github
.gradio		.gradio
.nexus		.nexus
.spec		.spec
DECISION_LOGS		DECISION_LOGS
GOVERNANCE		GOVERNANCE
PROJECT_PROFILES		PROJECT_PROFILES
app		app
archive		archive
config		config
data		data
database		database
dev_tools		dev_tools
docs		docs
evaluation		evaluation
history		history
k8s		k8s
logs		logs
scripts		scripts
sdk		sdk
src		src
tests		tests
tools		tools
tree_sitter_languages		tree_sitter_languages
var/cache		var/cache
vscode-extension		vscode-extension
workspace		workspace
.coveragerc		.coveragerc
.cursorignore		.cursorignore
.dockerignore		.dockerignore
.env.template		.env.template
.gitattributes		.gitattributes
.gitignore		.gitignore
.nexus_context.json		.nexus_context.json
.python-version		.python-version
CHANGELOG.md		CHANGELOG.md
CLAUDE.md		CLAUDE.md
Dockerfile.webapp		Dockerfile.webapp
LICENSE		LICENSE
Makefile		Makefile
NexusCore.code-workspace		NexusCore.code-workspace
README.md		README.md
activate_venv.sh		activate_venv.sh
docker-compose.saas.yml		docker-compose.saas.yml
docker-compose.yml		docker-compose.yml
main_cli.py		main_cli.py
mypy.ini		mypy.ini
openapitools.json		openapitools.json
package-lock.json		package-lock.json
package.json		package.json
pyproject.toml		pyproject.toml
pyrightconfig.json		pyrightconfig.json
pytest.ini		pytest.ini
requirements-ci-safe.lock		requirements-ci-safe.lock
requirements-ci-safe.txt		requirements-ci-safe.txt
requirements-dev.txt		requirements-dev.txt
requirements.dev.lock.txt		requirements.dev.lock.txt
requirements.lock.txt		requirements.lock.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NexusCore

特徴

マルチエージェントシステム

LLMルーティング（2層構成）

多層品質ゲート

ガバナンス自動化

なぜNexusCoreを作ったか

アーキテクチャ

API構成

プロジェクト状況

Roadmap

プロジェクト構成

クイックスタート

前提条件

インストール

基本的な使用例

テスト実行

使用技術

ドキュメント

コントリビューション

ライセンス

謝辞

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

NexusCore

特徴

マルチエージェントシステム

LLMルーティング（2層構成）

多層品質ゲート

ガバナンス自動化

なぜNexusCoreを作ったか

アーキテクチャ

API構成

プロジェクト状況

Roadmap

プロジェクト構成

クイックスタート

前提条件

インストール

基本的な使用例

テスト実行

使用技術

ドキュメント

コントリビューション

ライセンス

謝辞

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages