Skip to content
Draft
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2 changes: 1 addition & 1 deletion AGENTS.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@ This file is intended for AI coding agents (Claude Code, OpenClaw, Codex, Copilo

## What This Repo Is

**FirstData** is a structured knowledge base of global authoritative open data sources. It is a **pure data repository** — no application code, no runtime logic.
**FirstData** is the External Facts Context Layer for AI Agents — a structured, authoritative collection of global open data sources. It is a **pure data repository** — no application code, no runtime logic.

Your job here is to **create or edit JSON metadata files** that describe real-world data sources (government databases, international organizations, academic datasets, etc.).

Expand Down
2 changes: 1 addition & 1 deletion CLAUDE.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@ This file provides guidance to Claude Code (claude.ai/code) when working with co

## Project Overview

**FirstData** is a structured knowledge base of global authoritative open data sources. It is a **pure data repository** — no application code, no runtime logic.
**FirstData** is the External Facts Context Layer for AI Agents — a structured, authoritative collection of global open data sources. It is a **pure data repository** — no application code, no runtime logic.

Your job here is to **create or edit JSON metadata files** that describe real-world data sources (government databases, international organizations, academic datasets, etc.).

Expand Down
8 changes: 4 additions & 4 deletions README.en.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@ English | **[中文](README.md)** | **[日本語](README.ja.md)**

---

**The World's Most Comprehensive, Authoritative, and Structured Open Data Source Repository — Agent First**
**The External Facts Context Layer for AI Agents**

> **Agent First**: FirstData is designed with AI Agents as the primary user. Agents can automatically register, activate, and configure MCP via standardized Skills — zero human intervention required.

Expand All @@ -27,7 +27,7 @@ When noise, patchwork content, and hallucinations become the default background,

### Our Mission: Building the Trusted Foundation for the AI Era

This project aims to build a **global, authoritative, and structured Primary Sources knowledge base**.
This project aims to build a **global, authoritative, and structured External Facts Context Layer for AI Agents** built on primary sources.

We systematically discover and aggregate high-trust sources across domains—covering scientific research, government disclosures, laws and regulations, corporate filings and financial reports, standards and authoritative industry materials—**transforming scattered, non-standard, difficult-to-reuse original content into traceable, verifiable, and citable "Core Facts"**, while preserving complete evidence chains and version history, ensuring that every conclusion can be traced "back to the source".

Expand Down Expand Up @@ -63,7 +63,7 @@ We systematically discover and aggregate high-trust sources across domains—cov
| 📊 **Structured Metadata System** | Complete metadata standards (access URLs, API interfaces, authority levels, update frequency, data content, etc.), not just links | Machine-readable, programmable access, supports automated evidence chain construction |
| ⭐ **Authority Level Classification** | Six authority levels: government, international organizations, research institutions, market, commercial, and others | Scientifically assess data source credibility, provide quality filtering basis for AI |
| 🤖 **AI Smart Search** | LLM-driven data source query Agent that understands complex multi-dimensional queries | Get authoritative data sources through natural language, no manual filtering needed |
| 🔌 **MCP Protocol Integration** | Provides standard MCP Server, integrable with Claude Desktop, Cline, and other AI applications | Enable any AI application to access the authoritative data source knowledge base |
| 🔌 **MCP Protocol Integration** | Provides standard MCP Server, integrable with Claude Desktop, Cline, and other AI applications | Enable any AI application to access the authoritative external facts context layer |
| 🤖 **Agent Skill Distribution** | Standardized Skill definition — Agents can auto-register tokens, auto-configure MCP, zero human intervention | Agent First — Let Agents access authoritative data like a built-in capability |
| 🌍 **Bilingual Support** | All metadata provided in both Chinese and English | Connect global data ecosystems, break language barriers |
| 🔍 **100% Verification** | Every URL tested, every data source with complete documentation, every authority level with justification | Ensure data sources are genuinely available, avoid broken links and hallucinated citations |
Expand Down Expand Up @@ -143,7 +143,7 @@ Each data source contains **structured metadata** that supports machine-readable

---

We've built a structured knowledge base of authoritative data sources, each with complete metadata, access paths, and authority identifiers. But for most users, the real challenge is: How to quickly find the most suitable one among massive data sources? Once you find the data source website, how to accurately locate the target data on complex official platforms? How to seamlessly integrate all this into your daily AI workflow?
We've built a structured external facts context layer of authoritative data sources, each with complete metadata, access paths, and authority identifiers. But for most users, the real challenge is: How to quickly find the most suitable one among massive data sources? Once you find the data source website, how to accurately locate the target data on complex official platforms? How to seamlessly integrate all this into your daily AI workflow?

**FirstData MCP** is built for this purpose—transforming a static data source knowledge base into a dynamic intelligent navigation system, making authoritative data accessible to everyone.

Expand Down
10 changes: 5 additions & 5 deletions README.ja.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@

---

**世界最も包括的・権威的・構造化されたオープンデータソースリポジトリ — Agent First**
**AI Agentのための外部ファクト・コンテキスト・レイヤー(External Facts Context Layer)**

> **Agent First**:FirstData は AI Agent を第一優先ユーザーとして設計されています。Agent は標準化された Skill を通じて登録・アクティベーション・MCP 設定を自動で完了でき、人手を介する必要はありません。

Expand All @@ -27,7 +27,7 @@

### 私たちのミッション:AI時代の信頼できる基盤を構築する

本プロジェクトは、**グローバルで権威ある構造化された一次情報ソースのナレッジベース**を構築することを目指しています
本プロジェクトは、**AI Agentのための、グローバルで権威性のある構造化された外部ファクト・コンテキスト・レイヤー(External Facts Context Layer)**の構築を目指しています

科学研究、政府開示、法律・規制、企業開示・財務報告、標準・権威ある業界資料など、あらゆる分野にわたる高信頼性ソースを体系的に発見・集約し、**散在する非標準的で再利用困難なオリジナルコンテンツを、追跡可能・検証可能・引用可能な「コアファクト」に変換します**。完全な証拠チェーンとバージョン履歴を保持し、すべての結論を「原典に立ち返る」ことができます。

Expand Down Expand Up @@ -63,7 +63,7 @@
| 📊 **構造化メタデータシステム** | 完全なメタデータ標準(アクセスURL、APIインターフェース、権威レベル、更新頻度、データコンテンツ等)、単なるリンクではない | 機械可読・プログラマティックアクセス、自動化された証拠チェーン構築をサポート |
| ⭐ **権威レベル分類** | 政府、国際機関、研究機関、市場、商業、その他の6つの権威レベル | データソースの信頼性を科学的に評価し、AIの品質フィルタリング基準を提供 |
| 🤖 **AIスマート検索** | 複雑な多次元クエリを理解するLLM駆動のデータソースクエリエージェント | 自然言語で権威あるデータソースを取得し、手動フィルタリング不要 |
| 🔌 **MCPプロトコル統合** | 標準MCPサーバーを提供、Claude Desktop、Clineなどのアプリケーションと統合可能 | 任意のAIアプリケーションが権威あるデータソースのナレッジベースにアクセス可能 |
| 🔌 **MCPプロトコル統合** | 標準MCPサーバーを提供、Claude Desktop、Clineなどのアプリケーションと統合可能 | 任意のAIアプリケーションが権威ある外部ファクト・コンテキスト・レイヤーにアクセス可能 |
| 🤖 **Agent Skill 配信** | 標準化された Skill 定義 — Agent が自動でトークン登録・MCP設定を完了、人手不要 | Agent First — Agent が組み込み機能のように権威データにアクセス |
| 🌍 **バイリンガルサポート** | すべてのメタデータを中国語と英語で提供 | グローバルなデータエコシステムを繋ぎ、言語の壁を打ち破る |
| 🔍 **100%検証** | すべてのURLをテスト済み、すべてのデータソースに完全な文書、すべての権威レベルに根拠あり | データソースが本当に利用可能であることを確保し、リンク切れや幻覚的な引用を回避 |
Expand Down Expand Up @@ -143,9 +143,9 @@

---

権威あるデータソースの構造化されたナレッジベースを構築しました。各データソースには完全なメタデータ、アクセスパス、権威識別子が含まれています。しかし多くのユーザーにとって、実際の課題は次のとおりです:膨大なデータソースの中から最適なものを素早く見つけるにはどうすればよいか?データソースのウェブサイトを見つけた後、複雑な公式プラットフォーム上でどのように目的のデータを正確に見つけるか?そしてこれらすべてを日常のAIワークフローにシームレスに統合するにはどうすればよいか?
権威あるデータソースの構造化された外部ファクト・コンテキスト・レイヤーを構築しました。各データソースには完全なメタデータ、アクセスパス、権威識別子が含まれています。しかし多くのユーザーにとって、実際の課題は次のとおりです:膨大なデータソースの中から最適なものを素早く見つけるにはどうすればよいか?データソースのウェブサイトを見つけた後、複雑な公式プラットフォーム上でどのように目的のデータを正確に見つけるか?そしてこれらすべてを日常のAIワークフローにシームレスに統合するにはどうすればよいか?

**FirstData MCP**はまさにこの目的のために作られました。静的なデータソースのナレッジベースをダイナミックなインテリジェントナビゲーションシステムに変え、権威あるデータを誰もがアクセスできるようにします。
**FirstData MCP**はまさにこの目的のために作られました。静的な外部ファクト・コンテキスト・レイヤーをダイナミックなインテリジェントナビゲーションシステムに変え、権威あるデータを誰もがアクセスできるようにします。

---

Expand Down
14 changes: 7 additions & 7 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -4,11 +4,11 @@

---

**全球最全面、最权威、最结构化的开源数据源知识库 — Agent First**
**面向 AI Agent 的外部事实上下文层 — Purpose-built · Authoritative · Structured**

**The World's Most Comprehensive, Authoritative, and Structured Open Data Source Repository**
**The External Facts Context Layer for AI Agents**

> **Agent First**:FirstData 以 AI Agent 为第一优先用户设计。Agent 可通过标准化 Skill 自动完成注册、激活和 MCP 配置,零人工介入即可接入权威数据源知识库
> **Agent First**:FirstData 以 AI Agent 为第一优先用户设计。Agent 可通过标准化 Skill 自动完成注册、激活和 MCP 配置,零人工介入即可接入权威外部事实上下文

[![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT)
[![Data Sources](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/MLT-OSS/FirstData/refs/heads/main/assets/badges/sources-count.json)](firstdata/indexes/statistics.json)
Expand All @@ -29,7 +29,7 @@

### 我们的目标:构建AI时代的可信底座

本项目旨在构建一个**面向全球的、权威的、结构化的 Primary Sources 知识库**。
本项目旨在构建一个**面向 AI Agent 的、全球的、权威的、结构化的外部事实上下文层(External Facts Context Layer)**。

我们系统性发掘并聚合跨领域高可信信源——覆盖科研学术、政务公开、法律法规、公司披露与财报、标准规范与行业权威资料等——**将分散、非标、难复用的原始内容,转化为可追溯、可验证、可引用的"核心事实(Core Facts)"**,并保留完整证据链与版本历史,确保每一条结论都能"回到原文"。

Expand Down Expand Up @@ -65,7 +65,7 @@
| 📊**结构化元数据体系** | 完整元数据标准(访问URL、API接口、权威等级、更新频率、数据内容等),不只是链接 | 机器可读、可编程访问,支持自动化证据链构建 |
| ⭐**权威等级分类** | 政府、国际组织、研究机构、市场、商业等六类权威等级 | 科学评估数据源可信度,为AI提供质量过滤依据 |
| 🤖**AI智能搜索** | 基于LLM驱动的数据源查询Agent,理解复杂多维度查询 | 自然语言即可获取权威数据源,无需人工筛选 |
| 🔌**MCP协议集成** | 提供标准MCP Server,可集成到Claude Desktop、Cline等AI应用 | 让任何AI应用都能访问权威数据源知识库 |
| 🔌**MCP协议集成** | 提供标准MCP Server,可集成到Claude Desktop、Cline等AI应用 | 让任何AI应用都能访问权威外部事实上下文层 |
| 🤖**Agent Skill 分发** | 标准化 Skill 定义,Agent 可自动注册 token、自动配置 MCP,零人工介入 | Agent First — 让 Agent 像调用内置能力一样接入权威数据 |
| 🌍**中英双语支持** | 所有元数据提供中英文版本 | 连接全球数据生态,打破语言壁垒 |
| 🔍**100%验证** | 每个URL经过测试,每个数据源有完整文档,每个权威等级有依据 | 确保数据源真实可用,避免断链和幻觉引用 |
Expand Down Expand Up @@ -145,9 +145,9 @@

---

我们构建了权威数据源的结构化知识库,每个数据源都有完整的元数据、访问路径和权威性标识。但对于大多数用户来说,真正的挑战在于:如何在海量数据源中快速找到最合适的那一个?找到了数据源网站,如何在复杂的官方平台中准确定位目标数据?如何将这一切无缝集成到日常的 AI 工作流中?
我们构建了权威数据源的结构化外部事实上下文层,每个数据源都有完整的元数据、访问路径和权威性标识。但对于大多数用户来说,真正的挑战在于:如何在海量数据源中快速找到最合适的那一个?找到了数据源网站,如何在复杂的官方平台中准确定位目标数据?如何将这一切无缝集成到日常的 AI 工作流中?

**FirstData MCP** 正是为此而生——将静态的数据源知识库转化为动态的智能导航系统,让每个人都能轻松访问权威数据。
**FirstData MCP** 正是为此而生——将静态的外部事实上下文层转化为动态的智能导航系统,让每个人都能轻松访问权威数据。

---

Expand Down
Loading
Loading