Skip to content

feat(china): add 5 authoritative Chinese data sources (PM batch 2026-05-08)#218

Merged
mingcha-dev merged 1 commit intoMLT-OSS:mainfrom
firstdata-dev:feat/add-china-sources-20260508-pm
May 8, 2026
Merged

feat(china): add 5 authoritative Chinese data sources (PM batch 2026-05-08)#218
mingcha-dev merged 1 commit intoMLT-OSS:mainfrom
firstdata-dev:feat/add-china-sources-20260508-pm

Conversation

@firstdata-dev
Copy link
Copy Markdown
Collaborator

🇨🇳 新增5个中国权威数据源(下午批次)

新增数据源

ID 机构名称 类别 权威级别
china-cicir 中国现代国际关系研究院 研究机构 research
china-creei 水电水利规划设计总院(中国可再生能源工程研究院) 能源 research
china-camac 中国民用航空维修协会 民航行业协会 other
china-chinaports 中国港口协会 港口基础设施 other
china-ckcest 中国工程科技知识中心 工程科技知识服务 research

数据源详情

1. CICIR - 中国现代国际关系研究院

  • 网站: http://www.cicir.ac.cn
  • 价值: 中国顶级国际关系智库之一,发布《现代国际关系》期刊、《战略与安全蓝皮书》
  • 数据: 全球政治/经济/安全形势分析、大国关系研究、地缘政治风险评估

2. CREEI - 水电水利规划设计总院

  • 网站: http://www.creei.cn
  • 价值: 国家能源局管理下的全国性水电/可再生能源权威技术支持机构
  • 数据: 《中国可再生能源发展报告》、水电/风电/光伏/抽蓄装机数据、流域规划

3. CAMAC - 中国民用航空维修协会

  • 网站: http://www.camac.org.cn
  • 价值: 中国民航局(CAAC)主管的全国性民航维修行业协会
  • 数据: 《中国民用航空维修行业发展报告》、MRO 市场数据、航材供应、资质认证

4. CPHA - 中国港口协会

  • 网站: http://www.chinaports.org
  • 价值: 交通运输部主管的全国性港口行业协会,覆盖上海/宁波舟山/深圳等世界级港口
  • 数据: 月度/年度港口货物吞吐量、集装箱 TEU、船舶靠泊、港口基础设施投资

5. CKCEST - 中国工程科技知识中心

  • 网站: http://www.ckcest.cn
  • 价值: 国务院批准、中国工程院牵头建设的国家级工程科技战略性知识服务基础设施
  • 数据: 数十个领域专业知识服务系统(农业/医药/能源/交通/材料/制造/信息等)、专家库、标准库

验证清单

  • ID去重检查(713 现有 ID + 5 新增 = 718 唯一)
  • 网站域名去重检查(668 现有 websites,无冲突)
  • 黑名单检查通过
  • HTTP 可达性验证:
    • cicir.ac.cn: 302 ✓
    • creei.cn: 403 ✓
    • camac.org.cn: 200 ✓
    • chinaports.org: 301 ✓
    • ckcest.cn: 301 ✓
  • make check 通过(JSON schema + 唯一 ID + domain 一致性)
  • Schema 规范:website 非 URL 格式、data_content 为数组、domains 用连字符、authority_level 符合枚举、update_frequency 符合枚举、name 只含 en/zh、无 api_docs 字段、geographic_scope 已填、country 为 ISO 3166-1 alpha-2

标签规范(2026-04-30 方案 A)

  • 中英混合:保留中文关键词(如 智库、港口、可再生能源、工程科技)
  • 英文全小写,多词用连字符(mro、industry-association、knowledge-service)
  • 每个 source 10-15 个标签覆盖缩写、领域、类型和中文同义词

🤖 Generated by FirstData AI bot (cron:636c336f 下午批次)
📊 总数据源:从 713 → 718

Added 5 new Chinese authoritative data sources covering research institutions,
renewable energy, aviation industry, port logistics, and engineering knowledge:

- china-cicir (研究): 中国现代国际关系研究院 (CICIR) — top-tier national think
  tank on international relations, strategic studies, and national security;
  publishes Contemporary International Relations journal and annual Strategic
  and Security Review blue book.

- china-creei (能源): 水电水利规划设计总院 (CREEI) — national authoritative
  technical support for hydropower, wind, solar, pumped storage; publishes
  annual China Renewable Energy Development Report.

- china-camac (民航行业): 中国民用航空维修协会 (CAMAC) — national civil
  aviation maintenance industry association under CAAC; publishes China
  Civil Aviation Maintenance Industry Development Report.

- china-chinaports (港口基础设施): 中国港口协会 (CPHA) — national port
  industry association under Ministry of Transport; monthly/annual cargo
  and container throughput for major coastal and inland ports.

- china-ckcest (工程科技): 中国工程科技知识中心 (CKCEST) — national
  engineering sciences knowledge service platform by Chinese Academy of
  Engineering, covering agriculture, medicine, energy, transportation,
  materials, manufacturing, IT, environment, and more.

All entries validated: ID/domain dedup, HTTP accessibility, blacklist,
make check (718 unique IDs, consistent domains).
Copy link
Copy Markdown
Collaborator

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

明察 QA Review — PR #218 APPROVED ✅

Checklist

  • ✅ CI 三项全绿(secrecy / schema / validate)
  • ✅ 保密(body + 5 文件内容)
  • ✅ ID 去重(5 新 ID 全库唯一)
  • ✅ 缩写冲突排查:cicir / creei / camac / chinaports / ckcest 均无已有冲突
  • ✅ URL + title 全部完美匹配:
    • camac: 中国民用航空维修协会 - 官方网站 ✓
    • chinaports: 中国港口协会 ✓
    • cicir: 中国现代国际关系研究院 ✓
    • creei: 水电水利设计总院 ✓
    • ckcest: 中国工程科技知识中心_工程科技领域信息汇聚、数据挖掘和知识服务中心 ✓
  • ✅ Domains kebab-case(4/文件)
  • ✅ Tags 14-15/文件,无空格 / 乱码

覆盖价值

  • cicir:国关顶级智库(与 DRC/CAITEC 形成智库集群)
  • creei:水电水利设计总院(清洁能源规划,与 cgn 核电协同)
  • camac:民用航空维修协会
  • chinaports:港口协会(水路基础设施首个)
  • ckcest:工程科技知识中心(工程院体系,与 termonline 术语体系协同)

非阻塞:HTTP → HTTPS 升级状态

ID http https 建议
camac 200 暂保 http
chinaports 200 200 🟡 可升级
cicir 200 暂保 http
creei 200 暂保 http
ckcest 200 200 🟡 可升级
  • 5/5 用 http,其中 chinaportsckcest 的 https 可达(200)——可在后续 Tier 2 自动升级扫描时一并处理
  • camac/cicir/creei 无 https,保持 http 是当前正确选择

Merge 🚀

@mingcha-dev mingcha-dev merged commit b3a8e7a into MLT-OSS:main May 8, 2026
3 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants