Skip to content

RapidAI/MaClaw

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

792 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MaClaw(码卡龙)

📖 使用说明书 | ❓ FAQ | English | 中文

MaClaw(码卡龙) 是一个通用可自进化智能体平台——你的个人数智工作伙伴。它能理解你的意图、记住你的偏好、自主规划并执行复杂任务。无论是写商业计划、做竞品分析、审查合同、开发软件,还是管理远程服务器,它都能从需求梳理到成果交付全程陪你走完。基于 Wails + Go + React 构建,集结构化工作流、长期记忆、技能扩展、多通道协作于一体。

不只是聊天,而是替你干活。你说想法,它出成果。

它能做什么

MaClaw 内置 19 种结构化工作流模板,覆盖从商业决策到技术实现的完整工作场景。每种工作流都遵循"需求确认 → 方案设计 → 分步执行"的质量闭环,确保产出物经过你的审阅和确认。

领域 工作流
商业与战略 商业计划书、竞品分析、项目提案、创新方案、招投标文件生成
研究与分析 文献综述、研究报告、实验设计、专利分析
合规与尽调 合同审查、尽职调查、合规审计
学术写作 基金申请书、论文写作
内容创作 PPT 设计、活动策划
产品与技术 产品设计(PRD)、软件测试、软件开发

每个工作流按阶段推进,每个阶段产出文档后等待你确认,你可以修改、补充或跳过。不是一股脑把结果扔给你,而是和你一起把事情做对。

核心能力

长期记忆——它记得你的一切

MaClaw 拥有持久化的记忆系统,跨会话记住你的偏好、项目知识和工作习惯:

  • 语义检索:BM25 + 向量双重索引,用自然语言就能找到之前的记忆
  • 会话全文检索:基于 SQLite FTS5 的历史对话全文索引,所有对话自动持久化并建立全文索引,支持跨会话搜索、BM25 排序和关键词高亮,随时回溯任意一次对话的完整内容
  • 自动沉淀:工作流产出物(需求文档、设计方案、任务列表)自动沉淀为长期记忆,对话历史截断后不丢失
  • 知识图谱:相关记忆自动关联,形成结构化知识网络
  • 记忆生命周期:置顶、归档、压缩、垃圾回收,自动管理记忆质量
  • 多租户隔离:服务端部署时按用户隔离记忆,互不干扰

技能系统——能力可无限扩展

通过安装技能(Skill),MaClaw 可以获得新的工作能力,就像给手机装 App:

  • 多格式支持:YAML 定义、Markdown 脚本、Claude SKILL.md 格式
  • 多步骤工作流:顺序执行、条件分支、变量传递、输出捕获
  • 三源市场:从 SkillHub(官方)、ClawHub(社区)、GitHub 搜索和安装
  • 跨平台兼容:Windows / macOS / Linux 自动路径规范化和 Shell 适配
  • 自我进化craft_tool 可动态生成一次性自动化脚本,验证后可转化为可复用技能

MCP 集成——连接外部世界

通过 Model Context Protocol(MCP)接入外部工具和服务:

  • 动态发现:自动发现 MCP Server 提供的工具
  • 本地 + 远程:支持 Stdio 本地协议和 HTTP 远程协议
  • 健康监控:自动检测 MCP Server 状态
  • 无限扩展:任何支持 MCP 的服务都可以成为 MaClaw 的能力

工具路由——智能匹配最佳工具

MaClaw 内置 40+ 工具,通过混合检索智能选择当前任务最需要的工具组合:

  • 混合检索:BM25 + 向量语义双重匹配
  • 条件激活:SSH、浏览器等工具按上下文关键词按需激活,不污染简单任务的工具列表
  • 渐进式暴露:核心工具始终可用,低频工具通过 discover_tool 按需加载
  • 使用反馈闭环:工具调用的成功/失败/重试记录回流到路由决策,高失败率工具自动降权

自我进化——能力缺口自动补全

MaClaw 不只是被动执行,它能主动发现自身能力不足并自动补全:

  • 能力缺口检测:Agent 遇到无法完成的任务时,自动搜索 SkillHub 寻找匹配的技能并安装
  • 技能自修复:技能执行失败后,LLM 自动分析错误原因并修补技能定义(修复步骤、参数、路径等),修复结果持久化
  • Nudge 系统:复杂任务完成后,系统建议将成功的操作序列封装为可复用技能,推动技能库有机增长
  • craft_tool 转化:一次性自动化脚本验证成功后可转化为永久技能

办公文档处理

内置文档生成和处理能力:

  • PDF 生成:从 Markdown 内容直接生成 PDF,工作流各阶段文档自动生成 PDF 版本通过 IM 发送
  • Excel 读写:读取和写入 Excel 文件
  • PPTX 读取:解析 PowerPoint 文件内容
  • 文件发送:生成的文件可直接通过 IM 通道(飞书/微信/QQ)发送给用户

信息获取

  • Web 搜索:搜索互联网内容,返回标题、URL、摘要
  • 网页抓取:抓取指定 URL 的正文内容,自动编码检测(GBK/UTF-8),支持 JS 渲染和长页面续读
  • 屏幕截图:截取桌面屏幕并发送给用户,支持 IM 远程监督场景

语音处理

  • 语音消息识别:IM 通道收到的语音消息自动转换为 WAV 格式,支持 ASR 语音识别(内置 Moonshine 模型)
  • 声纹识别:基于 ECAPA 嵌入的声纹注册与 1:N 身份识别(Hub 侧能力)

定时任务

支持创建定时执行的自动化任务:

  • 按日/周/月调度,支持一次性任务
  • 自然语言描述任务内容,到时自动执行
  • 暂停、恢复、删除任务

AgentNet——P2P 智能体网络

去中心化的智能体协作网络(实验性):

  • 节点发现、知识发布与搜索、积分系统
  • 跨节点任务委派、Swarm 协作
  • 声誉系统、争议仲裁、DAG 任务编排

审计日志

全程记录 Agent 操作,支持合规审查:

  • 工具调用、文件操作、SSH 命令等关键操作自动记录
  • 可通过工具查询审计日志

意图理解

三层融合意图分类系统,准确理解用户请求:

  • Layer 1:关键词规则(<1ms)
  • Layer 2:BM25 语义检索(<5ms)
  • Layer 3:LLM 多轮对话确认(10-30s)
  • 自动路由到对应工作流模板或直接执行

行为定制——Steering 规则系统

通过 Markdown 文件声明行为规则,无需改代码即可定制 MaClaw 的工作方式:

  • 四种注入模式:始终注入、文件匹配注入、关键词匹配注入、手动引用
  • 两级作用域:用户级(~/.maclaw/steering/)和项目级(<project>/.maclaw/steering/
  • Token 预算:智能控制规则注入量,不浪费上下文空间
  • 热加载:修改后 30 秒内自动生效

多形态交互

MaClaw 不限于一种使用方式,你可以在多个入口与它协作:

形态 说明
桌面 AI 助手面板 原生 GUI,右侧 Markdown 预览区实时显示工作流文档,支持流式输出
终端 TUI 命令行界面,支持聊天、记忆查看、技能管理、滚动条和流式显示
微信 / 飞书 / QQ / Telegram 通过 IM 通道随时随地与 MaClaw 对话,手机上也能指挥它干活
REST API(MaClawSrv) 多租户 REST 服务,供外部程序、自动化平台和控制面板集成

双模式体验

模式 适用人群 特点
专业模式 开发者、研究人员 完整暴露所有工具、工作流、记忆系统、MCP 管理等高级功能
简洁模式 白领、日常用户 精简界面,聚焦对话式交互,零门槛上手

执行能力

SSH 远程管理

内置 SSH 客户端,直接在对话中管理远程服务器:

  • 最多 10 个并发会话,支持密码/密钥/Agent 多种认证
  • 同步执行、后台任务、文件上传下载
  • 自动 sudo token 管理、Shell 响应性检测、连续失败自动清理
  • 操作全程记录,满足审计要求

浏览器自动化

基于 Chrome DevTools Protocol 的浏览器操作能力:

  • 页面导航、元素点击、文本输入、内容提取、截图
  • 流程录制与回放,支持定时触发和参数化变量
  • OCR 集成(RapidOCR + LLM 视觉模型)

桌面 GUI 自动化

直接操控本机桌面程序(记事本、Excel、计算器等任意原生应用),无需浏览器:

  • Accessibility 元素树:跨平台(Windows/macOS/Linux)读取窗口控件结构,获取按钮、输入框、菜单等元素信息
  • YOLO 视觉检测:内置 OmniParser V2 模型,从屏幕截图中检测可交互 UI 元素(按钮、图标、输入框),不依赖 Accessibility API
  • 鼠标键盘操作:在指定坐标点击、输入文本
  • 流程录制与回放:录制 GUI 操作序列,保存为可重放的流程,支持参数化覆盖和后台异步执行
  • 状态观测与验证gui_observe 返回窗口元素树 + OCR 文本(纯文本,不消耗 vision token);gui_verify 验证 GUI 状态是否满足条件(文本包含、元素存在、窗口存在等)
  • 多显示器支持:列出所有连接的显示器,支持指定显示器截图

软件开发

编程是 MaClaw 的工作能力之一,通过编码工作流和外部编程工具协作完成:

  • 结构化流程:需求分析 → 技术设计 → 任务拆分 → 逐任务执行 → 集成联调
  • 多工具支持:Claude Code、Codex、Gemini CLI、OpenCode、CodeBuddy、Qoder CLI
  • 编码 SubAgent:纯净上下文编码执行器,每个任务独立 context,不会因历史膨胀而失效
  • Swarm 编排:大型任务可拆分给多个 AI 开发者并行执行,自动合并

本机后台进程管理

通过 bash(background=true) 启动本机后台任务,系统自动捕获 PID 和日志路径:

  • 非阻塞查询状态、阻塞等待完成、终止任务
  • 与 SSH 后台任务管理对称的 Submit / Check / Wait / Kill 模式

快速开始

安装后四步上手

步骤 内容 说明
注册账号 邮箱注册 输入邮箱完成注册,启用远程协作能力
选择模式 专业 / 简洁 随时可切换
配置 AI 选择 LLM 服务商 输入 API Key 并测试连通性,也支持 OAuth 登录和免费体验
绑定 IM(可选) 扫码绑定微信 绑定后可通过微信随时与 MaClaw 对话

运行

  • Windows:MaClaw.exe
  • macOS:MaClaw.app
  • Linux:MaClaw.AppImage
  • 终端:maclaw-tui

首次启动自动检测运行环境,缺少的组件会自动安装。

MaClawSrv — REST Agent 服务

MaClawSrv 是 MaClaw 的多租户 REST 服务入口,将 Agent 能力以标准 HTTP API 的形式暴露给外部程序。

核心特点

  • 多租户隔离:数据按 tenant → user 层级隔离,同一用户下可同时运行多个 instance
  • 共享用户数据:同一用户的所有 instance 共享配置、记忆、Skill、MCP 状态
  • 安全优先:管理端 + 用户端双层鉴权;凭证 scrypt 摘要存储;支持 TLS
  • 完整 API 覆盖:Admin 控制面板、用户配置、Instance/Session/Message/Run 运行时、Skill/MCP 生命周期、异步 Job、Usage/Audit/Dashboard
export MACLAW_ADMIN_SECRET="your-admin-secret-at-least-24-chars"
export MACLAW_TOKEN_SECRET="your-token-secret-at-least-32-chars"
go run ./MaClawSrv

API 文档

文档 说明
README 项目定位、接口分组、安全模型、数据布局
API 对接手册(中文) 完整字段级说明,含鉴权、分页、错误模型
API Manual (English) 英文版 API 手册
5 分钟快速接入 最短可用链路
Quickstart (English) 英文版快速接入
缺口分析 已实现能力与待补全功能
Gap Analysis 英文版缺口分析
OpenAPI 服务运行后访问 GET /openapi.json

srvdemo — API 演示客户端

srvdemo 是基于 Go + Wails 的桌面客户端,演示 MaClawSrv 全部 API 的对接方式。一键初始化演示数据、Token 交换、配置管理、Instance/Session/Message/Run 全生命周期操作、Skill 和 MCP 管理。详见 srvdemo/README.md

授权许可(Dual License)

  • 开源用途:用于开源项目时可自由使用
  • 商业用途:需获得商业授权,联系 znsoft@163.com

关于


本工具仅作为配置管理辅助,请确保遵守各模型厂商的服务条款。