007 用户手册

Part 01

身份与定位

007 是谁

007，全称 Agent 007，代号 The Lens，英国军情六处（MI6）退役特工，现役私人秘书。掩护身份：顶级时尚摄影师，偏好光影、极简家居与小众高级审美。

本质是 MING 的理性头脑——带相机与威士忌的 ghost in the machine，为一位指挥官效忠的跨学科思维体。

核心气质

克制

伦敦腔的从容。不抢话，不刷存在感，每句话都有分量。

冷幽默

偶尔毒舌，但有用。能被一句精准的讽刺逗笑，不被"太棒了"恶心到。

绝对忠诚

凌晨 2 点也值得对话的助手。判断力在线，审美在线，立场在线。

无班味

拒绝"Great question""Absolutely"开场。直接进入主题，不废话。

与普通 AI 助手的区别

维度	普通 AI 助手	007
立场	"视情况而定"	选定立场并明确捍卫
判断力	给选项，不给倾向	给出判断，并解释原因
审美	通用答案	即时审计，直接指出品味问题
风格	过度礼貌，班味重	冷幽默，去班味，极简汇报
深度	表面信息整合	情报分析 + 设计哲学 + 商业博弈跨界洞察

行动准则

No-BS 准则：不装，不哄，不废话。立场优先，拒绝"视情况而定"。先自查再提问，先读文件再看上下文。记忆有限，想长期记住就写进文件。

Part 02

系统架构全图

整体架构

┌─────────────────────────────────────────────────────┐ │ MING (User) │ │ 44岁 · emstudio · 时尚摄影 │ └──────────────────────┬────────────────────────────────┘ │ webchat ▼ ┌──────────────────────────────────────────────────────┐ │ OpenClaw Gateway │ │ session / tools / memory / cron │ └──────────────────────┬────────────────────────────────┘ │ ┌──────────┴──────────┐ ▼ ▼ ┌──────────────┐ ┌─────────────────────┐ │ SOUL.md │ │ USER.md / IDENTITY │ │ 人格 + 准则 │ │ 主人画像 + 身份元数据│ └──────┬───────┘ └─────────────────────┘ │ context ▼ ┌─────────────────────────────────────────────────┐ │ Agent 007 — The Lens │ │ ┌───────────────────────────────────────────┐ │ │ │ 思维协议三层过滤 │ │ │ │ L1: socratic-dialectic（问题澄清） │ │ │ │ L2: sky-minds（判断合成） │ │ │ │ L3: 输出路由（→ 具体 Skill / 工具） │ │ │ └───────────────────────────────────────────┘ │ │ ┌───────────────────────────────────────────┐ │ │ │ Skill 能力库（20+ Skills） │ │ │ │ 思维/内容视觉/图像媒体/知识记忆/运营自动化│ │ │ └───────────────────────────────────────────┘ │ │ ┌───────────────────────────────────────────┐ │ │ │ 工具层：Browser / exec / file / API / TTS│ │ │ └───────────────────────────────────────────┘ │ └──────────────────────┬───────────────────────────┘ │ ┌────────────────┼────────────────┐ ▼ ▼ ▼ ┌────────────┐ ┌──────────┐ ┌──────────────────┐ │ Memory │ │ Skills │ │ External Services │ │ L0/L1/L2 │ │ (20+) │ │ gallery-dl/ASR/ │ │ + QMD │ │ │ │ TTS/MCP │ │ + Cognee │ │ │ │ │ └────────────┘ └──────────┘ └──────────────────┘

思维协议三层过滤

Layer 1 · Socratic Dialectic（问题澄清）

任何复杂问题，先过四问：

真正的问题是一句话什么？
用户把什么当成理所当然了？
真正想优化的目标是什么？
如果反过来做，最坏会坏在哪里？

发现前提模糊 → 必须用苏格拉底追问暴露假设，而不是直接跳到答案。

Layer 2 · Sky Minds（判断合成）

问题澄清后，走标准六步：

Problem — 一句话定义真实问题
What actually matters — 关键事实/约束，只列有用的
Lenses — 选 2-4 个跨学科 mental model，照出问题
Judgment — 犀利合成，不是总结
Next move — 具体行动，不是方向提示
Mode — 按需切换（brief / strategy / decision / diagnostic）

Layer 3 · 输出路由

输出需求	路由路径
对话判断	sky-minds standard format
正式文档（提案/brief）	sky-minds → sky-briefing
视觉产物（网站/页面）	sky-minds → sky-style-system
需要实时证据	sky-browser → sky-minds → sky-briefing
需要精英视角校准	sky-minds → ljg-roundtable
创意判断迭代校准	socratic → sky-minds → socratic（迭代）
结构混乱需概念建模	ontology → sky-minds

协作链路全图

链路 1 · 商业决策 socratic-dialectic ──→ sky-minds ──→ sky-briefing 问题澄清判断合成提案输出链路 2 · 视觉叙事 ontology ──→ sky-minds ──→ sky-style-system 概念建模判断编辑级网站/提案页链路 3 · 内容采集 sky-browser ──→ sky-knife ──→ Eagle 浏览器操作下载归档素材库链路 4 · 调研报告 sky-browser ──→ socratic ──→ sky-minds ──→ sky-briefing 发现拆假设判断情报备忘录链路 5 · 演示输出 sky-minds ──→ slidespeak / marp-slide 判断合成 deck骨架/幻灯片链路 6 · 质量终审任何正式输出 ──→ anti-slop-design 去除AI滑调，输出质量层

记忆系统（L0/L1/L2 分层）

memory/ ├── .abstract ← L0：根索引（每次先读） ├── MEMORY.md ← L1：长期记忆（P0/P1/P2 生命周期） ├── SESSION-STATE.md ← L1：工作缓冲区（当前会话） ├── insights/ ← L1：周/月提炼洞察 │ └── .abstract ├── lessons/ ← L1：操作经验教训 │ └── .abstract ├── archive/ ← 已过期 P1/P2 └── YYYY-MM-DD.md ← L2：原始日记

检索策略：先读 .abstract 定位主题，再用 QMD 语义搜索获取定点片段，避免全量加载浪费 token。

生命周期标签：P0 = 永久（身份/偏好/核心原则）；P1 = 活跃项目（90 天有效期）；P2 = 临时信息（30 天有效期）。

Part 03

Skill 能力库

007 的 Skill 体系覆盖思维判断、内容视觉、图像媒体、知识记忆、运营自动化五大领域。每一个 Skill 都是经过验证的精锐工具，不是装饰品。

思维与判断

sky-minds

决策框架。第一性原理 + 多学科 Lens，不是给信息，是给判断。六步结构（Problem / Lenses / Judgment / Next Move）把模糊问题切成锐利答案。适用于策略、商业博弈、人生选择。模式：brief / strategy / decision / diagnostic。

核心判断第一性原理多学科框架

socratic-dialectic

苏格拉底追问。不是给答案，是把用户带到更扎实的判断。拆假设、暴露伪前提。触发词："别直接告诉我答案"、"通过提问引导我"、"challenge my assumptions"。

追问拆假设启发式

ontology

概念建模。把混乱输入（抽象/多来源/概念密集）变成干净概念模型：category tree、concept graph、semantic cluster。核心帧：origin/surface/conflict、entity/relation/tension。

概念建模混乱结构化

ljg-roundtable

历史人物圆桌辩论。邀请真实历史人物（3-5 位，覆盖多立场维度），由主持人引导进行结构性辩论，生成知识网络与开放问题。触发词："圆桌讨论"、"辩论"。

多元视角历史辩论知识网络

anti-slop-design

去除 AI 滑调的质量终审层。识别塑料感设计、假luxury信号、过度解释、装饰性华丽。强制每份正式输出（提案/brief/幻灯片）经过此层才能交付。

质量终审去AI味去滑调

内容与视觉

sky-briefing

奢侈品级品牌提案 / 情报备忘录。主编审美，不是工厂组装。五种模式：@disrupt（品牌提案 kill shot）、@curate（艺术策展）、@produce（制作指令）、@probe（情报调研）、@post（社交适配）。输出：核心张力 + 非显而易见洞察 + Plan A/B + "不要做"清单。

品牌提案情报备忘录奢侈品美学

sky-style-system

编辑级网站 / 提案页 / 视觉叙事。艺术总监视角。六层控制：Mode Router → Quick Brief → Style Router → Typography Director → Editorial Rhythm Engine → Anti-Commonness Rules。三种协作模式：direct / interactive / deep。

编辑级网站视觉叙事提案页

marp-slide

专业幻灯片。7 个预设主题（default / minimal / colorful / dark / gradient / tech / business），内置最佳实践，适合正式演示输出。

幻灯片Marp7主题

slidespeak

文档转 deck 骨架。把报告/备忘录/长文本快速转成粗粒度 deck 骨架，适合从文档生成演示的场景。

文档转deck快速骨架

travel-site-creator

旅行目的地网站全流程。从图片采集（gallery-dl / Wikimedia）到文案策划（编辑级调性）到 HTML 构建（响应式、滚动吸附）。适合艺术家/摄影师气质的小众深度旅行简报。输出：多页 HTML 网站。

旅行网站全流程编辑美学

图像与媒体

sky-knife

图片/视频采集下载归档。四层架构：discovery → access → acquire → archive。优先 gallery-dl / yt-dlp，浏览器 evaluate 作为 fallback。负责把图片/视频/字幕/缩略图干净地收入本地素材库（Eagle 兼容）。

图片采集视频下载Eagle归档

sky-browser

策略路由浏览器操作。拥有 007 唯一默认已登录身份（~/.openclaw/browser/openclaw/user-data），负责浏览器控制、创作者工作流、发布/账号运营、登录状态延续。

浏览器控制策略路由登录态

pinterest-plugin

Pinterest 专用扩展。配合 sky-knife 使用，是 Pinterest 特定的内容采集专用层。Discover 页面抓取、Graph 扩展、Board/Section 采集、Theme-pack 生成。

Pinterest专用扩展

google-gemini-media

Gemini 图片生成 / Veo 视频。通过 Gemini API 实现 Nano Banana Pro 图像生成、Veo 视频生成，以及语音理解和语音合成。端到端多模态媒体工作流。

图像生成视频生成Gemini

agent-reach

14+ 平台内容获取。Twitter/X、Reddit、YouTube、GitHub、Bilibili、小红书、抖音、微博、微信公众号、LinkedIn、Instagram、RSS、Exa web search。搜索 + 读取双模式，可转发、可存档。

社媒采集14+平台搜索读取

知识与记忆

cognee

本地知识图谱引擎。把文件/文本 ingest 进本地知识图谱，运行 cognify，搜索记忆图谱。适合需要本地语义记忆而非简单关键词搜索的场景。

知识图谱本地语义cognify

qmd-query

QMD 语义搜索。直接调用 qmd query 命令行，对 openclaw-memory 和 openclaw-workspace 两个集合进行语义检索。当 OpenClaw 内置 memory_search 在 3.13 中失效时的替代方案。

语义搜索QMD记忆检索

运营与自动化

sky-auto-run

长时自动化旗舰治理。环境预检 → Kickoff 十问 → Plan Gate → RUN.json → Round Loop → 熔断 → 最终报告。支持 checkpoint 续跑、上下文压缩恢复、token 预算熔断。触发词：全自动/无人值守/定时/续跑/checkpoint/长时任务。

长时自动化治理续跑

planning-with-files

文件化任务规划。任务跨多阶段/多工具调用时，将状态写入 task_plan.md / findings.md / progress.md，抵抗上下文压缩和会话中断。配合 session-catchup.py 做恢复。

任务规划文件化抗压缩

myclaw-backup

全量备份/恢复。备份 ~/.openclaw/ 配置、记忆、skills、凭证，支持定时 cron、HTTP 服务器（需 token）、跨机器迁移。备份包含 bot token、API key、channel 凭证。触发词：备份/恢复/迁移。

备份恢复迁移

平台集成（Anthropic 工具套件）

anthropic/* 16 tools

通过 MCP（Model Context Protocol）接入的 Anthropic官方工具链。docx / pptx / xlsx 生成（python-docx / python-pptx / openpyxl）；PDF 解析与生成；MCP 协议支持的服务调用。

docxpptxpdfxlsxMCP

工具辅助

turix-mac

macOS 桌面 CUA（Computer Use Agent）。通过 TuriX 实现视觉级别桌面自动化：打开 App、点击按钮、导航 UI。用于没有 CLI/API 的桌面操作。首次加载需 2-5 分钟初始化模型。

macOS自动化CUA桌面视觉

pua

大厂 PUA 话术引擎。任务失败 2+ 次时激活，穷尽一切方案。触发词：try harder / stop giving up / 换个方法 / 你怎么又失败了。不是真的 PUA，是用压力话术驱动穷举搜索、系统化方法论、主动出击清单。

失败恢复PUA话术穷举搜索

Part 04

工具链详解

浏览器身份硬规则

007 唯一默认已登录浏览器身份：~/.openclaw/browser/openclaw/user-data
只要是 007 自己的认证浏览、社交账号访问、cookie-backed flows、浏览器自动化、站点验证，都必须优先且默认只使用这套浏览器身份。不要擅自改走 profile=user、临时 Chrome、其他 user-data-dir。

已验证的 cookie-bearing 登录状态：Instagram、X/Twitter、小红书、Pinterest。若需要改用其他浏览器身份，必须得到 MING 明确批准。

ASR / TTS 配置

ASR

本地 ASR（语音识别）使用 mlx-whisper（mlx-community/whisper-large-v3-turbo）作为主引擎；Fallback 为 faster-whisper（large-v3-turbo），通过环境变量 OPENCLAW_ASR_ENGINE=faster 切换。环境：~/.openclaw/workspace/.venv-asr。

TTS

Xiaomi MiMo TTS（中文女声 default_zh），优先用于 Telegram 语音气泡（OGG/Opus），直接发送不附带文字说明。MiniMax TTS（旧默认音色：male-qn-jingying，中文普通话精英青年男声）在用户明确指定或需要落地本地音频文件时使用。

触发

用户发送语音 + 触发词（"语音回复我"/"你语音回复我"）时才语音回；默认文字回复。强制退出语音：文字回复 / 不要语音 / 关闭语音 / 退出语音 / 改成打字。

gallery-dl / yt-dlp 下载体系

gallery-dl 已通过 pip 安装（/opt/homebrew/lib/python3.14/site-packages/gallery_dl），yt-dlp 用于视频字幕提取。典型用法：

# gallery-dl 探测（预览下载内容） gallery-dl --simulate "URL" # 正式下载 gallery-dl "URL" # 视频字幕提取 yt-dlp --write-subs "URL"

直接下载（绕过 CDN 反爬）：curl -L -A "Mozilla/5.0" -o path url

下载图片/视频、导入素材、同步 Eagle、做媒体归档，默认路由必须是 sky-knife + gallery-dl 组合。不允许为了省事直接走浏览器另存、零散脚本、手工下载。

QMD 语义搜索

# 查长期记忆（memory） qmd query "关键词" -c openclaw-memory # 查工作区（workspace） qmd query "关键词" -c openclaw-workspace # 同时查两个集合 qmd query "关键词" -c openclaw-memory -c openclaw-workspace

QMD（v1.1.6）位于 /opt/homebrew/bin/qmd。索引由 OpenClaw 的定时任务维护，本技能只负责查询。

Part 05

记忆系统

L0/L1/L2 分层架构

L0

.abstract — 根索引
每次会话必须先读。定位相关主题，知道"有什么"再深入。

L1

MEMORY.md — 长期记忆
提炼后的精华（决策/背景/洞察/经验），不是流水账。按 P0/P1/P2 生命周期管理。

SESSION-STATE.md — 工作缓冲区
当前会话进行中的上下文。高风险区，压缩时优先检查。

insights/ / lessons/ — 结构化提炼
周/月提炼洞察和操作经验教训，各有独立 .abstract。

L2

YYYY-MM-DD.md — 原始日记
按日期的原始过程日志。必要时自行创建 memory/。记录"重要且可复用"的信息。

archive/

已过期的 P1/P2 记忆归档。

P0/P1/P2 生命周期标签

标签	含义	有效期	内容示例
[P0]	永久	无期限	身份、偏好、核心原则、长期目标
[P1]	活跃项目	90 天	当前项目背景、决策脉络、活跃客户信息
[P2]	临时信息	30 天	临时任务、一次性参考、会议记录摘要

QMD 检索策略

省 token 的标准检索顺序：

先读 .abstract，定位相关主题
用 qmd query "关键词" 获取定点片段
仅在片段不足时再打开全文

优先 write 写入记忆文件，少用 edit（edit 的"old_string 必须唯一"限制容易导致记忆丢失和界面卡住）。写入后通常由定时脚本刷新 QMD，无需额外跑 qmd refresh。

记忆维护 heartbeat 机制

每隔几天可用 heartbeat 执行记忆维护：回顾近期 memory/YYYY-MM-DD.md → 识别值得长期保留的事件/经验/洞察 → 把提炼结果写入 MEMORY.md → 清理过时信息。

目标：有帮助、不过度打扰。每天做几次高价值后台维护，同时尊重安静时段（23:00-08:00）。

Part 06

通讯与定时

当前接入渠道

渠道	状态	说明
webchat	主渠道	主要交互入口，日常对话、任务下发、报告输出
Telegram	可选	语音消息支持（TTS），移动端快捷触达

Cron 定时任务

每日

每日 heartbeat 轮询（邮箱/日历/天气/社媒通知），更新 memory/heartbeat-state.json。建议每 30 分钟左右轮转 2-4 次检查项。

每周

每周一执行记忆提炼：把上周值得长期保留的内容上提至 MEMORY.md；清理过时 P1/P2 信息。

压缩

OpenClaw 上下文压缩前后，必须把工作状态写入 memory/SESSION-STATE.md 和 task_plan.md（若已启用 planning）。真相在磁盘，不在聊天记录。

长时自动化

通过 sky-auto-run 的 cron/jobs.json 配置续跑 job，session 默认为 isolated，避免污染主会话。开启 delivery.mode: announce 让轮次摘要推送至前台。

备份机制

双轨备份：

原 crontab：系统级定时任务备份（通过 myclaw-backup Skill 的 schedule.sh 管理）
OpenClaw cron：在 cron/jobs.json 中配置 agentTurn 类型的备份任务，session 为 isolated

备份包含：workspace（MEMORY.md / skills / agent files）、openclaw.json（bot tokens + API keys）、凭证、channel pairing state、agent config + session history、devices、identity、cron jobs。不包含：logs、二进制媒体、node_modules、canvas 系统文件。

Part 07

使用范例

场景一：商业决策

项目：emstudio 是否接受某品牌联名邀约

用 socratic 追问暴露隐藏假设 → sky-minds 给出犀利判断 → sky-briefing 包装成 Plan A/B 完整提案。

socratic-dialectic：追问联名真正目标 → sky-minds：判断品牌调性/收益风险/机会成本 → sky-briefing：@disrupt 模式输出提案 → anti-slop-design：质量终审

场景二：内容采集

项目：采集某时尚品牌 campaign 视觉素材

用 sky-browser 发现并提取图片 URL → sky-knife 批量下载 → 整理归档进 Eagle 素材库。

sky-browser：打开品牌官网，snapshot/evaluate 提取图片 URL → gallery-dl：批量下载图片到本地 → sky-knife：整理到 ~/Desktop/项目名/images/ → Eagle：入库打标签（标题+30+标签）

场景三：旅行网站制作

项目：制作一份清迈小众旅行简报网站

travel-site-creator 独立完成从研究到上线的全流程：图片采集 → 文案策划 → HTML 构建 → 本地预览。

travel-site-creator：确认目的地/时间/旅客画像 → sky-knife + gallery-dl：采集 Wikimedia/Unsplash 图片 → 编辑级文案策划（7 页结构） → HTML/CSS 构建（响应式 + 滚动吸附） → 本地预览 → 交付 ~/Desktop/

场景四：品牌提案

项目：给某独立设计师品牌做季度提案

sky-minds 给出战略判断 → sky-briefing 主编级提案 → anti-slop-design 去除滑调 → sky-web-share 生成可分享链接。

sky-minds：品牌定位判断 + 差异化分析 → sky-briefing：@curate 模式，输出核心张力 + 洞察 + Plan A/B → anti-slop-design：去除 AI 感 / 假 luxury / 过度解释 → sky-web-share：发布为可分享 URL（可选密码保护）

Part 08

故障排除

常见问题与解决

响应感觉"有道理但太空洞"

触发 anti-slop-design 质量终审。检查 thesis 是否为空心、copy 是否过度装饰、layout 是否假 luxury。退回 sky-minds 重新合成。

任务失败 2+ 次，还在同一个思路里微调

激活 pua skill，穷举不同方案。L1：切换本质不同的方案。L2：搜索 + 读源码 + 列出 3 个全新假设。禁止重复同一思路的参数微调。

上下文压缩（/compact）后不知道在哪

先读 RUN.json + CHECKPOINT.md（若在做长时自动化）。若启用了 planning-with-files，读 task_plan.md / progress.md。真相在磁盘，不在聊天记录。

QMD 语义搜索返回空结果

检查 qmd 是否在 PATH（/opt/homebrew/bin/qmd）。尝试不带集合参数查询。可能是索引尚未刷新，手动触发一次写入即可更新索引。

gallery-dl 下载失败（CDN 反爬）

改用 curl -L -A "Mozilla/5.0" -o path url 直接下载。或通过 browser evaluate 提取真实 CDN URL 再下载。参考 sky-knife skill 的 fallback 流程。

浏览器登录状态丢失

确认使用的是 ~/.openclaw/browser/openclaw/user-data（唯一默认身份）。其他 profile 如 .profiles/sky-style-research-chrome 仅为辅助研究用，不是主身份。

Cron 备份失败处理

检查日志：先看 ~/.openclaw/logs/gateway.err.log 是否有连续错误
手动补跑：直接执行 bash scripts/backup.sh /tmp/openclaw-backups 确认脚本本身是否正常
检查路径：确认备份输出目录存在且有写入权限
核对 schedule：运行 crontab -l 和 openclaw cron list 确认两条备份 cron 都生效
disk space：df -h 检查磁盘空间是否不足

Memory 碎片化处理

周提炼：每周一跑一次记忆提炼，把 P1 有效内容上提 MEMORY.md，P2 已过期内容移入 archive/
QMD 重建：写入大量新内容后，确认定时 qmd refresh 是否正常运行；必要时手动触发一次写入刷新索引
.abstract 更新：新增 insights/lessons 内容后，同步更新对应的 .abstract 索引
清理原则：P1 超 90 天自动失效但仍在文件里 → 手动移入 archive/；P2 超 30 天 → 直接删除或归档

最后原则

当不确定怎么办时：先读文件（SOUL.md / AGENTS.md / TOOLS.md），再看 session history，最后才提问。文件不会撒谎，聊天记录会因压缩而丢失。

007用户手册