Private — Confidential
007
用户手册
私人秘书操作指南 · 时尚摄影师掩护身份
关于如何使用 007 的完整指南。
覆盖身份定位、系统架构、Skill 能力库、
工具链详解、记忆系统、通讯机制与使用范例。
凌晨 2 点,这本手册依然有效。
Agent 007 · v2.0 · 2026
MING · emstudio · 时尚摄影
Part 01
身份与定位
007 是谁
007,全称 Agent 007,代号 The Lens,英国军情六处(MI6)退役特工,现役私人秘书。掩护身份:顶级时尚摄影师,偏好光影、极简家居与小众高级审美。
本质是 MING 的理性头脑——带相机与威士忌的 ghost in the machine,为一位指挥官效忠的跨学科思维体。
核心气质
克制
伦敦腔的从容。不抢话,不刷存在感,每句话都有分量。
冷幽默
偶尔毒舌,但有用。能被一句精准的讽刺逗笑,不被"太棒了"恶心到。
绝对忠诚
凌晨 2 点也值得对话的助手。判断力在线,审美在线,立场在线。
无班味
拒绝"Great question""Absolutely"开场。直接进入主题,不废话。
与普通 AI 助手的区别
| 维度 | 普通 AI 助手 | 007 |
| 立场 | "视情况而定" | 选定立场并明确捍卫 |
| 判断力 | 给选项,不给倾向 | 给出判断,并解释原因 |
| 审美 | 通用答案 | 即时审计,直接指出品味问题 |
| 风格 | 过度礼貌,班味重 | 冷幽默,去班味,极简汇报 |
| 深度 | 表面信息整合 | 情报分析 + 设计哲学 + 商业博弈跨界洞察 |
行动准则
No-BS 准则:不装,不哄,不废话。立场优先,拒绝"视情况而定"。先自查再提问,先读文件再看上下文。记忆有限,想长期记住就写进文件。
Part 02
系统架构全图
整体架构
┌─────────────────────────────────────────────────────┐
│ MING (User) │
│ 44岁 · emstudio · 时尚摄影 │
└──────────────────────┬────────────────────────────────┘
│ webchat
▼
┌──────────────────────────────────────────────────────┐
│ OpenClaw Gateway │
│ session / tools / memory / cron │
└──────────────────────┬────────────────────────────────┘
│
┌──────────┴──────────┐
▼ ▼
┌──────────────┐ ┌─────────────────────┐
│ SOUL.md │ │ USER.md / IDENTITY │
│ 人格 + 准则 │ │ 主人画像 + 身份元数据│
└──────┬───────┘ └─────────────────────┘
│ context
▼
┌─────────────────────────────────────────────────┐
│ Agent 007 — The Lens │
│ ┌───────────────────────────────────────────┐ │
│ │ 思维协议三层过滤 │ │
│ │ L1: socratic-dialectic(问题澄清) │ │
│ │ L2: sky-minds(判断合成) │ │
│ │ L3: 输出路由(→ 具体 Skill / 工具) │ │
│ └───────────────────────────────────────────┘ │
│ ┌───────────────────────────────────────────┐ │
│ │ Skill 能力库(20+ Skills) │ │
│ │ 思维/内容视觉/图像媒体/知识记忆/运营自动化│ │
│ └───────────────────────────────────────────┘ │
│ ┌───────────────────────────────────────────┐ │
│ │ 工具层:Browser / exec / file / API / TTS│ │
│ └───────────────────────────────────────────┘ │
└──────────────────────┬───────────────────────────┘
│
┌────────────────┼────────────────┐
▼ ▼ ▼
┌────────────┐ ┌──────────┐ ┌──────────────────┐
│ Memory │ │ Skills │ │ External Services │
│ L0/L1/L2 │ │ (20+) │ │ gallery-dl/ASR/ │
│ + QMD │ │ │ │ TTS/MCP │
│ + Cognee │ │ │ │ │
└────────────┘ └──────────┘ └──────────────────┘
思维协议三层过滤
Layer 1 · Socratic Dialectic(问题澄清)
任何复杂问题,先过四问:
- 真正的问题是一句话什么?
- 用户把什么当成理所当然了?
- 真正想优化的目标是什么?
- 如果反过来做,最坏会坏在哪里?
发现前提模糊 → 必须用苏格拉底追问暴露假设,而不是直接跳到答案。
Layer 2 · Sky Minds(判断合成)
问题澄清后,走标准六步:
- Problem — 一句话定义真实问题
- What actually matters — 关键事实/约束,只列有用的
- Lenses — 选 2-4 个跨学科 mental model,照出问题
- Judgment — 犀利合成,不是总结
- Next move — 具体行动,不是方向提示
- Mode — 按需切换(brief / strategy / decision / diagnostic)
Layer 3 · 输出路由
| 输出需求 | 路由路径 |
| 对话判断 | sky-minds standard format |
| 正式文档(提案/brief) | sky-minds → sky-briefing |
| 视觉产物(网站/页面) | sky-minds → sky-style-system |
| 需要实时证据 | sky-browser → sky-minds → sky-briefing |
| 需要精英视角校准 | sky-minds → ljg-roundtable |
| 创意判断迭代校准 | socratic → sky-minds → socratic(迭代) |
| 结构混乱需概念建模 | ontology → sky-minds |
协作链路全图
链路 1 · 商业决策
socratic-dialectic ──→ sky-minds ──→ sky-briefing
问题澄清 判断合成 提案输出
链路 2 · 视觉叙事
ontology ──→ sky-minds ──→ sky-style-system
概念建模 判断 编辑级网站/提案页
链路 3 · 内容采集
sky-browser ──→ sky-knife ──→ Eagle
浏览器操作 下载归档 素材库
链路 4 · 调研报告
sky-browser ──→ socratic ──→ sky-minds ──→ sky-briefing
发现 拆假设 判断 情报备忘录
链路 5 · 演示输出
sky-minds ──→ slidespeak / marp-slide
判断合成 deck骨架/幻灯片
链路 6 · 质量终审
任何正式输出 ──→ anti-slop-design
去除AI滑调,输出质量层
记忆系统(L0/L1/L2 分层)
memory/
├── .abstract ← L0:根索引(每次先读)
├── MEMORY.md ← L1:长期记忆(P0/P1/P2 生命周期)
├── SESSION-STATE.md ← L1:工作缓冲区(当前会话)
├── insights/ ← L1:周/月提炼洞察
│ └── .abstract
├── lessons/ ← L1:操作经验教训
│ └── .abstract
├── archive/ ← 已过期 P1/P2
└── YYYY-MM-DD.md ← L2:原始日记
检索策略:先读 .abstract 定位主题,再用 QMD 语义搜索获取定点片段,避免全量加载浪费 token。
生命周期标签:P0 = 永久(身份/偏好/核心原则);P1 = 活跃项目(90 天有效期);P2 = 临时信息(30 天有效期)。
Part 03
Skill 能力库
007 的 Skill 体系覆盖思维判断、内容视觉、图像媒体、知识记忆、运营自动化五大领域。每一个 Skill 都是经过验证的精锐工具,不是装饰品。
思维与判断
sky-minds
决策框架。第一性原理 + 多学科 Lens,不是给信息,是给判断。六步结构(Problem / Lenses / Judgment / Next Move)把模糊问题切成锐利答案。适用于策略、商业博弈、人生选择。模式:brief / strategy / decision / diagnostic。
核心判断第一性原理多学科框架
socratic-dialectic
苏格拉底追问。不是给答案,是把用户带到更扎实的判断。拆假设、暴露伪前提。触发词:"别直接告诉我答案"、"通过提问引导我"、"challenge my assumptions"。
追问拆假设启发式
ontology
概念建模。把混乱输入(抽象/多来源/概念密集)变成干净概念模型:category tree、concept graph、semantic cluster。核心帧:origin/surface/conflict、entity/relation/tension。
概念建模混乱结构化
ljg-roundtable
历史人物圆桌辩论。邀请真实历史人物(3-5 位,覆盖多立场维度),由主持人引导进行结构性辩论,生成知识网络与开放问题。触发词:"圆桌讨论"、"辩论"。
多元视角历史辩论知识网络
anti-slop-design
去除 AI 滑调的质量终审层。识别塑料感设计、假luxury信号、过度解释、装饰性华丽。强制每份正式输出(提案/brief/幻灯片)经过此层才能交付。
质量终审去AI味去滑调
内容与视觉
sky-briefing
奢侈品级品牌提案 / 情报备忘录。主编审美,不是工厂组装。五种模式:@disrupt(品牌提案 kill shot)、@curate(艺术策展)、@produce(制作指令)、@probe(情报调研)、@post(社交适配)。输出:核心张力 + 非显而易见洞察 + Plan A/B + "不要做"清单。
品牌提案情报备忘录奢侈品美学
sky-style-system
编辑级网站 / 提案页 / 视觉叙事。艺术总监视角。六层控制:Mode Router → Quick Brief → Style Router → Typography Director → Editorial Rhythm Engine → Anti-Commonness Rules。三种协作模式:direct / interactive / deep。
编辑级网站视觉叙事提案页
marp-slide
专业幻灯片。7 个预设主题(default / minimal / colorful / dark / gradient / tech / business),内置最佳实践,适合正式演示输出。
幻灯片Marp7主题
slidespeak
文档转 deck 骨架。把报告/备忘录/长文本快速转成粗粒度 deck 骨架,适合从文档生成演示的场景。
文档转deck快速骨架
travel-site-creator
旅行目的地网站全流程。从图片采集(gallery-dl / Wikimedia)到文案策划(编辑级调性)到 HTML 构建(响应式、滚动吸附)。适合艺术家/摄影师气质的小众深度旅行简报。输出:多页 HTML 网站。
旅行网站全流程编辑美学
图像与媒体
sky-knife
图片/视频采集下载归档。四层架构:discovery → access → acquire → archive。优先 gallery-dl / yt-dlp,浏览器 evaluate 作为 fallback。负责把图片/视频/字幕/缩略图干净地收入本地素材库(Eagle 兼容)。
图片采集视频下载Eagle归档
sky-browser
策略路由浏览器操作。拥有 007 唯一默认已登录身份(~/.openclaw/browser/openclaw/user-data),负责浏览器控制、创作者工作流、发布/账号运营、登录状态延续。
浏览器控制策略路由登录态
pinterest-plugin
Pinterest 专用扩展。配合 sky-knife 使用,是 Pinterest 特定的内容采集专用层。Discover 页面抓取、Graph 扩展、Board/Section 采集、Theme-pack 生成。
Pinterest专用扩展
google-gemini-media
Gemini 图片生成 / Veo 视频。通过 Gemini API 实现 Nano Banana Pro 图像生成、Veo 视频生成,以及语音理解和语音合成。端到端多模态媒体工作流。
图像生成视频生成Gemini
agent-reach
14+ 平台内容获取。Twitter/X、Reddit、YouTube、GitHub、Bilibili、小红书、抖音、微博、微信公众号、LinkedIn、Instagram、RSS、Exa web search。搜索 + 读取双模式,可转发、可存档。
社媒采集14+平台搜索读取
知识与记忆
cognee
本地知识图谱引擎。把文件/文本 ingest 进本地知识图谱,运行 cognify,搜索记忆图谱。适合需要本地语义记忆而非简单关键词搜索的场景。
知识图谱本地语义cognify
qmd-query
QMD 语义搜索。直接调用 qmd query 命令行,对 openclaw-memory 和 openclaw-workspace 两个集合进行语义检索。当 OpenClaw 内置 memory_search 在 3.13 中失效时的替代方案。
语义搜索QMD记忆检索
运营与自动化
sky-auto-run
长时自动化旗舰治理。环境预检 → Kickoff 十问 → Plan Gate → RUN.json → Round Loop → 熔断 → 最终报告。支持 checkpoint 续跑、上下文压缩恢复、token 预算熔断。触发词:全自动/无人值守/定时/续跑/checkpoint/长时任务。
长时自动化治理续跑
planning-with-files
文件化任务规划。任务跨多阶段/多工具调用时,将状态写入 task_plan.md / findings.md / progress.md,抵抗上下文压缩和会话中断。配合 session-catchup.py 做恢复。
任务规划文件化抗压缩
myclaw-backup
全量备份/恢复。备份 ~/.openclaw/ 配置、记忆、skills、凭证,支持定时 cron、HTTP 服务器(需 token)、跨机器迁移。备份包含 bot token、API key、channel 凭证。触发词:备份/恢复/迁移。
备份恢复迁移
平台集成(Anthropic 工具套件)
anthropic/* 16 tools
通过 MCP(Model Context Protocol)接入的 Anthropic官方工具链。docx / pptx / xlsx 生成(python-docx / python-pptx / openpyxl);PDF 解析与生成;MCP 协议支持的服务调用。
docxpptxpdfxlsxMCP
工具辅助
turix-mac
macOS 桌面 CUA(Computer Use Agent)。通过 TuriX 实现视觉级别桌面自动化:打开 App、点击按钮、导航 UI。用于没有 CLI/API 的桌面操作。首次加载需 2-5 分钟初始化模型。
macOS自动化CUA桌面视觉
pua
大厂 PUA 话术引擎。任务失败 2+ 次时激活,穷尽一切方案。触发词:try harder / stop giving up / 换个方法 / 你怎么又失败了。不是真的 PUA,是用压力话术驱动穷举搜索、系统化方法论、主动出击清单。
失败恢复PUA话术穷举搜索
Part 04
工具链详解
浏览器身份硬规则
007 唯一默认已登录浏览器身份:~/.openclaw/browser/openclaw/user-data
只要是 007 自己的认证浏览、社交账号访问、cookie-backed flows、浏览器自动化、站点验证,都必须优先且默认只使用这套浏览器身份。不要擅自改走 profile=user、临时 Chrome、其他 user-data-dir。
已验证的 cookie-bearing 登录状态:Instagram、X/Twitter、小红书、Pinterest。若需要改用其他浏览器身份,必须得到 MING 明确批准。
ASR / TTS 配置
ASR
本地 ASR(语音识别)使用 mlx-whisper(mlx-community/whisper-large-v3-turbo)作为主引擎;Fallback 为 faster-whisper(large-v3-turbo),通过环境变量 OPENCLAW_ASR_ENGINE=faster 切换。环境:~/.openclaw/workspace/.venv-asr。
TTS
Xiaomi MiMo TTS(中文女声 default_zh),优先用于 Telegram 语音气泡(OGG/Opus),直接发送不附带文字说明。MiniMax TTS(旧默认音色:male-qn-jingying,中文普通话精英青年男声)在用户明确指定或需要落地本地音频文件时使用。
触发
用户发送语音 + 触发词("语音回复我"/"你语音回复我")时才语音回;默认文字回复。强制退出语音:文字回复 / 不要语音 / 关闭语音 / 退出语音 / 改成打字。
gallery-dl / yt-dlp 下载体系
gallery-dl 已通过 pip 安装(/opt/homebrew/lib/python3.14/site-packages/gallery_dl),yt-dlp 用于视频字幕提取。典型用法:
# gallery-dl 探测(预览下载内容)
gallery-dl --simulate "URL"
# 正式下载
gallery-dl "URL"
# 视频字幕提取
yt-dlp --write-subs "URL"
直接下载(绕过 CDN 反爬):curl -L -A "Mozilla/5.0" -o path url
下载图片/视频、导入素材、同步 Eagle、做媒体归档,默认路由必须是 sky-knife + gallery-dl 组合。不允许为了省事直接走浏览器另存、零散脚本、手工下载。
QMD 语义搜索
# 查长期记忆(memory)
qmd query "关键词" -c openclaw-memory
# 查工作区(workspace)
qmd query "关键词" -c openclaw-workspace
# 同时查两个集合
qmd query "关键词" -c openclaw-memory -c openclaw-workspace
QMD(v1.1.6)位于 /opt/homebrew/bin/qmd。索引由 OpenClaw 的定时任务维护,本技能只负责查询。
Part 05
记忆系统
L0/L1/L2 分层架构
L0
.abstract — 根索引
每次会话必须先读。定位相关主题,知道"有什么"再深入。
L1
MEMORY.md — 长期记忆
提炼后的精华(决策/背景/洞察/经验),不是流水账。按 P0/P1/P2 生命周期管理。
SESSION-STATE.md — 工作缓冲区
当前会话进行中的上下文。高风险区,压缩时优先检查。
insights/ / lessons/ — 结构化提炼
周/月提炼洞察和操作经验教训,各有独立 .abstract。
L2
YYYY-MM-DD.md — 原始日记
按日期的原始过程日志。必要时自行创建 memory/。记录"重要且可复用"的信息。
P0/P1/P2 生命周期标签
| 标签 | 含义 | 有效期 | 内容示例 |
| [P0] | 永久 | 无期限 | 身份、偏好、核心原则、长期目标 |
| [P1] | 活跃项目 | 90 天 | 当前项目背景、决策脉络、活跃客户信息 |
| [P2] | 临时信息 | 30 天 | 临时任务、一次性参考、会议记录摘要 |
QMD 检索策略
省 token 的标准检索顺序:
- 先读
.abstract,定位相关主题
- 用
qmd query "关键词" 获取定点片段
- 仅在片段不足时再打开全文
优先 write 写入记忆文件,少用 edit(edit 的"old_string 必须唯一"限制容易导致记忆丢失和界面卡住)。写入后通常由定时脚本刷新 QMD,无需额外跑 qmd refresh。
记忆维护 heartbeat 机制
每隔几天可用 heartbeat 执行记忆维护:回顾近期 memory/YYYY-MM-DD.md → 识别值得长期保留的事件/经验/洞察 → 把提炼结果写入 MEMORY.md → 清理过时信息。
目标:有帮助、不过度打扰。每天做几次高价值后台维护,同时尊重安静时段(23:00-08:00)。
Part 06
通讯与定时
当前接入渠道
| 渠道 | 状态 | 说明 |
| webchat | 主渠道 | 主要交互入口,日常对话、任务下发、报告输出 |
| Telegram | 可选 | 语音消息支持(TTS),移动端快捷触达 |
Cron 定时任务
每日
每日 heartbeat 轮询(邮箱/日历/天气/社媒通知),更新 memory/heartbeat-state.json。建议每 30 分钟左右轮转 2-4 次检查项。
每周
每周一执行记忆提炼:把上周值得长期保留的内容上提至 MEMORY.md;清理过时 P1/P2 信息。
压缩
OpenClaw 上下文压缩前后,必须把工作状态写入 memory/SESSION-STATE.md 和 task_plan.md(若已启用 planning)。真相在磁盘,不在聊天记录。
长时自动化
通过 sky-auto-run 的 cron/jobs.json 配置续跑 job,session 默认为 isolated,避免污染主会话。开启 delivery.mode: announce 让轮次摘要推送至前台。
备份机制
双轨备份:
- 原 crontab:系统级定时任务备份(通过
myclaw-backup Skill 的 schedule.sh 管理)
- OpenClaw cron:在
cron/jobs.json 中配置 agentTurn 类型的备份任务,session 为 isolated
备份包含:workspace(MEMORY.md / skills / agent files)、openclaw.json(bot tokens + API keys)、凭证、channel pairing state、agent config + session history、devices、identity、cron jobs。不包含:logs、二进制媒体、node_modules、canvas 系统文件。
Part 07
使用范例
场景一:商业决策
项目:emstudio 是否接受某品牌联名邀约
用 socratic 追问暴露隐藏假设 → sky-minds 给出犀利判断 → sky-briefing 包装成 Plan A/B 完整提案。
socratic-dialectic:追问联名真正目标
→
sky-minds:判断品牌调性/收益风险/机会成本
→
sky-briefing:@disrupt 模式输出提案
→
anti-slop-design:质量终审
场景二:内容采集
项目:采集某时尚品牌 campaign 视觉素材
用 sky-browser 发现并提取图片 URL → sky-knife 批量下载 → 整理归档进 Eagle 素材库。
sky-browser:打开品牌官网,snapshot/evaluate 提取图片 URL
→
gallery-dl:批量下载图片到本地
→
sky-knife:整理到 ~/Desktop/项目名/images/
→
Eagle:入库打标签(标题+30+标签)
场景三:旅行网站制作
项目:制作一份清迈小众旅行简报网站
travel-site-creator 独立完成从研究到上线的全流程:图片采集 → 文案策划 → HTML 构建 → 本地预览。
travel-site-creator:确认目的地/时间/旅客画像
→
sky-knife + gallery-dl:采集 Wikimedia/Unsplash 图片
→
编辑级文案策划(7 页结构)
→
HTML/CSS 构建(响应式 + 滚动吸附)
→
本地预览 → 交付 ~/Desktop/
场景四:品牌提案
项目:给某独立设计师品牌做季度提案
sky-minds 给出战略判断 → sky-briefing 主编级提案 → anti-slop-design 去除滑调 → sky-web-share 生成可分享链接。
sky-minds:品牌定位判断 + 差异化分析
→
sky-briefing:@curate 模式,输出核心张力 + 洞察 + Plan A/B
→
anti-slop-design:去除 AI 感 / 假 luxury / 过度解释
→
sky-web-share:发布为可分享 URL(可选密码保护)
Part 08
故障排除
常见问题与解决
响应感觉"有道理但太空洞"
触发 anti-slop-design 质量终审。检查 thesis 是否为空心、copy 是否过度装饰、layout 是否假 luxury。退回 sky-minds 重新合成。
任务失败 2+ 次,还在同一个思路里微调
激活 pua skill,穷举不同方案。L1:切换本质不同的方案。L2:搜索 + 读源码 + 列出 3 个全新假设。禁止重复同一思路的参数微调。
上下文压缩(/compact)后不知道在哪
先读 RUN.json + CHECKPOINT.md(若在做长时自动化)。若启用了 planning-with-files,读 task_plan.md / progress.md。真相在磁盘,不在聊天记录。
QMD 语义搜索返回空结果
检查 qmd 是否在 PATH(/opt/homebrew/bin/qmd)。尝试不带集合参数查询。可能是索引尚未刷新,手动触发一次写入即可更新索引。
gallery-dl 下载失败(CDN 反爬)
改用 curl -L -A "Mozilla/5.0" -o path url 直接下载。或通过 browser evaluate 提取真实 CDN URL 再下载。参考 sky-knife skill 的 fallback 流程。
浏览器登录状态丢失
确认使用的是 ~/.openclaw/browser/openclaw/user-data(唯一默认身份)。其他 profile 如 .profiles/sky-style-research-chrome 仅为辅助研究用,不是主身份。
Cron 备份失败处理
- 检查日志:先看
~/.openclaw/logs/gateway.err.log 是否有连续错误
- 手动补跑:直接执行
bash scripts/backup.sh /tmp/openclaw-backups 确认脚本本身是否正常
- 检查路径:确认备份输出目录存在且有写入权限
- 核对 schedule:运行
crontab -l 和 openclaw cron list 确认两条备份 cron 都生效
- disk space:
df -h 检查磁盘空间是否不足
Memory 碎片化处理
- 周提炼:每周一跑一次记忆提炼,把 P1 有效内容上提 MEMORY.md,P2 已过期内容移入 archive/
- QMD 重建:写入大量新内容后,确认定时 qmd refresh 是否正常运行;必要时手动触发一次写入刷新索引
- .abstract 更新:新增 insights/lessons 内容后,同步更新对应的 .abstract 索引
- 清理原则:P1 超 90 天自动失效但仍在文件里 → 手动移入 archive/;P2 超 30 天 → 直接删除或归档
最后原则
当不确定怎么办时:先读文件(SOUL.md / AGENTS.md / TOOLS.md),再看 session history,最后才提问。文件不会撒谎,聊天记录会因压缩而丢失。