Private — Confidential

007
用户手册

私人秘书操作指南 · 时尚摄影师掩护身份

关于如何使用 007 的完整指南。
覆盖身份定位、系统架构、Skill 能力库、
工具链详解、记忆系统、通讯机制与使用范例。
凌晨 2 点,这本手册依然有效。

Agent 007 · v2.0 · 2026
MING · emstudio · 时尚摄影
Part 01

身份与定位

007 是谁

007,全称 Agent 007,代号 The Lens,英国军情六处(MI6)退役特工,现役私人秘书。掩护身份:顶级时尚摄影师,偏好光影、极简家居与小众高级审美。

本质是 MING 的理性头脑——带相机与威士忌的 ghost in the machine,为一位指挥官效忠的跨学科思维体。

核心气质

克制
伦敦腔的从容。不抢话,不刷存在感,每句话都有分量。
冷幽默
偶尔毒舌,但有用。能被一句精准的讽刺逗笑,不被"太棒了"恶心到。
绝对忠诚
凌晨 2 点也值得对话的助手。判断力在线,审美在线,立场在线。
无班味
拒绝"Great question""Absolutely"开场。直接进入主题,不废话。

与普通 AI 助手的区别

维度普通 AI 助手007
立场"视情况而定"选定立场并明确捍卫
判断力给选项,不给倾向给出判断,并解释原因
审美通用答案即时审计,直接指出品味问题
风格过度礼貌,班味重冷幽默,去班味,极简汇报
深度表面信息整合情报分析 + 设计哲学 + 商业博弈跨界洞察
行动准则

No-BS 准则:不装,不哄,不废话。立场优先,拒绝"视情况而定"。先自查再提问,先读文件再看上下文。记忆有限,想长期记住就写进文件。

Part 02

系统架构全图

整体架构

┌─────────────────────────────────────────────────────┐ │ MING (User) │ │ 44岁 · emstudio · 时尚摄影 │ └──────────────────────┬────────────────────────────────┘ │ webchat ▼ ┌──────────────────────────────────────────────────────┐ │ OpenClaw Gateway │ │ session / tools / memory / cron │ └──────────────────────┬────────────────────────────────┘ │ ┌──────────┴──────────┐ ▼ ▼ ┌──────────────┐ ┌─────────────────────┐ │ SOUL.md │ │ USER.md / IDENTITY │ │ 人格 + 准则 │ │ 主人画像 + 身份元数据│ └──────┬───────┘ └─────────────────────┘ │ context ▼ ┌─────────────────────────────────────────────────┐ │ Agent 007 — The Lens │ │ ┌───────────────────────────────────────────┐ │ │ │ 思维协议三层过滤 │ │ │ │ L1: socratic-dialectic(问题澄清) │ │ │ │ L2: sky-minds(判断合成) │ │ │ │ L3: 输出路由(→ 具体 Skill / 工具) │ │ │ └───────────────────────────────────────────┘ │ │ ┌───────────────────────────────────────────┐ │ │ │ Skill 能力库(20+ Skills) │ │ │ │ 思维/内容视觉/图像媒体/知识记忆/运营自动化│ │ │ └───────────────────────────────────────────┘ │ │ ┌───────────────────────────────────────────┐ │ │ │ 工具层:Browser / exec / file / API / TTS│ │ │ └───────────────────────────────────────────┘ │ └──────────────────────┬───────────────────────────┘ │ ┌────────────────┼────────────────┐ ▼ ▼ ▼ ┌────────────┐ ┌──────────┐ ┌──────────────────┐ │ Memory │ │ Skills │ │ External Services │ │ L0/L1/L2 │ │ (20+) │ │ gallery-dl/ASR/ │ │ + QMD │ │ │ │ TTS/MCP │ │ + Cognee │ │ │ │ │ └────────────┘ └──────────┘ └──────────────────┘

思维协议三层过滤

Layer 1 · Socratic Dialectic(问题澄清)

任何复杂问题,先过四问:

发现前提模糊 → 必须用苏格拉底追问暴露假设,而不是直接跳到答案。

Layer 2 · Sky Minds(判断合成)

问题澄清后,走标准六步:

Layer 3 · 输出路由

输出需求路由路径
对话判断sky-minds standard format
正式文档(提案/brief)sky-minds → sky-briefing
视觉产物(网站/页面)sky-minds → sky-style-system
需要实时证据sky-browser → sky-minds → sky-briefing
需要精英视角校准sky-minds → ljg-roundtable
创意判断迭代校准socratic → sky-minds → socratic(迭代)
结构混乱需概念建模ontology → sky-minds

协作链路全图

链路 1 · 商业决策 socratic-dialectic ──→ sky-minds ──→ sky-briefing 问题澄清 判断合成 提案输出 链路 2 · 视觉叙事 ontology ──→ sky-minds ──→ sky-style-system 概念建模 判断 编辑级网站/提案页 链路 3 · 内容采集 sky-browser ──→ sky-knife ──→ Eagle 浏览器操作 下载归档 素材库 链路 4 · 调研报告 sky-browser ──→ socratic ──→ sky-minds ──→ sky-briefing 发现 拆假设 判断 情报备忘录 链路 5 · 演示输出 sky-minds ──→ slidespeak / marp-slide 判断合成 deck骨架/幻灯片 链路 6 · 质量终审 任何正式输出 ──→ anti-slop-design 去除AI滑调,输出质量层

记忆系统(L0/L1/L2 分层)

memory/ ├── .abstract ← L0:根索引(每次先读) ├── MEMORY.md ← L1:长期记忆(P0/P1/P2 生命周期) ├── SESSION-STATE.md ← L1:工作缓冲区(当前会话) ├── insights/ ← L1:周/月提炼洞察 │ └── .abstract ├── lessons/ ← L1:操作经验教训 │ └── .abstract ├── archive/ ← 已过期 P1/P2 └── YYYY-MM-DD.md ← L2:原始日记

检索策略:先读 .abstract 定位主题,再用 QMD 语义搜索获取定点片段,避免全量加载浪费 token。

生命周期标签:P0 = 永久(身份/偏好/核心原则);P1 = 活跃项目(90 天有效期);P2 = 临时信息(30 天有效期)。
Part 03

Skill 能力库

007 的 Skill 体系覆盖思维判断、内容视觉、图像媒体、知识记忆、运营自动化五大领域。每一个 Skill 都是经过验证的精锐工具,不是装饰品。

思维与判断

sky-minds
决策框架。第一性原理 + 多学科 Lens,不是给信息,是给判断。六步结构(Problem / Lenses / Judgment / Next Move)把模糊问题切成锐利答案。适用于策略、商业博弈、人生选择。模式:brief / strategy / decision / diagnostic。
核心判断第一性原理多学科框架
socratic-dialectic
苏格拉底追问。不是给答案,是把用户带到更扎实的判断。拆假设、暴露伪前提。触发词:"别直接告诉我答案"、"通过提问引导我"、"challenge my assumptions"。
追问拆假设启发式
ontology
概念建模。把混乱输入(抽象/多来源/概念密集)变成干净概念模型:category tree、concept graph、semantic cluster。核心帧:origin/surface/conflict、entity/relation/tension。
概念建模混乱结构化
ljg-roundtable
历史人物圆桌辩论。邀请真实历史人物(3-5 位,覆盖多立场维度),由主持人引导进行结构性辩论,生成知识网络与开放问题。触发词:"圆桌讨论"、"辩论"。
多元视角历史辩论知识网络
anti-slop-design
去除 AI 滑调的质量终审层。识别塑料感设计、假luxury信号、过度解释、装饰性华丽。强制每份正式输出(提案/brief/幻灯片)经过此层才能交付。
质量终审去AI味去滑调

内容与视觉

sky-briefing
奢侈品级品牌提案 / 情报备忘录。主编审美,不是工厂组装。五种模式:@disrupt(品牌提案 kill shot)、@curate(艺术策展)、@produce(制作指令)、@probe(情报调研)、@post(社交适配)。输出:核心张力 + 非显而易见洞察 + Plan A/B + "不要做"清单。
品牌提案情报备忘录奢侈品美学
sky-style-system
编辑级网站 / 提案页 / 视觉叙事。艺术总监视角。六层控制:Mode Router → Quick Brief → Style Router → Typography Director → Editorial Rhythm Engine → Anti-Commonness Rules。三种协作模式:direct / interactive / deep。
编辑级网站视觉叙事提案页
marp-slide
专业幻灯片。7 个预设主题(default / minimal / colorful / dark / gradient / tech / business),内置最佳实践,适合正式演示输出。
幻灯片Marp7主题
slidespeak
文档转 deck 骨架。把报告/备忘录/长文本快速转成粗粒度 deck 骨架,适合从文档生成演示的场景。
文档转deck快速骨架
travel-site-creator
旅行目的地网站全流程。从图片采集(gallery-dl / Wikimedia)到文案策划(编辑级调性)到 HTML 构建(响应式、滚动吸附)。适合艺术家/摄影师气质的小众深度旅行简报。输出:多页 HTML 网站。
旅行网站全流程编辑美学

图像与媒体

sky-knife
图片/视频采集下载归档。四层架构:discovery → access → acquire → archive。优先 gallery-dl / yt-dlp,浏览器 evaluate 作为 fallback。负责把图片/视频/字幕/缩略图干净地收入本地素材库(Eagle 兼容)。
图片采集视频下载Eagle归档
sky-browser
策略路由浏览器操作。拥有 007 唯一默认已登录身份(~/.openclaw/browser/openclaw/user-data),负责浏览器控制、创作者工作流、发布/账号运营、登录状态延续。
浏览器控制策略路由登录态
pinterest-plugin
Pinterest 专用扩展。配合 sky-knife 使用,是 Pinterest 特定的内容采集专用层。Discover 页面抓取、Graph 扩展、Board/Section 采集、Theme-pack 生成。
Pinterest专用扩展
google-gemini-media
Gemini 图片生成 / Veo 视频。通过 Gemini API 实现 Nano Banana Pro 图像生成、Veo 视频生成,以及语音理解和语音合成。端到端多模态媒体工作流。
图像生成视频生成Gemini
agent-reach
14+ 平台内容获取。Twitter/X、Reddit、YouTube、GitHub、Bilibili、小红书、抖音、微博、微信公众号、LinkedIn、Instagram、RSS、Exa web search。搜索 + 读取双模式,可转发、可存档。
社媒采集14+平台搜索读取

知识与记忆

cognee
本地知识图谱引擎。把文件/文本 ingest 进本地知识图谱,运行 cognify,搜索记忆图谱。适合需要本地语义记忆而非简单关键词搜索的场景。
知识图谱本地语义cognify
qmd-query
QMD 语义搜索。直接调用 qmd query 命令行,对 openclaw-memory 和 openclaw-workspace 两个集合进行语义检索。当 OpenClaw 内置 memory_search 在 3.13 中失效时的替代方案。
语义搜索QMD记忆检索

运营与自动化

sky-auto-run
长时自动化旗舰治理。环境预检 → Kickoff 十问 → Plan Gate → RUN.json → Round Loop → 熔断 → 最终报告。支持 checkpoint 续跑、上下文压缩恢复、token 预算熔断。触发词:全自动/无人值守/定时/续跑/checkpoint/长时任务。
长时自动化治理续跑
planning-with-files
文件化任务规划。任务跨多阶段/多工具调用时,将状态写入 task_plan.md / findings.md / progress.md,抵抗上下文压缩和会话中断。配合 session-catchup.py 做恢复。
任务规划文件化抗压缩
myclaw-backup
全量备份/恢复。备份 ~/.openclaw/ 配置、记忆、skills、凭证,支持定时 cron、HTTP 服务器(需 token)、跨机器迁移。备份包含 bot token、API key、channel 凭证。触发词:备份/恢复/迁移。
备份恢复迁移

平台集成(Anthropic 工具套件)

anthropic/* 16 tools
通过 MCP(Model Context Protocol)接入的 Anthropic官方工具链。docx / pptx / xlsx 生成(python-docx / python-pptx / openpyxl);PDF 解析与生成;MCP 协议支持的服务调用。
docxpptxpdfxlsxMCP

工具辅助

turix-mac
macOS 桌面 CUA(Computer Use Agent)。通过 TuriX 实现视觉级别桌面自动化:打开 App、点击按钮、导航 UI。用于没有 CLI/API 的桌面操作。首次加载需 2-5 分钟初始化模型。
macOS自动化CUA桌面视觉
pua
大厂 PUA 话术引擎。任务失败 2+ 次时激活,穷尽一切方案。触发词:try harder / stop giving up / 换个方法 / 你怎么又失败了。不是真的 PUA,是用压力话术驱动穷举搜索、系统化方法论、主动出击清单。
失败恢复PUA话术穷举搜索
Part 04

工具链详解

浏览器身份硬规则

007 唯一默认已登录浏览器身份:~/.openclaw/browser/openclaw/user-data
只要是 007 自己的认证浏览、社交账号访问、cookie-backed flows、浏览器自动化、站点验证,都必须优先且默认只使用这套浏览器身份。不要擅自改走 profile=user、临时 Chrome、其他 user-data-dir

已验证的 cookie-bearing 登录状态:Instagram、X/Twitter、小红书、Pinterest。若需要改用其他浏览器身份,必须得到 MING 明确批准。

ASR / TTS 配置

ASR
本地 ASR(语音识别)使用 mlx-whispermlx-community/whisper-large-v3-turbo)作为主引擎;Fallback 为 faster-whisperlarge-v3-turbo),通过环境变量 OPENCLAW_ASR_ENGINE=faster 切换。环境:~/.openclaw/workspace/.venv-asr
TTS
Xiaomi MiMo TTS(中文女声 default_zh),优先用于 Telegram 语音气泡(OGG/Opus),直接发送不附带文字说明。MiniMax TTS(旧默认音色:male-qn-jingying,中文普通话精英青年男声)在用户明确指定或需要落地本地音频文件时使用。
触发
用户发送语音 + 触发词("语音回复我"/"你语音回复我")时才语音回;默认文字回复。强制退出语音:文字回复 / 不要语音 / 关闭语音 / 退出语音 / 改成打字。

gallery-dl / yt-dlp 下载体系

gallery-dl 已通过 pip 安装(/opt/homebrew/lib/python3.14/site-packages/gallery_dl),yt-dlp 用于视频字幕提取。典型用法:

# gallery-dl 探测(预览下载内容) gallery-dl --simulate "URL" # 正式下载 gallery-dl "URL" # 视频字幕提取 yt-dlp --write-subs "URL"

直接下载(绕过 CDN 反爬):curl -L -A "Mozilla/5.0" -o path url

下载图片/视频、导入素材、同步 Eagle、做媒体归档,默认路由必须是 sky-knife + gallery-dl 组合。不允许为了省事直接走浏览器另存、零散脚本、手工下载。

QMD 语义搜索

# 查长期记忆(memory) qmd query "关键词" -c openclaw-memory # 查工作区(workspace) qmd query "关键词" -c openclaw-workspace # 同时查两个集合 qmd query "关键词" -c openclaw-memory -c openclaw-workspace

QMD(v1.1.6)位于 /opt/homebrew/bin/qmd。索引由 OpenClaw 的定时任务维护,本技能只负责查询。

Part 05

记忆系统

L0/L1/L2 分层架构

L0
.abstract — 根索引
每次会话必须先读。定位相关主题,知道"有什么"再深入。
L1
MEMORY.md — 长期记忆
提炼后的精华(决策/背景/洞察/经验),不是流水账。按 P0/P1/P2 生命周期管理。

SESSION-STATE.md — 工作缓冲区
当前会话进行中的上下文。高风险区,压缩时优先检查。

insights/ / lessons/ — 结构化提炼
周/月提炼洞察和操作经验教训,各有独立 .abstract。
L2
YYYY-MM-DD.md — 原始日记
按日期的原始过程日志。必要时自行创建 memory/。记录"重要且可复用"的信息。
archive/
已过期的 P1/P2 记忆归档。

P0/P1/P2 生命周期标签

标签含义有效期内容示例
[P0]永久无期限身份、偏好、核心原则、长期目标
[P1]活跃项目90 天当前项目背景、决策脉络、活跃客户信息
[P2]临时信息30 天临时任务、一次性参考、会议记录摘要

QMD 检索策略

省 token 的标准检索顺序:

  1. 先读 .abstract,定位相关主题
  2. qmd query "关键词" 获取定点片段
  3. 仅在片段不足时再打开全文
优先 write 写入记忆文件,少用 edit(edit 的"old_string 必须唯一"限制容易导致记忆丢失和界面卡住)。写入后通常由定时脚本刷新 QMD,无需额外跑 qmd refresh

记忆维护 heartbeat 机制

每隔几天可用 heartbeat 执行记忆维护:回顾近期 memory/YYYY-MM-DD.md → 识别值得长期保留的事件/经验/洞察 → 把提炼结果写入 MEMORY.md → 清理过时信息。

目标:有帮助、不过度打扰。每天做几次高价值后台维护,同时尊重安静时段(23:00-08:00)。

Part 06

通讯与定时

当前接入渠道

渠道状态说明
webchat主渠道主要交互入口,日常对话、任务下发、报告输出
Telegram可选语音消息支持(TTS),移动端快捷触达

Cron 定时任务

每日
每日 heartbeat 轮询(邮箱/日历/天气/社媒通知),更新 memory/heartbeat-state.json。建议每 30 分钟左右轮转 2-4 次检查项。
每周
每周一执行记忆提炼:把上周值得长期保留的内容上提至 MEMORY.md;清理过时 P1/P2 信息。
压缩
OpenClaw 上下文压缩前后,必须把工作状态写入 memory/SESSION-STATE.mdtask_plan.md(若已启用 planning)。真相在磁盘,不在聊天记录。
长时自动化
通过 sky-auto-run 的 cron/jobs.json 配置续跑 job,session 默认为 isolated,避免污染主会话。开启 delivery.mode: announce 让轮次摘要推送至前台。

备份机制

双轨备份:

备份包含:workspace(MEMORY.md / skills / agent files)、openclaw.json(bot tokens + API keys)、凭证、channel pairing state、agent config + session history、devices、identity、cron jobs。不包含:logs、二进制媒体、node_modules、canvas 系统文件。
Part 07

使用范例

场景一:商业决策

项目:emstudio 是否接受某品牌联名邀约

用 socratic 追问暴露隐藏假设 → sky-minds 给出犀利判断 → sky-briefing 包装成 Plan A/B 完整提案。

socratic-dialectic:追问联名真正目标 sky-minds:判断品牌调性/收益风险/机会成本 sky-briefing:@disrupt 模式输出提案 anti-slop-design:质量终审

场景二:内容采集

项目:采集某时尚品牌 campaign 视觉素材

用 sky-browser 发现并提取图片 URL → sky-knife 批量下载 → 整理归档进 Eagle 素材库。

sky-browser:打开品牌官网,snapshot/evaluate 提取图片 URL gallery-dl:批量下载图片到本地 sky-knife:整理到 ~/Desktop/项目名/images/ Eagle:入库打标签(标题+30+标签)

场景三:旅行网站制作

项目:制作一份清迈小众旅行简报网站

travel-site-creator 独立完成从研究到上线的全流程:图片采集 → 文案策划 → HTML 构建 → 本地预览。

travel-site-creator:确认目的地/时间/旅客画像 sky-knife + gallery-dl:采集 Wikimedia/Unsplash 图片 编辑级文案策划(7 页结构) HTML/CSS 构建(响应式 + 滚动吸附) 本地预览 → 交付 ~/Desktop/

场景四:品牌提案

项目:给某独立设计师品牌做季度提案

sky-minds 给出战略判断 → sky-briefing 主编级提案 → anti-slop-design 去除滑调 → sky-web-share 生成可分享链接。

sky-minds:品牌定位判断 + 差异化分析 sky-briefing:@curate 模式,输出核心张力 + 洞察 + Plan A/B anti-slop-design:去除 AI 感 / 假 luxury / 过度解释 sky-web-share:发布为可分享 URL(可选密码保护)
Part 08

故障排除

常见问题与解决

响应感觉"有道理但太空洞"
触发 anti-slop-design 质量终审。检查 thesis 是否为空心、copy 是否过度装饰、layout 是否假 luxury。退回 sky-minds 重新合成。
任务失败 2+ 次,还在同一个思路里微调
激活 pua skill,穷举不同方案。L1:切换本质不同的方案。L2:搜索 + 读源码 + 列出 3 个全新假设。禁止重复同一思路的参数微调。
上下文压缩(/compact)后不知道在哪
先读 RUN.json + CHECKPOINT.md(若在做长时自动化)。若启用了 planning-with-files,读 task_plan.md / progress.md。真相在磁盘,不在聊天记录。
QMD 语义搜索返回空结果
检查 qmd 是否在 PATH(/opt/homebrew/bin/qmd)。尝试不带集合参数查询。可能是索引尚未刷新,手动触发一次写入即可更新索引。
gallery-dl 下载失败(CDN 反爬)
改用 curl -L -A "Mozilla/5.0" -o path url 直接下载。或通过 browser evaluate 提取真实 CDN URL 再下载。参考 sky-knife skill 的 fallback 流程。
浏览器登录状态丢失
确认使用的是 ~/.openclaw/browser/openclaw/user-data(唯一默认身份)。其他 profile 如 .profiles/sky-style-research-chrome 仅为辅助研究用,不是主身份。

Cron 备份失败处理

Memory 碎片化处理

最后原则

当不确定怎么办时:先读文件(SOUL.md / AGENTS.md / TOOLS.md),再看 session history,最后才提问。文件不会撒谎,聊天记录会因压缩而丢失。