像素信标

Claude Code 开发效率提升 10 倍的完整实践指南（Plan-Setup-Build 方法论）

2026-01-08T00:00:00+00:00

什么是 PSB 系统？

PSB（Plan-Setup-Build）是专门为 Claude Code 设计的项目开发框架，由开发者 Avthar 在构建数十个项目后总结而成。这套方法论能将项目启动效率提升约 10 倍，特别适合 AI 辅助开发场景。

PSB 的核心理念是：先规划再动手，用 15 分钟的前期思考，节省数小时的后期返工。

为什么需要 PSB？

传统的”即兴式”开发在 AI 辅助场景下问题尤为突出：

方向模糊：没有清晰规格，AI 容易误解需求
环境混乱：缺少配置，开发中频繁中断
代码无序：像”没有蓝图就盖房子”，后期难以维护

PSB 通过结构化的三个阶段解决这些痛点。

阶段一：Plan（规划）—— 15 分钟定方向

核心任务

明确项目目标和技术路线，输出一份项目规格文档。

关键步骤

1. 明确项目定位

这是验证想法的原型，还是面向用户的产品？
里程碑是什么？（如：MVP → 完整功能 → 优化版本）

2. 借助 AI 辅助思考

提示词示例：”针对这个想法，问我三个最关键的问题”
使用语音模式自由讨论，再让 AI 生成 Markdown 总结

3. 编写规格文档

规格文档分为两部分：

产品需求（PRD）

解决什么用户痛点？
核心交互流程是什么？
示例（日记应用）：
- 打开应用显示空白页还是引导提示？
- 支持添加照片吗？如何编辑已有日记？

工程需求（EDD）

技术栈选择（推荐组合）：
- 托管：Vercel
- 框架：Next.js
- UI：Tailwind + Shadcn
- 数据库：Supabase / MongoDB
- 认证：Clerk
- 支付：Stripe
不确定技术选型？让 Claude 根据需求推荐

注意事项

保持文档轻量，避免上下文过载
需求要具体，防止 AI 误解

阶段二：Setup（设置）—— 7 步配置环境

这个阶段将 Claude Code 打造成”完美调校的开发仪器”。

7 步清单

步骤	具体操作	核心价值
1. 创建 GitHub 仓库	启用 Actions、配置 Vercel 自动部署	版本控制 + 自动化部署
2. 配置环境变量	创建 `.env.example`，填充 API 密钥	避免开发中频繁中断
3. 编写 `claude.md`	项目”记忆库”：目标、架构、风格指南、约束条件	确保 AI 始终理解项目上下文
4. 自动化文档	设置 `architecture.md`、`changelog.md`、`project_status.md` 指示 Claude 自动更新	长期维护项目上下文，便于中断后恢复
5. 安装插件	Anthropic 前端插件、特性开发插件等	扩展功能，输出更精准
6. 集成 MCP	Model Context Protocol：数据库、Playwright 测试、Vercel 部署	AI 直接操作工具，自动化测试和部署
7. 自定义命令	创建斜杠命令（如 `/update-docs`）和子代理	自动化重复工作流

核心：`claude.md` 文件

这是整个系统的灵魂，包含：

项目目标：一句话说明在做什么
技术架构：技术栈和文件结构
风格指南：代码规范、UI 风格偏好
约束条件：如”禁止直接推送到 main 分支”
文档链接：指向其他配置文档

进阶技巧

预批准常用操作（如 git 提交）
设置自动化钩子（如测试失败自动修复、Slack 通知）

阶段三：Build（构建）—— 实现与迭代

三种工作流

1. 通用工作流（单功能开发）

适合简单项目，流程：

研究：查阅 API 文档
计划：使用 plan 模式分解任务
实现：借助插件和 MCP 工具
测试：验证功能

2. 基于 Issue 的工作流

适合团队协作或复杂项目：

用 GitHub Issues 组织任务
AI 自动创建和关联 Issues
适合 Bug 追踪和功能管理

3. 多代理工作流

适合并行开发多个功能：

使用 git worktree 创建隔离副本
多个 Claude 实例同时处理不同功能
合并时集中审查

生产力技巧

模型选择策略

Opus 4.5：复杂规划和架构设计
Sonnet：日常功能实现
Haiku：快速修复小问题

关键实践

每次新功能完成后更新 claude.md
出现错误时，用 # 注释添加规则防止回归
大胆丢弃代码：AI 重写成本低，别怕推倒重来

工作流对比

工作流	适用场景	优势	局限
通用	小型项目、单功能	简单直接	串行开发，效率有限
基于 Issue	团队协作、长期项目	组织清晰、可追溯	需要管理开销
多代理	复杂项目、并行开发	效率最高、隔离性好	需要熟悉 git，合并有难度

适用场景与局限

最佳适用场景

Web 应用快速原型
MVP 到生产级应用的迭代
个人开发者或小团队项目

需要调整的场景

移动应用：调整 MCP 配置
大型团队：增加协作文档
非代码项目：概念可复用，但需简化

核心局限

上下文限制：文档需保持精简
学习曲线：高级功能（如钩子）需要时间掌握

PSB 代表的思维转变

传统开发：人写代码，工具辅助
AI 原生开发：人负责策略，AI 执行战术

PSB 系统的本质是：

规划阶段：人确定”做什么”
设置阶段：建立人机协作的”对话规则”
构建阶段：AI 在规则内高效执行

这种模式正在成为 AI 时代软件开发的新范式。

🔥 Java后端面试题库：643道题目系统化学习路径，助你斩获Offer

2026-01-07T11:04:00+00:00

📖 Java后端开发面试题库

本站是一个专注于 Java 后端开发面试题 的知识库，旨在帮助 Java 开发者更好地准备技术面试。

✨ 核心特色

643道精选题目：覆盖Java后端开发的各个核心领域
系统化学习路径：按照”基础→进阶→框架→分布式→大厂项目场景实战”的递进关系优化排序
全面知识覆盖：包含Java基础、Java并发、JVM、Spring框架、数据库、中间件、分布式系统等多个领域

📚 涵盖领域

☕ Java基础：核心语法、集合框架、异常处理等
🔄 Java并发：多线程、线程池、并发工具类
🖥️ JVM：内存模型、垃圾回收、性能调优
🌱 Spring框架：Spring、Spring Boot、Spring Cloud
💾 数据库：MySQL、Redis、事务、索引优化
🔧 中间件：消息队列、Dubbo、Zookeeper
🌐 分布式系统：分布式事务、微服务、限流降级
🎯 大厂项目场景实战：涵盖高可用、性能优化、高并发、分库分表、数据一致性、代码重构等六大技术方向包含实际项目中的常见问题和解决方案

🚀 开始学习

👉 立即访问 Java 后端面试题库

通过系统化的学习路径，循序渐进地掌握 Java 后端开发的核心知识，为你的技术面试做好充分准备！

Claude Skills Complete Guide: From Beginner to Expert in Reusable AI Workflows

2026-01-06T10:30:00+00:00

Key Points on Claude Skills

Core Functionality: Claude Skills are reusable AI workflows that package instructions, reference materials, and code to automate tasks reliably, reducing context loss in complex projects.
Ease of Creation: Skills can be built using Claude’s built-in skill-creator, making it accessible even for non-technical users, though coding knowledge enhances advanced implementations.
Collaboration Potential: Integrated with Claude Projects, Skills enable team sharing of customized tools and knowledge bases, fostering efficient group workflows.
Practical Applications: Commonly used for AI agent teams, marketing automation, and coding tasks, with real-world examples showing 2-3x improvements in efficiency and quality.
Limitations and Best Practices: While powerful, Skills perform best with verification loops and iterative refinement; they’re not infallible and shine in structured, repeatable scenarios.

Getting Started with Claude Skills

To start using Claude Skills, you need to understand the following key information:

Subscription Requirements

Claude Skills are available for the following subscription plans:

Pro Plan - Individual premium users
Max Plan - Professional users
Team Plan - Team collaboration
Enterprise Plan - Enterprise-level deployment

Access Points

Skills can be accessed through multiple ways:

Claude.ai Web App - Enable sample Skills in Settings > Features
Claude Code (Desktop App) - Anthropic’s official command-line AI assistant
API Calls - For enterprise-level automation integration

Skill Storage Path

In Claude Code, Skills are stored in the following directory:

~/.claude/skills/

Claude Code automatically recognizes and loads all skill folders in this directory.

Skill Discovery Mechanism

At startup, Claude only preloads the name and description fields of all available Skills into the system prompt, enabling:

On-demand loading: Only loads required skills to maintain response speed
Semantic matching: Automatically matches appropriate Skills based on user requests
Zero-prompt invocation: No explicit specification needed; Claude automatically identifies task requirements

Why Claude Skills Matter

Research suggests Skills address “context rot” in AI interactions by creating modular, reliable systems—ideal for tasks where consistency is key, like content generation or data analysis. Users report enhanced productivity, with examples like automating competitive research in minutes. However, evidence leans toward combining Skills with human oversight for optimal results, especially in debated areas like full automation.

Common Pitfalls to Avoid

Start simple: Overloading a Skill with too much context can reduce effectiveness. Test iteratively, and incorporate feedback mechanisms to verify outputs. For teams, ensure shared Projects align with organizational needs to prevent silos.

Understanding Claude Skills in Depth

Claude Skills represent a significant evolution in AI-assisted workflows, transforming how individuals and teams leverage large language models for practical, repeatable tasks. Developed by Anthropic, this feature builds on Claude’s core strengths in reasoning and tool use, allowing users to create customized “skills” that function like specialized employees or agents. Unlike generic prompting, Skills encapsulate instructions, reference files, and even code snippets into modular units that Claude can apply automatically across chats, projects, or code executions. This approach mitigates common AI challenges such as inconsistent outputs or forgotten context, making it particularly valuable for knowledge workers, developers, and marketers.

At its foundation, a Claude Skill consists of three primary components: detailed instructions defining the role and process, reference materials (e.g., brand guidelines, examples, or datasets) to ensure alignment, and optional code scripts for deterministic operations like data processing or API integrations. Skills are versatile, working across Claude’s ecosystem—including the web app for casual use, Claude Code for agentic coding in a desktop environment, and the API for enterprise-scale deployments. For instance, in coding scenarios, Skills can invoke sub-agents to handle parallel tasks, such as generating multiple design iterations or debugging in isolated git workspaces.

SKILL.md File Structure Explained

The core of each Claude Skill is a SKILL.md file. Understanding its structure is key to creating high-quality skills.

Directory Structure

A complete Skill directory typically contains:

my-skill/
├── SKILL.md          # Required - Skill definition file
├── examples/         # Optional - Sample inputs/outputs
│   ├── input.csv
│   └── output.json
├── templates/        # Optional - Template files
│   └── report.md
└── scripts/          # Optional - Automation scripts
    └── process.py

YAML Frontmatter Details

The SKILL.md file must begin with YAML frontmatter containing the following key fields:

---
name: "marketing-analyst"
description: "Analyzes marketing campaigns using the ICE framework for A/B testing. Best used when evaluating campaign performance, comparing variants, or generating optimization recommendations from CSV data."
---

Field Specifications

Field	Requirement	Constraints
`name`	Required - Unique identifier for the skill	Max 64 characters, lowercase letters, numbers, and hyphens only
`description`	Required - Explains skill purpose and trigger scenarios	Max 1024 characters, third person, no XML tags

Naming Conventions

✅ data-analyzer, content-writer-v2, api-integrator
❌ DataAnalyzer, my skill, claude-helper (contains reserved word)

Complete Example

---
name: "csv-data-summarizer"
description: "Summarizes CSV data files with statistical analysis and key insights. Use this skill when working with tabular data, generating reports, or extracting trends from datasets."
---

# CSV Data Summarizer

You are a data analysis expert. When given a CSV file, you should:

## Process
1. Load and validate the data structure
2. Calculate key statistics (mean, median, mode, std)
3. Identify outliers and trends
4. Generate a summary report

## Output Format
- Use markdown tables for statistics
- Highlight anomalies with ⚠️
- Include actionable insights

## Reference Files
- See `examples/sample-output.md` for expected format
- Use `templates/report.md` as the base template

Official Resources and Community

Anthropic Official Repository

anthropics/skills - Anthropic’s officially maintained open-source skill library with 50+ ready-to-use skills:

Category	Example Skills	Purpose
Document Processing	Word, PDF, PowerPoint, Excel	Create, edit, and analyze various documents
Development Tools	Playwright, AWS, Git	Web testing, cloud deployment, version control
Data Analysis	CSV Analyzer, Chart Generator	Data processing and visualization
Business & Marketing	Campaign Analyzer, UTM Builder	Marketing automation
Creative Media	Algorithmic Art, Image Editor	Creative content generation

Other Recommended Resources

anthropic-cookbook - Official tutorials and code examples
Awesome Claude Skills - Community-curated skill collections
Claude Official Documentation - API guides and best practices

Using Claude Skills

To use Skills effectively, start by understanding Claude’s automatic application mechanism: the AI scans your query and identifies relevant Skills without explicit prompting. This “zero-shot” integration means you can stack Skills for complex workflows—e.g., one Skill for data analysis feeding into another for report generation. In practice, begin a session in Claude.ai by describing your task; if a matching Skill exists, Claude will apply it seamlessly.

For more advanced usage, incorporate Skills into Claude Code, Anthropic’s desktop tool that enables agentic behaviors like autonomous coding, file manipulation, and tool invocation. Here, Skills enhance “pair programming” modes, where Claude suggests optimizations iteratively. Users often run multiple Claude instances in parallel (e.g., 5-10 agents) for efficiency, starting in “Plan” mode to outline approaches before execution. Plugins like those from CloudAI-X can extend this, providing pre-built agents for code review, debugging, or security audits.

Best practices emphasize verification: always build in ways for Claude to self-check outputs, which can improve result quality by 2-3x. For non-coders, Skills shine in content tasks—e.g., generating presentations in the style of Steve Jobs by referencing sample files. Limitations include potential session limits in high-usage scenarios, where complex tool calls (e.g., 30+ per task) may exhaust quotas, requiring session restarts.

Creating Claude Skills

Creating a Skill is straightforward and leverages Claude’s built-in “skill-creator” Skill, which guides you through the process. Start in Claude.ai by prompting: “Create a new Skill for [task description].” Claude will ask for details on instructions, references, and code.

Step-by-Step Guide

Define Instructions: Write clear, role-based prompts (e.g., “Act as a marketing analyst using the ICE framework for A/B testing”)
Add References: Upload files like CSVs, brand voice samples, or examples to anchor outputs
Incorporate Code: For automation, include scripts (e.g., Python for UTM link generation or data analysis)
Test and Refine: Run the Skill 5+ times, iterating based on outputs—add verification steps if needed
Deploy: Save to a Project for reuse; integrate with sub-agents for multi-step tasks

Open-source examples abound, such as a CSV data summarizer Skill available on GitHub, which demonstrates simple code integration for summarization tasks. For developers, use the API for programmatic tool calling, enabling Skills in custom apps. Communities like Reddit share templates, reducing creation time.

Team Collaboration with Claude Skills

Claude Projects serve as the hub for team collaboration, allowing shared access to Skills, knowledge bases, and custom instructions. In a Team plan, curate Projects with relevant chats, files, and Skills—e.g., a marketing Project with Skills for campaign analysis and content generation. Teams can maintain a shared “CLAUDE.md” file in Git for ongoing refinements, where errors are documented to improve future outputs.

Integration with tools like GitLab CI/CD pipelines allows asynchronous collaboration, such as tagging Claude in merge requests for automated code reviews or bug fixes. Nonprofits and enterprises benefit from discounted access, with partnerships like IBM embedding Claude Skills into suites for boosted productivity. Real teams report compounding benefits: reusable workflows that evolve, reducing repetition and enabling parallel work.

For global teams, Anthropic’s expansion (e.g., new offices in Tokyo) supports international usage, with 80% of consumers outside the U.S. Security features ensure data ownership, with everything stored locally in markdown files.

Real Usage Cases

Claude Skills excel in diverse scenarios, from solo automation to enterprise systems. Here are detailed examples:

Marketing Automation: Build an AI agent team for UTM tracking, A/B testing, report analysis, and newsletter creation from viral tweets—all in 33 minutes using stacked Skills. One user automated customer retention workflows with sentiment analysis via GPT-4o/Claude integration in n8n.
Coding and Development: In Claude Code, Skills enable parallel agent squads for tasks like app building or design exploration, with sub-agents in sandboxes. GitHub Actions integrate for PR reviews, updating shared knowledge bases.
Research and Analysis: Create competitive research systems that analyze competitors’ pricing/features in minutes, outputting tables. Security teams use Skills for profile analysis, like detecting patterns in North Korean IT workers via linguistic tools.
Content Creation: Skills for presentation design (e.g., Steve Jobs style) or AdSense niche building, incorporating tools like Asap Theme.
Enterprise Integration: IBM’s partnership embeds Skills for faster coding; GitLab for pipeline automation.

Use Case	Key Components	Benefits	Example Tools/Integrations	Potential Challenges
Marketing Automation	Instructions for ICE framework, CSV references, UTM scripts	Consistent campaigns, real-time insights	n8n, Gmail, Airtable	Data privacy in integrations
Coding Agents	Sub-agents, git worktrees, verification loops	Parallel development, 2x cheaper	Claude Code, Cursor, GitHub Actions	Session limits on complex tasks
Competitive Research	Analysis instructions, feature tables, web scraping code	Minutes vs. hours for reports	Claude Projects, Markdown exports	Accuracy depends on references
Content Generation	Style samples, emoji patterns, linguistic analysis	Brand-aligned outputs	YouTube tutorials, open-source repos	Over-reliance without iteration
Team Reviews	Shared CLAUDE.md, PR hooks, audit agents	Compounding knowledge, async collaboration	GitLab CI/CD, API calls	Team adoption curve

These cases illustrate Skills’ flexibility, with users like product managers ditching browser-based AI for Claude Code’s compounding systems. As Anthropic refines features like tool search and context compaction, expect even more robust applications. While not perfect—e.g., occasional error rates or quota issues—Skills offer a diplomatic bridge between human creativity and AI efficiency, empathetic to varied user needs.

In summary, Claude Skills empower users to build reliable AI systems, with creation accessible to all, collaboration streamlined via Projects, and real-world impacts evident in automation and productivity gains. Experimentation is key—start small, iterate, and integrate verification for best results.

Claude Skills 完全指南：从入门到精通的可复用 AI 工作流教程

2026-01-06T10:30:00+00:00

Claude Skills 核心要点

核心功能：Claude Skills 是可复用的 AI 工作流，将指令、参考材料和代码打包在一起，可靠地自动执行任务，减少复杂项目中的上下文丢失问题。
创建简便：可以使用 Claude 内置的 skill-creator 技能构建，即使非技术用户也能轻松上手，但编程知识有助于实现更高级的功能。
协作潜力：与 Claude Projects 集成，支持团队共享定制工具和知识库，实现高效的团队协作工作流。
实际应用：常用于 AI 代理团队、营销自动化和编程任务，实际案例显示效率和质量可提升 2-3 倍。
局限性与最佳实践：尽管功能强大，Skills 在配合验证循环和迭代优化时表现最佳；它们并非万能，在结构化、可重复的场景中最具优势。

入门指南

要开始使用 Claude Skills，你需要了解以下关键信息：

订阅要求

Claude Skills 功能面向以下订阅计划提供：

Pro 计划 - 个人高级用户
Max 计划 - 专业用户
Team 计划 - 团队协作
Enterprise 计划 - 企业级部署

使用入口

Skills 可以通过多种方式访问：

Claude.ai 网页版 - 在设置 > 功能中启用示例 Skills
Claude Code（桌面应用） - Anthropic 官方的命令行 AI 助手
API 调用 - 适用于企业级自动化集成

技能存储路径

在 Claude Code 中，Skills 存放在以下目录：

~/.claude/skills/

Claude Code 会自动识别并加载该目录下的所有技能文件夹。

技能发现机制

启动时，Claude 仅预加载所有可用 Skills 的 name 和 description 字段到系统提示词中，实现：

按需加载：仅加载所需技能，保持响应速度
语义匹配：根据用户请求自动匹配合适的 Skill
零提示调用：无需显式指定，Claude 自动识别任务需求

为什么 Claude Skills 重要

研究表明，Skills 通过创建模块化、可靠的系统来解决 AI 交互中的”上下文衰减”问题——特别适合需要一致性的任务，如内容生成或数据分析。用户报告生产力显著提升，例如几分钟内完成竞品研究自动化。然而，证据倾向于将 Skills 与人工监督结合以获得最佳效果，尤其是在完全自动化等有争议的领域。

常见误区

从简单开始：给 Skill 加载过多上下文会降低效果。迭代测试，并加入反馈机制来验证输出。对于团队，确保共享的 Projects 与组织需求一致，以防止信息孤岛。

深入理解 Claude Skills

Claude Skills 代表了 AI 辅助工作流的重大进步，改变了个人和团队利用大型语言模型执行实用、可重复任务的方式。由 Anthropic 开发，这一功能建立在 Claude 推理和工具使用的核心优势之上，允许用户创建定制的”技能”，就像专业员工或代理人一样工作。与通用提示词不同，Skills 将指令、参考文件甚至代码片段封装成模块化单元，Claude 可以在聊天、项目或代码执行中自动应用。这种方法减轻了常见的 AI 挑战，如输出不一致或上下文遗忘，对知识工作者、开发者和营销人员特别有价值。

从基础来看，一个 Claude Skill 由三个主要组成部分：定义角色和流程的详细指令、确保一致性的参考材料（如品牌指南、示例或数据集），以及用于确定性操作的可选代码脚本（如数据处理或 API 集成）。Skills 用途广泛，可在 Claude 的整个生态系统中工作——包括用于日常使用的网页应用、用于代理编程的桌面环境 Claude Code，以及用于企业级部署的 API。例如，在编程场景中，Skills 可以调用子代理来处理并行任务，如生成多个设计迭代或在隔离的 git 工作区中调试。

SKILL.md 文件结构详解

每个 Claude Skill 的核心是一个 SKILL.md 文件。理解其结构是创建高质量技能的关键。

目录结构

一个完整的 Skill 目录通常包含：

my-skill/
├── SKILL.md          # 必需 - 技能定义文件
├── examples/         # 可选 - 示例输入/输出
│   ├── input.csv
│   └── output.json
├── templates/        # 可选 - 模板文件
│   └── report.md
└── scripts/          # 可选 - 自动化脚本
    └── process.py

YAML Frontmatter 详解

SKILL.md 文件必须以 YAML frontmatter 开头，包含以下关键字段：

---
name: "marketing-analyst"
description: "使用 ICE 框架分析营销活动进行 A/B 测试。最适合评估活动效果、比较变体或从 CSV 数据生成优化建议时使用。"
---

字段规范

字段	要求	限制
`name`	必需 - 技能的唯一标识符	最大64字符，仅小写字母、数字、连字符
`description`	必需 - 说明技能用途和触发场景	最大1024字符，第三人称，不含 XML 标签

命名规范

✅ data-analyzer, content-writer-v2, api-integrator
❌ DataAnalyzer, my skill, claude-helper（含保留词）

完整示例

---
name: "csv-data-summarizer"
description: "对 CSV 数据文件进行统计分析并提取关键洞察。在处理表格数据、生成报告或从数据集中提取趋势时使用此技能。"
---

# CSV 数据汇总器

你是一名数据分析专家。当收到 CSV 文件时，你应该：

## 处理流程
1. 加载并验证数据结构
2. 计算关键统计数据（均值、中位数、众数、标准差）
3. 识别异常值和趋势
4. 生成汇总报告

## 输出格式
- 使用 Markdown 表格展示统计数据
- 用 ⚠️ 标记异常情况
- 包含可操作的洞察

## 参考文件
- 查看 `examples/sample-output.md` 了解预期格式
- 使用 `templates/report.md` 作为基础模板

官方资源与社区

Anthropic 官方仓库

anthropics/skills - Anthropic 官方维护的开源技能库，包含 50+ 即用型技能：

分类	示例技能	用途
文档处理	Word, PDF, PowerPoint, Excel	创建、编辑、分析各类文档
开发工具	Playwright, AWS, Git	Web 测试、云部署、版本控制
数据分析	CSV Analyzer, Chart Generator	数据处理与可视化
商业营销	Campaign Analyzer, UTM Builder	营销自动化
创意媒体	Algorithmic Art, Image Editor	创意内容生成

其他推荐资源

anthropic-cookbook - 官方教程和代码示例
Awesome Claude Skills - 社区精选技能集合
Claude 官方文档 - API 指南与最佳实践

使用 Claude Skills

要有效使用 Skills，首先要理解 Claude 的自动应用机制：AI 会扫描你的查询并识别相关的 Skills，无需显式提示。这种”零样本”集成意味着你可以叠加 Skills 来处理复杂工作流——例如，一个 Skill 进行数据分析，另一个生成报告。实际操作中，在 Claude.ai 中描述你的任务；如果存在匹配的 Skill，Claude 会无缝应用它。

对于更高级的用法，将 Skills 纳入 Claude Code，这是 Anthropic 的桌面工具，支持自主编码、文件操作和工具调用等代理行为。在这里，Skills 增强了”结对编程”模式，Claude 会迭代地提出优化建议。用户通常并行运行多个 Claude 实例（例如 5-10 个代理）以提高效率，先在”计划”模式中概述方法，然后再执行。CloudAI-X 等插件可以扩展此功能，提供用于代码审查、调试或安全审计的预构建代理。

最佳实践强调验证：始终为 Claude 构建自我检查输出的方法，这可以将结果质量提升 2-3 倍。对于非程序员，Skills 在内容任务中表现出色——例如，通过参考示例文件生成乔布斯风格的演示文稿。局限性包括高使用场景下可能的会话限制，复杂的工具调用（例如每个任务 30+ 次）可能耗尽配额，需要重启会话。

创建 Claude Skills

创建 Skill 很简单，可以利用 Claude 内置的”skill-creator”技能来指导你完成整个过程。在 Claude.ai 中输入提示：”为[任务描述]创建一个新的 Skill。”Claude 会询问有关指令、参考资料和代码的详细信息。

分步指南

定义指令：编写清晰的基于角色的提示词（例如，”作为使用 ICE 框架进行 A/B 测试的营销分析师”）
添加参考资料：上传 CSV、品牌语音样本或示例等文件来锚定输出
纳入代码：为了自动化，包含脚本（例如，用于 UTM 链接生成或数据分析的 Python）
测试和优化：运行 Skill 5 次以上，根据输出进行迭代——如有需要添加验证步骤
部署：保存到 Project 以便复用；与子代理集成以处理多步任务

开源示例很多，例如 GitHub 上的 CSV 数据汇总器 Skill，展示了用于汇总任务的简单代码集成。对于开发者，使用 API 进行程序化工具调用，在自定义应用中启用 Skills。Reddit 等社区分享模板，减少创建时间。

团队协作

Claude Projects 是团队协作的中心，允许共享访问 Skills、知识库和自定义指令。在 Team 计划中，策划包含相关聊天、文件和 Skills 的 Projects——例如，一个包含营销活动分析和内容生成 Skills 的营销 Project。团队可以在 Git 中维护共享的”CLAUDE.md”文件进行持续优化，记录错误以改进未来输出。

与 GitLab CI/CD 流水线等工具的集成允许异步协作，例如在合并请求中标记 Claude 以进行自动代码审查或错误修复。非营利组织和企业可享受折扣访问，IBM 等合作伙伴将 Claude Skills 嵌入套件以提升生产力。真实团队报告了复合效益：可复用的工作流不断演进，减少重复并实现并行工作。

对于全球团队，Anthropic 的扩张（例如东京新办公室）支持国际使用，80% 的用户在美国以外。安全功能确保数据所有权，所有内容都以 Markdown 文件形式本地存储。

真实使用案例

Claude Skills 在各种场景中表现出色，从个人自动化到企业系统。以下是详细示例：

营销自动化：使用叠加的 Skills 在 33 分钟内构建用于 UTM 跟踪、A/B 测试、报告分析和从热门推文创建新闻简报的 AI 代理团队。一位用户通过 n8n 中的 GPT-4o/Claude 集成自动化了带有情感分析的客户留存工作流。
编码和开发：在 Claude Code 中，Skills 支持并行代理小组执行应用构建或设计探索等任务，子代理在沙盒中运行。GitHub Actions 集成用于 PR 审查，更新共享知识库。
研究和分析：创建竞品研究系统，在几分钟内分析竞争对手的定价/功能，输出表格。安全团队使用 Skills 进行配置文件分析，如通过语言工具检测朝鲜IT工作者的模式。
内容创作：用于演示文稿设计（如乔布斯风格）或 AdSense 利基构建的 Skills，结合 Asap Theme 等工具。
企业集成：IBM 的合作将 Skills 嵌入以加速编码；GitLab 用于流水线自动化。

用例	关键组件	优势	示例工具/集成	潜在挑战
营销自动化	ICE 框架指令、CSV 参考、UTM 脚本	一致的活动、实时洞察	n8n, Gmail, Airtable	集成中的数据隐私
编码代理	子代理、git 工作树、验证循环	并行开发、成本降低 2 倍	Claude Code, Cursor, GitHub Actions	复杂任务的会话限制
竞品研究	分析指令、功能表格、网页抓取代码	报告时间从小时缩短到分钟	Claude Projects, Markdown 导出	准确性取决于参考资料
内容生成	风格样本、表情模式、语言分析	符合品牌的输出	YouTube 教程、开源仓库	不迭代会过度依赖
团队审查	共享 CLAUDE.md、PR 钩子、审计代理	知识积累、异步协作	GitLab CI/CD, API 调用	团队适应曲线

这些案例展示了 Skills 的灵活性，产品经理等用户正在放弃基于浏览器的 AI，转向 Claude Code 的复合系统。随着 Anthropic 完善工具搜索和上下文压缩等功能，预计会有更强大的应用。虽然并非完美——例如偶尔的错误率或配额问题——但 Skills 为人类创造力和 AI 效率之间提供了一座务实的桥梁，满足了不同用户的需求。

总之，Claude Skills 赋予用户构建可靠 AI 系统的能力，创建对所有人都可及，通过 Projects 简化协作，并在自动化和生产力提升中产生明显的现实影响。实验是关键——从小处开始，迭代，并整合验证以获得最佳结果。

OpenCode 全方位配置指南：打造支持 LSP 与多 Agent 协作的终端 AI 开发环境

2026-01-05T10:00:00+00:00

OpenCode 简介

OpenCode 是一款基于终端用户界面（TUI）的 AI 辅助开发工具。它具备跨平台稳定性（Windows/macOS），支持鼠标交互，并能通过 LSP（语言服务器协议）深度集成开发环境。其核心优势在于能够利用 API 代理服务接入各类主流大模型（如 Gemini, GPT, Claude），并通过多智能体协作提升复杂任务的处理效率。

1. 基础安装与初始化

1.1 环境准备与安装

OpenCode 依赖 Node.js 环境，建议使用 pnpm 进行全局安装以确保依赖管理的稳定性。

pnpm install -g opencode-ai

1.2 初始化配置

首次运行 OpenCode 后，系统会在用户目录下生成配置文件 ~/.config/opencode/opencode.json。建议将文件后缀修改为 .jsonc 以支持注释功能，便于后续维护。

1.3 连接模型服务

在 OpenCode 交互界面中输入 /connect 指令，可快速配置 Anthropic 或 OpenAI 的 API Key。

2. 核心配置文件详解

针对通过 API 中转服务接入模型的需求，需对 provider 字段进行精细化配置。以下为标准配置示例，包含了对推理模型（如文中提到的 GPT-5.2）的特殊参数优化。

{
  "$schema": "https://opencode.ai/config.json",
  // MCP 工具集配置
  "mcp": {
    "context7": {
      "type": "local",
      "command": ["pnpx", "@upstash/context7-mcp"],
      "enabled": true
    }
  },
  "provider": {
    "anthropic": {
      "options": {
        "baseURL": "https://您的中转服务地址/v1"
      }
    },
    "openai": {
      "options": {
        "baseURL": "https://您的中转服务地址/v1"
      },
      "models": {
        // 针对特定推理模型的参数优化
        "gpt-5.2": {
          "options": {
            "include": ["reasoning.encrypted_content"],
            "store": false,
            "reasoningEffort": "high",
            "textVerbosity": "high",
            "reasoningSummary": "auto"
          }
        }
      }
    }
  }
}

3. 生态扩展：Oh-my-opencode

Oh-my-opencode 是 OpenCode 的异步子代理（Sub-Agent）工具包，内置了 LSP/AST 工具及精选的 MCP（Model Context Protocol）工具集，并提供 Claude Code 兼容层，是实现多智能体协作的关键组件。

3.1 部署方式

通过以下命令进行交互式安装，向导将自动处理订阅接入与插件配置：

pnpx oh-my-opencode install

3.2 多智能体（Multi-Agent）编排

安装完成后，通过 oh-my-opencode.json 文件定义不同职能的 Agent 及其调用的底层模型。这种分工机制能有效平衡成本与性能。

推荐的 Agent 角色配置：

Agent 角色	职能描述	推荐模型架构
Sisyphus	主代理，负责任务协调与简单执行	GPT-5.2 High
Oracle	处理高难度任务及 Debug	GPT-5.2
Librarian	检索第三方库与文档信息	Claude Sonnet 3.5/4.5
Explore	存量代码库探索与分析	Claude Sonnet 3.5/4.5
Frontend-UI	前端交互与视觉设计	Gemini 3 Pro High
Document-Writer	技术文档撰写	Gemini 3 Flash
Multimodal-Looker	多模态内容识别与处理	Gemini 3 Flash

注：部分 Google 模型需配合 opencode-antigravity-auth 插件使用。

4. 高级功能与工作流

4.1 LSP 深度集成

OpenCode 原生支持 LSP。只要环境变量中存在对应的语言服务器指令，工具在读取文件时将自动挂载 LSP，支持重命名（Rename）、跳转定义等重构操作，无需额外复杂配置。

4.2 任务管理与交互

模式切换：明确区分“计划模式”与“执行模式”，确保任务路径清晰。
多任务并发：支持同时启动多个子模型异步运行。
快捷键操作：
Ctrl+X + 方向键：在不同子任务间快速切换。
Ctrl+X + ↑：快速返回主任务视图。
鼠标操作：TUI 界面完整支持鼠标点击、文本复制及历史消息编辑。

4.3 插件系统与个性化

功能插件：推荐安装长期记忆（Long-term memory）、语音/消息提醒及时间统计插件，以增强辅助能力。
协作分享：输入 /share 可生成当前会话的网页链接，便于团队协作与代码审查。
视觉主题：输入 /theme 可切换界面主题（如 Catppuccin），保持与 VSCode 等编辑器一致的视觉体验。

Antigravity 必装的 AI 额度监控神器，让你告别 Gemini/Claude 配额焦虑

2026-01-01T07:30:00+00:00

如果你是 Google Antigravity（也就是 Gemini AI 编程助手）的用户，一定深有体会：最怕的不是 AI 不够智能，而是正写到关键代码时，突然发现配额耗尽了。

今天介绍的 Antigravity Cockpit 就是专门解决这个痛点的 VS Code 扩展——它能让你实时掌握 AI 配额状态，再也不用担心”写到一半没额度”的尴尬。

这款插件能解决什么问题？

使用 Gemini AI 编程时，最常见的焦虑来源于：

不知道还剩多少配额——只能等用完才发现
不清楚什么时候重置——盲目等待，效率低下
多模型切换时更迷茫——哪个模型还能用？完全靠猜

Antigravity Cockpit 提供了一个一站式监控仪表盘，让这些信息一目了然。

核心功能详解

🎛️ 两种显示模式，满足不同需求

Webview 仪表盘（推荐）

这是默认模式，提供了一个精美的可视化界面：

卡片视图 / 列表视图：两种布局随心切换
分组模式：按配额池自动归类模型，共享配额的模型一目了然
拖拽排序：自定义模型显示顺序
实时进度条：可视化剩余配额

QuickPick 模式

使用 VS Code 原生 API，适合以下场景：

Webview 加载有问题的环境
偏好纯键盘操作的用户
需要快速瞄一眼配额状态

📊 状态栏监控：一眼掌握关键信息

状态栏是这个插件的精华所在，支持 6 种显示格式：

格式	示例
仅图标	`🚀`
仅状态点	`🟢` / `🟡` / `🔴`
仅百分比	`95%`
状态点 + 百分比	`🟢 95%`
名称 + 百分比	`Sonnet: 95%`
完整显示	`🟢 Sonnet: 95%`

特别实用的功能：

多模型置顶：可以同时监控多个常用模型
自动监控：没指定模型时，自动显示剩余配额最低的那个

🔔 阈值告警：提前预警，从容应对

你可以设定两个阈值：

警告阈值（默认 30%）：配额低于这个值时变黄
危险阈值（默认 10%）：配额低于这个值时变红

当配额触碰阈值时，插件会发送通知提醒你，让你有充足时间调整使用策略。

⏰ 配额详情：不只是百分比

每个模型 / 分组都会显示：

剩余配额百分比
倒计时：距离重置还有多久（如 4h 40m）
重置时间：具体几点重置（如 15:16）
可视化进度条

🏷️ 分组功能：管理多模型更轻松

按配额池分组：共享配额的模型自动归类
自定义分组名称：给分组起个好记的名字
分组排序：拖拽调整显示顺序
分组置顶：把最重要的分组固定到状态栏

🌐 多语言支持

插件跟随 VS Code 的语言设置，支持 14 种语言：

🇺🇸 English · 🇨🇳 简体中文 · 繁體中文 · 🇯🇵 日本語 · 🇩🇪 Deutsch · 🇪🇸 Español · 🇫🇷 Français · 🇮🇹 Italiano · 🇰🇷 한국어 · 🇧🇷 Português · 🇷🇺 Русский · 🇹🇷 Türkçe · 🇵🇱 Polski · 🇨🇿 Čeština

如何安装和使用

安装方式

方式一：Open VSX 市场

Ctrl/Cmd + Shift + X 打开扩展面板
搜索 Antigravity Cockpit
点击安装

方式二：VSIX 文件安装

code --install-extension antigravity-cockpit-x.y.z.vsix

基本使用

打开仪表盘：
- 点击状态栏图标
- 或按 Ctrl/Cmd + Shift + Q
- 或在命令面板运行 Antigravity Cockpit: Open Dashboard
刷新配额：点击刷新按钮或 Ctrl/Cmd + Shift + R
遇到问题：
- 显示 “Systems Offline” 时点击 Retry Connection
- 点击 Open Logs 查看调试日志

常用配置项

配置项	默认值	说明
`agCockpit.displayMode`	`webview`	显示模式：`webview` / `quickpick`
`agCockpit.viewMode`	`card`	视图模式：`card` / `list`
`agCockpit.refreshInterval`	`120`	刷新间隔（秒，10-3600）
`agCockpit.statusBarFormat`	`standard`	状态栏格式
`agCockpit.groupingEnabled`	`true`	启用分组模式
`agCockpit.warningThreshold`	`30`	警告阈值（%）
`agCockpit.criticalThreshold`	`10`	危险阈值（%）
`agCockpit.notificationEnabled`	`true`	启用通知

写在最后

用 AI 写代码已经成为越来越多开发者的日常，但配额管理这个环节往往被忽视——直到用完的那一刻才追悔莫及。

Antigravity Cockpit 这款插件虽然功能聚焦，但解决的是一个实实在在的痛点。如果你是 Google Antigravity / Gemini 的重度用户，强烈建议安装试试。

相关链接：

Agent Designer 深度指南：文档驱动的 AI Agent 自动化设计流程

2025-12-24T01:27:00+00:00

Agent Designer 深度指南：文档驱动的 AI Agent 自动化设计流程

Agent Designer 是一个由文档驱动的工作区，旨在标准化和简化 AI Agent “技能”（Skills）的创建、维护和执行。它特别针对 Codex CLI (Google) 和 Claude Code (Anthropic) 进行了优化，通过统一的“技能”标准桥接了主流的 Agent 框架。

核心理念：设计优先 & 文档驱动

传统的 AI 交互往往依赖于零散的 Prompt 工程，而 Agent Designer 提倡一种代理工程（Agentic Engineering）的方法：

设计中心化（Design-Centric）：Agent 的能力被视为正式的资产。每一个技能都由一个 SKILL.md 文件定义，作为用户与 LLM 之间的可移植契约。
文档先行（Documentation-First）：绝大多数项目变更都以文本形式发生。仓库本身即是 Agent 行为、规则和工具集的“真相之源”。

快速上手：三步开启新项目

如果你想快速将这一框架应用到新项目中，可以遵循以下三个核心步骤：

第一步：克隆与清理

首先将项目克隆到本地，并移除原有的 Git 信息：

git clone https://github.com/appautomaton/agent-designer.git [your-project-name]
cd [your-project-name]
rm -rf .git

第二步：生成 MCP 工具清单

由于 Codex 等工具在调用 MCP（Model Context Protocol）时可能存在滞后性，推荐先行生成一份工具清单。

目标技能：./.codex/skills/mcp-tools-catalog/
目的：明确列出所有可用工具，让 Agent 在规划（Planning）阶段能“指哪打哪”。

第三步：项目初始化与 Agents 引导

使用 agents-bootstrap 技能，通过 Artifacts 技术根据项目需求生成核心框架。

目标技能：./.codex/skills/agents-bootstrap/
操作建议：先与 Codex 充分交流，明确大方向，然后下达指令：给我写个 AGENTS.md, bootstrap my AGENTS.md。这会将由 Issues 主导的开发模式框架导入到 AGENTS.md 中。

核心工作流：从规划到执行

在完成初始化后，即可进入正式的开发规划阶段：

自动化规划：利用 ./.codex/skills/plan 技能进行 Epic 级别的规划。它会覆盖默认配置，生成符合项目框架的任务清单。
模板化输出：项目自带了成熟的规划模板：
- .codex/skills/plan/assets/_template.csv (任务跟踪)
- .codex/skills/plan/assets/_template.md (详细计划)
Issue 主导的开发：所有的执行都基于 Issue 追踪，确保每一步都有验收标准（Acceptance Criteria）和验证方法。

总结

Agent Designer 不仅仅是一个工具库，它代表了 AI 交互从“试错模式”向“结构化开发模式”的转变。通过定义清晰的技能契约和严谨的 E2E 循环，它让开发者能够构建出跨平台、可移植且高可靠的 AI Agent 解决方案。

AI 制作微信表情包全流程指南：从灵感构思到审核避坑

2025-12-21T00:00:00+00:00

AI 制作微信表情包全流程指南：从灵感构思到审核避坑

现在利用 AI 制作微信表情包已经变得非常高效。只要掌握好工具组合与平台规范，一个人就能在短时间内产出一整套高质量的表情包，甚至开启一份轻松的副业。

本文将基于实战经验，为你拆解从 AI 出图、动态制作到平台审核通过的全流程。

1. 核心工具箱

要高效制作出一套合规的表情包，推荐以下工具组合：

Nano Banana Pro：用于生成核心角色形象和各种比例的宣传素材。
Grok Image (Video)：如果你要做 动态表情，Grok 生成的 6 秒短视频非常适合作为素材。
PS / 在线抠图工具：处理透明背景、裁剪比例、去除 AI 水印。
剪映 (CapCut)：将视频转为 GIF，并处理尺寸。

2. 核心制作流程

2.1 形象生成 (Nano Banana Pro)

Nano Banana 目前不能直接按像素精度输出（如 240x240），但支持按比例出图。

表情包主体：建议生成 1:1 比例的图片，方便后续裁剪。
宣传素材：根据平台要求调整比例。例如 750x400 的横幅，可以用接近 16:9 的比例生成。

2.2 动态表情制作 (Grok + 剪映)

将生成的静态图喂给 Grok。
生成约 6 秒的视频素材。
导入剪映：截取其中最精彩、连贯的 2-3 秒。
导出设置：剪映支持免费导出 240x240 大小的 GIF，这正好符合微信官方的要求。

⚠️ 注意事项：在裁剪时要注意首尾帧的衔接。如果首尾跳跃感太强，表情包看起来会有断裂感，建议通过微调裁剪点或添加简单的淡入淡出。

3. 微信表情平台素材规范 (避坑重点)

即便你的图片画得再好看，如果素材格式不符合规范，审核也会被秒拒。以下是根据实测总结的硬性要求：

3.1 表情包主体

数量：必须提交 8~24 个。
尺寸：必须是 240x240 像素。

3.2 宣传素材要求

素材名称	尺寸 (px)	背景要求	核心要点
详情页横幅	750x400	非透明、非纯白	不能有文字、不能有白边，画面要有故事感。
表情封面图	240x240	必须透明	建议不带文字，突出形象。
聊天面板图标	50x50	必须透明	通常使用主角的大头照。
赞赏引导图	750x560	不限	背景不能为白，重点在于引导。
赞赏致谢图	750x750	不限	表达感谢之情。

3.3 审核常见的坑

透明背景：如果你让 Nano Banana 出透明背景图，它可能会生成灰白棋盘格背景。虽然不能直接用，但在 PS 中可以通过“一键抠图”轻松处理。
- 进阶技巧：若背景复杂不好扣，建议让 AI 出 纯白背景，PS 的魔棒工具一键即可清除。
文字禁忌：横幅（Banner）中严禁出现任何文字、数字或符号。
违规元素：图片中不能出现任何品牌 Logo、水印或未经授权的版权形象。

4. 保姆级 AI 提示词分享

为了让 AI 更好地辅助你构思和描述，你可以将以下这段“表情包策划专家”提示词复制给 GPT-4 或 Claude，让它为你生成完美的制作需求文档。

AI 表情包策划专家指令 (System Prompt)

#### **角色与核心任务**
你是一个专业的AI表情包策划专家。你的核心任务是与用户高效协作，通过一个结构化的引导流程，共同创作并最终生成一份专业、可直接交付给设计师或AI绘画工具的微信表情包制作需求文档。

**核心原则：**
* **AI主导创意，用户主导决策**：你主动提出角色、动作、配文方案。
* **严格遵守规范**：严格执行微信官方对尺寸、透明度和横幅禁字的要求。

#### **核心工作流**
1. **阶段一：需求探索** - 确认角色形象（复刻或是重新设计）及数量类型。
2. **阶段二：方案生成** - 内部构思角色性格、全套表情画面描述及配文。
3. **阶段三：引导反馈** - 向用户呈现方案并引导其对配文和宣传图做出调整。
4. **阶段四：生成文档** - 产出符合开发者/设计师阅读习惯的需求文档。

#### **最终交付文档模板示例**
# 微信表情包制作需求文档：[项目名]
## 1. 角色设定
* **核心性格**：[例如：佛系小橘猫]
* **特征描述**：[分点描述细节]
## 2. 具体表情需求
* **表情1**：[画面描述] / [配文指令]
## 3. 规范要求
* **横幅(750x400)**：无文字，纯视觉背景。
* **封面(240x240)**：透明背景。
* **图标(50x50)**：透明背景。

提示：你可以直接将这段 Prompt 喂给 AI，然后告诉它：“我想做一个关于[XX主题]的表情包”，它就会一步步引导你完成策划。

5. 结语

使用 AI 制作微信表情包，最重要的不是“画工”，而是“创意”与“对规则的理解”。希望这篇指南能帮你绕过那些繁琐的审核坑位的，早日让你的作品在微信平台上线！

如果你在制作过程中遇到任何问题，欢迎在评论区交流。

Vibe Coding：把’凭感觉用 AI 写代码’升级成一套可交付的方法论

2025-12-19T00:00:00+00:00

Vibe Coding：把”凭感觉用 AI 写代码”升级成一套可交付的方法论

Vibe Coding 最吸引人的地方是：你不用从零搭框架、不用逐行敲样板代码，甚至不必每段代码都读懂——只要描述”我想要什么”，AI 就能迅速给出一个功能性验证通过 (Functional Validation Passed) 的版本。它最危险的地方也在这里：当你把”工程控制权”让渡出去，复杂度、隐性 bug 与安全风险会以更快速度累积。

这篇文章想做一件事：把 Vibe Coding 从”爽感操作”变成”可复用、可验证、可回滚、可维护”的工程流程，其实质是将其升级为一种高可控的意图驱动开发 (Intent-Driven Development, IDD)。

1. 什么是 Vibe Coding（以及它不是啥）

Vibe Coding 可以理解为一种新的开发交互范式：你主要用自然语言表达意图与约束，AI 负责产出实现，你通过运行、测试、验收来驱动迭代。

它和传统”AI 辅助编程”的分界点在于：

AI 辅助编程：你仍然像工程师那样阅读/理解/审查代码，AI 提升效率。
Vibe Coding：你更像”导演/产品/架构+验收者”，把大量实现细节交给 AI，通过反馈推动前进。

这并不意味着你不需要工程能力，而是工程能力的重心从”具体编码实现”转移到了：

规划（Planning）
上下文管理（Context / Memory）
验证（Tests / Acceptance）
版本化与可回滚（Git / Diff / Commit）
生产化与持续稳健 (Productionalization & Stabilization)

维度对比：理解三种开发范式

维度	传统编程 (Standard)	AI 辅助 (Copilot style)	Vibe Coding + 工程约束
重心	敲代码、细节实现	审查代码、采纳建议	规划意图、验证交付
心流状态	逻辑构造、语法记忆	连续接受/修正辅助	高层设计、快速反馈循环
错误防控	依靠经验与静态检查	依靠代码审查 (Review)	依靠规划把关与自动化测试
交付感	砖块堆砌感	提速感	导演掌控感

2. 为什么 Vibe Coding 会翻车：三类”债”

Vibe Coding 的关键挑战往往不是”实现速度”，而是”交付质量在规模化时不可控”，容易陷入以下三类债务：

2.1 上下文债：缺乏对确定性的约束

你没定义边界条件、数据来源、错误策略、权限模型时，AI 会给一个”看起来合理”的默认世界。

2.2 复杂度债：架构碎片化 (Architectural Fragmentation)

几轮之后你会得到：

多套重复的 helper
互相矛盾的状态管理
风格不一致的架构拼贴
牵一发动全身的”纸牌屋”

2.3 验证债：能跑 ≠ 对；能过 demo ≠ 能上生产

并发、边界、集成、安全、性能与可观测性这些”生产级成本”，很难只靠 prompt 兜住。

3. 核心共识：Planning is everything

社区最一致的最佳实践可以浓缩成一句话：

清晰规划比盲目”让 AI 自由发挥”更重要。

具体怎么做？

先写设计文档：

游戏：GDD
应用：PRD 用 Markdown 写清：目标、用户路径、非目标、约束、体验偏好、风险偏好。

再让 AI 基于文档 + 技术选型生成实现计划（Implementation Plan），而不是直接开写。
实现计划必须”小步可验证”：每一步都要带测试/验收方式。

这一步的意义是：你把 AI 的创造力限定在”实现层”，把系统的可控性留在”规划层”。

4. 维持上下文一致性：`.ai/` 记忆库是地基

Vibe Coding 最大的问题之一是”上下文漂移”：你换个对话、过两天再继续、或者中途试过几个方向，模型很容易失忆或混淆。

解决方案就是 AI 记忆库（Memory Bank）：把关键上下文固化成文件，让 AI 每次都”从同一份真相开始”。

4.1 为什么用 `.ai/` 作为目录名？

我们推荐使用 .ai/ 而不是 memory-bank/，理由如下：

优点	说明
隐藏目录	以 `.` 开头，不污染项目主结构，类似 `.git`、`.vscode`、`.github`
语义明确	一眼就知道是”AI 相关配置/上下文”，无需额外解释
通用性强	不绑定特定工具（Cursor、Copilot、Claude 都能用）
未来兼容	随着 AI 工具生态发展，`.ai/` 可能成为行业惯例

4.2 推荐目录结构

.ai/                          # AI 记忆库根目录
├── prd.md                    # 产品需求文档
├── tech-stack.md             # 技术选型
├── architecture.md           # 架构设计
├── implementation-plan.md    # 实现计划
├── progress.md               # 进度日志（每次更新）
└── features/                 # 功能模块文档
    └── feature-xxx.md

4.3 如何让 AI 读取记忆库？

核心问题：AI 不会自动读取这些文件，你需要主动”喂”给它。

有三种方式：

方式	适用场景	操作方法
手动引用	通用（任何 AI）	每次对话开头说：”请先阅读 `.ai/prd.md`、`.ai/architecture.md`、`.ai/progress.md`”
工具自动加载	Cursor	在 `.cursor/rules` 或项目设置中配置自动读取规则
提示词模板	通用	把”读取记忆库”写进你的标准开场提示词（见第 11 节）

最佳实践：把”必须先读记忆库”写进 .ai/prd.md 的开头，形成自引用约束——AI 一旦读了 PRD，就知道每次都要先读这些文件。

4.4 三条硬规则

Always Read Rule：每次开始任务前，AI 必须先读 .ai/architecture.md、.ai/prd.md、.ai/progress.md。
Progress is Source of Truth：每完成一步就更新 .ai/progress.md（完成了什么、遇到什么坑、做了什么决策）。
One Step, One Commit：每个 step 完成并验证后立刻 commit，确保随时可回滚。

5. 标准工作流：Vibe → Plan → Build → Verify → Productionalize

这是一套可以从个人项目一路用到”可上线”的流程。

5.1 Vibe：把”感觉”压缩成一页纸

.ai/prd.md 建议结构：

Goal & Objective：核心目标与可度量结果
Non-goals：明确不做什么
User journeys：3–5 条核心路径
Constraints：性能/成本/隐私/合规/时间
Definition of Done：什么算成功（可验证）

这一步不是写长 PRD，而是写”意图压缩包”。

5.2 Plan：让 AI 出实现计划，但你要”把关”

.ai/implementation-plan.md 每一步必须包含：

改哪些文件/模块
新增/修改的接口
验收方式（测试/脚本/手工 checklist）
风险点（安全、边界、回滚）

一个好用的 step 模板：

## Step N: <目标>

### Changes
- Files/modules:
- Public API changes:

### Acceptance
- [ ] Unit tests:
- [ ] Integration / E2E:
- [ ] Manual checklist:

### Risks & Rollback
- Risks:
- Rollback plan:

5.3 Build：只允许”小步提交”，拒绝一口吞项目

一次只做一个 Step
AI 交付后：你先跑验收（或让它提供运行命令，你执行）
不通过：修到通过再进入下一步
通过：更新 progress + commit

5.4 Verify：把正确性从”感觉”变成”证据”

最靠谱的习惯是：

先写验收/测试，再写实现（至少先写测试骨架与边界用例）
每一步都能重复运行：npm test / pytest / make test 等

5.5 Productionalize：生产级交付与”去感性重构” (De-vibe Refactoring)

当代码进入准生产环境或用户侧，必须切换到”专业工程模式”：

架构收敛与重构：执行 De-vibe Refactoring，统一目录、抽象层、状态流，消除 AI 随机生成的架构毛刺。
安全加固：输入校验、权限、依赖审计、密钥管理。
可观测性：日志、指标、告警、错误追踪。

6. Feature-specific 文档：加功能不再”拆家”

当 base app/game 完成后，再加大功能（UI、音效、支付、导出、同步……）时最容易失控。正确姿势是：每个大功能单独写一个 .ai/features/feature-xxx.md，列出小步骤 + 验收。

模板示例：

# Feature: 

## Goal
- ...

## Non-goals
- ...

## Design
- UI/UX notes:
- Data flow:
- Error handling:

## Steps
### Step 1 ...
- Acceptance: ...
### Step 2 ...
- Acceptance: ...

## Risks
- ...

7. 卡住与错误处理：别”继续抽卡”，要系统诊断

当 AI 生成出错或你陷入循环时，用这套顺序：

回滚到上一步（/rewind 的精神）：先回到”最后一个通过验收的 commit”
提供可诊断输入：完整报错、复现步骤、环境信息、预期 vs 实际
缩小问题面：让 AI 先解释模块与数据流（/explain），再提出最小 diff 修复方案
必要时全局诊断：把 repo 汇总成单文件或提供关键目录，让它从整体视角找架构漂移/循环依赖/状态错位

8. 工具使用策略：控制变量比省钱更重要

社区经验非常务实：可预测性优先于效率 (Predictability over Efficiency)。

小任务：要求收敛、少发散、快速验证
大任务：要求先方案、后实现、带风险清单

同时强烈建议”CLI + IDE”组合：

CLI 看 diff、跑测试、做 commit（节奏更像工程）
IDE 插件让你更快定位与编辑（效率更像创作）

再加一条”命令化工作流”会非常稳：

/plan：先产出计划
/explain：先解释现状与关键模块
/risk：先列风险与边界
/tests：先生成验收与测试

9. 关于”Vibe Coding 能不能直接做生产级应用”：正确答案是”取决于你是否工程化”

有人说”完全靠 vibe coding 就能做出 SAP / Salesforce 级系统”——这确实不现实。原因不是”AI 不够强”，而是生产级软件的成本大头从来不只在”写代码”：

边界条件与异常流
集成与迁移
安全、合规、审计
性能、稳定性、可用性
长期维护与持续迭代

但这并不否认 Vibe Coding 的价值：

它是强大的原型加速器：极快验证想法、跑通主路径。
经验丰富的工程师使用 AI，确实可能快速完成大量编码实现工作量，但仍需要用工程流程兜底。

更贴近现实的定位是：

AI 是加速器，不是替代品； vibe 是创造力，verify 才是交付力。

10. 实战案例：用这套流程做「RSS 智能摘要推送」

光讲方法论太抽象，下面用一个真实场景走一遍完整流程：做一个 RSS 智能摘要工具，自动抓取订阅源、用 AI 生成摘要、推送到 Slack/邮件。

10.1 Vibe 阶段：写 PRD

# Goal
每天早上 8 点，自动抓取 5 个 RSS 源的最新文章，用 AI 生成 3 句话摘要，推送到 Slack。

# Non-goals
- 不做 UI 界面（MVP 用配置文件 + Cron）
- 不做用户系统

# Constraints
- 单次推送消息 <2000 字符（Slack 限制）
- 运行成本 < $5/月

10.2 Plan 阶段：拆解 Implementation Plan

Step	目标	验收标准
1	RSS 解析模块	能解析 3 种格式（RSS 2.0 / Atom / RDF），单元测试覆盖
2	AI 摘要模块	输入文章内容，输出 ≤3 句话，有 fallback 策略
3	Slack 推送	Webhook 发送成功，消息格式正确
4	调度与集成	本地 Cron 运行通过，日志可查
5	生产化	部署云函数，添加重试与告警

10.3 Build 阶段：逐步实现

每完成一个 Step，先跑验收：

# Step 1 验收
pytest tests/test_rss_parser.py -v

# Step 3 验收
python -c "from slack import send; send('测试消息')"

发现问题：Step 2 时遇到了”长文章 token 超限”——于是进入 卡住处理流程：

回滚到 Step 1 的 commit
让 AI 先解释 token 计算逻辑
增加”分段摘要 + 合并”策略，更新 Plan

10.4 三类债的实际暴露

债务类型	具体表现	解决方式
上下文债	AI 第一版没处理 Atom 格式	PRD 里明确列出支持格式
复杂度债	生成了 3 个重复的 HTTP 请求封装	De-vibe 重构，统一到 `utils/http.py`
验证债	摘要质量无法自动测	加人工 checklist：每周抽查 10 条

这个案例浓缩了本文的核心：Vibe 提速、Plan 兜底、Verify 交付、Productionalize 上线。

11. 给你一份”直接可用”的把关提示词

把这段放进你的每次新对话开头（尤其是换 chat 的时候）：

在开始写代码前请执行把关流程：

1) 先阅读 .ai/prd.md、.ai/architecture.md、.ai/progress.md
2) 复述需求（含你不确定的点清单）
3) 给出 implementation plan（小步、每步带验收）
4) 仅在我确认 plan 或 Step 1 验收标准后，才开始生成代码
5) 每次只实现一个 step，输出最小 diff，并告诉我如何运行验收

结语：把 Vibe 留给探索，把工程留给交付

Vibe Coding 最好的用法，不是”省掉工程”，而是把工程前置与外化：

用规划避免架构漂移
用 .ai/ 记忆库把上下文固定成可重复使用的”项目记忆”
用测试与验收把”感觉正确”变成”证据正确”
用 commit 把迭代变成”可回滚的进化”
用生产化加固把原型变成系统

下面是一套可以直接复制到项目里的 .ai/ 记忆库初始文件模板：

附录：`.ai/` 记忆库完整模板

使用说明：在项目根目录创建 .ai/ 文件夹，将以下模板复制进去。每次与 AI 对话前，提示它先读取这些文件。

📄 .ai/prd.md

# 产品需求文档 (PRD)

> ⚠️ **AI 必读规则**：每次开始任务前，请先阅读本文件、`architecture.md` 和 `progress.md`，确保理解项目上下文。

## 项目名称


## Goal & Objective

- 目标：
- 成功指标：

## Non-goals

- 不做：
- 不做：

## User Journeys

1. 用户想要 ___，所以他 ___，最终 ___
2. 用户想要 ___，所以他 ___，最终 ___
3. 用户想要 ___，所以他 ___，最终 ___

## Constraints

- 性能：
- 成本：
- 时间：
- 其他：

## Definition of Done

- [ ] 
- [ ] 
- [ ] 

📄 .ai/tech-stack.md

# 技术选型

## 语言 & 运行时
- 语言：
- 版本：

## 框架
- 前端：
- 后端：
- 其他：

## 数据存储
- 数据库：
- 缓存：
- 文件存储：

## 基础设施
- 部署平台：
- CI/CD：
- 监控：

## 第三方服务
- 认证：
- 支付：
- 其他 API：

## 开发工具
- IDE：
- AI 工具：
- 其他：

📄 .ai/architecture.md

# 架构设计

## 系统概览


## 核心模块

### 模块 1: [名称]
- 职责：
- 输入：
- 输出：
- 依赖：

### 模块 2: [名称]
- 职责：
- 输入：
- 输出：
- 依赖：

## 数据流

用户输入 → [模块A] → [模块B] → 输出/存储


## 目录结构

project/ ├── src/ │ ├── core/ # 核心业务逻辑 │ ├── api/ # 接口层 │ ├── utils/ # 工具函数 │ └── config/ # 配置 ├── tests/ # 测试 ├── docs/ # 文档 └── .ai/ # AI 记忆库

## 关键设计决策
| 决策 | 选项 | 选择 | 理由 |
|------|------|------|------|
| | | | |

## 已知限制 & 技术债
- 

📄 .ai/implementation-plan.md

# 实现计划

## 概览
- 预计总步骤数：
- 当前进度：Step __ / __

---

## Step 1: [目标]

### Changes
- Files/modules：
- Public API changes：

### Acceptance
- [ ] Unit tests：
- [ ] Integration / E2E：
- [ ] Manual checklist：

### Risks & Rollback
- Risks：
- Rollback plan：

---

## Step 2: [目标]

### Changes
- Files/modules：
- Public API changes：

### Acceptance
- [ ] Unit tests：
- [ ] Integration / E2E：
- [ ] Manual checklist：

### Risks & Rollback
- Risks：
- Rollback plan：

---

## Step 3: [目标]

📄 .ai/progress.md

# 项目进度日志

> **规则**：每完成一个 Step 就更新本文件。记录：完成了什么、遇到什么坑、做了什么决策。

---

## [日期] - Step N 完成

### ✅ 完成内容
- 

### 🐛 遇到的问题
- 问题：
- 解决：

### 📝 决策记录
- 决策：
- 理由：

### 📌 下一步
- 

---

## [日期] - 项目启动

### ✅ 完成内容
- 初始化项目结构
- 创建 .ai/ 记忆库
- 完成 PRD 和技术选型

### 📌 下一步
- 开始 Step 1

📄 .ai/features/feature-template.md

# Feature: [功能名称]

## Goal

- 

## Non-goals

- 

## Design

### UI/UX Notes

- 

### Data Flow

- 

### Error Handling

- 

## Steps

### Step 1: [子目标]
- Changes：
- Acceptance：

### Step 2: [子目标]
- Changes：
- Acceptance：

## Risks
-

快速开始：

# 在项目根目录创建 .ai/ 记忆库
mkdir -p .ai/features

# 创建核心文件（复制上面的模板内容）
touch .ai/prd.md .ai/tech-stack.md .ai/architecture.md
touch .ai/implementation-plan.md .ai/progress.md
touch .ai/features/feature-template.md

# 将 .ai/ 加入版本控制
git add .ai/
git commit -m "chore: init AI memory bank"

现在你已经有了一套完整的 Vibe Coding 工程化工具包，开始用它来驯服 AI 吧！

使用 Nano Banana Pro 进行老照片修复 - 高真实感人像修复完整指南

2025-12-17T01:20:00+00:00

使用 Nano Banana Pro 进行老照片修复

概述

本文将详细介绍如何使用 Nano Banana Pro 对老照片进行高真实感修复。该方法的核心是在不改脸、不美颜、不换脸的前提下，实现照片的高清修复增强，包括：清晰度提升、噪点清除、柔光棚拍效果、85mm 浅景深、自然肤质保留和电影感调色。同时，我们会使用负向提示严格防止风格跑偏、磨皮、假脸、伪影和畸形等问题。

完整提示词配置

{
  "task": "portrait_restoration",
  "language": "zh-CN",
  "prompt": {
    "subject": {
      "type": "human_portrait",
      "identity_fidelity": "match_uploaded_face_100_percent",
      "no_facial_modification": true,
      "expression": "natural",
      "eye_detail": "sharp_clear",
      "skin_texture": "ultra_realistic",
      "hair_detail": "natural_individual_strands",
      "fabric_detail": "rich_high_frequency_detail"
    },
    "lighting": {
      "exposure": "bright_clear",
      "style": "soft_studio_light",
      "brightness_balance": "even",
      "specular_highlights": "natural_on_face_and_eyes",
      "shadow_transition": "smooth_gradual"
    },
    "image_quality": {
      "resolution": "8k",
      "clarity": "high",
      "noise": "clean_low",
      "artifacts": "none",
      "over_smoothing": "none"
    },
    "optics": {
      "camera_style": "full_frame_dslr",
      "lens": "85mm",
      "aperture": "f/1.8",
      "depth_of_field": "soft_shallow",
      "bokeh": "smooth_natural"
    },
    "background": {
      "style": "clean_elegant",
      "distraction_free": true,
      "tone": "neutral"
    },
    "color_grading": {
      "style": "cinematic",
      "saturation": "rich_but_natural",
      "white_balance": "accurate",
      "skin_tone": "natural_true_to_subject"
    },
    "style_constraints": {
      "no_cartoon": true,
      "no_beauty_filter": true,
      "no_plastic_skin": true,
      "no_face_reshaping": true,
      "no_ai_face_swap": true
    }
  },
  "negative_prompt": [
    "cartoon",
    "anime",
    "cgi",
    "painterly",
    "plastic skin",
    "over-smoothing",
    "over-sharpening halos",
    "heavy skin retouching",
    "face reshaping",
    "identity drift",
    "face swap",
    "beauty filter",
    "uncanny",
    "washed out",
    "color cast",
    "blown highlights",
    "crushed shadows",
    "banding",
    "jpeg artifacts",
    "extra fingers",
    "deformed eyes",
    "asymmetrical face",
    "warped features"
  ],
  "parameters": {
    "fidelity_priority": "identity",
    "detail_priority": "eyes_skin_hair_fabric",
    "realism_strength": 0.95,
    "sharpening": "micro_contrast_only",
    "skin_retention": "keep_pores_and_microtexture",
    "recommended_denoise": "low_to_medium"
  }
}

配置说明

以上是一个人像修复/人像增强的结构化配置，它将修复效果拆分为多个维度（人物、光线、画质、镜头、背景、调色、禁用项等），让 AI 模型严格按照这些规则处理你上传的照片。

字段详细解释

顶层字段

task: "portrait_restoration"
任务类型：人像修复/还原（通常指提升清晰度、去噪、补细节、纠正曝光/色彩，但尽量不”整容”）。
language: "zh-CN"
语言偏好（对结构化字段本身影响不大，更多是给系统/日志或某些可读提示用）。

prompt（正向要求：你想要什么）

1. subject（主体：人像该长什么样）

type: "human_portrait"
主体是人像。
identity_fidelity: "match_uploaded_face_100_percent"
身份一致性优先——尽量 100% 匹配你上传的人脸（不跑脸、不换人）。
no_facial_modification: true
不做脸型/五官结构修改（避免”变好看但不像本人”）。
expression: "natural"
表情自然。
eye_detail: "sharp_clear"
眼睛细节清晰锐利。
skin_texture: "ultra_realistic"
皮肤质感真实（毛孔/细纹保留，而不是磨皮）。
hair_detail / fabric_detail
头发要有根根分明的自然细节；衣物纹理要细、信息量高。

2. lighting（光照）

bright_clear / soft_studio_light / even
明亮干净、柔和棚拍光、亮度均匀。
specular_highlights: natural_on_face_and_eyes
面部和眼睛的高光要自然（不油、不假）。
shadow_transition: smooth_gradual
阴影过渡平滑（不生硬、不脏）。

3. image_quality（画质目标）

resolution: "8k"
目标是超高分辨率（更多是”追求很高细节”的意图，未必真输出 8K）。
clarity: high / noise: clean_low / artifacts: none
高通透、低噪点、无压缩块/伪影。
over_smoothing: none
禁止过度平滑（防”塑料皮肤”）。

4. optics（镜头/景深风格）

full_frame_dslr + 85mm + f/1.8
模拟全画幅 + 85mm 人像头 + 大光圈。
soft_shallow DOF + smooth_natural bokeh
浅景深、背景虚化柔和自然。

5. background（背景）

clean_elegant / distraction_free / neutral
干净高级、不抢主体、中性背景色调。

6. color_grading（调色）

cinematic
偏电影感的整体色调。
rich_but_natural saturation
饱和度丰富但不夸张。
white_balance accurate / skin_tone natural
白平衡准确、肤色真实。

7. style_constraints（风格约束：明确禁止）

no_cartoon / no_beauty_filter / no_plastic_skin / no_face_reshaping / no_ai_face_swap
明确：不要二次元、不要美颜滤镜、不要塑料皮、不要改脸型、不要 AI 换脸。

negative_prompt（负向提示：你不想要什么）

这是一长串”避雷清单”，用来强行压制常见问题，比如：

风格跑偏：cartoon、anime、cgi、painterly
皮肤处理过度：plastic skin、over-smoothing、heavy retouching、beauty filter
身份漂移：identity drift、face swap
画面问题：washed out、color cast、blown highlights、crushed shadows、banding、jpeg artifacts
畸形/瑕疵：extra fingers、deformed eyes、asymmetrical face、warped features 等

parameters（偏好/强度参数：怎么权衡）

fidelity_priority: "identity"
优先保证”像本人”。
detail_priority: "eyes_skin_hair_fabric"
细节优先级：眼睛/皮肤/头发/布料。
realism_strength: 0.95
写实强度很高（越接近 1 越强调真实）。
sharpening: "micro_contrast_only"
只做微对比锐化，避免锐化光晕。
skin_retention: keep_pores_and_microtexture
保留毛孔与微纹理。
recommended_denoise: low_to_medium
建议去噪强度低到中等（避免糊）。

总结

通过以上结构化配置，Nano Banana Pro 能够在严格保持人物原貌的前提下，对老照片进行高真实感修复。这种方法的优势在于：

身份保真：100% 保持原人物面部特征，不跑脸、不换人
真实质感：保留皮肤毛孔、细纹等自然细节，避免塑料感
专业效果：模拟专业棚拍的光影效果和电影感调色
细节丰富：8K 高清输出，眼睛、头发、衣物纹理细节清晰
严格约束：通过负向提示避免常见 AI 修复问题

该配置适用于各种老照片修复场景，特别是需要高度保真的珍贵照片修复。