Claude Code Skills GitHub Skills GitHub Copilot Skills Browser Automation Skills Marketing Skills Frontend Development Skills Research Skills Design Skills

agent-evaluation

supercent-io

作者 supercent-io

24

最近更新 2026/3/6

Design and implement comprehensive evaluation systems for AI agents. Use when building evals for coding agents, conversational agents, research agents, or computer-use agents. Covers grader types, benchmarks, 8-step roadmap, and production integration.

agent-evaluationevalsAI-agentsbenchmarksgraderstestingquality-assurance

适用平台

最适合: Claude Code

这个 skill 适合解决什么

Design and implement comprehensive evaluation systems for AI agents. Use when building evals for coding agents, conversational agents, research agents, or computer-use agents. Covers grader types, benchmarks, 8-step roadmap, and production integration.

如果你在找一个围绕 Claude Code Skills、GitHub Skills 展开的 skill，这个页面会帮助你判断它是不是值得进入标准工具箱。

相关应用

相关场景

Browser Automation Skills Marketing Skills Frontend Development Skills Research Skills Design Skills

安装位置与仓库信号

仓库路径

.agent-skills/agent-evaluation/

许可证

未声明

下载量

0

最近更新

2026/3/6

常见问题

Loading files...

获取 Skill

相关专题

Claude Code Skills

聚合适合 Claude Code 的 skills，覆盖编程、自动化、浏览器任务与文档流程。页面重点放在与 Claude Code 约定和目录结构匹配的技能。

浏览适用于 pull request、issue triage、workflow automation 和仓库维护的 GitHub skills。

GitHub Copilot Skills

浏览与 GitHub Copilot 相关的 Agent Skills，按平台语境聚合安装线索、最佳实践和高价值 skill。

Browser Automation Skills

查找适用于 Playwright 流程、Web 应用测试、抓取和 UI 校验的 browser automation skills。这个专题页聚合跨运行时的浏览器任务能力。

Marketing Skills

浏览适用于 campaign 构思、落地页规划、文案流程和增长实验的 marketing skills，重点聚合策略型工作流。

Frontend Development Skills

浏览适用于 React、Next.js、Tailwind、组件开发、UI 交付与重复前端工作流的 frontend development skills。

Research Skills

浏览与 Research 相关的 Agent Skills，按场景语境聚合安装线索、最佳实践和高价值 skill。

浏览与 Design 相关的 Agent Skills，按场景语境聚合安装线索、最佳实践和高价值 skill。

相关 Skills

steipete

steipete

steipete