问题
选择 SKILL 缺少可靠依据
Claude Code 和 Codex 有大量社区 skills 与 MCP servers。许多项目散落在 GitHub 仓库中,缺少统一的评审信息。安装前,你往往很难判断它的权限需求、运行行为和维护状态。
CldKit 通过评审和 sandbox 运行记录补充这些信号。每个进入推荐面的 component 都会先经过测试;你可以在线试用、比较方案,再决定是否安装。
愿景
让 AGENT 工具变得可信
选择 agent 工具应该更像选择经过审查的依赖。CldKit 的目标是把分散的 Skills 和 MCP servers 整理成有证据支撑的决策信息。
证据优先
我们优先看运行记录、仓库元数据和评审笔记,而不是模糊的流行度。
边界清楚
sandbox 结果是信号,不是万能安全保证。我们会说明测了什么,也说明没覆盖什么。
新鲜度重要
Skills 会漂移。版本、仓库活跃度和审计时间会被追踪,避免旧评审看起来像新结论。
工作方式
AGENT + SANDBOX
策展 Agent
阅读每个 components,按三个维度评分,并回答它是否适合你的技术栈。
在线 Sandbox
在隔离环境中运行任何支持 Try Live 的 skill。把项目凭证交给它之前,先看到真实输出。
评审层
在组件被推荐之前,结合自动检查、sandbox 行为、版本新鲜度和人工判断。
评审方法
我们如何把一个仓库变成决策
分数是评审证据的压缩摘要。打开下面的维度,可以看到每项含义、sandbox 如何参与,以及我们的结论边界在哪里。
35 分
安全风险优先于便利性。
Token 处理、网络调用、依赖卫生、提示注入暴露面。
我们检查什么
信任与安全
数据处理
公开目录页面对所有人可见。用户对话、提交和账户数据用于运行 CldKit,并提升评审质量。
Sandbox 隔离
Sandbox 会将测试运行与本地项目分离。隔离可以降低影响范围,但它仍然是有明确边界的测试环境。
API Key 风险
把每个 MCP 或 Skill 都当作可能接触凭证的代码。优先使用可撤销、低权限、限定范围的 token,不要把生产 secrets 粘到 demo 里。
漏洞反馈
如果你发现安全问题、不安全组件、评分不准确或下架诉求,请把细节发到我们的联系邮箱,我们会处理。
收录策略
宁少但要跑过
我们更倾向于列出 100 个已运行验证的 components,而不是堆叠 10,000 个未经验证的链接。如果某个 skill 还不在这里,它可能还在队列中,或尚未通过评审。欢迎提交。