创建第一个任务

选择 AI 模型

进入新建任务页面后，页面左上角有一个模型选择器。这个选择器就像是你给搭档选「脑子」——不同的模型擅长的事情不太一样。

打开下拉菜单后，有些模型名字旁边带有小图标：

🧠 大脑图标（深度思考）：该模型支持深度推理，适合复杂分析、多步逻辑推导、写技术方案等任务，执行前会认真「想」一会儿
👁️ 眼睛图标（图片识别）：该模型能直接「看懂」图片，适合分析截图、识别图片中的文字内容

大多数时候，保持默认就好。以下几种情况可以主动切换：

任务类型	建议选择
写邮件、翻译、日常问答	默认模型即可，响应快
需要分析图片或截图	选带 👁️ 图标的模型
复杂推理、制定方案、代码架构设计	选带 🧠 图标的模型

如果你想让模型分析图片，但当前选中的模型没有 👁️ 图标，可以在设置 → 通用 → 视觉模型中配置一个备用的识图模型，当主模型不支持识图时，JimoClaw 会自动切换过去。

输入你的需求

接下来是最关键的一步——告诉 AI 你想做什么。在页面的正中央，你会看到一个输入框，这是你「下达任务」的地方。

任务描述和普通聊天不一样

在 JimoClaw 里下达任务，和在普通聊天软件里「聊天」有本质区别：

每次输入都有成本，比普通 AI 聊天贵得多。AI 执行一个任务需要调用工具、运行代码、联网搜索，每一步都在消耗额度
不要以寒暄开头：不用说「你好」、「请问」、「麻烦问一下」——直接说你要做什么
一次说清楚：如果第一条消息太模糊，AI 会反复来回确认，反而消耗更多额度、效率更低。越具体的需求，结果越好、也越省钱

低效的写法（不推荐）：

你好，我想让你帮我做点事情，能处理 Excel 表格吗？

高效的写法（推荐）：

我有一份销售数据表 sales.xlsx（已上传），请按月份汇总总销售额，生成一份 Markdown 格式的报告，包含每月环比增长率，最后给出结论。

区别在于：直接、具体、包含所有必要信息，一次说清楚不需要 AI 反复确认。

快捷操作按钮

如果你不确定该怎么开始描述需求，输入框下方有四个快捷按钮可以帮到你：

搜索整理资料

点击后输入框会出现模板文字：

请帮我搜索关于【主题】的资料，整合来自多个来源的信息，去除重复内容，按重要性排序后生成一份结构清晰的 Markdown 摘要报告。

你只需要把【主题】替换成你感兴趣的内容就行了。比如：

请帮我搜索关于 2026 年新能源汽车补贴政策的资料，整合来自多个来源的信息，去除重复内容，按重要性排序后生成一份结构清晰的 Markdown 摘要报告。

编写自动化脚本

适合重复性工作。模板内容：

请帮我写一个自动化脚本，实现【描述你的需求，例如：批量重命名文件夹下所有 jpg 图片，加上日期前缀】，使用 Python，并添加错误处理和日志输出。

起草一封邮件

写邮件时不知道怎么措辞？模板内容：

请帮我起草一封专业的工作邮件。收件人：【姓名/角色】；主题：【邮件目的】；背景：【简要说明情况】。语气正式，结构清晰，控制在 300 字以内。

你可以这样填：

请帮我起草一封专业的工作邮件。收件人：项目经理王总；主题：申请下周一请假一天；背景：家中有事需要处理，手头工作已和同事交接完毕。语气正式，结构清晰，控制在 300 字以内。

翻译文档

需要把内容翻译成其他语言。模板内容：

请将以下内容从【源语言】翻译成【目标语言】，保留原文格式（标题、列表、代码块等），专业术语使用行业标准译法，翻译完成后附上关键术语对照表。

小贴士：这四个按钮本质上就是帮你写好了「提示词模板」。等你用熟练之后，完全可以自己写更个性化的提示词，不受这些模板的限制。

上传文件和图片

如果你的需求涉及某个文件——比如想让 AI 帮你翻译一份 PDF、分析一个 Excel 表格——可以直接把文件发给它：

点击输入框左下角的「+」按钮，选择「上传文件」
或者直接把文件从文件夹拖拽到输入框里

上传成功后，文件会以小卡片的形式显示在输入框上方，确认没问题后一起发送即可。

图片的处理逻辑：上传图片后，JimoClaw 需要一个支持识图的模型来「看」图片。如果你当前选中的模型带有 👁️ 图标，它会直接处理图片；如果模型不支持识图，JimoClaw 会自动调用你在设置中配置的「视觉模型」来处理图片内容。如果两者都没有，AI 就只能忽略图片、仅根据文字回复。

支持的图片格式：PNG、JPG、JPEG、GIF、WEBP、BMP、SVG。图片以 base64 格式内嵌在消息中，不会上传到外部服务器，隐私更安全。

与 AI 对话互动

消息发出之后，AI 就开始工作了。你会看到它的回复区域出现各种内容，下面逐一解释你会看到的情况。

文字流式输出

最常见的情况是 AI 直接用文字回复你。它的回复不是一下子全部弹出来，而是一个字一个字逐渐显示的——就像有人在对面打字给你看一样。这叫「流式输出」，好处是你不用干等着，一边出内容就可以一边开始看。

「深度思考中」——AI 正在分析问题

有时候，AI 遇到比较复杂的问题，会先认真想一想再回答。你会看到一个「深度思考中」的提示，通常还会带一个折叠区域。这就像你问同事一个棘手的问题，他会先皱着眉头想一会儿，再给你一个靠谱的答案。

如果你好奇 AI 到底在想什么，可以点击展开，看看它的思考过程——它在考虑哪些方面、排除了哪些方案、最终怎么得出结论的。不想看也没关系，折叠着完全不影响使用。等它想完了，自然会给你一个完整的回复。

工具调用——AI 正在帮你干活

这是 JimoClaw 最有特色的地方。当 AI 需要执行实际操作时——比如搜索网页、读取文件、运行代码——你会看到一个「工具调用」的提示卡片。卡片上会显示 AI 正在使用什么工具，以及工具的执行状态。

举个例子，当你让 AI「搜索并整理 AI 行业新闻」时，它不只是凭记忆回答，而是会真的去搜索网页，找到最新的信息，然后整理给你。工具调用卡片就是告诉你：「我正在帮你搜索，请稍等。」

总结一下你会看到的三种状态：

文字逐字出现——AI 在给你写回复
「深度思考中」——AI 在认真分析你的问题
工具调用卡片——AI 正在使用工具帮你执行操作

这三种状态可能会交替出现，完全正常。比如 AI 可能先思考一会儿，然后搜索网页，最后整理成文字给你。整个过程你只需要看着就行，不用做任何操作。

审批与权限

AI 在执行某些操作的时候——比如运行代码、修改文件——可能会弹出一个审批卡片，问你「我能不能做这件事？」

这是 JimoClaw 的安全保护机制，防止 AI 在你不知情的情况下做了不该做的事。

在任务输入框右下角的锁形按钮处可以选择三种权限模式：

询问（推荐）

这是默认模式，也是新手最合适的选择。AI 在执行运行代码、修改文件等操作之前，会弹出一个审批卡片，告诉你它打算做什么，等你点「允许」才继续。审批卡片会清楚告诉你 AI 打算做什么。比如「执行一个 Python 脚本来分析数据」或者「创建一个新文件 result.md」。你觉得没问题就点「允许」，觉得不对就点「拒绝」。

自动执行

AI 自主完成所有操作，不打断你。适合你对 AI 比较信任、或者任务简单且重复不想被频繁打断的场景。好处是效率高；需注意 AI 执行前不会征求你的同意。

每步确认

最严格的模式——AI 的每一个操作都需要你确认才能继续，包括非敏感操作。适合处理特别重要、绝对不能出错的任务时使用，过程会慢一些，但你对整个流程有完全掌控。

提示：任务发出后，权限模式也可以随时在任务详情页的输入框旁切换，对后续操作立即生效。

查看任务进度和产物

AI 执行任务时，界面右侧会出现一个信息面板。这个面板不只是显示「文件」，它贯穿任务全程，让你随时掌握 AI 在做什么。

任务待办（进度卡片）

任务开始后，右侧面板最上方会出现一个「任务待办」卡片，显示 AI 规划的步骤列表和整体进度。每个步骤有三种状态：

⭕ 待处理：还没开始
🔄 进行中：正在执行（旋转图标）
✅ 已完成：执行完毕

卡片顶部还有一个进度条和「X/Y 已完成」的计数，让你一眼看出整体进度。

子任务（当 AI 拆分任务时）

对于复杂任务，AI 会把它拆分成多个子任务并行或串行推进。这时面板中会出现「子任务」卡片，每个子任务有独立的状态：等待中、运行中、已完成、出错。

这个功能帮助你了解 AI 的工作分工——不是「等待结果」，而是能看到每一块工作的实际进展。

制品（生成的文件）

AI 完成任务后，生成的文件会以卡片形式列在面板底部。支持的文件类型包括：

图片（PNG、JPG 等）
文档（PDF、Word、Markdown 等）
代码文件（Python、JavaScript 等）
网页（HTML）

点击文件卡片，JimoClaw 会直接在应用内打开预览窗口，无需下载就能先看内容——图片可以直接查看、代码高亮显示、网页直接渲染、PDF 可翻页阅读。如果预览后满意，点击下载按钮保存到你的电脑。

提示：右侧面板在窗口足够宽时（大屏）始终显示；在窄窗口模式下，只有当有文件生成时才会显示。如果看不到面板，可以拖宽窗口。

继续对话

任务完成之后并不是就结束了。你可以继续跟 AI 对话，就像微信聊天一样自然。

觉得结果哪里不太对？直接告诉它「再详细一些」或者「换个角度分析」。想补充新需求？尽管说。需要上传一份新文件让它接着处理？也可以。

AI 会记住你之前说了什么，所以不需要重复解释背景。你只管像平时聊天一样往下说就好。

示例任务

以下是一些常见的任务场景：

文档处理：「读取桌面的销售数据.xlsx，生成一份月度销售报告」
批量操作：「将下载文件夹中所有 PDF 文件的首页提取出来，保存为图片」
信息整理：「帮我搜索并整理最近一周的 AI 行业新闻，来源不少于 5 个，按重要性排序」
翻译文档：「把这份英文报告翻译成中文，保留原文的格式和表格结构」