创建第一个任务
学习如何创建和运行你的第一个 AI 任务
选择 AI 模型
进入新建任务页面后,页面左上角有一个模型选择器。这个选择器就像是你给搭档选「脑子」——不同的模型擅长的事情不太一样。
打开下拉菜单后,有些模型名字旁边带有小图标:
- 🧠 大脑图标(深度思考):该模型支持深度推理,适合复杂分析、多步逻辑推导、写技术方案等任务,执行前会认真「想」一会儿
- 👁️ 眼睛图标(图片识别):该模型能直接「看懂」图片,适合分析截图、识别图片中的文字内容
大多数时候,保持默认就好。以下几种情况可以主动切换:
| 任务类型 | 建议选择 |
|---|---|
| 写邮件、翻译、日常问答 | 默认模型即可,响应快 |
| 需要分析图片或截图 | 选带 👁️ 图标的模型 |
| 复杂推理、制定方案、代码架构设计 | 选带 🧠 图标的模型 |
如果你想让模型分析图片,但当前选中的模型没有 👁️ 图标,可以在设置 → 通用 → 视觉模型中配置一个备用的识图模型,当主模型不支持识图时,JimoClaw 会自动切换过去。
输入你的需求
接下来是最关键的一步——告诉 AI 你想做什么。在页面的正中央,你会看到一个输入框,这是你「下达任务」的地方。
任务描述和普通聊天不一样
在 JimoClaw 里下达任务,和在普通聊天软件里「聊天」有本质区别:
- 每次输入都有成本,比普通 AI 聊天贵得多。AI 执行一个任务需要调用工具、运行代码、联网搜索,每一步都在消耗额度
- 不要以寒暄开头:不用说「你好」、「请问」、「麻烦问一下」——直接说你要做什么
- 一次说清楚:如果第一条消息太模糊,AI 会反复来回确认,反而消耗更多额度、效率更低。越具体的需求,结果越好、也越省钱
低效的写法(不推荐):
你好,我想让你帮我做点事情,能处理 Excel 表格吗?
高效的写法(推荐):
我有一份销售数据表 sales.xlsx(已上传),请按月份汇总总销售额,生成一份 Markdown 格式的报告,包含每月环比增长率,最后给出结论。
区别在于:直接、具体、包含所有必要信息,一次说清楚不需要 AI 反复确认。
快捷操作按钮
如果你不确定该怎么开始描述需求,输入框下方有四个快捷按钮可以帮到你:
搜索整理资料
点击后输入框会出现模板文字:
请帮我搜索关于【主题】的资料,整合来自多个来源的信息,去除重复内容,按重要性排序后生成一份结构清晰的 Markdown 摘要报告。
你只需要把【主题】替换成你感兴趣的内容就行了。比如:
请帮我搜索关于 2026 年新能源汽车补贴政策的资料,整合来自多个来源的信息,去除重复内容,按重要性排序后生成一份结构清晰的 Markdown 摘要报告。
编写自动化脚本
适合重复性工作。模板内容:
请帮我写一个自动化脚本,实现【描述你的需求,例如:批量重命名文件夹下所有 jpg 图片,加上日期前缀】,使用 Python,并添加错误处理和日志输出。
起草一封邮件
写邮件时不知道怎么措辞?模板内容:
请帮我起草一封专业的工作邮件。收件人:【姓名/角色】;主题:【邮件目的】;背景:【简要说明情况】。语气正式,结构清晰,控制在 300 字以内。
你可以这样填:
请帮我起草一封专业的工作邮件。收件人:项目经理王总;主题:申请下周一请假一天;背景:家中有事需要处理,手头工作已和同事交接完毕。语气正式,结构清晰,控制在 300 字以内。
翻译文档
需要把内容翻译成其他语言。模板内容:
请将以下内容从【源语言】翻译成【目标语言】,保留原文格式(标题、列表、代码块等),专业术语使用行业标准译法,翻译完成后附上关键术语对照表。
小贴士:这四个按钮本质上就是帮你写好了「提示词模板」。等你用熟练之后,完全可以自己写更个性化的提示词,不受这些模板的限制。
上传文件和图片
如果你的需求涉及某个文件——比如想让 AI 帮你翻译一份 PDF、分析一个 Excel 表格——可以直接把文件发给它:
- 点击输入框左下角的「+」按钮,选择「上传文件」
- 或者直接把文件从文件夹拖拽到输入框里
上传成功后,文件会以小卡片的形式显示在输入框上方,确认没问题后一起发送即可。
图片的处理逻辑:上传图片后,JimoClaw 需要一个支持识图的模型来「看」图片。如果你当前选中的模型带有 👁️ 图标,它会直接处理图片;如果模型不支持识图,JimoClaw 会自动调用你在设置中配置的「视觉模型」来处理图片内容。如果两者都没有,AI 就只能忽略图片、仅根据文字回复。
支持的图片格式:PNG、JPG、JPEG、GIF、WEBP、BMP、SVG。图片以 base64 格式内嵌在消息中,不会上传到外部服务器,隐私更安全。
与 AI 对话互动
消息发出之后,AI 就开始工作了。你会看到它的回复区域出现各种内容,下面逐一解释你会看到的情况。
文字流式输出
最常见的情况是 AI 直接用文字回复你。它的回复不是一下子全部弹出来,而是一个字一个字逐渐显示的——就像有人在对面打字给你看一样。这叫「流式输出」,好处是你不用干等着,一边出内容就可以一边开始看。
「深度思考中」——AI 正在分析问题
有时候,AI 遇到比较复杂的问题,会先认真想一想再回答。你会看到一个「深度思考中」的提示,通常还会带一个折叠区域。这就像你问同事一个棘手的问题,他会先皱着眉头想一会儿,再给你一个靠谱的答案。
如果你好奇 AI 到底在想什么,可以点击展开,看看它的思考过程——它在考虑哪些方面、排除了哪些方案、最终怎么得出结论的。不想看也没关系,折叠着完全不影响使用。等它想完了,自然会给你一个完整的回复。
工具调用——AI 正在帮你干活
这是 JimoClaw 最有特色的地方。当 AI 需要执行实际操作时——比如搜索网页、读取文件、运行代码——你会看到一个「工具调用」的提示卡片。卡片上会显示 AI 正在使用什么工具,以及工具的执行状态。
举个例子,当你让 AI「搜索并整理 AI 行业新闻」时,它不只是凭记忆回答,而是会真的去搜索网页,找到最新的信息,然后整理给你。工具调用卡片就是告诉你:「我正在帮你搜索,请稍等。」
总结一下你会看到的三种状态:
- 文字逐字出现——AI 在给你写回复
- 「深度思考中」——AI 在认真分析你的问题
- 工具调用卡片——AI 正在使用工具帮你执行操作
这三种状态可能会交替出现,完全正常。比如 AI 可能先思考一会儿,然后搜索网页,最后整理成文字给你。整个过程你只需要看着就行,不用做任何操作。
审批与权限
AI 在执行某些操作的时候——比如运行代码、修改文件——可能会弹出一个审批卡片,问你「我能不能做这件事?」
这是 JimoClaw 的安全保护机制,防止 AI 在你不知情的情况下做了不该做的事。
在任务输入框右下角的锁形按钮处可以选择三种权限模式:
询问(推荐)
这是默认模式,也是新手最合适的选择。AI 在执行运行代码、修改文件等操作之前,会弹出一个审批卡片,告诉你它打算做什么,等你点「允许」才继续。审批卡片会清楚告诉你 AI 打算做什么。比如「执行一个 Python 脚本来分析数据」或者「创建一个新文件 result.md」。你觉得没问题就点「允许」,觉得不对就点「拒绝」。
自动执行
AI 自主完成所有操作,不打断你。适合你对 AI 比较信任、或者任务简单且重复不想被频繁打断的场景。好处是效率高;需注意 AI 执行前不会征求你的同意。
每步确认
最严格的模式——AI 的每一个操作都需要你确认才能继续,包括非敏感操作。适合处理特别重要、绝对不能出错的任务时使用,过程会慢一些,但你对整个流程有完全掌控。
提示:任务发出后,权限模式也可以随时在任务详情页的输入框旁切换,对后续操作立即生效。
查看任务进度和产物
AI 执行任务时,界面右侧会出现一个信息面板。这个面板不只是显示「文件」,它贯穿任务全程,让你随时掌握 AI 在做什么。
任务待办(进度卡片)
任务开始后,右侧面板最上方会出现一个「任务待办」卡片,显示 AI 规划的步骤列表和整体进度。每个步骤有三种状态:
- ⭕ 待处理:还没开始
- 🔄 进行中:正在执行(旋转图标)
- ✅ 已完成:执行完毕
卡片顶部还有一个进度条和「X/Y 已完成」的计数,让你一眼看出整体进度。
子任务(当 AI 拆分任务时)
对于复杂任务,AI 会把它拆分成多个子任务并行或串行推进。这时面板中会出现「子任务」卡片,每个子任务有独立的状态:等待中、运行中、已完成、出错。
这个功能帮助你了解 AI 的工作分工——不是「等待结果」,而是能看到每一块工作的实际进展。
制品(生成的文件)
AI 完成任务后,生成的文件会以卡片形式列在面板底部。支持的文件类型包括:
- 图片(PNG、JPG 等)
- 文档(PDF、Word、Markdown 等)
- 代码文件(Python、JavaScript 等)
- 网页(HTML)
点击文件卡片,JimoClaw 会直接在应用内打开预览窗口,无需下载就能先看内容——图片可以直接查看、代码高亮显示、网页直接渲染、PDF 可翻页阅读。如果预览后满意,点击下载按钮保存到你的电脑。
提示:右侧面板在窗口足够宽时(大屏)始终显示;在窄窗口模式下,只有当有文件生成时才会显示。如果看不到面板,可以拖宽窗口。
继续对话
任务完成之后并不是就结束了。你可以继续跟 AI 对话,就像微信聊天一样自然。
觉得结果哪里不太对?直接告诉它「再详细一些」或者「换个角度分析」。想补充新需求?尽管说。需要上传一份新文件让它接着处理?也可以。
AI 会记住你之前说了什么,所以不需要重复解释背景。你只管像平时聊天一样往下说就好。
示例任务
以下是一些常见的任务场景:
- 文档处理:「读取桌面的销售数据.xlsx,生成一份月度销售报告」
- 批量操作:「将下载文件夹中所有 PDF 文件的首页提取出来,保存为图片」
- 信息整理:「帮我搜索并整理最近一周的 AI 行业新闻,来源不少于 5 个,按重要性排序」
- 翻译文档:「把这份英文报告翻译成中文,保留原文的格式和表格结构」