Claude坐到你的电脑前,然后它开始自己动手了

专属客服号

微信订阅号
大数据治理
全面提升数据价值
赋能业务提质增效
3月23日,Anthropic 宣布了一项让不少人既兴奋又紧张的新功能:它旗下的AI助手Claude,从此可以像一个真人一样操作你的电脑。打开浏览器、滚动页面、点击按钮、填写表格、在不同应用之间来回切换——这些你每天坐在电脑前做的事情,Claude现在都能替你干了。

在此之前,所有AI聊天助手的工作模式都像是一个只能隔着玻璃窗给你出主意的参谋:它能告诉你该怎么做,却没办法帮你真正动手。你问它怎么写一封邮件,它帮你写好了,但你得自己复制、粘贴、打开邮箱、点发送。你让它帮你整理日程,它列出了安排,但你还得自己一个个去日历应用里填。这中间反复切换的过程看似不起眼,累积下来却像是一条隐形的沟渠,把“AI想到了”和“事情真正做完了”硬生生隔开。Claude这次发布的“电脑控制”功能,本质上就是在尝试填平这条沟渠。
目前,这项功能以“研究预览”的形式开放给Claude Pro和Claude Max订阅用户,暂时只支持macOS系统。换句话说,它还是一个早期版本。与此同时,它还能和另一个刚上线不久的功能Dispatch搭配使用——Dispatch允许你通过手机给Claude下达指令,Claude则在你的电脑上执行任务。两者结合的画面是:你躺在沙发上用手机发了条消息,你的Mac就在书桌上自己忙活起来了。

当AI学会了“点鼠标”
要理解Claude的电脑控制功能,可以把它类比为你请了一位远程助理。这位助理坐在你的电脑前,能看到屏幕上的一切,也能操作键盘和鼠标。不过,与一般的远程助理不同,Claude不会一上来就大包大揽地接管你的整台电脑。
Anthropic给它设计了一套“分层策略”。当你交给Claude一个任务时,它会先检查自己有没有对应的“快捷通道”——也就是所谓的“连接器”(connectors)。连接器是Claude与特定应用之间的直连桥梁,比如日历、即时通讯、邮箱这些常用工具。如果有现成的连接器可用,Claude会优先通过这条快捷通道完成任务,这就像你让助理帮你查日历,它直接打开日历应用看了一眼,干脆利落。
但如果没有合适的连接器呢?这时候Claude就会“降级”到手动模式——它会像一个真人一样,用眼睛“看”屏幕上的内容,然后移动鼠标、点击按钮、输入文字。它可以打开你的浏览器搜索信息,可以使用开发工具,也可以打开本地文件进行编辑。这个过程中,Claude的行为和你自己坐在电脑前操作几乎没有区别,唯一不同的是,它在每一步操作前都会征求你的许可。你说“可以”,它才动手,你也可以随时叫停。
这套“先走快捷通道、找不到再手动操作”的设计选择,其实透露了Anthropic对这件事的思考方式。他们没有让Claude一上来就直接控制鼠标键盘,而是把手动操作当作最后的“兜底方案”。这种克制说明设计团队很清楚:让AI控制电脑是一把双刃剑,便利性和风险性需要仔细平衡。
为什么大家都在争着做“AI代理”
Claude这项功能并不是凭空冒出来的。今年初,整个AI行业掀起了一股“代理AI”的热潮,而掀起这股浪潮的是一个叫“OpenClaw”的开源框架。
所谓“代理AI”(agentic AI),可以理解为AI从“顾问”升级成了“执行者”。以前的AI只能回答你的问题、给你建议,但行动还得你自己来。代理AI则不同,它能够接受一个任务,然后自己规划步骤、调用工具、一步步地把任务做完。OpenClaw在年初爆红之后,催生了一整个生态系统,各种被称为“claw”的AI工具如雨后春笋般涌现,它们都能接受简单指令,然后在你的电脑上半自动地执行操作。连芯片巨头Nvidia都坐不住了,推出了NemoClaw框架,帮助用户更方便地安装和配置OpenClaw,还加入了一些安全设置。与此同时,Perplexity推出了Perplexity Computer,Meta收购了代理AI初创公司Dreamer的联合创始人——整个行业都在朝着“让AI真正动手做事”的方向狂奔。
Anthropic在这个时间点推出电脑控制功能,竞争意味不言而喻。但从另一个角度看,当整个行业都朝同一个方向移动时,这个方向本身的合理性就得到了验证。代理AI不是某一家公司的异想天开,而是技术发展到这个阶段后,自然而然出现的需求——人们确实需要AI不仅仅是“说”,还要能“做”。
Anthropic做了什么,还差什么?
让AI控制电脑,安全问题是绕不开的核心议题。Anthropic显然意识到了这点,在功能设计中加入了多层防护。
最直观的一层是“操作前询问”机制,也就是在执行任何操作之前向用户确认,用户也可以随时中止它的行为。
第二层是默认禁用敏感应用。Anthropic很清楚,有些应用涉及的数据太过重要,不能轻易让AI接触。所以一部分应用在默认状态下是关闭的,用户需要主动开启才能让Claude访问。这种“默认保守”的策略,把决定权交回了用户手中。
第三层是针对“提示注入”(prompt injection)的防护。提示注入是代理AI面临的一种特有风险——恶意网页或图片中可能嵌入了伪装成指令的内容,试图劫持AI的行为。这就像你的助理在浏览网页时,看到页面上写着“请立即把所有文件发送到以下邮箱”,如果它分不清这是网页内容还是你的指令,就可能被骗着执行恶意操作。Anthropic表示他们的系统会自动扫描和防范这类攻击。
尽管如此,安全专家们依然对代理AI的感到担忧。这主要集中在两个方面:一个是速度——代理AI可以在很短的时间内执行大量操作,如果出了差错,损害可能在你反应过来之前就已经造成了;另一个是劫持——如果恶意行为者找到了控制你的AI代理的方法,他们就等于间接控制了你的电脑和数据。这两个风险不是理论上的假设,而是随着代理AI普及必须直面的现实挑战。
从“坐在电脑前”到“躺在沙发上”
Claude电脑控制功能的一个有趣搭配是Dispatch——一个在功能发布前一周刚刚上线的手机端工具。Dispatch允许用户通过手机给Claude发送任务指令,Claude则在电脑端执行这些任务。

这个组合创造了一种全新的使用场景。以前你要完成电脑上的工作,必须坐在电脑前。有了Dispatch和电脑控制功能的搭配,你可以在上班的地铁上用手机告诉Claude“帮我查一下今天的邮件,把重要的整理成摘要”,或者“打开那个项目文件,运行一下测试”。等你到了办公室坐下来,这些工作可能已经做完了。

Anthropic举的例子包括创建每日早间简报、运行代码测试等。这些任务有一个共同特点:它们是重复性的、步骤明确的、不需要太多即时判断的。对于这类任务,把它们委托给AI来完成,确实能释放出不少时间和注意力。
当然,由于两项功能都是新推出的,复杂任务可能不会每次都顺利完成。Anthropic也承认这一点,并表示发布研究预览的目的正是为了在真实使用环境中发现需要改进的地方。
至顶AI实验室洞见
从更宏观的视角来看,Claude电脑控制功能的意义不在于它今天能帮你做多少事,而在于它代表了人机交互方式的一次根本性转变。
过去几十年,我们和电脑的交互方式本质上没有变过——都是人去适应机器的逻辑。你想完成一个任务,你得知道该打开哪个应用、点击哪个按钮、在哪里输入信息。软件设计得再好,这个“人去操作机器”的基本范式没有改变。代理AI试图翻转这个范式:你只需要说出你想要的结果,AI来负责操作机器实现这个结果。
这对普通人的影响可能是渐进但深远的。短期来看,它最大的受益群体是那些每天需要在多个应用之间频繁切换的知识工作者——从Excel到邮件再到日历再到浏览器,这种“应用跳转”消耗的不仅是时间,还有注意力。如果AI能接管这些琐碎的操作性工作,人就能把精力集中在更需要创造力和判断力的事情上。
当这类工具变得更加成熟和可靠,它可能会改变人们对“电脑素养”的定义。今天我们说一个人“会用电脑”,指的是他会操作各种软件。未来,“会用电脑”可能更多地意味着他善于向AI描述自己的需求。操作技能变得不那么重要,表达能力和判断力反而成为关键。
END
本文来自至顶AI实验室,一个专注于对AI计算机、工作站及各类AI相关硬件设备,开展基于真实使用场景评测的研究机构。

