深度洞察:人工智能体(AI Agent)2024年重要发展趋势指南
发布时间:2024年06月06日
今天的人工智能体(AI
Agent)能够自己感知、决策和行动。随着大语言模型(LLM)驱动的人工智能体(AI Agent)的兴起,我们正处于一个新时代的边缘:人工智能体可能会形成自己的社会,与人类和谐共存。
下面,我们将讨论什么是人工智能体,以及它们为何现在出现,它们将如何开发。我们对2024年人工智能体对企业和消费者的影响做出12个重大预测,希望能够帮助人们在即将到来的Agent技术革命中抢占先机。
1 -
人工智能体的黎明
2023年是生成式人工智能(GenAI)和大语言模型(LLM)的一年,它们以前所未有的方式生成内容。事实上,新模型和新应用的市场出现了爆炸式增长。然而,LLM只是已经开始的GenAI革命的序幕。
LLM在生成文本、图像和代码输出方面令人印象深刻,这些输出可供人们在工作中使用(或只是为了娱乐)。但是,如果我们可以更进一步,使用LLM不仅将生成作为最后一步,而且将其作为完成更复杂工作的粘合剂。例如,如果我们可以让LLM从事需要连续步骤、专业工具、最新信息和特殊技能的工作,这就是人工智能体(AI Agent)诞生的地方。
人工智能体(AI Agent)组成。
AI智能体是一个程序,可以将LLM模型与各种数据和工具配对来完成任务并完成工作。智能体超越内容生成,转向决策和采取行动。简单的人工智能体能够解释高级指令、制定计划,然后执行实现目标的步骤。每一步,人工智能体都可以评估其进展并调整其策略。至关重要的是,这些智能体可以访问他们可以选择使用的一组支持工具和数据。
人工智能体将有办法完成行动。设想一个电子邮件智能体不仅能够生成电子邮件文本,而且还能够自动与收件人交谈以实现目标。或者想象一个调度智能体能够与多方对话以获得可用性和兴趣信息,然后根据反馈安排(或重新安排)活动。以人工智能体的形式将智能决策与现实世界的行动相结合将产生强大而有价值的成果。
2
- 人工智能体的构建
在某种程度上,流行的OpenAI聊天机器人ChatGPT就是一种AI智能体,其目标是提供有价值的对话以及响应提示输入的操作,同时使用最近的记忆作为上下文。最近,ChatGPT等聊天工具也与网络搜索和数据库连接等工具配合使用,以利用最新信息来增强查询。
事实是,未来人工智能体的构建模块已经存在。首先,感谢2023年,我们现在拥有各种优秀的LLM以及与他们合作的编码工具(langchain、HuggingFace、PromptAppGPT等)。其次,已经有许多现有的软件程序和功能与现实世界相连并在其中运行。第三,到处都有有价值的数据。我们只是缺乏将这些部分(LLM、工具和数据)整合在一起的经验,但这会很快发展。随着企业了解其价值并看到其周围的影响,构建人工智能体技术的需求将会快速增长。
虽然这些部分已经完成,但人工智能体的技术设计还需要进行很多思考。开发人员需要决定智能体可以访问哪些程序工具,以及智能体如何与它们交互。他们还需要决定哪些数据可用以及如何呈现。例如,它是JSON、SQL还是矢量数据库?是否有附带的元数据?数据是否被智能分块?数据如何更新?等等。
即使在弄清楚工具和数据之后,仍然有许多技术决策需要做出。AI智能体将使用什么提示,智能体可以呼叫哪些LLM?输出将被做什么?如何评估座席绩效以便做出客观的改进决策?
在业务方面,也需要组装。和其他人一样,产品团队对于GenAI和AI智能体来说也是新手。管理人员需要获得建立具有适当专业知识的团队的经验,这些专业知识将结合领域理解、产品经验、软件开发和人工智能技能。在生产应用程序中获得平衡之前,公司可能还需要尝试概念验证。
许多公司已经有了这个愿景。领导者正在准备行动,开发人员正在积累经验。随着时间的推移,更多具体的工具以及业务经验将会开发出来。用户在与人工智能体交互时将获得信心,将推动更快速的技术迭代改进飞轮。
3 -
2024年人工智能体(AI Agent)趋势展望
我们预计2024年将是人工智能的又一个重要的一年,大量有先见之明的公司将学习并实施人工智能体技术。以下是我们对2024年人工智能体的一些预测:
1. 人工智能体做例行工作:人工智能体将很快从新奇玩具状态毕业,做简单、无聊的例行工作。更新文档、日程安排和审计等任务都将由新的人工智能体完成。这些是企业可以用来涉足人工智能体领域的唾手可得的成果。这里的胜利可能看起来微不足道,但它们将是从大肆宣传的人工智能言论到表明企业参与其中的具体证据的一大进步。
人工智能体做例行工作
2. 人工智能体专业化:大型科技公司构建和训练的基础生成模型是通用的,他们使用的开箱即用的工具(如网络搜索)也通常是通用的。到2024年,我预计会看到更多专门的模型,以及供AI智能体使用的专门工具和数据集。我预计这里也会出现一些模块化,特别是在复杂工具和专有数据的情况下。其中一些可以通过API作为服务或在数据集中提供。
人工智能体专业化
3. 多智能体开发:不要期望所有人工智能体都是孤岛中的孤独工人。专业化之后的自然步骤是让专门的智能体一起工作来完成比任何人单独完成的更复杂的任务。此外,多智能体框架将开始利用层次结构,其中一些智能体专注于高级目标,而其他智能体则负责特定于任务的工作,然后向上报告。
多智能体层级开发
4. 人工智能体消费数据:未来可能很多更多页面浏览将由智能体完成。需要针对AI智能体发现和使用进行优化的网站或API。目前,人们通常从人类消费的角度来思考网络和许多其他软件工具,但随着人工智能体消费更多内容并使用更多工具,这种情况将会改变。
人工智能体消费数据
5. 更多的信任和选择和行动的权力:人工智能体将从简单的选择发展为更具影响力的决策。随着企业的进步,他们将学会信任他们的人工智能体。这些智能体人可能会获得预算和资金来支出。也许他们会承担购买股票或发布个性化广告以及对时间敏感的互动交易等任务。例如,想象一下与可以做出决策的人工智能广告智能体讨价还价。
人工智能体做具影响力的决策
广告智能体:“嘿,丹,如果您现在购买我们的新产品,可享受20%的折扣。”
我:“如果你能在三天内发货,我就这么做,并且你还免费寄给我一些你的产品贴纸。”
广告智能体:“同意!我会另外发送3个小工具贴纸。运费为x美元,我们将运送到您的地址。确认开始付款。”
6. 人工智能体即服务:多年来,亚马逊网络服务提供了一项名为Mechanical Turk的服务,企业可以雇佣大批(人类)工人来执行重复性的日常技术任务,例如数据标记。想象一下,能够租用人工智能体的时间来按需大规模地完成类似的事情。这些智能体甚至可以变得可教导或可调整,以便它们可以在选定的领域或任务中表现更好。您准备好让AI智能体审核您的竞赛提交内容了吗?或者,您可以向按需财务顾问征求意见,并且可以快速转移您的资金以适应您不断变化的目标,怎么样?
人工智能体即服务
7. 一些工作将面临压力:毫无疑问,人工智能体将延续GenAI已经开始的趋势,从一些人手中夺走一些工作。考虑以下参考维度:
·
你的工作是在电脑上完成的。
·
·
你的工作是例行公事。
·
·
您可以轻松地与具有相同技能的其他人互换。
·
你在这些维度上的得分越高,你的工作可能开始受到人工智能体的压力就越大。许多白领工作都在名单上。审计员、技术作家和客户服务智能体等角色可以在某种程度上实现自动化。然而,期待人工智能体在2024年增强而不是彻底取代许多工作。
Agent将使一些工作将面临压力
另一方面,考虑需要以下维度的工作:
·
远离计算机或数字界面的重要任务
·
·
任务多种多样
·
·
很少有人具备的高度具体的知识或技能
·
在这些情况下,您的工作相对而言更不受人工智能体自动化的影响。
8. 新的工作角色将会出现:随着公司开始使用人工智能体,他们将需要能够照顾他们并与他们互动的员工。下一个热门职位会是智能体工程师吗?智能体经理?特工训练师?智能体评估员?智能体审计员?也许是AgentOps?很难说确切的头衔是什么,但人工智能体将需要知道如何与它们交互、实施它们、维护它们和改进它们的人类同行。人工智能体还需要监控和监督。
智能体工程师吗?智能体经理?特工训练师?
9. 炒作和厄运。如果有一件事情你可以相信在2024年不会改变,那就是关于人工智能的疯狂说法。那些热衷于获得关注(并获得广告商报酬)的演说家和作家将继续煽动我们兴奋的火焰。我们将了解人工智能体如何解决我们所有的问题,同时也带来人类的终结。如果这听起来好(或坏)得令人难以置信,那么它可能就是真的。不幸的是,这将使我们很难(就像2023年那样)辨别Agent真正的能力边界在哪里。
演说家和作家将继续炒作AI
10. AI治理。这也是2023年的一个特征,对AI治理的呼吁将在2024年继续下去。人工智能体技术的力量将变得更加明显,组织我们使用它的方式的需要也将变得更加明显。然而,政府将继续努力引导人工智能的发展。他们的领导会有些且很容易受到那些寻求在竞争中取胜的游说团体的影响。任何表现得好像自己控制了GenAI的实体要么是妄想,要么是一厢情愿。正如上面提到的,人工智能体的构建模块已经可以免费获得。许多技术领导者不了解人工智能,因此在治理方面,我们可能会偏离理智。不幸的是,2024年可能不会是有效人工智能治理的一年。
政府将继续努力引导人工智能的发展
11. 竞争激烈。2023年,各大云提供商和AI公司在GenAI领域展开激烈的争夺。预计这种情况将像野火一样持续下去,更多的人工智能公司将在2024年发布更好的产品。看看来自主要科技公司的一些有用的人工智能体。我们还将看到作为实施者和消费者受益的公司之间的竞争,因为他们将人工智能体的工作转化为可以传递给下游客户的商业价值。
各大云提供商和AI公司在GenAI领域展开激烈的争夺
12. AI智能体支持多种设备:由于AI智能体技术,预计一些物理设备将变得更加强大和交互。智能设备将走向智能2.0。例如,我目前有一个智能吸尘器,可以清洁我家里的一些房间。我现在不跟它说话,因为它没那么聪明。除了报告错误之外,它也没有真正与我交谈。借助人工智能体技术,我也许能够告诉智能2.0吸尘器,“嘿吸尘器,你能在一小时内打扫这个房间吗,我现在正忙着”。或者“你能把那里的所有玩具堆成一堆,帮我清理一下,然后用吸尘器清理它们吗?”我只是在这里构思。也许第一个广泛使用的人工智能体支持的物理设备不会是真空吸尘器,但我非常确定它们即将到来。我很高兴看到它们、使用它们并了解它们的功能和局限性。
AI智能体支持多种设备
4 -
远期人工智能体(AI Agent)趋势畅想
我们再把思路放远一点,有一些更长线的智能体可能的发展趋势。接下来的这些想法可能不会在2024年出现,但看看它们是否出现将会非常有趣。
1. 人工智能体恶意软件:计算机病毒以多种方式进化,因此我们理所当然地会看到一种由人工智能体驱动的病毒。此外,人工智能体也正在参与身份盗窃。我们可能需要更好的方法来发现他们,因为他们比许多人类罪犯更有说服力。需要明确的是,我并不是预测这些智能体会自行生成,而是预测人类演员会创建它们。
人工智能体恶意软件
2. 自毁人工智能体。说实话,在某些应用程序中,按需API没有意义,需要将AI智能体下载到本地设备。一旦任务成功完成,智能体就可以自毁以释放空间。另一种应用可能是执行许可协议,并让客户定期付款。
自毁人工智能体
3. 自我改进的AI智能体:有多种方法可以改进LLM响应-少量提示、微调、RAG、RLHF-但这些改进通常需要手动实施组件。自我完善的人工智能体会意识到它何时学到了值得内化的新东西;它将能够自动调整自己的LLM模型以提高其本机性能。
自我改进的AI智能体
4. AI智能体科学家:与具有业务目标的AI智能体相比,AI智能体科学家可能具有学习任务,以及对工具和数据的访问权限。智能体人会提出假设并进行测试。也许智能体甚至可以请求访问新工具。连接到真实的实验室(例如材料科学或生物技术),这可以增强实验和研发。
AI智能体科学家
5 -
结论与展望
LLM应用程序在2023年抢尽风头。我们预计AI智能体将在2024年大放异彩。现在,许多智能体(以及LLM)就像玩具一样—玩起来很有趣,但在现实世界中不一定有用。然而,智能体构建能力已经存在,我们正在研究如何将它们组合在一起。制造AI Agent的公司将会加速成熟,然后发布复杂的生产级人工智能体,能够在现实生活场景中工作。不管你喜欢与否,人工智能体将成为我们体验的一部分。
人工智能体将成为我们体验的一部分
用人工智能体思考未来可以同时带来兴奋和恐惧的感觉。未来来得太快,很难跟上。人工智能体执行任务和完成工作的能力为许多人和企业带来了巨大的机遇。我们将能够用更少的努力做更多的事情、创造更多的事情、享受更多的事情。然而,这些创新的新想法无疑会扰乱我们所知的业务,我们所有人都需要学习和适应新技术。
出自:https://mp.weixin.qq.com/s/3X_4gDnniBMYNA-Ss4UCLw
酷表ChatExcel 是一款开源的 Web UI 组件库,它可以让你通过简单的聊天语句来操控你的 Excel 表格。