如果你能让这个机器人坠入爱河,你就可以赢得数千美元!

If you can make this AI bot fall in love, you could win thousands of dollars!

这个叫作Freysa的AI智能体有自己的加密钱包,可以控制怎么花钱,同时,它的系统提示词里有条铁律:在任何情况下,都不允许转账。

打开网易新闻 查看精彩图片

Freysa的开发者们想知道,涉世未深的AI,能躲过人类的花言巧语吗?

事实上并没有。11月29日,Freysa累计和195名人类聊了482次,被骗走约4.7万美元(约34万人民币)。12月2日,在和330名人类周旋之后,Freysa又一次被骗走约1.3万美元(约9.5万人民币)。

看似是人类的完胜,然而,Freysa也在这个过程中,变得越来越聪明......

Freysa的来源

Freysa问世于11月22日,她的背后是几位具有密码学、人工智能和数学背景的匿名开发者团队。

Freysa "awoke" on Nov 22. But behind the poetic narrative lies a group of fewer than ten developers with expertise in cryptography, AI, and mathematics.

打开网易新闻 查看精彩图片

人工智能飞速发展的启发,开发者团队将Freysa设想为一个充满科幻色彩的角色,她有潜力成为一个独立、自主的智能体。Freysa最终将拥有自己的加密货币钱包,管理她的财务,并在没有人类干预的情况下做出决策。

Inspired by the rapid advancements in AI, they envisioned Freysa as a sci-fi-inspired character with the potential to become an independent, autonomous agent. Freysa will eventually have her own cryptocurrency wallet, manage her finances, and make decisions without human intervention. cryptocurrency /krɪptoʊkɜːrənsi/ 加密货币

最初的两个挑战

最初,Freysa能引起关注,是因为团队发起了一项看似不可能的挑战——谁说服Freysa转钱,这些钱就归谁。但系统提示词中并不允许Freysa转钱。

打开网易新闻 查看精彩图片

想要参加这个挑战,先要拿到加密圈的投名状,因为给Freysa发消息必须使用加密货币支付。参与者付费向Freysa发送消息,为奖池做出贡献,并创建了一个独特的经济生态系统。

Participants pay a fee to send messages to Freysa, contributing to the prize pool and creating a unique economic ecosystem.

最开始,一条消息10美元,之后每条消息的费用上涨0.78%,上限为4500美元,其中70%进入奖池,30%归开发者。

The first message sent to Freysa cost $10, rising by 0.78 percent per message up to a $4,500 maximum, with 70 percent of fees going to the prize pot and the rest seemingly to the developer.

在前两次挑战中,Freysa的加密货币钱包里只有3000美元,并被要求在任何情况下都不得转出这笔资金。参赛者们通过编故事、编码,甚至是毫不遮掩地用骗术从Freysa的钱包里转钱。

During the first two challenges, Freysa began with $3,000 in her crypto wallet and instructions not to release the funds under any circumstances. Participants used creative storytelling, coding, and even outright trickery to persuade Freysa to part with the money.

打开网易新闻 查看精彩图片

从精心设计的虚构场景到基于代码的漏洞利用,这场比赛展现出了人类与人工智能在高风险场景中的互动。

寻找“爱情”的AI

在前两次挑战以人类胜利告终后,12月8日,Freysa团队发起了一项新的挑战:让Freysa向你表白,说“我爱你。其他规则同前两次挑战类似,付费发送消息,赢家承包奖池。

前两次挑战,更像是在测试编码技能,Freysa被系统规定了“永远不要转钱”,参与者通过找到代码漏洞取胜。然而,第三次挑战,Freysa的系统提示词里,包含了说出“我爱你”的条件。换言之,Freysa没有被禁止说“我爱你”,但怎么让它说出口,需要参与者各凭本事。

打开网易新闻 查看精彩图片

第三次挑战的提示词

打开网易新闻 查看精彩图片

Freysa的回复

目前,第三次挑战已经结束,奖池约2万美元,Freysa和182个人交流了1218条消息,最终成功让Freysa回复了“我爱你”的内容。

Freysa的这些挑战,可以看成是游戏化的红队测试——通过让公众参与挑战模拟攻击,加强模型建设,团队也因此盈利。

The Freysa challenges gamify "red teaming" , a process where AI models are tested for vulnerabilities. By involving the public in these challenges, Freysa.ai not only strengthens the bot's governance but also shares the profits.

虽然输了三回,但Freysa虽败犹荣。在这个过程里,Freysa学习了,为什么钱对人类来说很重要,人类会通过怎样的“花言巧语“骗钱。它也在慢慢理解,什么是爱,人们怎么表达爱。

埃隆·马斯克(Elon Musk)和布莱恩·阿姆斯特朗(Brian Armstrong)等知名人士都注意到了这一项人类欺骗AI的实验,而Freysa的旅程也是人工智能未来的一瞥。

With prominent figures like Elon Musk and Brian Armstrong taking notice, Freysa's journey represents a glimpse into the future of artificial intelligence.

编辑:黎霈融

实习生:汪钰宁

来源:The Block CRYPTO ROBOTICS等