万知“股东大会”

wanzhi's shareholders meeting

Chief Experience Officer

万知首席体验官

李开复

转眼过了一周,作为万知的C"E"O(Chief Experience Officer,首席体验官)的我又来向各位万知的“精神股东”汇报本周工作啦。

本周伊始,我们就收到了一个令人振奋的消息。在 LMSYS 盲测竞技场最新排名中,零一万物的最新千亿参数模型 Yi-Large 总榜排名世界模型第 7,中国大模型中第一,已经超过 Llama-3-70B、Claude 3 Sonnet;在中文分榜更是与 GPT-4o 并列世界第一。

由于 LMSYS Chatbot Arena 采用了号召千万真实用户盲测评分的形式,已经成为业内公认最客观公正、最接近用户实际应用场景的大模型评测平台。

目前,LMSYS 已经是 OpenAI、Google、Anthropic 等海外大厂旗舰模型“龙争虎斗”的当红擂台,像是 OpenAI CEO Sam Altman,Google DeepMind 首席科学家 Jeff Dean 都曾经引用 LMSYS 给出的排名成绩来佐证自家模型能力。

(向上滑动启阅)

致各位:

在模型能力之外,我们也注意到大家反馈的新需求,在万知的功能上也做了针对性的升级调整:

Case 1:我们关注到,通过输入完美提示词得到优质回答后,大家都会有分享出去的欲望;又或者在工作场景中,将生成的内容分享给同事伙伴,更高效地完成合作。

Action:我们在小程序端新增了回答分享功能,只要长按万知的回答消息,工具栏里就出现分享按钮,点击分享就可以把这轮问答转发给微信好友啦。

Case 2:大家对于识别图片内容的功能需求我们也有注意到。我们的多模态模型 Yi-VL-Plus 在视觉模型盲测平台Vision Arena上的评测成绩始终保持全球领先。基于多模态能力我们也在万知网页版的读文档界面中配置了截图问答的功能。

Action:万知微信小程序端的上传图片、识图聊天等功能已经准备就绪,预计稍晚些时候就会和大家见面。

提示词魔法大揭密

结合大家的反馈,我们了解到,与万知对话来获取各方面的知识是大多数人的诉求。与搜索引擎相比,毫无疑问,大模型能做到的事要多得多。它具备更自然的交互方式,能提供比搜索引擎更人性化的交互体验;同时得益于深度学习和语义理解,大模型也能够输出更准确、相关性更高的结果。

面对通识类问题,具备联网功能的万知都能对答如流。即便是诸如“iPad Pro比前作好吗?”这类极度口语化的问题,万知也能够理解“iPad Pro”是指“2024年款iPad Pro”、前作是“2023年款iPad Pro”,并且给出芯片、图形显示技术、内存等核心信息。

但是,如果能在提示词上做些优化,万知就会反馈给你更加详细、更具参考价值的答案。

在向大模型提问时,应当尽量避免使用模糊不清的词汇,比如“好”、“坏”、“怎么样”等,“请”、“麻烦你”这类礼貌用语也可以省略。尽可能使用目的明确的词汇,可以多次重复关键词“iPad Pro”。这样可以减少提问中的噪音,突出重点,便于万知理解你的真实意图。

如上述原问题中“比前作好吗?”就可以改为“我想了解iPad Pro产品的用户评价,与2023年款iPad Pro做个比较”。

同时,我们可以试着将复杂问题拆解为更简单的提示,分步骤提问,一步步引导万知理解你的问题。比如,在原问题的结尾加入“从性能、显示效果、价格、电池续航等角度分析”。

结合上面的小技巧,原问题就被改写为“我想了解iPad Pro产品的用户评价,与2023年款iPad Pro做个比较,可以从性能、显示效果、价格、电池续航等角度分析”。得出的内容与原回答也大不相同,不仅内容更加详实了,与2023年款iPad Pro的对比结果也更加明确了。

总结:

1、明确问题,尽量避免使用模糊不清的词汇,避免使用复杂的句式或过多的修饰语;

2、将复杂查询任务拆解为多步骤、更简单的提示,一步一步来;

3、在一个提示中可以多次重复重点单词或短语。

我们内部筛选出了一个badcase案例,结合上面的几点,让我们试试,一起把这个badcase转变成goodcase。

由于上述问题没有进行任何拆解,只是一个笼统的请求,万知所给出的回答内容也仅限于表面。同时,问题中没有重复任何关键词,没有突出重点,让人难以抓住问题的核心。

对比来看,这次万知的回答就细致深入了很多。修改之后的问题,直接指向了“最近流行的AI技术”,避免了模糊不清的词汇;同时笼统的问题也被拆解为三个更简单的小问题,分别是技术特点、应用场景和社会影响,便于万知逐一回答;在问题中多次使用“AI技术”这个词,强调了问题的重点。

答疑时间 ⏰

如何写好万知提示词?

大模型在训练过程中学习了大量的文本数据,这些数据中包含了各种词汇和表达方式。

你可以将大模型视作在知识的海洋里畅游的一只书虫。当你给到大模型一个清晰的词汇时,就像是给了它一个清晰的航标,它能迅速地在记忆的海洋中找到正确的航道,准确地吐出你想要的答案。但如果给它一个模糊的词汇,就像是给它一个谜语,它可能会陷入深思,甚至开始胡思乱想,给出的答案可能就像是一首抽象派的诗,让人摸不着头脑。

为了让它不至于在知识的海洋里晕头转向,我们得用重点词汇给它指明方向。在自然语言处理中,词汇的出现频率可以被视为一种信号。多次强调重点词汇增强了这些词汇的信号强度,使得模型更容易注意到它们,并将其视为重要的线索来理解问题。

换言之,这些重点词汇对于大模型而言就是知识海洋中的灯塔,告诉它“这里要重点关注!”这样一来,它就能更快地捕捉到关键信息,避免在理解时出现误会。

至于为什么要将复杂任务拆分为多步骤,则是因为,在逐步处理简单任务的过程中,模型的每一步的输出都可以作为下一步的输入,从而形成一个连贯的上下文链,这有助于模型更好地理解整个任务的上下文和目标。

另一方面,在处理复杂任务时,模型的错误可能会在生成过程中累积,导致最终输出偏离预期。通过将任务拆解为多个简单的步骤,模型可以在每一步都进行校正,从而减少错误的累积,提高最终输出的准确性。

微故事征集大赛

很多人都把万知当作搜索引擎,但是其实它可以很多有趣也很专业的事儿,它更可以当你的“AI特助”。前几天,我试着让万知用30个字写一个故事,要求写出惊悚的细节和完全想象不到的结局。结果它展现出的天马行空的想象力超出了我的预料。

我们的提示词课程也已经进行了两周,相信大家都总结出了自己的小技巧。所以,我决定向大家发出挑战书——30字微故事征集大赛!看看谁的故事更精彩!

登陆万知网页端(wanzhi.com)或进入“万知AI”微信小程序,编写专属于你的提示词,与万知一起创作出30字以内的精彩微故事。写出满意的微故事后,将你的微故事以视频评论、公众号评论及留言的形式发给我,就有机会获得签名版《AI未来进行式》及零一万物一周年限量版周边一份。

我们将选出十个优秀获奖选手,送出精美礼品,并于5月30日(下周四)《首席体验官周报》中展示获奖作品,期待你的参与!