去年,通义舞王在科目三的火爆出圈中成为了顶流,引发了对通义千问的广泛关注。这股热潮不仅推动了通义千问的人气,同时也让阿里云的AI产品,包括Qwen大模型和魔搭社区,受到了前所未有的关注。今天,我们将深入探讨阿里云旗下那些既实用又有趣的AI产品。

通义官网

特别是通义千问,它不仅在网页端提供一键直达 APP 的所有功能,还专门推出了多个垂直应用系列,满足了用户在不同场景下的需求,从而极大地丰富了用户体验。

第一节课:通义千问能干啥?通义千问APP:人人都能上手!

打开之后界面非常清晰简洁,主要分三个部分,对话、智能体、应用。乍一看挺正经,别急,咱挨个儿细看其中的门道儿。(手机商店自行下载即可)

  • 对话部分,想问啥都行,就怕你不敢问!(贴心的是还有指令中心帮你提供灵感)

通义千问APP

除了文字对话还设置有语音对话,在右上角直接打开就可以对话了。

语音对话

  • 智能体量身定制专属于你的bot,就怕你没想法,是时候拼创意了!除此之外,还有很多有趣的热门的智能体大家也可以尝试起来。分为对话式创建和自定义创建。

沉浸式创建:想设置什么功能直接在对话里就能实现。

对话式创建智能体

自定义创建:可以在这里更精细化调整。

自定义创建智能体

  • 应用:从通义照相馆到全民舞王,再到通义万象,这里有各式各样的应用。可以通过体验科目三、拜年、鬼步舞等热门舞蹈,三步让照片动起来。

通义千问 APP 的热门应用

应用一:通义照相馆

单人照、双人照、全家福都有,最多支持8人照片。

通义照相馆

应用二:全民舞王

三步就能让照片动起来,还有舞蹈模板和创意广场,给你充分发挥的空间。

通义舞王(APP专属)

应用三:通义万象(APP版),分为文字作画和涂鸦作画两部分。

通义万象:文字作画

通义万象:涂鸦作画

通义千问网页端:不费心一键直达多个应用!

通义千问网页端: https://tongyi.aliyun.com

这里是要着重介绍下网页端,作为阿里云自主研发的超大规模语言模型,通义千问依托于先进的自然语言处理技术,提供广泛的服务和帮助。其能力覆盖:

  1. 文字创作:无论是撰写故事、公文、邮件、剧本还是诗歌,通义千问都能轻松胜任。

  2. 编码助手:帮助开发人员高效编写代码。

  3. 语言翻译:支持英语、日语、法语、西班牙语等多种语言互译。

  4. 文本优化:进行文本润色和摘要提取,提升文本质量。

  5. 角色对话:以不同角色进行有趣的对话互动。

  6. 图表制作:助力数据可视化,简化图表创建过程。

第一,一键直达通义千问这里有创意文案、趣味生活、学习助手、办助理等,有啥问题都抛给它!

通义千问网页端直达步骤

第二,一键直达通义万象这里有虚拟模特/涂鸦作画/写真馆/艺术字等好玩的应用,比 APP 更加全面,找不到的直接在官网点击“体验通义万象”。

如果你想展示画面中的指定商品,你可以用它——虚拟模特;

如果你没有绘画基础但又想画一幅手绘作品,你可以用它——涂鸦作画;

如果你想拍写真但又不想出门,你可以用它——写真馆。

通义万象网页版,功能更加齐全

第三,最后是通义产品应用包含通义万象及八大产品应用,涵盖各行各业。除了通用的工作和生活助手外,还专门开发出了金融分析、法律顾问、健康助手等等应用,简直是超级福音!感兴趣的可以自行体验。

通义系列八大应用

第二节课 说说背后依托的 Qwen 大模型,开源!

聊了这么久的通义千问,该说说它背后的技术老大哥——Qwen大模型了。它不仅是通义千问的技术基石,还在阿里云AI生态中扮演着至关重要的角色。Qwen大模型以其卓越的技术实力和开放的姿态,为开发者和研究者提供了丰富的可能性。比如在 Huggingface 和 Github 社区。

Qwen 社区是一个致力于实现通用人工智能(AGI)的项目,目前包含大型语言模型(LLM)和大型多模态模型(LMM)。Qwen 团队通过预训练和后训练技术,如 SFT(有监督微调)和 RLHF(强化学习人类反馈),构建了一系列不同规模的模型,包括 Qwen-7B、Qwen-14B 和 Qwen-72B 等。这些模型支持多语种能力,具有良好的性能表现,在工具使用和 Agent 方面也展现出出色的能力。

Huggingface 社区 Qwen 地址:https://huggingface.co/Qwen

Qwen大模型的技术实力

  • 开源与合作:Qwen 大模型秉承开源精神,鼓励全球的开发者和研究者共同参与,不断优化和扩展模型的能力,推动AI技术的创新和应用。

  • 跨领域应用:Qwen 大模型不仅支撑着通义千问等应用的智能服务,其技术能力还被广泛应用于语言理解、文本生成、图像处理等多个领域,展现了其广泛的应用前景。

Github 社区 Qwen 地址: https://qwenlm.github.io

Qwen 大模型的开放应用场景

Qwen 大模型的开放性不仅体现在技术共享上,更通过具体的应用场景,为用户提供实际的解决方案。无论是开发者希望构建自己的 AI 应用,还是研究者需要强大的模型支持科研工作,Qwen 大模型都能提供必要的技术支持和资源。

一起来试试:这里以Qwen 1.5 72B Chat为例,直接进入Huggingface 即可对话,体验如下:

场景:文字创作

Prompt:写一个故事,主角是一只会说话的猫,它误打误撞成为了一位侦探。

场景:编码助手

Prompt:创建一个简单的天气查询应用,用户输入城市名称,返回该城市当前的天气状态。

场景:语言翻译

翻译自论文《Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context》

场景:角色对话

Prompt:假设《傲慢与偏见》中的伊丽莎白和达西夫妇生活在现代,他们会如何讨论今天的社交媒体?

场景:图表制作

Prompt:根据给定的全球气候变化数据集,制作一个直观展示过去50年全球平均温度变化的图表。

除了直接对话外,还可以在此页面进行微调模型,来实现自己想要的效果,类似于在 APP 上创建智能体。

微调模型,效果更佳

第三节课 还有些有意思的开源小应用!

来来来,讲了这么多理论,估计大家也听烦了,要说有啥好玩的还能 DIY 的,最有趣的莫过于 Huggingface 里开源的这些小应用啦!

首先出场的是TransferAnything

它支持从任何图像的任何区域转移各种视觉信息,以创建新的合成图像,支持布局、颜色、风格和像素内容的转移,我们可以轻松实现从一个图像到另一个图像的多维度视觉信息转移,极大地拓宽了创意表达的可能性。

应用地址:https://huggingface.co/spaces/modelscope/TransferAnything

效果图:

给猫换个银河极光背景

给手办换古风背景

给龙变个身

大熊猫开摩托车

其次是ReplaceAnything

这个工具的应用场景广泛,包括人物替换、服装更换、背景变更等。是时候拼脑洞了!

应用地址: https://huggingface.co/spaces/modelscope/ReplaceAnything

效果图:

给 Taylor Swift 换装换背景

给 Elon Musk 换装换背景

给可爱的猫猫狗狗换背景

最后是FaceChain

一个创新的人像链生成工具,它允许用户进行人物形象训练、创造多种风格的形象写真,以及使用固定模板进行形象设计。在这里,你可以根据自己的设想自由创作独一无二的人像肖像。

应用地址: https://huggingface.co/spaces/modelscope/FaceChain

整体来看,不论是出圈效应还是开源社区贡献,阿里云在AI方面多点开花,我总能在社交媒体刷到相关的 Demo 和应用,让人一度会发出:“什么?阿里云又出啥 Demo 了?”的惊叹。

而且现在阿里云出品已经成为了一种流量密码,这对于国内AI的发展,也是件好事。