打开网易新闻 查看精彩图片

李彦宏说:文心大模型4.0综合水平“与GPT-4相比毫不逊色”
李彦宏说:开源模型会越来越落后
李彦宏说:程序员岗位很可能将会消失

链接友好版:https://short.zhanglearning.com/weekly22

大模型 GLM-4开源:超越Llama3[1]

GLM-4-9B 开源模型综合能力相比 ChatGLM3-6B 提升 40% ,全面超过 Llama-3-8B-Instruct,中文学科能力提升 50%,最高支持达 1 百万 tokens 长文本,支持多达 26 种语言,函数调用(Function Call)能力媲美 GPT-4-Turbo。首次开源基于 GLM 基座的视觉模型 GLM-4V-9B,多模态能力比肩 GPT-4V。

模型下载:

Model Type Seq Length Download Online Demo GLM-4-9B Base 8KHuggingfaceModelScope/ GLM-4-9B-Chat Chat 128KHuggingfaceModelScope[5]ModelScope CPU[6]ModelScope vLLM[7]GLM-4-9B-Chat-1M Chat 1MHuggingface[8]ModelScope[9]/ GLM-4V-9B Chat 8KHuggingface[10]ModelScope[11]
阿里巴巴 Qwen2 开源[12]

⭐ 5种尺寸的基础和指导型号,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。

除英语和中文外,还接受过 27 种其他语言的数据培训。

在大量基准评估中表现 SOTA。编码和数学方面的表现显着提高。

Qwen2-7B-Instruct 和 Qwen2-72B-Instruct 的扩展上下文长度支持高达 128K 令牌。

DEMO: https://hf.co/spaces/Qwen/Qwen2-72B-Instruct CODE: https://github.com/QwenLM/Qwen2

Image 快手发布了可灵视频生成模型[13]
打开网易新闻 查看精彩图片
Image 快手发布了可灵视频生成模型[13]

可灵视频生成模型支持生成最长两分钟 30FPS 1080P 的视频。

生成质量是现在普通用户能接触到的天花板,5 秒视频这个等级完全超越了谷歌Voe 视频模型。

运动幅度、不同比例、一致性、物理特性都是除了 Sora 之外现在看到最好的。

体验方法:快影 APP-AI 玩法-AI 视频生成中申请。

字节跳动开发 TTS 模型王炸级产品[14]

Seed-TTS:由字节跳动开发的几乎完美接近人类的文本到语音(TTS)模型

该模型能够生成高质量、几乎无法与人类声音无法区分的语音。

无需训练的情况下,只需要简短的语音片段即可克隆生成高度自然且富有表现力的语音。

完全能否胜任读小说、配音等任务

Seed-TTS 还提供了对各种语音属性的高级控制能力,包括但不限于情感、语调、说话风格等。

还可以通过编辑文本来编辑生成的语音。

工具库 基于Cloudflare全家桶的博客方案[15]

⚡️Rin 一个基于 Cloudflare Pages + Workers + D1 + R2 全家桶的博客,无需服务器无需备案,只需要一个解析到 Cloudflare 的域名即可部署。

缺点是非静态,不利于搜索引擎收录。演示:https://xeu.life

打开网易新闻 查看精彩图片

Chrome 浏览器内置大模型[16]Chrome 的网页平台团队正在探索一个“内置 AI”的概念,其中浏览器将内置 AI 模型,为浏览器功能和网页平台 API 提供设备上的 AI 支持。通过内置 AI,您的网站或网络应用程序将能够针对基础模型和专家模型运行各种 AI 任务,而无需担心部署和管理这些模型。特别是,我们将在大多数配备 Chrome 的现代台式机和笔记本电脑上本地运行 Gemini Nano,它是 Gemini 模型系列中最小的版本。

最新的Chrome 已经内置大模型(Gemini Nano)了,官方推荐的用户是本地和远端大模型混合使用的方案。

使用 chrome 本地模型的好处:1、本地处理敏感数据;2、流畅的用户体验;3、对 AI 的访问权限更高;4、离线使用 AI。

打开网易新闻 查看精彩图片

Chrome内置大模型并提供了一个翻译 API,支持多语言的翻译。

打开网易新闻 查看精彩图片

如果没有资格,可以提交申请[17]

去除PDF加密最简单的方法

把pdf文件拖到任意浏览器里,选择打印,另存为PDF,不需要安装任何辅助工具。

小爱音箱接入 ChatGPT[18]
打开网易新闻 查看精彩图片
小爱音箱接入 ChatGPT[18]

将小爱音箱接入 ChatGPT 和豆包,改造成你的专属语音助手。

LLM 回答。想象一下,你的小爱音箱变身聊天高手,可以使用 ChatGPT 等大模型来回答你的问题。 角色扮演。一秒调教小爱,无论是成为你的完美伴侣,还是那个能听你倾诉心事的贴心闺蜜,都不在话下。 流式响应。爱情来得太快就像龙卷风,而你的小爱音箱也是,对你的爱意秒回,爱你不会让你等太久。 长短期记忆。小爱音箱现在能记住你们之间的每一次对话,越聊越默契,就像是你身边的老朋友。 自定义 TTS。厌倦了小爱同学的语音?帮你解锁「豆包」同款音色,就像真人在回你的消息。️ 智能家居 Agent。心情不好?小爱立刻懂你,自动帮你播放喜欢的音乐,调节灯光,逗你开心。

知识库 使用 Python 进行机器学习[19]

  • 描述各种类型的机器学习算法以及何时使用这些算法

  • 比较和对比线性分类方法,包括多类预测、支持向量机和逻辑回归

  • 编写 Python 代码,实现各种分类技术,包括 K-Nearest neighbors (KNN)、决策树和回归树

  • 使用评估指标对数据集上的简单线性、非线性和多元回归结果进行评估

打开网易新闻 查看精彩图片

以下为本次演讲的要点:①黄仁勋展示了最新量产版Blackwell芯片,并称将在2025年推出Blackwell Ultra AI芯片,下一代AI平台命名为Rubin,2027年推Rubin Ultra,更新节奏将是“一年一次”,打破“摩尔定律”。② 黄仁勋宣称英伟达推动了大语言模型诞生,其在2012年后改变了GPU架构,并将所有新技术集成在单台计算机上。③ 英伟达的加速计算技术帮助实现了100倍速率提升,而功耗仅增加到原来的3倍,成本为原来的1.5倍。④ 黄仁勋预计下一代AI需要理解物理世界。他给出的方法是让AI通过视频与合成数据学习,并让AI互相学习。⑤ 黄仁勋在PPT里甚至给token敲定了一个中文译名——词元。⑥ 黄仁勋表示,机器人时代已经到来,将来所有移动的物体都将实现自主运行。

轻阅读

人生很短,无论一个人多聪明,多有天分,也不可能漠视几千年来伟大学者共同努力得来的成果。这是人类了解大自然、了解人生、了解人际关系累积下来的经验,不是一朝一夕所能够成就的,所以一个人小的时候博览群书是非常重要的。——丘成桐

我为什么选择全家移居泰国清迈!泰国生活优缺点全方位分享![20]

这篇文章非常全面的介绍了泰国的医疗、教育、生活和事业。

世界上几乎所有美好的东西都要通过对抗熵增获得—— 想要成绩,就要把混乱的知识整理成体系; 想要财富,就要把复杂的工作梳理出标准; 想要幸福,就要把丰富的情感经营到恬淡… 成长的过程,就是不断剥离动物本能的过程。有的人脱胎换骨,成就最好的自己;有的人庸庸碌碌,浑浑噩噩过一生。

参考资料

GLM-4开源:超越Llama3: https://github.com/THUDM/GLM-4

Huggingface: https://huggingface.co/THUDM/glm-4-9b

ModelScope: https://modelscope.cn/models/ZhipuAI/glm-4-9b

Huggingface: https://huggingface.co/THUDM/glm-4-9b-chat

[5]

ModelScope: https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat

[6]

ModelScope CPU: https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary

[7]

ModelScope vLLM: https://modelscope.cn/studios/ZhipuAI/glm-4-9b-chat-vllm/summary

[8]

Huggingface: https://huggingface.co/THUDM/glm-4-9b-chat-1m

[9]

ModelScope: https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat-1m

[10]

Huggingface: https://huggingface.co/THUDM/glm-4v-9b

[11]

ModelScope: https://modelscope.cn/models/ZhipuAI/glm-4v-9b

[12]

阿里巴巴 Qwen2 开源: https://qwenlm.github.io/blog/qwen2/

[13]

快手发布了可灵视频生成模型: https://kling.kuaishou.com

[14]

字节跳动开发 TTS 模型王炸级产品: https://bytedancespeech.github.io/seedtts_tech_report/

[15]

基于Cloudflare全家桶的博客方案: https://github.com/OXeu/Rin

[16]

Chrome 浏览器内置大模型: https://developer.chrome.com/docs/ai/built-in?hl=zh-cn

[17]

提交申请: https://docs.google.com/forms/d/e/1FAIpQLSfZXeiwj9KO9jMctffHPym88ln12xNWCrVkMY_u06WfSTulQg/viewform

小爱音箱接入 ChatGPT: https://github.com/idootop/mi-gpt

使用 Python 进行机器学习: https://www.coursera.org/learn/machine-learning-with-python

我为什么选择全家移居泰国清迈!泰国生活优缺点全方位分享!: https://dashu.ai/blog/56