moonfdd

moonfdd

关注
63粉丝
57关注
3120被推荐

优质互联网领域创作者

13枚勋章

福大大架构师每日一题
IP属地:北京
更多信息

  • ollama v0.20.3 深度解读:Gemma 4 工具调用修复、模型库大更新、OpenClaw 兼容性问题彻底解决

    3小时前
    图片
  • DeepSpeed v0.18.9 正式发布!AutoTP 全面增强、ZeRO 与 SuperOffload 深度优化,大模型训练再升级
    DeepSpeed v0.18.9针对环境变量适配、GPU硬件检测逻辑进行了多项优化,解决了不同硬件平台、自定义环境路径下的适配问题,提升了框架的环境兼容性与部署灵活性。 1. 支持$TRITON_HOME环境变量 本次更新新增对环境变量的适配,框架会自动识别该环境变量配置的路径,解决了相关组件在自定义安装路径下无法被正确加载的问题。在过往版本中,仅默认读取系统默认路径下的相关文件,当用户通过自定义路径安装时,会出现路径查找失败、组件调用异常等问题,而通过适配TRITON_HOME环境变量,允许用户自由指定Triton的安装目录,大幅提升了框架在自定义部署环境下的适配能力,尤其适用于多版本Triton共存、离线部署等复杂场景。 2. ROCm GPU架构检测移除不必要的shell=True 针对AMD ROCm平台的GPU架构检测逻辑,本次更新移除了代码中不必要的shell=True参数。在Python的subprocess调用中,shell=True会带来潜在的安全风险与执行效率问题,同时可能引发命令解析异常。DeepSpeed v0.18.9优化了ROCm GPU架构检测的代码实现,采用无shell模式执行硬件检测命令,既提升了检测逻辑的安全性,又避免了因shell环境差异导致的GPU架构识别失败问题,保障了AMD GPU平台上DeepSpeed的稳定运行。 3. 支持$DS_IGNORE_CUDA_DETECTION环境变量跳过本地GPU检测 新增$DS_IGNORE_CUDA_DETECTION环境变量控制逻辑,当用户设置该环境变量时,DeepSpeed会跳过本地CUDA GPU的检测流程。该优化主要针对无GPU环境、远程训练节点、容器化部署等场景,在这些场景下,本地GPU检测不仅无意义,还可能因检测失败导致框架初始化异常。通过该环境变量,开发者可以灵活控制GPU检测行为,避免非必要的硬件检测流程,提升框架在纯CPU环境、云服务器远程调度场景下的初始化效率。 4. 修复Triton自动调优缓存的NFS路径判断问题 修复了Triton自动调优缓存模块中,is_nfs_path函数对不存在路径的处理异常问题。在过往版本中,当判断的NFS路径不存在时,该函数会抛出异常,导致Triton自动调优流程中断,影响模型训练的性能调优。v0.18.9优化了路径存在性校验逻辑,当目标路径不存在时,函数会返回合理的默认值,不会中断调优流程,保障了Triton自动调优功能在任意路径配置下的稳定运行,提升了大模型训练的性能调优可靠性。
  • DeepSpeed v0.18.9 正式发布!AutoTP 全面增强、ZeRO 与 SuperOffload 深度优化,大模型训练再升级

    1天前
    图片
  • Rust 1.94.1 已发布,这次更新虽然版本号看起来只是一个小版本修复,但实际包含了多个非常重要的改动,尤其涉及线程、Windows 文件系统扩展、Clippy、Cargo 依赖安全更新等内容。下面我们按照官方更新信息,逐条梳理本次 Rust 1.94.1 的核心变化。
    一、修复 std::thread::spawn 在 wasm32-wasip1-threads 上的问题 Rust 1.94.1 修复了 std::thread::spawn 在 wasm32-wasip1-threads 目标上的问题。 这意味着在该编译目标下,线程相关能力的行为得到了修正,对于使用 WebAssembly 线程能力的场景来说,这是一个重要的稳定性修复。 如果你的项目编译目标包含 wasm32-wasip1-threads,这次更新值得尽快跟进,以避免线程创建相关异常。 二、移除 std::os::windows::fs::OpenOptionsExt 新增方法 本次更新还移除了此前添加到 std::os::windows::fs::OpenOptionsExt 的新方法。 原因在于:这些新方法是 unstable 的,但 OpenOptionsExt 这个 trait 本身 不是 sealed,因此它不能被扩展加入非默认方法。 也就是说,这次修改不是简单的删除某些功能,而是出于 trait 设计约束进行的调整。对于依赖 Windows 文件扩展能力的代码来说,需要注意这部分 API 变化。 三、Clippy 修复 match_same_arms 的 ICE Rust 1.94.1 还修复了 Clippy 中 match_same_arms 的 ICE 问题。 ICE 指的是内部编译器错误,这类问题通常会直接影响开发体验,甚至导致静态检查无法正常运行。 这次修复说明 Clippy 在处理 match_same_arms 相关场景时的稳定性得到了改善,对依赖 Clippy 进行代码检查的开发者来说是一个实用修复。 四、Cargo 更新 tar 到 0.4.45 Cargo 方面,这次将 tar 更新到了 0.4.45。 这次升级的原因很明确: 它修复了 CVE-2026-33055 和 CVE-2026-33056。 需要注意的是,官方说明中还特别指出:crates.io 的用户不受影响。 同时,更多细节可以参考官方 blog 的说明。 这部分更新主要涉及依赖安全性与工具链维护,对于使用 Cargo 的开发流程来说,这是一次重要的安全修复。 五、Rust 1.94.1 本次更新重点总结 这次 Rust 1.94.1 的更新内容可以概括为以下几个重点: • 修复 std::thread::spawn 在 wasm32-wasip1-threads 上的问题 • 移除 std::os::windows::fs::OpenOptionsExt 中新增的 unstable 方法 • 修复 Clippy 中 match_same_arms 的 ICE • Cargo 更新 tar 到 0.4.45 • 修复 CVE-2026-33055 和 CVE-2026-33056 • crates.io 用户不受影响
  • ollama v0.20.2 更新:默认首页从 launch 切换到 new chat,4 个文件同步调整
    四、这次更新的整体意义 从这 4 个文件的修改可以看出,这次版本更新并不是单点修改,而是数据库、后端、前端、路由跳转逻辑同步调整。 统一后的结果就是: • 数据库存储默认值变为 chat • 数据迁移默认值变为 chat • 后端读取空值时默认变为 chat • 前端设置默认值变为 chat • 首页路由根据 chat 默认跳转到 new 最终实现了一个一致的默认体验: 应用首页默认进入 new chat,而不是 launch。 五、变更总结 本次 ollama v0.20.2 更新的核心可以概括为一句话: 默认 app home view 从 launch 改为 chat,并且相关数据库、后端和前端默认值全部同步更新。 涉及的关键文件有: • app/store/database.go • app/store/store.go • app/ui/app/src/hooks/useSettings.ts • app/ui/app/src/routes/index.tsx
  • ollama v0.20.2 更新:默认首页从 launch 切换到 new chat,4 个文件同步调整

    2026-04-05
    图片
  • ollama v0.20.0 更新:Gemma 4 全家桶发布,音频、视觉、MoE、BPE 支持全面升级
    整体来看,ollama v0.20.0 这次更新可以概括为几个核心方向: 1. Gemma 4 正式上线 • 提供了 E2B、E4B、26B、31B 多种规格 • 支持 GGML 模型 2. 音频能力全面增强 • 支持音频输入 • 新增转写命令 • 增加 OpenAI 音频 API 与 transcription API 支持 • 支持 input_audio • 简化音频输入方式 3. Tokenizer 和模板能力增强 • 增加 SentencePiece-style BPE 支持 • pipeline 尊重 add_bos_token • renderer 重写并修复 BOS token 输出 4. MoE 与推理路径优化 • 增加 per_expert_scale • 修复 MoE 相关问题 • 调整字段格式和分裂逻辑 • 改进缓存复用 5. 测试与工程能力增强 • 视觉测试稳定性提升 • 新增 thinking tests • 补充 Gemma 4 音频测试与 OpenAI API 覆盖
  • ollama v0.20.0 更新:Gemma 4 全家桶发布,音频、视觉、MoE、BPE 支持全面升级

    2026-04-04
    图片
  • openclaw v2026.4.1 发布!16 大核心功能升级 + 28 项关键修复,AI 智能体网关全面进化,稳定性与安全性再攀高峰
    核心功能新增(Changes):16大特性,全面强化AI智能体核心能力 (一)Tasks/chat:会话原生任务面板,后台任务管理更便捷 本次更新率先为聊天模块新增**/tasks命令,打造会话原生的后台任务面板,实现当前会话内任务的可视化管理。该功能直接集成于聊天界面,无需切换外部工具,用户可实时查看会话关联的所有后台任务详情,包括任务执行状态、进度、耗时等核心信息;当会话无关联任务时,面板会自动显示最近任务记录与代理本地回退计数**,让用户清晰掌握智能体任务执行历史与异常回退情况,彻底解决此前版本中后台任务“不可见、难追踪”的痛点。 这一优化将任务管理与聊天会话深度绑定,实现“对话-任务-反馈”的闭环体验,无论是临时执行的文件处理、数据查询,还是长期运行的自动化脚本、定时任务,用户都能通过简单命令实时掌控,大幅提升AI智能体任务执行的透明度与可控性。 (二)Web search/SearXNG:集成SearXNG搜索插件,私有化搜索更安全 针对用户对私有化、可配置网页搜索的需求,新版本正式加入SearXNG提供商插件,作为内置网页搜索能力的重要补充。SearXNG作为开源隐私搜索引擎,支持聚合多个搜索源结果且不追踪用户行为,此次集成后,用户可通过配置host参数自由指定SearXNG服务地址,既可以使用公共实例,也能部署私有实例,实现完全自主可控的网页搜索。 相比此前依赖单一搜索源的模式,SearXNG集成带来三大优势:一是隐私保护升级,搜索请求不经过第三方商业平台,避免用户查询信息泄露;二是结果更全面,聚合多平台搜索结果,覆盖更广泛的信息源;三是部署更灵活,支持本地、内网、云端多种部署方式,适配个人、企业不同网络环境,完美契合OpenClaw本地优先的核心定位。
  • dify 1.13.3版本深度解析:稳定性全面升级,工作流、流式传输、知识检索三大核心模块重磅优化
    1.1 LLM节点:模型参数动态化,适配复杂业务场景 在以往版本中,LLM节点的模型参数(如温度值temperature、最大生成长度max_tokens、上下文窗口大小等)均为固定配置值,开发者需在工作流设计阶段手动预设,无法根据业务场景、用户输入、前置节点输出结果进行动态调整。这一限制导致工作流在应对复杂多变的业务需求时灵活性不足,例如: • 针对不同用户等级,需动态调整LLM生成内容的创新性(temperature参数); • 根据输入文本长度,自动适配最大生成长度,避免资源浪费; • 结合前置数据处理节点的输出结果,动态配置模型的上下文关联逻辑。 v1.13.3版本彻底打破这一限制,允许开发者在LLM节点的模型参数配置中直接引用工作流中的全局变量、前置节点输出变量、用户输入变量。通过简单的变量表达式,即可实现模型参数的动态赋值,让LLM节点真正适配千变万化的业务场景,大幅提升工作流的智能化与自适应能力。 1.2 问题分类器节点:分类规则参数化,提升配置效率 问题分类器作为工作流中实现请求分流、业务逻辑分支的核心节点,其分类阈值、匹配权重、置信度标准等参数,直接影响分类准确性与执行效率。此前版本中,这些参数同样为固定值,无法根据不同业务场景动态调整。 本次更新后,问题分类器节点的核心参数全面支持变量引用。开发者可将分类阈值、匹配权重等参数与工作流变量绑定,例如: • 根据系统负载动态调整分类置信度阈值,平衡效率与准确性; • 针对不同数据源、不同用户群体,设置差异化的分类匹配权重; • 通过前置节点的计算结果,自动优化分类规则参数,实现自适应分类。 这一更新让问题分类器节点的配置更灵活、更高效,无需反复修改节点配置,即可适配多场景、多维度的分类需求。
  • dify 1.13.3版本深度解析:稳定性全面升级,工作流、流式传输、知识检索三大核心模块重磅优化

    2026-04-02
    图片
  • go-zero v1.10.1 更新解析:JSON5 配置正式支持 Redis 通用命令 Do DoCtx 上线 Go 1.24 升级与 core/codec 关键安全修复全梳理
    二、新功能亮点:两大核心能力升级,开发效率再突破 2.1 core/conf:新增JSON5配置支持,配置文件更灵活易读 配置管理是微服务框架的核心能力之一,此前go-zero主要支持JSON、YAML等配置格式,而JSON5作为JSON的超集,在保留JSON兼容性的基础上,增加了诸多人性化特性,如支持注释、 trailing commas(尾部逗号)、单引号、多行字符串等,极大提升了配置文件的可读性与可维护性。 在go-zero v1.10.1中,core/conf模块正式加入JSON5配置支持,开发者无需额外引入第三方库,即可直接使用JSON5格式编写配置文件。这一更新解决了传统JSON配置文件无法添加注释、格式约束严格的问题,尤其适合复杂微服务项目中多环境、多模块的配置管理场景。例如,在配置Redis、MySQL等中间件连接信息时,可直接在配置项旁添加注释说明用途、默认值及注意事项,团队协作时配置文件的理解成本大幅降低。 2.2 core/stores/redis:新增Do/DoCtx通用命令执行方法,Redis操作无边界 Redis作为微服务架构中最常用的缓存与数据存储中间件,其命令丰富多样,而框架内置的Redis客户端往往仅封装常用命令,对于特殊命令、自定义命令或新版本Redis命令的支持存在滞后性。go-zero v1.10.1针对这一痛点,在core/stores/redis模块中新增了Do/DoCtx方法,实现了通用Redis命令的执行能力。 Do方法支持传入任意Redis命令及参数,直接与Redis服务器交互,返回原生的Redis响应结果;DoCtx则在此基础上增加了上下文(Context)支持,可实现请求的取消、超时控制,适配微服务中高并发、高可用的场景需求。这一更新彻底打破了框架对Redis命令的封装限制,开发者可直接执行任何Redis命令,无需等待框架更新封装,极大提升了Redis操作的灵活性与扩展性。无论是执行Redis 7.0+的新命令,还是自定义Lua脚本相关命令,都能通过Do/DoCtx方法轻松实现。
  • ollama v0.19.0 发布!Web 搜索插件上线、多模型兼容修复、MLX 与 KV 缓存全面优化,本地大模型体验再升级
    1. 应用体验优化 ollama应用将不再错误显示“模型已过时”提示,彻底解决此前版本中模型状态判断异常的问题,避免用户被无效提示干扰,提升使用流畅度。 2. Web搜索插件集成 ollama launch pi功能新增内置Web搜索插件,该插件直接使用ollama官方Web搜索能力,无需额外配置即可让本地模型具备联网搜索能力,拓展本地大模型的信息获取边界,支持实时检索最新数据。 3. Anthropic兼容API性能提升 优化使用Anthropic兼容API时的KV缓存命中率,减少重复计算与资源消耗,提升API调用的响应速度与效率,尤其在高频、长对话场景下效果显著。 4. Qwen3.5模型工具调用修复 修复Qwen3.5模型工具调用解析问题,解决此前版本中工具调用内容被错误输出在思考模块的问题,确保工具调用逻辑清晰、结果准确,保障Qwen3.5模型的函数调用能力正常生效。 5. MLX运行器增强 • MLX运行器在提示词处理过程中会创建周期性快照,实现状态的持续备份,避免处理中断导致的进度丢失; • 修复MLX运行器中KV缓存快照的内存泄漏问题,优化内存资源占用,提升长时间运行的稳定性; • 优化MLX运行器的缓存驱逐与LRU跟踪逻辑,提升缓存管理效率; • 合并setStateRaw与setStateDetached为setState,简化API调用逻辑,降低开发与使用复杂度。
  • ollama v0.19.0 发布!Web 搜索插件上线、多模型兼容修复、MLX 与 KV 缓存全面优化,本地大模型体验再升级

    2026-03-31
    2跟贴
    图片
  • openclaw v2026.3.28更新详解:模型适配、插件增强、多平台优化一网打尽
    1. xAI(Grok)功能升级 • 捆绑的xAI提供商迁移至Responses API,新增原生x_search搜索能力。 • 自动启用xAI插件,无需手动切换,基于已有的网页搜索与工具配置,即可直接使用Grok认证与搜索流程。 • 新增Grok网页搜索插件引导:在openclaw onboard和openclaw configure --section web流程中,提供可选的x_search设置,包含共享xAI密钥的模型选择器。 2. MiniMax图像生成能力新增 • 新增MiniMax图像生成提供商,支持image-01模型。 • 核心能力:支持图像生成、图像到图像编辑,可自定义图像宽高比。 • 模型目录精简:仅保留M2.7模型,移除M2、M2.1、M2.5、VL-01等旧版模型。 3. OpenAI/Codex功能优化 • 为OpenAI与OpenAI Codex模型默认启用apply_patch功能。 • 对齐apply_patch的沙箱策略访问权限与写入权限,保障操作安全性。
  • openclaw v2026.3.28更新详解:模型适配、插件增强、多平台优化一网打尽

    2026-03-30
    图片
  • openclaw v2026.3.24 版本发布:从OpenAI模型与Embedding到Teams与Slack交互 全链路体验与稳定性一次补齐
    1. Gateway/OpenAI兼容性升级 • 新增/v1/models与/v1/embeddings接口,实现与OpenAI生态的基础接口对齐 • 在/v1/chat/completions与/v1/responses接口中,支持显式模型覆盖转发,大幅提升客户端与RAG系统的兼容性 2. Agents/tools能力重构 • /tools接口仅返回当前智能体可立即使用的工具,精准匹配智能体可用能力 • 新增紧凑默认视图,同时提供可选的详细模式,兼顾简洁性与信息完整性 • Control UI新增实时“Available Right Now”(当前可用)区域,让用户在发起请求前清晰知晓可用工具,提升交互效率 3. Microsoft Teams深度集成优化 • 迁移至官方Teams SDK,遵循AI-agent用户体验最佳实践 • 支持1:1流式回复、带提示词启动器的欢迎卡片、反馈与反思功能、信息状态更新、输入指示器、原生AI标签 • 新增消息编辑与删除支持,无明确目标时提供线程内回退机制,适配Teams消息交互逻辑 4. Skills/install元数据增强 • 为捆绑技能(coding-agent、gh-issues、openai-whisper-api、session-logs、tmux、trello、weather)添加一键安装配置 • CLI与Control UI可在依赖缺失时自动提示并完成依赖安装,简化技能部署流程 5. Control UI/skills管理升级 • 新增状态筛选标签(全部/就绪/需设置/已禁用),并显示各状态技能数量 • 替换内联技能卡片为点击详情对话框,展示技能依赖、开关、安装操作、API密钥输入、源元数据与主页链接,实现一站式技能管理
  • openclaw v2026.3.24 版本发布:从OpenAI模型与Embedding到Teams与Slack交互 全链路体验与稳定性一次补齐

    2026-03-29
    图片
  • redis 8.6.2 发布:流 IDMP、命令处理、模块配置全修复,稳定性大幅提升
    1. 内存安全修复:解决潜在UAF风险 修复模块字符串场景下的回复复制规避机制,避免因不当使用该机制导致的潜在UAF(释放后使用)漏洞。UAF漏洞可能引发内存访问异常、数据篡改甚至服务崩溃,此次修复从底层逻辑优化模块字符串的内存管理,彻底消除该场景下的安全隐患。 2. 复制机制修复:解决全同步时的命令处理崩溃 修复副本节点执行全量同步过程中,命令处理环节可能出现的崩溃问题。在Redis主从复制架构中,全量同步是数据一致性的关键流程,此前版本中该环节的命令处理逻辑存在缺陷,易导致副本节点异常退出,此次修复优化了同步时的命令执行与资源调度逻辑,保障复制流程稳定运行。 3. 流数据(Streams)修复:新增内部命令与状态恢复能力 新增XIDMPRECORD内部命令,同时优化AOFRW(AOF重写)的消息发射逻辑,用于恢复流数据的IDMP(幂等消息生产)状态。IDMP是Redis 8.6系列为流数据新增的核心特性,用于保障XADD命令的幂等性,此次修复解决了IDMP状态在AOF重写、数据恢复时的丢失问题,确保流数据的幂等性机制始终生效。 4. 模块配置修复:优化模块回调参数传递 修复setModuleEnumConfig()函数的参数传递问题,确保该函数向模块回调传递带前缀的名称时逻辑正确。该修复保障了Redis模块的配置加载与回调执行一致性,避免因参数传递错误导致模块功能异常、配置不生效等问题。 5. 流数据修复:保障XADD IDMP/IDMPAUTO的元数据记录 修复XADD命令使用IDMP/IDMPAUTO参数时,命中现有IID(幂等ID)却未记录元数据变更的问题。此前版本中,该场景下元数据更新逻辑缺失,会导致流数据的IDMP状态与实际数据不一致,此次修复完善了元数据同步机制,确保XADD操作的幂等性与数据一致性。 6. 内存泄漏修复:多场景内存管理优化 集中修复三处潜在内存泄漏问题,覆盖流数据、模块交互、命令执行等多个核心场景。内存泄漏会逐步消耗服务器内存资源,最终导致服务性能下降甚至OOM(内存溢出),此次修复从内存分配、释放、引用管理等环节优化,彻底解决对应场景的内存泄漏风险。 7. 流数据修复:解决RDB加载后IDMP定时过期失效问题 修复Redis加载RDB快照文件后,流数据IDMP的定时过期(cron expiration)功能不生效的问题。RDB是Redis核心持久化方式,此前版本中IDMP的过期状态无法通过RDB正确恢复,导致过期消息无法自动清理,此次修复完善了RDB加载时的IDMP状态初始化逻辑,保障过期机制正常运行。 8. ACL权限修复:解决错误参数命令的ACL检查崩溃 修复执行参数数量错误(wrong-arity)的命令时,ACL权限检查环节可能出现的崩溃问题。ACL是Redis的核心安全机制,用于控制客户端命令访问权限,此前版本中对错误参数命令的ACL校验逻辑存在缺陷,易引发服务崩溃,此次修复优化了校验流程,提升ACL机制的稳定性。 9. 哈希命令修复:完善HSETEX、HGETEX的参数校验 修复HSETEX、HGETEX命令未校验FIELDS参数仅指定一次的问题。此前版本中,若重复指定FIELDS参数,命令会出现执行异常、数据错误等问题,此次修复新增参数合法性校验逻辑,确保哈希命令的参数格式符合规范,提升命令执行的可靠性。 10. 流数据修复:全面解决IDMP相关遗留Bug 集中修复流数据IDMP特性的多项遗留问题,覆盖IDMP状态管理、命令执行、数据同步、过期清理等全流程。IDMP作为Redis 8.6系列的核心新特性,此前存在多处细节缺陷,此次修复完成了IDMP特性的全面优化,保障其在生产环境的稳定可用。
  • redis 8.6.2 发布:流 IDMP、命令处理、模块配置全修复,稳定性大幅提升

    2026-03-28
    图片
正在载入...
正在载入...