炸裂开源!Meta发布“万能语音识别”,覆盖全球1600+语言
智谱GLM-4.7模型在推理和氛围编程的测试体验
微软开源Fara-7B:首个专为计算机自动化操作设计的开源智能体小语言模型
AI性能调优实战:从Profiling到极致优化的完整指南
DFLabel:YOLO算法必备!智能分割与多种标注方式全支持!
Umi-OCR:完全免费、离线运行的高精度OCR文字识别工具
Triton:Python驱动的面向GPU的高性能并行编程框架与编译器
Apache TVM:跨任意硬件的开源机器学习编译框架
面壁智能 VoxCPM-0.5B:轻量级开源语音合成模型测试体验
OpenXLA 全面解析:开源ML编译生态的性能革命
微软推出 VibeVoice-Realtime-0.5B 轻量级实时文本转语音模型
GLM-4.6V:基于原生工具调用的开源多模态模型的测试体验
深入浅出精讲 FlashAttention 原理
造相 Z-Image:阿里通义实验室开源6B参数图像生成模型
腾讯混元OCR:1B参数点燃多模态革命,文字瞬间“活”起来!
Ultralytics YOLO 和 OpenCV 环境部署全攻略
UltraRAG 与 KAG:下一代检索增强生成架构的原理、差异与实战评估
Xiaomi Miloco 深度解析:小米生态新锐,智能生活新选择
AI Agent 记忆机制设计与实现:关键技术与解决方案综述
李飞飞老师推荐!Marble 发布:2025年最强“世界模型”,Sora看了沉默,Genie看了流泪...