Chrome Skills来了!一键调用+跨标签页抓取
2023年4月15日,谷歌推出了一项名为"Skills"的新功能,旨在简化用户在Chrome浏览器中的操作。通过保存复杂的AI提示词为一键式工具,用户无需在不同网页间重复输入同一句话。然而,该功能的安全性引发关注,系统必须获得用户的二次批准才能执行关键操作,如向日历添加事件。此外,为应对潜在的安全威胁,谷歌采用了自动红队测试和防护升级措施。Skills的隐私保护设计使其成为用户信息处理过程中的重要环节。
谷歌深夜大招!机器人学会看仪表盘干活,成功率飙升300%
4月15日,谷歌推出了Gemini Robotics-ER 1.6机器人模型,引入了一项新的功能:仪表读数。这一功能使机器人能够读取复杂的压力表和液位观察窗等设备。然而,该技术在提高机器人在高精度工业任务中的自主性同时,也面临潜在风险。谷歌强调,与以往版本相比,Gemini Robotics-ER 1.6在遵守物理安全约束方面有显著提升,但在测试中仍需确保其对伤害事故报告的识别能力足够准确,以避免可能的安全隐患。
有了这个Agent,上班路上也能做表了
智东西4月14日报道,千问推出了一款新的"表格Agent",旨在提高用户在Excel文件处理上的效率。尽管该工具能够通过自然语言快速执行复杂的计算和格式调整,但在某些情况下,列宽调整后可能会导致表格变得拥挤。此外,该工具对数据源的清晰度要求较高,上传内容混乱或复杂的数据可能影响结果质量。在生成图表时,提示词需要足够具体,以确保准确性。
Meta AI基建负责人离职与高管变动
Meta在AI基础设施领域面临人事挑战,负责部门的副总裁阿帕娜・拉马尼宣布离职。她在Meta工作十余年,领导了AI基础设施的建设。在此之前,OpenAI的三位关键负责人已加入Meta。此外,公司的多位高管也在过去一个月内相继离任。这些人事变动可能影响Meta的算力和AI研发节奏,给公司带来核心人才流失风险。
百度又开源!消费级GPU可跑,文字渲染能力对标Nano Banana
4月15日,百度开源文生图模型ERNIE-Image,参数规模仅8B,可在24GB显存的消费级GPU上运行。尽管该模型在多主体空间关系控制、数据图表生成和光影细节还原方面表现良好,但其文字渲染能力存在明显不足。在复杂文字、多语言内容或人物关系处理上出现理解偏差和错误情况。此外,中英日韩四语混排测试中也出现了遗漏字母和韩文错误的问题。这些负面事件限制了ERNIE-Image在高要求场景中的应用潜力。
深夜大涨,空头遭重锤,超18万人爆仓
在4月14日晚,加密货币市场出现显著上涨,比特币突破75000美元大关。此次价格上涨导致超过18.5万投资者爆仓,总金额超过6.6亿美元,其中空头损失达5.21亿美元。
李飞飞世界模型“杀手锏”开源
4月15日,李飞飞的团队World Labs开源了3DGS渲染器Spark 2.0。该版本旨在解决网页端大规模三维场景的渲染问题,通过连续LoD、.RAD格式和虚拟显存技术来优化大场景渲染。然而,新版仍面临着与高端GPU相关的性能挑战,这限制了部分设备的运行效率。因此,该技术的开源既是为了降低空间智能创作门槛,也反映出竞争对手在定义空间内容基础设施中的挑战。
AI早报 | 高德首款具身机器人将亮相;Seedance 2.0全面开放API服务
哩布哩布AI因内容安全问题引发关注,已启动内部专项排查,并发现平台在复杂提示词组合下生成不符合规范内容。此外,OpenAI因战略转向和面对竞争者Anthropic的挑战,其高达8520亿美元估值受到投资者质疑。
郑纬民谈TaaS范式跃迁,北电数智发布新AI生产系统,酒仙桥论坛干货一文看尽
在酒仙桥AI产业高峰论坛上,中国工程院院士郑纬民指出,随着智能时代的演进,token已成为产业竞争的核心,挑战传统大模型服务。现有基础设施无法满足低成本、大规模生产token的需求,造成资源浪费。郑纬民强调,需实现全系统异构协同、存算协同和智能调度,以提高生产效率。与此同时,李海洲分析指出,中美大模型性能差距缩小,中国在开源领域领跑,但能源供给仍是瓶颈。
阿里AI视频模型“欢乐马”正处于最终优化冲刺阶段,两周后发布
近日,阿里巴巴推出的AI视频模型HappyHorse-1.0在Arena平台上线开放测试。早期评估显示该模型在视频编辑领域表现优异。当前,开发团队正进行最后的优化,预计两周后正式发布。报道称,该模型支持文本、图像转视频及音频生成,并已登顶Artificial Analysis的排行榜,超过竞争对手字节跳动的Seedance和快手可灵。阿里表示,模型正处于内测中,并向用户开放体验入口以获取反馈。
热门跟贴