微软报告了连续两天的Azure服务故障,包括昨日影响虚拟机管理操作的中断,以及今日在美国东部和西部地区发生的Azure资源托管身份服务中断。
据微软报告,今日的Azure资源托管身份服务问题影响了美国东部和西部地区,持续近六小时,从协调世界时0015至0605。当用户尝试创建、更新、删除或获取令牌时出现问题。
安全漏洞和系统停机往往源于手动管理密钥和证书。Azure资源托管身份服务旨在减轻开发者的凭证管理负担。
这次已得到缓解的故障"影响了依赖服务,包括Azure Synapse Analytics、Azure Databricks、Azure Stream Analytics、Azure Kubernetes Service、Microsoft Copilot Studio、Azure Chaos Studio、Azure Database for PostgreSQL灵活服务器、Azure Container Apps和Azure AI Video Indexer"。受影响范围相当广泛。
这次停机紧随另一次故障发生,前一次故障中虚拟机的服务管理操作导致错误通知。微软给出的例子包括"创建、删除、更新、扩展、启动、停止"。
与今早的停机一样,昨日的问题因服务对这些操作的依赖性而加剧,包括Azure Arc启用服务器、Azure Batch、Azure Cache for Redis、Azure Container Apps、Azure DevOps、Azure Kubernetes Service、Azure Backup、Azure Load Testing、Azure Firewall、Azure Search、Azure虚拟机规模集和GitHub。
微软在昨晚协调世界时1946承认了这个问题,但没有提供缓解时间表。The Register已询问更多细节,如果公司回应将更新本文。
GitHub在协调世界时1903注意到Actions性能下降,直到2月3日协调世界时0056,这家代码托管公司才表示事件已解决。
至于虚拟机故障的原因,微软表示:"我们确定根本原因是一项配置更改,意外限制了对用于托管虚拟机扩展包的某些微软管理存储账户的公共访问。"
是的,微软进行了一项配置更改,意外地破坏了多个地区开发者的服务。这些开发者可能会建议微软在部署到生产环境之前测试更改。
这些问题突出了云服务之间的相互依赖性。一个地方的错误配置更改可能导致其他地方的连锁问题。
Q&A
Q1:Azure资源托管身份服务是做什么的?
A:Azure资源托管身份服务旨在减轻开发者的凭证管理负担,帮助解决因手动管理密钥和证书而导致的安全漏洞和系统停机问题,让开发者无需手动管理这些敏感信息。
Q2:这次Azure故障影响了哪些服务?
A:故障影响了众多依赖服务,包括Azure Synapse Analytics、Azure Databricks、Azure Kubernetes Service、Microsoft Copilot Studio、Azure Container Apps、GitHub Actions等多项服务,造成了广泛的连锁影响。
Q3:微软虚拟机故障的根本原因是什么?
A:根本原因是一项配置更改意外限制了对某些微软管理存储账户的公共访问,这些存储账户用于托管虚拟机扩展包,这个配置错误导致了虚拟机管理操作出现问题。
热门跟贴