一个代码拼写错误,导致微软AzureDevOps服务在巴西停摆十小时
,由于一个简单的代码错误,微软 Azure DevOps 在南巴西地区的服务中断了约十个小时。IT之家注意到,微软的软件工程经理 Eric Mattingly 在周五为这次中断道歉,并揭示了事故的原因:一个拼写错误导致了十七个生产数据库被删除。
Azure DevOps提供一组集成的服务和工具,用于管理软件项目,从规划和开发到测试和部署。Mattingly 解释说,Azure DevOps 的工程师有时会对生产数据库进行快照,以便调查报告的问题或测试性能改进。他们依赖于一个每天运行的后台系统,该系统会在一定时间后删除旧的快照。近日 Azure DevOps 的工程师进行了一次代码升级,用支持的 Azure.ResourceManager.* NuGet 包替换了已弃用的 Microsoft.Azure.Managment.* 包。这导致了一个大型的拉取请求,其中更换了旧包和新包中的 API 调用。
拼写错误就发生在这个拉取请求中,它将删除快照数据库的调用换成了删除托管数据库的 Azure SQL Server 的调用。Azure DevOps 有专门的测试来发现这样的问题,但 Mattingly 说,由于错误的代码只在某些条件下运行,因此现有的测试覆盖不到。
几天后,软件更改被部署到南巴西规模单元的客户环境。该环境有一个老的快照数据库,触发了这个错误,导致后台任务删除了“整个 Azure SQL Server 和所有十七个生产数据库”。
所有数据都已经恢复,但花了十多个小时。Mattingly 说,有几个原因造成这种情况。其中之一是,由于客户无法自己恢复 Azure SQL Server ,必须由值班的 Azure 工程师来处理,这个过程大约需要一个小时。另一个原因是,数据库有不同的备份配置:有些配置为区域冗余备份,有些配置为更新的地理区域冗余备份,解决这种不匹配增加了很长的恢复时间。
为了防止问题再次发生,Mattingly 称微软已经采取了各种修复和重新配置措施,并再次向所有受此中断影响的客户道歉。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
今日报道
- 《星球大战绝地:幸存者》玩家数据公布:共击败28.56亿个敌人,单剑...
- 消息称高通骁龙8Gen2芯片售价高达160美元...
- RAEGR在印度推出MagFixMM60保护套,适用于苹果MagSa...
- Patriot展示首款无DRAM缓存PCIe5.0SSD,速度可达1...
- 东风风神全新奕炫冠军版上市,售8.99万-9.39万元...
- 马斯克私人飞机已离开上海,前往特斯拉总部所在地美国奥斯汀...
- OPPOMRGlass扩展现实头显开发者版亮相,搭载骁龙XR2+平台...
- 英伟达股价飙升:机构投资者大力支持,散户持币观望...
- 华为发布智简全光联接战略...
- 苹果全球首播不带货130万人围观最佛系态度卖最多货...
精彩热图
24小时新闻排行
最新文章
- LoopCapital:上调好市多COST.US目标价至570美元维持“
- 正式版7月发布,LinuxMint21.2发行版已结束开发:支持全局深色
- 摩托罗拉:越来越多iPhone机主转投使用安卓可折叠手机
- 苹果发布iOS/iPadOS16.6和macOSVentura13.5第
- USANA葆婴关爱童伴六一行营养健康常陪伴
- 微软更新Win11版画图应用:原生支持深色模式、优化缩放控件
- 微软宣布MixedRealityToolkit3工具包2023年Q3面向
- 印度:富士康将于明年4月起在卡纳塔克邦生产苹果iPhone手机
- 月均增长“百亿级”!今年我国快递业务量已突破500亿件
- 经典单机游戏《仙剑奇侠传》未来成谜,消息称软星多个开发团队解散