Projekt tardigrade chrání vaše VMS před chybami hostitele

Obsah:

Video: На что СПОСОБЕН ДРОН | CS:GO - Интересное 2024

Video: На что СПОСОБЕН ДРОН | CS:GO - Интересное 2024
Anonim

Po několika změnách Azure a vylepšení zabezpečení v posledních několika měsících společnost Microsoft představuje Project Tardigrade jako svůj nejnovější pokus o zvýšení spolehlivosti Azure.

Projekt Tardigrade zabraňuje selhání platformy

Projekt Tardigrade je nová služba, která si klade za cíl zlepšit odolnost Azure. Zahrnuje strategie zmírnění, které chrání Azure VM proti selhání platformy.

Zde popsal Mark Russinovich, hlavní technologický ředitel společnosti Microsoft Azure, aktuální práci na Azure:

Naším cílem je zmocnit organizace, aby spolehlivě provozovaly svou pracovní zátěž na Azure. Díky tomuto hlavnímu principu neustále investujeme do vývoje platformy Azure, abychom se stali odolnými proti chybám, a to nejen proto, abychom zvýšili produktivitu podnikání, ale také poskytovali bezproblémový zákaznický zážitek.

Aby se předešlo dopadu na vaše pracovní vytížení, služba umožňuje komponentám se samoléčit a rychle se zotavit z možných selhání, a to i v kritických chybách hostitele.

Jak funguje Project Tardigrade?

Zde je příklad, jak funguje pracovní postup obnovy Tardigrade:

  • Fáze 1: Tento krok nemá žádný dopad na provozování virtuálních počítačů zákazníků. Jednoduše recykluje všechny služby běžící na hostiteli. Ve výjimečném případě, že se chybná služba úspěšně restartuje, přejdeme do fáze 2.
  • Fáze 2: Naše diagnostická služba běží na hostiteli, aby se systematicky shromažďovaly všechny relevantní protokoly / výpisy, abychom zajistili, že můžeme důkladně diagnostikovat příčinu selhání ve fázi 1. Tato komplexní analýza nám umožňuje „příčinu problému“ vyřešit, a tím zabránit opakování v budoucnu.
  • Fáze 3: Na vysoké úrovni obnovujeme operační systém do zdravého stavu s minimálním dopadem na zákazníka, abychom zmírnili problém hostitele. Během této fáze zachováme stavy každého VM na RAM, po kterém začneme resetovat OS do zdravého stavu. Zatímco se operační systém rychle resetuje pod, spouštění aplikací na všech virtuálních počítačích hostovaných na serveru se „dočasně zastaví“, protože procesor je dočasně pozastaven. Tato zkušenost je podobná síťovému připojení dočasně ztracenému, ale rychle obnovenému kvůli logice opakování. Po úspěšném resetu operačního systému spotřebovávají VM uložený stav a obnovují normální činnost, čímž obcházejí potenciální restartování virtuálního počítače.

S ohledem na to zajistí Project Tardigrade, že selhání kterékoli jednotlivé komponenty v hostiteli neovlivní celý systém. Zákaznické VM proto nebudou ovlivněny hostitelskými chybami.

Společnost Microsoft usilovně pracuje na vylepšení a rozšíření různých scénářů selhání hostitele, aby zajistila, že jejich platforma cloud computing je spolehlivější než kdykoli předtím.

Očekávejte nový vývoj a další implementace spolehlivosti v blízké budoucnosti.

Projekt tardigrade chrání vaše VMS před chybami hostitele