Le terme de haute disponibilité se réfère pour simplifier à une architecture informatique
qui a un taux de disponibilité supérieur à 99%
Par des mécanismes de redondance des organes du système d'information, on obtient une tolérance aux pannes efficace.
Le monde du logiciel libre est très bien fourni pour de la haute disponibilité système :
Il existe entre autres drbd, qui permet de faire du raid réseau sur des partitions du disque,
c'est à dire qu'une opération disque (ex: écrire un fichier) est synchronisée entre les machines,
de manière à ce que les informations sur la partition en question soient identiques sur les serveurs.
Dans le mode le plus courant, un seul des serveurs a accès en écriture sur cette partition
et lance le service associé (serveur de mail par exemple avec les comptes utilisateur sur une partition répliquée par drbd)
Quand ce serveur tombe en panne, le serveur "failover" (celui qui était passif, et attendait sur le banc de touche),
ayant toutes les informations nécessaires, lancera automatiquement le service chez lui,
en prenant soin de devenir primary (pouvoir lire et écrire) du point de vue drbd pour la partition répliquée.
Lorsque le serveur en panne est réparé, il revient dans la chaîne, mais passif (en prenant la place sur le banc de touche, encore chaude.)
Pour cette détection de perte de service et action correctrice automatique, il existe le projet Linux HA (heartbeat / pacemaker), qui dans sa version 2 permet d'atteindre une complexité de scénarios tout à fait épatante.