Ricerca in FOLBlog

[SdSM] Indiana Bofh and the Server Of Doom

 Scritto da alle 00:15 del 26/09/2008  Aggiungi commenti
Set 262008
 
closeQuesto articolo è stato pubblicato 8 anni 10 mesi 25 giorni giorni fa quindi alcuni contenuti o informazioni presenti in esso potrebbero non essere più validi. Questo sito non è responsabile per eventuali errori causati da questo problema.

Indiana Bofh

01/09/2008

Con il recente ‘trend’ di internettizzazione globale non e’ una sorpresa se quasi tutte le scuole stanno proponendo corsi e ricorsi che hanno come argomento la Grande Rete, solo che si sa gia cosa succede se si mettono una quindicina di ragazzotti tra i 13 ed i 18 anni in una stanza con un certo numero di computer ed una connessione ad Internet. Uno dei poveri tapini che ha scoperto sulla sua pelle e sul suo account il risultato di una simile manovra e’ $NoiInsegniamoConRispetto, nota accolita di super-cattolici-osservanti (quelli che in termini non troppo ossequiosi si potrebbero definire BIGOTTI), i quali, dopo aver messo al rogo tutti i computer “infetti” ed aver recitato i loro 50 rosari di espiazione, si sono rivolti a noi perche’ trovassimo il modo di tenere i “giovani lontani dalle tentazioni meretrici”.

La soluzione e’ stata l’installazione di un server con Squid+DansGuardian, ed una serie di regexp per filtrare tutto l’involuto (cioe’ il 99% di tutta la rete) e lasciare solo il permesso (cioe’ niente).

Ma dato che tutta la combriccola ha in piano di passare dall’attuale sistema (con un singolo proxy ‘centrale’) ad un sistema piu’ strutturato, con un proxy per ogni scuola ed un server di posta dedicato, DaBoss ha pensato di fare una cosa superelaborata ed usare 4 macchine virtuali sul server per suddividere i compiti.

Percui, entra in scena il ‘proxy’ che e’ composto dalla macchina ‘host’ che esegue proxy (vm 1), webmail e gui di amministrazione della posta (vm 2), server radius e dns (vm 3) e smtp/db server (vm 4). Per qualche strano motivo (leggasi: sconti), l’hardware prescelto per l’accrocchio e’ un Sun Fire X1200, che a me e’ stato sulle balle dal momento in cui lo ho tirato su dalla pila dei server e per tutta risposta lui mi ha tirato una delle slide su un piede.

Dopo aver fatto presente le mie rimostranze (che secondo me, tutta questa virtualita’ va a scapito delle prestazioni e della semplicita’ del sistema) ho installato l’arnese, riportato tutte le configurazioni, fatto un paio di test in ufficio, poi abbiamo portato il coso in co-lo, attaccato alla rete, copiato la vecchia posta e tutto il resto dalla macchina vecchia e via che si va.

Il meledetto si e’ inchiodato subito dopo un paio d’ore. Due delle VM apparivano in stato ‘run’ nella console, ma non davano segno di vita alcuno. Ammazza le vm, riavviale e sembrano funzionare.

A questo punto cominciano a piovere le lamentele: e’ piu’ lento di una lumaca stanca.

Un paio di controlli sulla vm del proxy mi dicono che il load average e’ tra 12 e 21. Cerco di fare qualche smanettamento per vedere se riesco a sveltire la cosa quando W mi segnala che il server IMAP (dovecot) non risponde piu’. Guardo e vedo che dovecot e’ semplicemente kaputt. Lo riavvio e sembra piu’ contento. Ma noto anche che l’ora di sistema della vm e’ avanti di una bella mezz’ora. Oh bella. La rimetto a posto e dovecot decede all’istante (?). Riavvio (di nuovo) Dovecot. E continuo a cercare di capire che ha st’arnese. Non trovo un fico secco salvo il vedere delle lentezze mostruose tra l’arrivo della connessione e l’uscita di un qualunque dato utile dalla macchina.

Spiego meglio: io vedo i primi 3-4 pacchetti arrivare, la connessione si stabilisce e poi niente, nada, nothing, niets! Una bella “Windows Pause” (non succede niente per nessun motivo specifico) per uno/due minuti e poi la connessione va avanti come se niente fosse…

Il mattino dopo tutte e 4 le vm sono cadaveri. Sempre ‘run’ nella console ma niente di niente. Riavvio tutte e 4 e vedo subito che 3 delle 4 vm hanno la data di sistema nel pallone: o corre come una lepre o e’ lenta come una tartaruga. L’unico indizio sulla ‘morte’ delle VM e’ un errore riportato nel dmesg che indica un problema con il controller SCSI (virtuale).

Nel primo pomeriggio mi arriva anche la notizia che, apparentemente, da una delle scuole non riescono a collegarsi al proxy. Solo da una, dalle altre funziona tutto. In effetti non riesco a trovare nel log una connessione da quella scuola, solo dalle altre. Che accidenti ha sto’ maledetto? E’ un laico e protesta per essere dai cattolici?

I problemi si susseguono con vm che muiono a destra e a manca, l’orologio di sistema che continua ad andare per conto suo nonostante tutto (prima che mi riempiate di commenti: si’, vmware_tools ERA installato e funzionante), errori e kernel panic riferiti al controller scsi virtuali. Riguardo quest’ultimo, riesco a trovare un riferimento (UNO) allo stesso errore su un forum Sun, guarda caso si riferisce allo stesso identico hardware che abbiamo noi ed ovviamente non ha nessuna soluzione.

Dopo una settimana di bestemmie decido che qualche cosa s’ha da fare e che la cosa migliore e’ cestinare l’idea delle macchine virtuali. Comincio percio’ il trasferimento di tutti i servizi sulla macchina ‘host’ (hardware reale). Il risultato e’ istantaneo, dalla famosa scuola da cui non potevano collegarsi adesso si collegano e tutti affermano che “adesso e’ veloce come prima, anzi meglio”. Ok, questa e’ la strada giusta allora.

Nei giorni successivi trasferisco tutte le funzioni sulla macchina host e spengo una alla volta le macchine virtuali. Alla fine della settimana ho praticamente un server normale con tutte le funzionalita’ del server precedente. A questo punto e’ arrivato DaBoss.

DB – Che accidenti succede con $NoiInsegniamoConRispetto?
IO – Succede che quel maledetto Sun Fire non va d’accordo con VmWare e noi non sappiamo perche’.
DB – Hummm… ok, adesso vado ad ordinare un’altra macchina, prendiamo un Sun X2200, con controller raid hardware…
IO – Ma senti, al momento, per fargli funzionare st’arnese, ho semplicemente spostato tutti i servizi sul server reale e funzionano tutti. Da lunedi’, quando ho spostato gli ultimi due servizi, non ho sentito altre lamentele, ed anche H ha detto che adesso il monitoring non si lamenta piu’ del server. Non e’ molto meglio semplicemente lasciare perdere st’idea delle macchine virtuali?
DB – …adesso non si lamentano piu’?
IO – Io non ho sentito altre lamentele.
DB – Hummmmm…. ok, allora teniamolo cosi’… e poi vedremo…

Qualche volta “KISS” e’ il sistema migliore.

Davide

legenda personaggi

[ratings]

Technorati Tags: Storie dalla Sala Macchine,humor

Articoli simili:

  • Facebook
  • Twitter
  • Delicious
  • StumbleUpon
  • Wikio
  • Reddit
  • Technorati
  • Segnalo
  • Live
  • Add to favorites
  • Email
  • RSS

 Lascia un commento

Puoi usare questi tag e attributi HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(richiesto)

(richiesto)

Pinterest
EmailEmail
PrintPrint
%d blogger hanno fatto clic su Mi Piace per questo: