Ricerca in FOLBlog

[SdSM] Che Bello Il Backup

 Scritto da alle 00:15 del 18/01/2009  Aggiungi commenti
Gen 182009
 
closeQuesto articolo è stato pubblicato 8 anni 10 mesi 6 giorni giorni fa quindi alcuni contenuti o informazioni presenti in esso potrebbero non essere più validi. Questo sito non è responsabile per eventuali errori causati da questo problema.

Quando funziona ovviamente. Ma andiamo con ordine.

E’ settembre! Ed il mio collega T se ne va (finalmente) in vacanza, anche se e’ abbastanza incacchiato perche’ invece che andare a giocare a fare Indiana Jones se ne andrà semplicemente in giro a cazzeggiare. Comunque, prima di andarsene mi ha passato una lista di cose da fare, per cui piglio in mano la lista e comincio a guardare. La prima voce dice “aggiornare backup su MacServer”.

Si, il MacServer e’ lo schifoso arnese che fa da server di posta, DNS ed altre cose varie di cui ho detto un po’ di tempo fa. Dopo quell’evento se non altro il maledetto coso e’ stato tolto dallo sgabuzzino, spostato nel rack insieme agli altri server ed attaccato ad un UPS. E tanto per non sbagliarsi i servizi di DHCP e DNS sono stati spostati su altre macchine meno rognose. Ma rimane sempre il server di posta e “repository” centrale di documenti.

Fino ad ora, il backup su questo arnese era fatto con un buon-vecchio RSync verso il nostro server di backup, ma adesso vogliamo cercare di centralizzare la gestione del backup usando un tool (in Java) che consenta di avere un colpo d’occhio generale delle cose. Il Tool e’ composto da una parte server (che già funziona) ed un client che occorre installare sul client. Dopo di che, in genere, si controlla dal server e basta (una volta che il daemon funziona e si scarica le configurazioni intendo).

Seguo le distruzioni installando il client, il set di backup era gia definito da T, lo abilito su questa chiavica di web-interfaccia, e via. Il mattino dopo mi aspetta una bella mail di “backup fallito”. Senza nessuna spiegazione. Guardo nella famosa interfaccia, nada, nessuna informazione. Mi dice solo “backup fallito, nuovi files 0, files uploadati 0”. Che bello il backup! Ok, che accidenti ha che non va?

Faccio login nel maledetto arnese (il Mac ovviamente) e cerco di capire quale puo essere il problema. Dopo un po’ capisco che non lo capiro. (se vi si sono incrociate le palle degli occhi leggendo l’ultima frase sapete come mi sentivo io quel giorno) Quindi procedo con il sistema degli antichi: lancio il backup a manella e mi metto ad aspettare che vada nel pallone. Alle 6 di sera decido che me ne vado a casa ed il backup si arrangia. Il mattino dopo (24 ore dopo) sta ancora girando, informandomi che ha uploadato il file numero 23.567 di 875.432.

Un rapido calcolo mi dice che se ci ha messo 24 ore ad uploadare 23 mila files, per uploadarne 875 mila ci mettera un mese. Dopo essermi grattato la pera per un po’ fermo il coso e comincio a rimuovere roba dal set di backup. Riducendolo all’essenziale (che significa: le directory degli utenti e poco altro) e poi rilancio il processo.

Il mattino dopo mi informa che il backup e’ finito con errori, quali siano questi errori non e’ dato saperlo. Il “report” e’ un mastodontico file .htm di 175 Mb, che non ho nessunissima intenzione di leggere. Ok, se non altro funziona. Lo aggiungo allo “schedulatore” e vediamo cosa succede.

Altro giorno, altra mail con “backup fallito” e poco altro. Stavolta scovo il file di log che contiene un laconico “cannot contact property server”. Hummm… il nome del server e’ giusto si? Si. E riesco a fare ping si? Si. E riesco ad accedere al coso sia via HTTP che HTTPS si? Yup! Firewall? Nope! Permessi di root? Lo scheduler gira come root. Ok, e’ il momento di contattare il supporto tennico di questa gente. Dopo 3 ore perse cercando di decifrare il merdoso captcha che serve per registrarsi nel loro supporto tennico (ed il fatto che io non riesca a leggere sta roba mi fa dubitare seriamente della mia umanita) parte la mail.

Surprise, surprise! Rispondono quasi immediatamente. Con buona pace mia che gia temevo in un ripetersi della mia esperienza con $merdavigliosasoftwarehouse. Mi risponde invece un tizio che mi chiede di zippare e mandargli questo e quel file di log e di controllare questo e quel parametro di configurazione.

Scopriamo quasi subito che il client pensa di essere eseguito da un utente invece che da root con il risultato che non riesce ad aggiornare il suo file di configurazione perche’ tale file e’ scrivibile solo da root. Lartato al suo posto il client io schedulo un nuovo backup e lo vedo partire senza fallo (nel senso che non sembra fare ca$$ate). Contento e felice di aver trovato qualcuno che in effetti risolve i problemi me ne vado a casa dopo aver schedulato il “vero” backup a mezzanotte.

Ed il mattino dopo non mi ritrovo una mail di “backup completato con successo”, in effetti non ho nessuna mail. Perche’? Perche’ lo “scheduler” pare sia morto di morte naturale ad un’ora non ben precisata tra le 17.30 e le 24.00, quando doveva partire il famoso backup. Mi sembrava troppo bello. Ok, altra mail al supporto tennico. Altra risposta quasi immediata. Stavolta mi chiedono di vedere questo e quel log e di vedere se c’e’ un file di dump di Java. Non trovo residui caffeinici nel server e loro suggeriscono di aggiornare il client all’ultimissima versione. Eseguo. Avvio lo scheduler, pare restare in piedi. Peccato che a questo punto il backup non si avvii ritornandomi lo stesso errore di “cannot contact property server”.

A questo punto ho provato ad avviare il backup via cron e l’ho visto andare a termine senza grossi problemi, tranne un paio di errori di “file not found”. Dopo essermi grattato la pera pensando “ok, ‘file not found’, ma quale file?” ed aver girato tale domanda al supporto tennico, ricevo un’altra mail dallo stesso supporto che mi suggerisce di bloccare lo scheduler e di riavviarlo richiamando direttamente java da console, senza usare SystemStarter.

Eseguo, guardo lo scheduler dirmi che il successivo backup verra eseguito in 8 minuti… 7 minuti… 6 minuti… Ok aspetto. 10 minuti dopo mi chiedo che e’ successo al backup e scopro che il countdown e’ terminato due minuti prima dell’ora X e che lo scheduler e’ deceduto.

Altra mail al supporto tennico che mi suggerisce di applicare una patch al codice (aka: edita questo-e-quel file e cambia questo-e-quel parametro). Eseguo. Riavvio lo scheduler, quello avvia il backup che si interrompe con il solito “cannot contact property server”.

Oooookey, una settimana passata e sono ancora al punto 1 della lista. Adesso sono al punto in cui a) il backup funziona da cron o eseguito manualmente, anche se segnala “file not found” ma non mi dice quale file non e’ found o b) lo scheduler decede per ca$$i suoi senza avviare una mazza o avvia il processo che pero’ non puo’ leggere i suoi files.

Mi vengono i brividi pensando a quando dovro provare un restore… e adesso che ci penso… la chiave di decrittazione la conosce solo T, ma non c’e’ problema, a questo ritmo sara’ tornato da un pezzo quando arrivero a provare il restore.

Davide

legenda personaggi

Technorati Tags: Storie dalla Sala Macchine,humor

Articoli simili:

  • Facebook
  • Twitter
  • Delicious
  • StumbleUpon
  • Wikio
  • Reddit
  • Technorati
  • Segnalo
  • Live
  • Add to favorites
  • Email
  • RSS

 Lascia un commento

Puoi usare questi tag e attributi HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(richiesto)

(richiesto)

Pinterest
EmailEmail
PrintPrint
%d blogger hanno fatto clic su Mi Piace per questo: