Ricerca in FOLBlog

[SdSM] Presto! Presto! Presto!

 Scritto da alle 06:27 del 29/01/2012  Aggiungi commenti
Gen 292012
 
closeQuesto articolo è stato pubblicato 5 anni 9 mesi 22 giorni giorni fa quindi alcuni contenuti o informazioni presenti in esso potrebbero non essere più validi. Questo sito non è responsabile per eventuali errori causati da questo problema.

chiedere-aiuto-caso-emergenza

E’ (di nuovo) la meta’ di Dicembre (cosa che capita tutti gli anni da un po’ di tempo) e la neve cade leggera al suolo poi si surgela provocando catastrofi nella viabilita’. Il risultato e’ che l’ufficio e’ letteralmente decimato dal punto di vista della presenza. Considerando che ci sono un massimo di 10 persone in questo ufficio, "decimato" significa che ci sono io a tenere il forte (e ad esercitare la mia Risposta Patentata da Bionda Scema al telefono).

Comunque sia, dato che le ferrovie olandesi hanno anche deciso di mettere in pratica l’orario invernale (aka: tagliare il numero di treni che viaggiano) io sono nella situazione di uscire dall’ufficio alle 16.30 o uscire alle 19.00 e dato che (di solito) arrivo in ufficio prima delle 8 del mattino (questo quando non mi metto a lavorare da casa alle 6 per installare roba o altro) ho deciso di uscirmene alle 16.30.

Ergo, quando il telefono suona alle 12 (sempre all’ora di pranzo eh?) ed il CL di turno mi dice che "a causa un problema gravissimo" nel loro sito interdet e’ necessario fare un rilascio di emergenza lo stesso pomeriggio, io mi sono subito premunito di specificare che il rilascio sarebbe stato meglio farlo prima delle 16 o rimandare al giorno dopo.

CL1 – Aaaaaghhh!!! Ma questa e’ una emergenza, c’e’ un baco terribile nell’applicazione (me pensa: ed i test ovviamente li avete fatti con il didietro eh?).
IO – Comunque sia, il rilascio deve essere prima nell’ambiente di test no?
CL1 – No, prima in produzione.
IO – ? Prima in produzione? Non dovrebbe essere prima in test e poi in produzione? A che serve l’ambiente di test se non a testare?
CL1 – Ma e’ una emergenza!!!

Sicomeno… Comunque sia, io mi rimetto a fare quello che stavo facendo ed attendo che questa nuova versione sia consegnata. Dopo una mezz’ora ri-suona il telefono. E questa volta e’ CL2 che annuncia che per un problema nella loro uebapplicascion dovranno rilasciare un "hot-fix" su tutti gli ambienti (test, accettazione, produzione, staging… sta’ gente ne ha una caterva). E questo hot fix dovrebbe essere consegnato nel giro di un paio d’ore dal loro sviluppatroto. Hummm… comincio a vedere un certo ‘trend’ nella giornata.

Ovviamente alle 15.59 non si e’ ancora visto un tubazzo di niente. Ed io sto’ gia cominciando a madonnare quando risuona il telefono ed e’ CL1 che dice che la nuova release dovrebbe essere consegnata "a momenti". Alle 16.15 la nuova release e’ pronta sul server per essere installata, io domando conferma che questa cosa deve andare in produzione direttamente e dopo poco ricevo una mail da CL1 con la conferma. Noto che la mail termina con "inviata dal mio HTC"… ossignur, ma se hai una tale iphone-penis-envy comperati sto’ ca$$o di iphone e non rompere i marroni.

L’installazione e’ una procedura abbastanza noiosa e ripetitiva, onde per cui io ho sviluppato uno script per eseguire il tutto. Lancio lo script, che tra le altre cose verifica che il file appaia per lo meno decente, che i files di configurazione siano leggibili e cose cosi’ e poi procedo alla "prova fumo": si punta il browser sul sito interdet e vediamo se questo risponde. Pare che tutto funzioni per cui riferisco a CL1 che l’installazione e’ avvenuta e che possono andare a farsi ammazzarecominciare a verificare che funzioni tutto.

Alle 16.25 del famoso "hot-fix" non ve ne e’ alcuna traccia, ma uno dei miei colleghi (LX) e’ risorto (non si sa come) ed e’ in Jabber che mi dice che dell’hotfix se ne occupa lui.

Ora, il secondo cliente (CL2) ha un ambiente che e’ un po’ un casino, con 10 server di produzione ed una pletora di altra roba. Dato che un rilascio richiederebbe di fare login e logout da ogni singolo server, io ho sviluppato uno script di installazione centralizzato, che prende quello che c’e’ da installare e lo installa "a distanza" su uno o piu’ server a raffica. In seguito, dato che questi continuavano con ‘hotfix’ su ‘hotfix’, ho modificato il tutto per gestire anche quelli. La differenza maggiore tra un ‘hotfix’ ed una installazione e’ che l’installazione rimuove prima la versione precedente mentre l’hotfix viene semplicemente installato ‘dentro’ a quella gia’ esistente (e’ un volgare unzip). Per questo motivo l’hotfix deve chiamarsi ‘hotfix-…zip’. E tutto questo e’ chiaramente spiegato nell’howto che e’ disponibile sulla Wiki aziendale.

Vabbe’, io me ne corro in stazione a prendere il treno e poi non ci penso piu’ di tanto. Fino alle 6 del mattino dopo quando DaBoss mi chiama al telefono domandando che e’ successo con CL1.

IO – Loro hanno mandato la nuova versione ed io l’ho installata.
DB – Si ma su che sistema?
IO – Entrambi. Come da istruzioni di CL1
DB – Perche’ pare che tutto il sito sia andato in coma ieri sera e non funzionanava piu’ un ca$$o
IO – La home page del sito era ok, ho controllato. E non ho visto nessun alert nel sistema di monitoring. Dato che noi non sappiamo esattamente cosa controllare e’ il massimo che possiamo fare. Per altro, se loro hanno un sistema di test ma decidono di mettere le cose in produzione direttamente non e’ che possiamo farci poi molto.
DB – Vabbe’, poi ne parliamo in ufficio… che e’ successo con CL2?
IO – Non lo so… che e’ successo con CL2?
DB – Mi hanno chiamato ieri sera che dovevano mandare un hotfix e che non e’ stato installato.
IO – Io non ho visto nessun hotfix fino alle 16.30, poi ho sentito LX che ha detto che ci pensava lui e poi non ho piu’ saputo nulla.
DB – Ma hai controllato?
IO – Se LX dice che ci pensa lui, io assumo che ci pensi lui e che sia in grado di fare il suo lavoro, quindi no, non ho controllato.

Ho scoperto in seguito che il problema con CL1 e’ che nella fretta di risolvere il "terribile problema" il programmatroto di turno ha confuso i files di configurazione del sistema di test con quelli del sistema di produzione, ma la cosa non era evidente dalla home page del sito (ed in effetti in nessun altra pagina da noi raggiungibile) ma solo dopo che un ‘ordine’ era inserito nel sistema e che l’hotfix di CL2 era stata in effetti installata da LX ma nella fretta aveva sbagliato il nome del file, invece che ‘.zip’ era stato chiamato ‘.xip’ e quindi l’unzip non aveva fatto un tubo.

Ed il "terribile bug" che doveva essere corretto immediatamente? Il colore del banner sbagliato!

Davide

legenda personaggi

Articoli simili:

  • Facebook
  • Twitter
  • Delicious
  • StumbleUpon
  • Wikio
  • Reddit
  • Technorati
  • Segnalo
  • Live
  • Add to favorites
  • Email
  • RSS

 Lascia un commento

Puoi usare questi tag e attributi HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(richiesto)

(richiesto)

Pinterest
EmailEmail
PrintPrint
%d blogger hanno fatto clic su Mi Piace per questo: