La frase in questione la disse lui, Isaac Newton, all’inizio del XVIII secolo. Letteralmente sta per “non faccio ipotesi” e si riferisce al cuore del metodo scientifico: osservazione del fenomeno, deduzione di cause ed effetti ed elaborazione della teoria sottostante. Ma nel caso in cui nulla fosse deducibile dall’osservazione del fenomeno Newton dichiarava che non avrebbe fatto ipotesi di alcun tipo.
Nel momento in cui scrivo sono 60+ ore di blackout del servizio di email LIBERO.IT. Ho un paio di account gratuiti che uso soprattutto per ricevere spam e cancellare una cinquantina di email era da mesi la mia prima attività giornaliera. Con nostalgia mi viene da pensare anche che a volte mi mettevo di buzzo buono a cercare di “disiscrivermi” da alcuni di questi fantasiosi servizi finendo per scoprire che in molti casi essi erano gestiti proprio da IOL e richiedevano di loggarmi al mio account IOL (???) per dismetterli.
Dunque, il metodo scientifico.
L’osservazione del fenomeno ci dice che il servizio è giù e i messaggi cambiati ogni 6/8 ore parlano di problema infrastrutturale, escludono l’attacco hacker (e magari crypto-riscatti) ed escludono anche la perdita di dati. Nell’ultimo messaggio, firmato dal CTO di IOL, però non si trova la stessa nettezza di prima sul recupero dei dati. Pare invece verosimile che le email ricevute in queste 60+ ore siano andate perse.
Non mi metto a menarla con saccenza a coloro che stanno subendo un danno economico e professionale. Non è questo il punto di questo punto. Non ho trovato ancora un resoconto sulla faccenda e vorrei condividere i miei pensieri di “esperto del settore”. Al di là dei danni causati, ho la fortissima curiosità intellettuale di sapere/capire cosa diavolo può essere successo.
L’osservazione del fenomeno mi porta a formulare le seguenti ipotesi più o meno nell’ordine in cui si sono formate nella mia mente.
- Fallito upgrade programmato della piattaforma. Nella notte di domenica si è intrapreso un qualche aggiornamento di un qualche software infrastrutturale (qualcuno ha ipotizzato Kubernetes) la cui configurazione è risultata imprecisa/incompleta/errata al punto da tenere fermo il servizio di email. Quando IOL parla di software “esterno” fa pensare proprio a questo; non bug di qualche tipo (che NON POSSONO FISICAMENTE buttare giù un sistema) ma configurazione errata. Ora, però, se intraprendi un upgrade dovresti ragionevolmente essere in grado di tornare immediatamente (in poche ore) indietro. Senza contare che magari quello stesso sistema “nuovo” l’avrai testato e ritestato in un ambiente parallelo e invisibile al pubblico prima. VERIDICITA: 6/10
- Attacco hacker. Che sia stato subito escluso categoricamente da IOL non significa che l’ipotesi non stia in piedi. Potrebbe essere stato DDOS (ovvero fantastiliardi di richieste auto-generate che affogano i server) o ransomware. Nel primo caso, siti ben più esposti come Github reagiscono e isolano il sistema in pochi minuti. 60+ ore sembrano decisamente troppe. Ransomware? Se sì, l’intero sistema sarebbe criptato e inutilizzabile. Ci stanno le 60+ ore a oltranza di attesa senza soluzione. Potrebbe essere in corso una trattativa o un tentativo alla cieca di rimettere in piedi un sistema gemello. Ci sono i backup? Dove sono? Sono anch’essi criptati? Rimettere il tutto in piedi richiede qualche giorno. Però questa ipotesi è stata smentita con forza. Certo, questione di immagine! VERIDICITA: 7/10
- Problema hardware. Significherebbe che è saltato un “macchinario” cruciale per un problema di obsolescenza o forse sbalzo di corrente o forse perché le cose semplicemente accadono. 60+ ore di stop fanno pensare a un componente nient’affatto secondario. La comunicazione tende a incoraggiare questo generico scenario usando il termine “infrastrutturale” ma quale pezzo di infrastruttura esattamente? VERIDICITA 4/10
- Malfunzionamento dello storage. La comunicazione IOL, sebbene fastidiosamente generica, pare sincera. Ciò porta a rientrare nell’ambito del problema hardware focalizzandosi su un particolare elemento: lo storage, ovvero il “database” è saltato. Se così fosse, allora effettivamente il sistema riceve le email in arrivo ma non riesce a capire dove deve scriverle e per conto di chi. Al tempo stesso il database rotto impedisce login a chi vuol leggere la posta o scrivere nuovi messaggi. Ciò pare in linea con quanto largamente riportato su Twitter sotto #liberodown. E torna pure con l’enfasi posta sul recupero dei dati nelle comunicazioni ufficiali. Si tratterebbe di dotarsi di hardware sostitutivo (e qui il discorso obsolescenza torna prepotente) e soprattutto di recuperare i dati da backup esistenti o addirittura da hardware danneggiato. Più passa il tempo più si fa strada l’ipotesi che qualcosa possa essere andata persa. Nell’ultima comunicazione (martedi sera) si parla di ogni possibile sforzo per evitare perdite di dati. Sempre in questo scenario, una domanda che assilla molti utenti che non ha ancora risposta è: e le mail che arrivassero nel frattempo? Potrebbero essere state dirottate su un server parallelo e accantonate. Se ci hanno pensato! E se sono stati pronti a farlo! Se non lo hanno fatto sono perse. Punto. Quanto ci vuole a tornare su? O dicono “signori abbiamo piallato il sistema” e ripartono da zero appena sostituiscono l’hardware o la tirano per le lunghe (finché reggono) e poi ripartono con quello (>0) che avrebbero recuperato. VERIDICITA 9/10
Se dovessi scommettere i miei 2 cent lo farei sullo storage saltato che significa giorni di stop. Se dovessi scommettere altri 2 cent direi almeno altre 24/36 ore. E sono le 10:00 del 25 gennaio.
PS: Se ritenete di entrare in contatto fatelo su LinkedIn (https://linkedin.com/in/dinoesposito)