jump to navigation

Business Continuity e Disaster Recovery nella PA sabato 30 novembre 2013

Posted by andy in Business Continuity, Pubblica Amministrazione.
Tags: , , , , ,
add a comment

Il 18 novembre scorso l’Agenzia per l’Italia Digitale (DigitPA) ha pubblicato una serie di indicazioni sulla continuità operativa dei propri processi di business.

Colgo l’occasione per fare qualche considerazione che, ahimé, vedo che sfgge ai più, e tutto sommato credo anche alla DigitPA: pur accennando che “La sfera di interesse della continuità operativa va oltre il solo ambito informatico, interessando l’intera funzionalità di un’organizzazione”, si concentra essenzialmente sui soli aspetti informatici.

Inoltre produce una quantità di documenti, modelli e procedure che vanno ampiamente al di là delle competenze e delle disponibilità di tempo e di risorse degli enti coinvolti e dei relativi referenti.

La scadenza prefissata di 15 mesi dall’emissione del decreto è stata ampiamente superata senza che le PA possano garantire ai cittadini una reale continuità dei propri servizi.

Come ai tempi del DPS ci si concentrava sulla sicurezza delle informazioni limitandosi soltanto all’aspetto informatico, oggi si pensa alla continuità operativa (ed al disaster recovery come suo processo di supporto) limitandosi agli aspetti informatici.

Certamente al giorno d’oggi non è possibile pensare alla continuità operativa di qualunque processo o servizio pubblico senza includere come elemento essenziale l’IT (altrettanto vale, naturalmente, per la sicurezza delle informazioni).

Tuttavia noto che ci sta concentrando da anni praticamente esclusivamente sull’IT, dimenticando che questo è soltanto uno strumento di supporto ai processi di business.

Purtroppo si progettano sistemi ed architetture a prova di qualsiasi cosa, senza considerare che, in caso di disastro, l’unica cosa che rimarrebbe in piedi sarebbe probabilmente proprio l’IT.

Certamente ci si dimentica che i disastri possono essere anche non distruttivi, ma biologici: un’importante epidemia di influenza potrebbe mettere in ginocchio molti processi di business, così come potrebbero farlo seri rischi di attentato.

Ogni tanto provo a chiedere cosa accadrebbe un qualunque lunedì mattina se durante il week-end il palazzo di Giustizia dovesse crollare, o semplicemente divenire completamente inagibile per una qualsiasi ragione (rischio epidemico, rischio bomba, o altro).

Tutto il personale operativo non potrebbe accedere ai propri uffici ed alle proprie postazioni di lavoro; ci si troverebbe quindi nella situazione in cui l’informatica sarebbe perfettamente efficiente, ma non potrebbe essere utilizzata da nessuno.

E nel frattempo ci si troverebbe con code di cittadini ed avvocati che attandono le proprie udienze, persone che attendono di essere scarcerate entro i termini di legge, ed altre per cui devono essere convalidati per tempo i relativi fermi, pena la loro liberazione.
Altre persone potrebbero avere la necessità di ottenere certificati per poter essere assunti, o per convalidare un permesso di soggiorno.

Cosa accadrebbe in caso di indisponibilità degli uffici del Comune, della Regione, e così via?

Già un giorno di chiusura potrebbe procurare danni seri, ma se invece di un giorno si dovesse trattare di una o più settimane, il disastro sarebbe probabilmene irreparabile.

In sostanza, nessuno pensa alla continuità operativa legata al processo, una continuità che potrebbe essere assicurata anche con semplici ed economici accordi con altri enti pubbliici (ad esempio, quelli del Comune), e con i Vigili Urbani, per informare ed instradare gli utenti verso le nuove modalità operative.

Troppo spesso manca purtroppo una visione d’insieme, e si lascia l’onere di gestire la continuità ai responsabili dei vari servizi, che per forza di cose hanno visibilità soltanto sulle aree di propria competenza.

Tra le cause occorre certamente annoverare:

  • la mancanza di una visione d’insieme da parte delle istituzioni, che non affrontando concretamente il problema, non riescono a fare sistema, sfruttando le opportunità di collaborazione tra i diversi enti;
  • la mancanza di risorse specifiche per la progettazione e la gestione dei piani di continuità (occorrono dei professionisti del settore, e non la buona volontà dei referenti che si rimboccano le maniche per imparare una materia che esula completamente dai propri compiti istituzionali);
  • la mancanza di risorse da dedicare alla formazione del personale, per la gestione, manutenzione e prova dei piani di continuità;
  • l’eccesso di risorse destinate all’IT, dimenticando che l’IT è soltanto uno degli strumenti di supporto ai processi di business, e non l’unico.

 

 

Il nuovo CAD e la continuità operativa: un nuovo DPS? giovedì 21 febbraio 2013

Posted by andy in Business Continuity, Pubblica Amministrazione.
add a comment

Il 22 Dicembre 2010 è stato definitivamente approvato il nuovo CAD (Codice per l’Amministrazione Digitale).

Oltre ai tanti obiettivi di qualità, efficienza e riduzione dei costi, all’art. 50 bis il testo prevede l’obbligo per tutti gli enti e le strutture della PA di dotarsi. entro 15 mesi, di un piano di continuità operativa e di uno per il disaster recovery.

I 15 mesi stanno per scadere, e ci si viene a trovare in una situazione analoga a quella in cui scattò l’obbligo della redazione del DPS (Documento Programmatico sulla Sicurezza), previsto dal D.Lgs. 196/2003, e obbligatorio a decorrere dal 31 Marzo 2006.

Seppur con meno fibrillazione della precedente scadenza per il DPS, qualcosa inizia a muoversi; proverò a fare il punto su quali siano realmente le implicazioni dell’art. 50 bis ed a scattare una fotografia sui diversi approcci emergenti, così da consentire a chi non avesse provato ad analizzare la situazione da vari punti di vista possa collocare l’approccio adottato e valutare le alternative.

Focalizziamoci in primo luogo su quali siano realmente gli obblighi: le pubbliche amministrazioni devono definire:

a) il piano di continuità operativa, che fissa gli obiettivi e i principi da perseguire, descrive le procedure per la gestione della continuità operativa, anche affidate a soggetti esterni. Il piano tiene conto delle potenziali criticità relative a risorse umane, strutturali, tecnologiche e contiene idonee misure preventive. Le amministrazioni pubbliche verificano la funzionalità del piano di continuità operativa con cadenza biennale;

b) il piano di disaster recovery, che costituisce parte integrante di quello di continuità operativa di cui alla lettera a) e stabilisce le misure tecniche e organizzative per garantire il funzionamento dei centri di elaborazione dati e delle procedure informatiche rilevanti in siti alternativi a quelli di produzione. DigitPA, sentito il Garante per la protezione dei dati personali, definisce le linee guida per le soluzioni tecniche idonee a garantire la salvaguardia dei dati e delle applicazioni informatiche, verifica annualmente il costante aggiornamento dei piani di disaster recovery delle amministrazioni interessate e ne informa annualmente il Ministro per la pubblica amministrazione e l’innovazione.

Venendo ora ai principali approcci che riscontro, i più rilevanti appaiono essere i seguenti:

  1. l’ufficio non fa nulla, per la mancanza di risorse;
  2. l’ufficio prova ad analizzare realmente quali siano i punti su cui può intervenire.
  3. l’ufficio si affida ai fornitori, che garantiscono la compliance normativa attraverso la semplice adozione di soluzioni commerciali hardware e/o software.

L’approccio 1. può essere comprensibile: in effetti con i continui tagli alle risorse degli ultimi anni, e con quelli che prevedibilmente continueranno ad arrivare, gli uffici si trovano spesso talmente oberati di lavoro che non risulta fattibile distogliere risorse dai propri incarichi per affrontare, gestire e portare a compimento un progetto di questo tipo. In effetti, qualsiasi progetto non può ragionevolmente essere avviato senza la preventiva assegnazione di adeguate risorse.

Approccio 2: è l’ideale; si affronta oggettivamente il problema, si effettua una spassionata analisi dei rischi, e sulla base delle priorità e delle disponibilità si definisce un piano per gli interventi possibili;

L’approccio 3 è il più pericoloso: l’obiettivo passa dall’interesse della PA all’interesse del fornitore, che tende a massimizzare il proprio ritorno riducendo i costi e massimizzare i margini; a seconda dei casi, al cliente verranno proposte soluzioni che saranno un mix di consulenze, hardware e software.

Ovviamente niente è mai così semplice e definito, e le situazioni reali fanno spesso un mix dei vari approcci, fondendo i vari approcci, in base alle capacità e disponibilità dei referenti degli uffici, e dalla capacità ed insistenza dei fornitori.

Dopo tutto questo preambolo, doveroso per scattare una foto di quella che appare essere la realtà, desidero dedicare qualche parola anche alla sostanza.

Per farlo, focalizziamoci sugli obiettivi imposti dal CAD: un piano di continuità operativa, ed un piano di disaster recovery.

L’IT al giorno d’oggi è di fatto il fondamento di ogni processo operativo, e viene quindi naturale pensare che i termini ‘continuità’ e ‘disaster recovery’ vengano immediatamente associate ai sistemi informativi.

Questo è un grave errore, perché ci porta a dimenticare che l’IT non è il fine, ma il mezzo.

I sistemi, il software, la connettività non sono ciò che dobbiamo proteggere, ma strumenti a supporto dei processi che dobbiamo proteggere.

Prendendo ad esempio un qualunque edificio pubblico, come il palazzo del Comune, o quello di Giustizia, cosa accadrebbe se un terremoto che occorresse la Domenica notte ne compromettesse gravemente la struttura?

Ci si troverebbe alle 8 del Lunedì mattina con tutti gli utenti che si assiepano fuori dal palazzo, con le proprie esigenze, i propri certificati da richiedere, i propri atti da registrare, e nessun ufficio aperto, nessun sistema accessibile.

Certamente i sistemi informativi saranno stati realizzati a regola d’arte; i computer continueranno a funzionare, nel palazzo o in un’altra sede predisposta per il disaster recovery.

Ma i dipendenti dell’ufficio non sapranno cosa fare, dove sedersi, su quale tastiera mettere le mani.

È inverno, e fà piuttosto freddo; la folla all’esterno inizia a rumoreggiare; gli anziani sono già in coda dalla primissima mattina.

Inizia ad arrivare qualche vigile urbano, che non sa cosa fare, o cosa dire, se non che non è possibile accedere ai locali dell’edificio per motivi di sicurezza.

Qualcuno si è preso una giornata di permesso dal lavoro per richiedere un certificato, e senza una tempestiva ordinanza qualche condannato verrà rimesso in libertà per decorrenza dei termini di custodia cautelare.

Passa mezza giornata, e nulla è cambiato; qualche dirigente cerca di organizzarsi come può, ma non sà dove e come allestire le decine o centinaia di postazioni di lavoro per i propri dipendenti, per poter continuare a fornire il servizio dovuto ai cittadini.

Eppure i server e le applicazioni funzionano e i dati ci sono: una perfetta configurazione di disaster recovery, costata tanto hardware, software, consulenze, tempo uomo per l’installazione, le prove ed i collaudi …

E la morale qual’è? Che la continuità operativa, così come la sicurezza, non è uno ‘stato’, ma un processo, ed un processo, per essere tale, deve esistere nel tempo.

Probabilmente per l’emissione di molti certificati sarebbe stato sufficiente predisporre un piano per trasferire temporaneamente il personale presso gli uffici periferici, attivando una connessione ad hoc verso i server, ed informare i vigili urbani sulle informazioni da dare ai cittadini che si fosser presentati agli ingressi del palazzo; anche un comunicato stampa via Internet ed alle televisioni locali e regionali avrebbero potuto essere d’aiuto.

Il numero degli scenari che si possono verificare è naturalmente limitato soltanto dalla fantasia.

Tuttavia, per quanto si possa spendere in tecnologia, il giorno che accade qualcosa di anomalo, è estremamente improbabile che questa consenta di affrontare i problemi, se non è parte di un piano coordinato in cui tutte le persone coinvolte sanno come comportarsi.

Dedico anche qualche riga a tutti quei software progettati per aiutare le organizzazioni ad effettuare le proprie analisi dei rischi e a definire i propri piani di continuità e di recovery.

Si tratta di software veramente notevoli, che più sono completi ed evoluti e più costano.

Tali software hanno tuttavia alcuni difetti:

  • per essere utilizzati correttamente necessitano di specialisti ben preparati;
  • per fornire risultati realistici ed attendibili devono essere compilati in modo puntuale ed esaustivo;
  • devono essere tenuti continuamente aggiornati a fronte di qualsiasi variazione;

Purtroppo gli specialisti sono in generale molto bravi ad utilizzare il software, ma non hanno la minima idea di quali siano i reali rischi che l’organizzazione corre, ed i risultati che emergono sono spesso in conflitto con ciò che il buon senso e l’esperienza indica come prioritario.

In pratica, il miglior compromesso per le PMI e per le organizzazioni anche grandi ma poco mature nella gestione dei propri rischi è quello di avere il supporto di uno specialista che faciliti il percorso di maturazione del processo della gestione della continuità operativa, da cui poi, con il tempo, può derivare naturalmente l’acquisto di software di supporto e di tecnologia per ridurre i costi di ripristino in caso di eventi anomali.