La gestione dei dati è la pratica che consente di raccogliere, conservare e utilizzare i dati in modo sicuro, efficiente ed economico. L'obiettivo del data management è quello di aiutare persone, organizzazioni e oggetti connessi a ottimizzare l'uso dei dati nel rispetto di policy e regolamenti, consentendo di prendere decisioni e intraprendere azioni che massimizzino i vantaggi per l'organizzazione. Poiché le organizzazioni si affidano sempre più ad asset immateriali per creare valore, oggi adottare una solida strategia di gestione dei dati sta diventando più importante che mai.
La gestione dei dati digitali in un'organizzazione implica una vasta gamma di attività, policy, procedure e pratiche. L'attività di gestione dei dati ha una vasta portata, copre fattori come creazione, accesso e aggiornamento dei dati su un livello di dati diversificato, archiviazione di dati su più cloud e on-premise, disponibilità elevata e disaster recovery, utilizzo di dati in una crescente varietà di app, strumenti di analisi e algoritmi e garanzia di sicurezza e privacy dei dati.
Una strategia di gestione dei dati formale riguarda l'attività di utenti e amministratori, le funzionalità delle tecnologie di gestione dei dati, le disposizioni dei requisiti normativi e le esigenze dell'organizzazione al fine di ottenere valore dai dati.
Nell'ambito dell'economia digitale dei nostri giorni, i dati rappresentano un tipo di capitale, un fattore economico di produzione di beni e servizi digitali. Una casa automobilistica non può produrre un nuovo modello se non ha il capitale finanziario necessario. Allo stesso modo, non può rendere le sue auto autonome se mancano i dati per alimentare gli algoritmi integrati. Questo nuovo ruolo dei dati ha impatto sulla strategia competitiva e sul futuro dell'informatica.
Poiché questo ruolo dei dati è centrale e strategico, sono essenziali complesse pratiche di gestione e un solido sistema di gestione per ogni organizzazione, indipendentemente dalle dimensioni o dal tipo. Le organizzazioni di oggi hanno bisogno di una soluzione di gestione dei dati che fornisca un modo efficiente per gestire i dati attraverso un livello di dati diversificato, ma unificato. I sistemi di gestione dei dati si basano su piattaforme di gestione dei dati e possono includere database, data lake e data warehouse e sistemi di gestione dei big data.
Tutti questi componenti interagiscono sotto forma di "utilità di dati" per fornire le funzionalità di gestione dei dati di cui un'organizzazione ha bisogno per le app di cui dispone, così come per l'analisi e gli algoritmi che utilizzano i dati che hanno origine da tali app. Sebbene gli strumenti correnti consentano agli amministratori di database (DBA) di automatizzare molte delle attività di gestione tradizionali, l'intervento manuale è comunque spesso richiesto a causa delle dimensioni e della complessità della maggior parte delle implementazioni di database.
Una piattaforma di data management è il sistema di base per la raccolta e l'analisi di grandi volumi di dati all'interno di un'organizzazione. Le piattaforme di dati commerciali includono in genere strumenti software per la gestione, sviluppati dal fornitore del database o da fornitori di terze parti. Queste soluzioni di gestione dei dati aiutano i team IT e i DBA a svolgere attività tipiche, tra cui: identificazione, avviso, diagnostica e risoluzione di errori nel sistema di database o nell'infrastruttura sottostante, allocazione di risorse di storage e memoria del database, modifica alla progettazione del database e ottimizzazione delle risposte alle query del database per ottimizzare le performance dell'applicazione. Le sempre più diffuse piattaforme di database cloud consentono alle aziende di ampliare o ridurre il numero di servizi in modo rapido ed economico. Basato sul cloud, un database autonomo utilizza l'intelligenza artificiale (AI) e il machine learning per automatizzare numerose attività di data management eseguite dai DBS, tra cui la gestione dei backup dei database, la sicurezza e il tuning delle performance.
Noto anche come database self-driving, un database autonomo offre vantaggi significativi per la gestione dei dati, tra cui la possibilità di potenziale errore umano nettamente ridotta, maggiore affidabilità e sicurezza del database e efficienza operativa, e soprattutto costi ridotti.
I big data corrispondono al significato della parola stessa, ovvero grandi quantità di dati; rispetto ai dati tradizionali, esistono tantissimi tipi di big data, che vengono raccolti a un'altissima velocità. Si pensi a tutti i dati che arrivano ogni giorno, od ogni minuto, da un social media come Facebook. La quantità, la varietà e la velocità sono gli aspetti che rendono tali dati così preziosi per le aziende, ma anche particolarmente complessi da gestire.
Poiché viene raccolto un numero sempre più elevato di dati da origini diverse, ad esempio videocamere, social media, registrazioni audio e dispositivi Internet of Things (IoT), sono stati creati sistemi di gestione dei big data.Le aziende utilizzano i big data per migliorare e accelerare lo sviluppo del prodotto, la manutenzione, la Customer Experience, la sicurezza e l'efficienza operativa. Con l'aumentare dei big data, aumenteranno anche le opportunità.