Las promesas y expectativas en Big Data se basan en la extracción de valor de los grandes volúmenes de información sin explotar. Sin embargo, la mayoría de estos nuevos datos no están ni clasificados ni estructurados, lo que indica que es muy poco lo que se sabe acerca de ellos.
En este sentido, IDC estima que:
- El universo digital se ha duplicado en los últimos años hasta alcanzar los 2.8 ZB, dato que en 2020 será de 40 ZB, una cifra que supera las previsiones que se habían hecho anteriormente de 14%. Si pudiéramos guardar este volumen de 40 ZB en formato Blue-ray, el peso de estos discos (sin embalaje) sería el mismo que 424 portaaviones Nimitz-class.
- En 2012, 23% (643 exabytes) del universo digital sería aprovechable para Big Data si fuese clasificado y analizado.
- Actualmente sólo 3% de los datos potencialmente útiles está clasificado, y es inferior aún el porcentaje que está siendo analizado.
- La mayoría de la información digital no está protegida, si bien el volumen de datos que requiere ser protegido aumenta a un ritmo aún más rápido que el propio universo digital.
- Menos de la tercera parte del universo digital necesitaba protección en 2010, tasa que se espera supere 40% en 2020.