Contenido Exclusivo

Cómo sobrevivir a la explosión de datos

IDC estima que los datos empresariales se duplican cada 18 meses. Esta es una estadística asombrosa, pero algo difícil de imaginar. Una simple analogía puede ayudarle.

Digamos que es un ávido aficionado al cine, y que fue uno de los primeros en comprar la colección de los mejores 100 DVD del American Film Institute cuando salió a la venta en noviembre de 1998. Una colección de 100 DVD es lo suficientemente grande para ser impresionante, pero lo suficientemente pequeña para poder navegar en ella fácilmente y encontrar algo que desee ver. Con un peso de alrededor de 28 libras y ocupando más de un metro de espacio en su estantería para libros, es probable que incluso el loft más estrecho tenga espacio para ella. Lo mejor de todo, “Apocalipsis Ahora” estará a solo unos 30 segundos de una búsqueda visual rápida en su reproductor de DVD.

Ahora, apliquemos la estadística acerca del crecimiento de los datos corporativos de IDC a su colección. Después de duplicarse cada 18 meses, para noviembre del 2015, su colección habrá crecido a más de 200 mil DVDs que pesarán más de 20 toneladas y ocuparán casi dos kilómetros de espacio en su estantería. A menos que haya guardado los DVDs escrupulosamente, ordenándolos alfabéticamente, encontrar el que desea podría tomarle horas. Su colección habrá crecido a un tamaño tan grande, que sería casi inútil. Sería una bola de hierro con cadena que arrastraría tras de sí hasta que se rinda y se deshaga de la mayor parte de ellos.

Eso es precisamente lo que está pasando con nuestros datos. Sea información personal, corporativa, gubernamental, no importa. Estamos guardando y manteniendo más datos de los que podemos usar. El hecho de que un disco con 18GB disponibles en 1998, hoy sea aproximadamente del mismo tamaño, peso y costo que un disco de 4TB, solo oscurece el problema y nos hace perezosos acerca de vigilar el crecimiento de nuestros datos.

Podemos ser capaces de almacenar todos esos datos, pero cuando perdemos la capacidad de gestionarlos y explotarlos de manera eficaz, su valor disminuye. Como resultado, muchas empresas están gastando cada vez más tiempo y capital para almacenar datos que valen cada vez menos para el negocio. El crecimiento de datos es inevitable. Pero debe ir acompañado de políticas de gestión de información que aseguren que los datos creados y retenidos tengan un valor real y duradero.

Por supuesto que es más fácil decirlo que hacerlo. Se trata de una cuidadosa reflexión y no de poco esfuerzo. Lanzar una nueva unidad de disco en una matriz de almacenamiento es mucho más fácil que desarrollar medidas para controlar el crecimiento. Pero necesitamos hacerlo si queremos evitar convertirnos en esclavos de nuestra propia creación, un desenlace del cual es mucho más difícil recuperarse, que evitarlo.

Caminos hacia la contención de datos

Puede que no sea capaz de detener el crecimiento de los datos, pero al menos puede reducir la velocidad con que esto sucede. Desafortunadamente, no hay un único método de contención que calce para toda situación. Hacerle frente a crecientes montañas de datos requiere una combinación creativa de varios enfoques diferentes.

Metodolodías no técnicas

El almacén de datos que hoy tenemos no apareció de la nada, alguien lo creó y decidió que valía la pena retenerlo. Antes de intentar aplicar una solución tecnológica, tiene que influir en el comportamiento de aquellos que crean y mantienen los datos empresariales. Empezar por la fuente, por quienes crean los datos, es casi siempre una estrategia exitosa.

Controles. La cuota de almacenamiento es uno de los más antiguos métodos para controlar el crecimiento de los datos. Las cuotas de almacenamiento son a menudo pasadas por alto en estos días, ya que son vistas como una imposición en la empresa que dictamina una organización de TI que extralimita. No necesita ser de esa manera.

Las cuotas de almacenamiento logran un objetivo importante: Obligan a los usuarios y a los departamentos corporativos a pedir más almacenamiento cuando se ha llegado al límite predefinido, en lugar de simplemente limitarse a permitir que se llene todo el espacio disponible. El área TI puede, en última instancia, verse obligada a acceder a las solicitudes de espacio de almacenamiento adicional, pero el simple hecho de tener que hacer una solicitud, le da al área de TI una oportunidad de pedir al usuario que justifique su pedido. Ninguna implementación de cuotas de almacenamiento está completa sin los informes que muestran cómo los usuarios están consumiendo los datos. Pero los informes que simplemente den cuenta de los megabytes consumidos y/o disponibles no pueden contar una historia significativa. En lugar de ello, vincule la capacidad de almacenamiento consumida con los gastos de mantenimiento en un informe. Los costos duros son una gran manera de reforzar el llamado a la moderación.

Errores comunes en implementar showback, incluyen la omisión inadvertida de partes de la infraestructura de almacenamiento y no educar a los usuarios sobre todos los componentes necesarios para lograr un almacenamiento de clase empresarial. En el primer caso, es posible que se descuide tener en cuenta el costo de los recursos de almacenamiento que se utilizan para ejecutar la recuperación en caso de desastres (como un sitio replicado SAN o hardware y software de copia de seguridad), o incluso la mano de obra necesaria para administrar dichos recursos. Sea escrupuloso. Controle todo.

Un panorama completo acerca de lo que cuesta el almacenamiento de datos, tiene como riesgo darle a los usuarios y a los stakeholders un desagradable caso de impacto del precio. Algunos pueden tomar esto en serio y frenar el crecimiento de los datos. En tiempos en los que cualquier persona puede comprar un disco duro de 2TB en una tienda de suministros de oficina por alrededor de 100 dólares, se requiere brindar educación esmerada para justificar el gasto de almacenamiento y protección de datos dentro de una infraestructura de almacenamiento empresarial.

Chargeback. Para cambiar el comportamiento, puede no ser suficiente mostrar simplemente lo que cuesta verdaderamente almacenar los datos. Transmitir los costos a los departamentos a través de un mecanismo de devolución de cargo (chargeback), crea un sentido de propiedad de los datos que sería imposible de obtener por otros medios. Tenga en cuenta que implementar la devolución de cargo no es algo que podrá hacer por su cuenta. Se requiere un apoyo sustancial de los interesados, algo que puede no existir en todos los ambientes de negocios.

Ingeniería social. Hay muchas otras formas menos obvias de influir en el comportamiento del usuario. Durante la búsqueda de incentivos para conservar el espacio, no tenga miedo de pensar “fuera de la caja”. Organice una competencia al estilo “Biggest Loser“, en donde los departamentos que más reduzcan la creación de datos ganen certificados de regalos, o planee un Día de la Tierra con la temática de la conservación del almacenamiento. Aunque se recupere poco almacenamiento con estas iniciativas, hacer que la gestión de los datos sea parte de crear conciencia corporativa, será un esfuerzo que valdrá la pena.

Metodologías técnicas

Después de haber hecho todo lo posible por frenar la proliferación de datos enfocándose en quienes los crean, preste atención a la infraestructura de almacenamiento en sí. Están surgiendo todo tipo de nuevas tecnologías para asegurar que los datos se almacenen en las formas más eficientes posibles.

La deduplicación de datos. La duplicación de datos es una gran fuente de ineficiencia. La deduplicación identifica y elimina archivos redundantes, reduciendo la cantidad de disco necesario en cualquier lugar de 10:1 a 50:1 y más, en función del nivel de redundancia. Esto puede ser especialmente valioso cuando se utiliza con datos no estructurados, como archivos compartidos de un departamento de la empresa, donde los usuarios son propensos a realizar varias copias de los mismos archivos.

Originándose a partir de los sistemas de copia de seguridad, la tecnología de deduplicación ha hecho incursiones en el almacenamiento primario. Muchos sistemas operativos modernos, incluyendo Windows Server 2012, simplemente la incluyen como una característica incorporada desde fábrica, por lo que su uso es una obviedad.

Estructuración de datos. Una manera de lidiar con el crecimiento de datos es imponer una nueva estructura. Tomando como ejemplo el correo electrónico, el software para archivar correo electrónico puede despojar los archivos adjuntos de las bases de datos de correo electrónico y almacenarlos fuera de la infraestructura de correo electrónico mediante el almacenamiento de instancia única (deduplicación a nivel de aplicación efectiva).

En otros casos, simplemente implementando soluciones de administración de información, puede tener un enorme impacto en la creación y conservación de los datos empresariales. Sistemas de gestión de la información como SharePoint, pueden reemplazar archivos compartidos difíciles de controlar y permitir frenar la duplicación. También capturan los metadatos que necesita para determinar cuándo los datos se pueden archivar o eliminar.

La gestión del ciclo de vida. Una de las cosas más difíciles de hacer con respecto a cualquier infraestructura de almacenamiento, es gestionar la última parte del ciclo de vida de los datos, cuando estos deben ser archivados o borrados. A nadie le gusta eliminar datos, hay algo en ello que parecierano ser natural. Después de todo, se necesitó hacer un esfuerzo para crearlos y nadie quiere verse obligado a volver a hacerlo.

Crear una metodología que los usuarios puedan emplear para determinar cuándo archivar o echar por la borda los datos antiguos, requiere de una cuidadosa consideración. Puede ser tentador archivar o borrar los datos a partir de que cumplan una edad determinada, pero eso es, por lo general, un criterio pobre. Para tomar esa decisión, necesita metadatos que describan el propósito de los datos. Dichos metadatos generalmente no existirán a menos que usted haya estructurado sus datos.

Hacer o morir

No importa qué combinación de enfoques utilice para controlar el crecimiento de los datos, implemente enfoques técnicos y no técnicos para educar a los usuarios e incrementar la eficiencia del almacenamiento. Puede disminuir la cantidad de almacenamiento que necesita, y también mantener la capacidad de la organización de aprovechar eficazmente sus datos. Cuanto más espere, más difícil será, así que no pierda el tiempo.

-. Matt Prigge, Infoworld EE.UU.

Lo Más Reciente

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización...

Los ‘Scam-Yourself Attacks’ aumentan 614% en el tercer trimestre del año: informe

Los 'Scam-Yourself Attacks' o "ataques de estafa”, en los...

Newsletter

Recibe lo último en noticias e información exclusiva.

Mireya Cortés
Mireya Cortés
Editora CIO Ediworld Online. La puedes contactar en mcortes@ediworld.com.mx

Tenable descubre nuevas técnicas de ataque en software de código abierto

El equipo de investigación de seguridad en la nube de Tenable descubrió nuevas técnicas de ataque en los Lenguajes Específicos de Dominio (DSLs, por...

“Mejorar la visibilidad en el ecosistema tecnológico, interno y de cara al cliente” : José Armando López Flores, CISO de Crediclub

“Queremos ser esa institución financiera que cubra con las expectativas de los clientes a través de garantizarles que su patrimonio estará seguro”. Con el objetivo...

Shopperbot: robot mexicano que ayuda a tomar mejores decisiones de compra

Como parte de las soluciones para impulsar la hiperpersonalización en la atención al cliente por medio de la tecnología, PepsiCo México desarrolló a Shopperbot....