Cuando se trata de archivar datos, generalmente hay tres enfoques diferentes disponibles. La elección del sistema adecuado depende de las capacidades técnicas, pero también de factores externos, incluidas las limitaciones presupuestarias. Los profesionales del almacenamiento empresarial deben equilibrar los requisitos de preservación de datos, accesibilidad y optimización de recursos mientras evalúan los diversos sistemas de archivo por lotes, en tiempo real y jerárquicos disponibles en el mercado.

Índice
  1. Archivado por lotes tradicional
  2. Archivado en tiempo real
  3. Archivado tipo HSM

Archivado por lotes tradicional

En un sistema de archivo por lotes tradicional, los datos se utilizan durante un período de tiempo antes de almacenarse en una ubicación segura en espera de un posible uso futuro. La idea principal de este tipo de archivo es conservar los datos durante un largo período de tiempo, manteniendo los costes al mínimo y garantizando que la búsqueda siga siendo sencilla, incluso después de varios años. En este tipo de sistema de archivo, a cada colección de datos seleccionados para archivarlo se le asigna una o más identidades, que se almacenan como metadatos junto con los datos archivados. Estos metadatos juegan un papel esencial en la localización y recuperación de información archivada. Detalles como los nombres de los proyectos, las herramientas utilizadas para crear los datos, el nombre del creador y el plazo de creación son parte de esta huella digital. Sin embargo, cabe señalar que los servidores en los que se almacenaron los datos generalmente no están incluidos en los metadatos, lo que diferencia radicalmente este método de archivado de la copia de seguridad.

El archivado por lotes tradicional puede ser una opción ideal en muchos escenarios. Es el caso, por ejemplo, de una empresa constructora que reúne equipos ad hoc para responder a las licitaciones de diversos proyectos. Si la RFP tiene éxito, los datos del proyecto permanecen en el almacenamiento de producción durante la duración del proyecto. Por otro lado, si la licitación no prospera, los datos se transfieren a un sistema de archivo que sirve como punto de referencia para futuros proyectos. La necesidad de mantener los sistemas de almacenamiento de producción a un nivel razonable hace que el sistema de archivo tradicional sea la opción más pragmática para almacenar datos históricos de licitaciones. En mi puesto anterior en una empresa de satélites, utilizaron un enfoque de archivo similar. Archivó todos los modelos de satélites después de su construcción. Esta práctica dio sus frutos cuando el gobierno, que había encargado un satélite varios años antes, volvió con una solicitud similar. Con solo unos pocos clics, pudieron acceder a múltiples diseños almacenados en el archivo, desde los primeros diseños hasta los planes de producción finales.

Archivado en tiempo real

En el otro extremo del espectro se encuentran los archivos en tiempo real. En este tipo de archivo, los datos creados o almacenados en el entorno de producción se duplican instantáneamente y se envían a una ubicación secundaria para fines de archivado. El cumplimiento y la auditoría son los principales casos de uso del archivado en tiempo real. Este es el caso clásico de las cuentas de correo electrónico de los días en que reinaban los sistemas de correo electrónico locales. Cuando un correo electrónico ingresaba al sistema de correo, una copia idéntica terminaba en el registro de correo, mientras que el original llegaba a la bandeja de entrada del destinatario. Esta bandeja de entrada sirvió como un depósito accesible para auditores y gerentes que buscaban información para preguntas legales o para responder a solicitudes de la Ley de Libertad de Información de EE. UU. (FOIA).

El acceso a archivos en tiempo real suele realizarse a través de portales especializados con capacidades de búsqueda granular. Es importante señalar que, a diferencia de los archivos tradicionales, los archivos en tiempo real no alivian la presión sobre los sistemas de almacenamiento de producción, a menos, por supuesto, que integren la funcionalidad de gestión en su sistema de Gestión de almacenamiento jerárquico (HSM) (ver más abajo). Hoy en día, con el auge de los sistemas de correo electrónico basados ​​en SaaS y otros servicios basados ​​en la nube, el archivado en tiempo real no está obsoleto y, por el contrario, se ha convertido en algo habitual. Microsoft 365 y Google Workspace ofrecen soluciones de archivo en tiempo real llamadas "Políticas de retención" en Microsoft y "Google Archive" en Google. Con el nivel de acceso adecuado, solo se necesitan unos pocos clics para indicar a estos sistemas que mantengan una copia archivada de todos los correos electrónicos y documentos generados, enviados o recibidos a través de sus plataformas. Microsoft 365 incluso ofrece una función que impide que cualquier usuario, incluidos los administradores, elimine estos archivos, haciéndolos verdaderamente inmutables.

Archivado tipo HSM

Entre los diferentes sistemas de archivo, el archivo de tipo HSM o Hierarchical Storage Management realmente destaca de los demás. El archivado HSM se basa en la gestión de almacenamiento jerárquico (HSM) para controlar el almacenamiento de datos, un término que en cierto modo ha desaparecido, aunque el concepto sigue siendo relevante hoy en día. A medida que los datos envejecen o tienen un acceso reducido, resulta financieramente prudente trasladarlos a opciones de almacenamiento más rentables. Cuando los usuarios ya no necesitan acceso diario a los datos, o cuando los datos se vuelven obsoletos pero deben conservarse por motivos de cumplimiento, las empresas comienzan a explorar alternativas para almacenar esos datos, por ejemplo, sistemas de almacenamiento de objetos escalables o almacenamiento en frío dedicado basado en la nube. Además, algunas soluciones permiten la migración de datos de archivo a cintas magnéticas para su almacenamiento fuera del sitio y fuera de línea, con la idea de que, dado que las cintas magnéticas son prácticamente inaccesibles a menos que se necesiten explícitamente, pueden proporcionar una mayor seguridad. Además, la cinta suele ofrecer un coste por gigabyte más bajo que la mayoría de los demás sistemas de almacenamiento. Por último, las cintas también son excelentes para la retención de datos a largo plazo. A principios de la década de 2000, las empresas hicieron un uso generalizado del archivado HSM para archivar el correo electrónico en tiempo real. Con el aumento de los correos electrónicos con formato HTML y los archivos adjuntos de gran tamaño, las empresas se han enfrentado a necesidades de almacenamiento cada vez mayores. Los administradores podrían incluso ser proactivos y especificar que los correos electrónicos con más de x días o de cierto tamaño deben trasladarse a los archivos y eliminarse del sistema principal.

Recientemente, lo que ha llamado la atención son los datos no estructurados almacenados en servidores de archivos en red. Si bien los analistas señalan la caída del costo por gigabyte, la creciente necesidad de espacio de almacenamiento es innegable. Por lo tanto, cualquier oportunidad de reducir el gasto en almacenamiento de producción de alto rendimiento resulta invaluable. Los archivos HSM normalmente reubican los datos según su antigüedad o la marca de tiempo del último acceso. Cuando los datos migran del sistema de archivos al sistema de archivo, a menudo dejan punteros o lecturas en el sistema de origen, lo que facilita la recuperación automatizada cuando sea necesario. Sin embargo, algunos sistemas optan por un motor de búsqueda robusto en lugar de declaraciones. Este enfoque mejora la compatibilidad entre sistemas, pero a veces falla cuando los usuarios recuerdan dónde almacenaron los datos, pero no su contenido, lo que hace que las búsquedas sean menos eficientes.

Por tanto, a la hora de elegir el sistema de archivo adecuado, hay que recordar que cada uno de ellos tiene sus propias ventajas y desventajas. Ya sea el archivado por lotes tradicional, el archivado en tiempo real o el archivado estilo HSM, la elección depende de las necesidades específicas y de cómo interactúan los factores técnicos y no técnicos dentro de la empresa. Es un arte y una ciencia, un delicado equilibrio entre preservación, accesibilidad y relación calidad-precio.