"Si queremos guardar información digital, tenemos que envasarla en un recipiente que aguante bien el paso del tiempo"

 

"Si queremos guardar información digital, tenemos que envasarla en un recipiente que aguante bien el paso del tiempo"

16/06/2022

Font: Joan Oliva y Sandra Pérez

Entrevista a Jorge Franganillo, docente e investigador experto en formatos digitales, documentación audiovisual, marketing de contenidos y SEO; doctor en Información y Comunicación por la Universidad de Barcelona (UB).

Jorge Franganillo es profesor de la Facultad de Información y Medios Audiovisuales de la UB, donde participa en distintos grupos de investigación. Ha ejercido asimismo como docente en diversas universidades de Alemania, Croacia y República Checa .

El autor aborda en Formatos digitales (UOC, 2022) el uso que hacemos de nuestra información y documentación digital, siguiendo el hilo de su primer trabajo, Gestión de la información personal: integración mediante el correo electrónico (UOC, 2018). Si en aquella obra se adentraba en por qué conviene gestionar la información personal, en esta novedad editorial se centra más en cómo gestionarla y qué decisiones tomar a la hora de elegir el formato más adecuado.

Escucha la entrevista completa:

La información que procesamos es cada vez más digital y su gestión a través de diferentes formatos crece en nuestro día a día. ¿Por qué tenemos que alfabetizarnos en conocimiento digital como lo hicimos en el mundo analógico?

La tecnología digital exige un aprendizaje continuo, que va más allá de saber usar algunas herramientas y programas. Tener una buena competencia en el manejo de documentación digital puede enriquecer la vida cotidiana y puede mejorar nuestra capacidad crítica al informarnos. Entender, por ejemplo, la anatomía de un vídeo o de una imagen digital nos va a ayudar luego a saber dónde hay que mirar o a qué pruebas hay que someterlos para verificar el contenido y determinar si es auténtico o si puede haberse falseado.

Adoptar un formato digital incorrecto al gestionar un documento puede conllevar pérdidas irreversibles. ¿Nos puede indicar algún ejemplo?

Al almacenar imágenes, audios o vídeos, los formatos digitales tienen que elegirse con especial cautela. Contienen información que está codificada digitalmente, lo que implica grandes volúmenes de datos, y por ello se han ideado algoritmos de compresión que rebajan el peso final de esa imagen, audio o vídeo. Se trata de formatos digitales que codifican el contenido con pérdidas de calidad e información a propósito, pero que en la difusión por internet resultan asumibles porque prevalece la fluidez y la rapidez de su difusión frente a otros factores.

En otro contexto, sin embargo, podrían ser pérdidas inaceptables. Eso explica, por ejemplo, que quienes se dedican profesionalmente a la fotografía digital elijan disparar sus fotos en los formatos conocidos como RAW, que retienen todos los detalles de la instantánea original sin ninguna merma de calidad asociada durante su procesamiento.

La cinta VHS de vídeo, el casete, el CD..., entre otros soportes, se extinguieron en su día. ¿Podría pasar lo mismo en el mundo digital? ¿Hay obsolescencia en los formatos como pasó con los aparatos analógicos?

Desde luego. Si hoy ya resulta difícil acceder al contenido de ciertos formatos de hace veinte o treinta años, como WordPerfect o RealMedia, ¿quién nos asegura que, en el futuro, dentro de ese mismo plazo de tiempo, podremos acceder a la información que estamos generando ahora? Los formatos digitales, aunque no dependan de un soporte físico en particular, también tienen unas expectativas de uso inciertas. Por esta razón, es clave evitar, en la medida de lo posible, casarse con formatos digitales que dependan de un programa o de un hardware muy específico o que estén afectados por patentes de software. Un caso muy ilustrativo de este problema fue el sistema Photo CD de Kodak.

Por el contrario, ¿cuál ha sido la clave del éxito de algunos formatos de texto como el SMS, el PDF o el Word para sobrevivir tantos años?

Son los mismos factores de éxito que hoy favorecen que ciertos formatos más actuales pervivan también en el futuro. Lo deseable es que los formatos hayan sido adoptados por una amplia comunidad de usuarios y que sean abiertos, es decir, que la estructura interna esté descrita de manera pública y que, además, su uso no esté condicionado por patentes de software. Así, cualquier programador podrá desarrollar con total libertad aplicaciones capaces de leerlos y manipularlos, lo que es una manera de perpetuar ese formato digital. Hay más factores, pero sobre todo estos que he mencionado explican por qué formatos de texto como PDF, HTML, el texto llano de los SMS y de los tiques de compra, o los documentos de Word, llevan tantos años entre nosotros y tienen hoy aún garantías de perdurar mucho tiempo.

Ya que menciona el lenguaje de texto HTML, quien tiene un blog personal o profesional o el editor de contenidos de una web corporativa, ¿pueden familiarizarse con este formato más fácilmente de lo que a priori pensamos?

Sí. Ya desde su fundación, el HTML, junto con el lenguaje XML, estaba pensado para gestionar contenidos con una sintaxis muy sencilla para que las máquinas pudieran interpretar fácilmente el contenido y para que a los humanos nos fuera también muy fácil estructurar ese contenido. Y ello es, sin duda, una de las claves del éxito de este formato.

Algunos formatos como los códigos QR parecían ir paulatinamente en desuso, pero la pandemia de la covid los ha resucitado. ¿Qué ventajas presentan respecto a otros sistemas de codificación de datos?

A los códigos QR, que son la evolución natural de los omnipresentes códigos de barras, apenas se les hacía caso hasta que llegó la covid. El nuevo escenario al que nos llevó la pandemia en un primer momento dio un impulso a esas matrices de puntos que nos dan acceso a cualquier contenido digital sin tocar nada. A causa del confinamiento y de las restricciones de movilidad, vimos un renacimiento de los QR, que fue paralelo al que experimentaron los pódcast, las videoconferencias, los vídeos y las retransmisiones en streaming…, y parece que ya no hay vuelta atrás.

¿Qué son los metadatos y por qué son tan importantes para la preservación digital?

Lo que hacen los metadatos con mayor o menor detalle es describir el contenido de un documento: aportan información administrativa, técnica y estructural, y también pueden informar sobre propiedad intelectual. Toda esa información, cuando existe, facilita un triple propósito: identificar el contenido de los documentos, facilitar su búsqueda y encuentro, y mejorar la gestión de las colecciones digitales. Resultan muy útiles en todo tipo de ficheros, incluso en los de nuestras colecciones personales. Por este motivo los metadatos tienen que ser abundantes. Al fin y al cabo, el valor del objeto digital aumenta cuantos más metadatos se consignan, porque así se facilitan operaciones masivas de búsqueda, selección y organización.

¿El almacenamiento de información virtual en lo que conocemos como la nube es más eficiente que cualquier soporte físico, dispositivo USB o memoria extraíble?

Algunos confiamos más en ese servidor remoto virtual que es la nube que en las memorias extraíbles, que se estropean o podemos perder. La nube es una opción muy versátil para compartir ficheros, y además ha aumentado las posibilidades de acceso a la información personal, de la que procura mantener su integridad. Por ejemplo, en un bloc de notas digital, como puede ser Evernote o Google Keep, se pueden anotar ideas, que después se pueden recuperar y modificar de manera remota desde otros dispositivos que estén conectados a internet, y en ellos es clave la sincronización automática.

Pero la nube también tiene sus flaquezas, en cuanto a disponibilidad y seguridad de los datos. La información es vulnerable, se aloja en un servidor remoto y, por lo tanto, es susceptible de ataques. Y si el proveedor de servicios cierra de forma repentina, como ocurrió con Megaupload, esto puede llevarnos a perder toda la información. La mejor solución sigue siendo hacer copias de seguridad periódicas.

¿Por qué recomiendas a modo de conclusión usar formatos sostenibles: abiertos, libres de patentes, con metadatos abundantes y de aceptación generalizada?

Guardamos información que consideramos que nos será útil en un futuro: para ello tenemos que envasarla en un recipiente que aguante bien el paso del tiempo y que además esté bien etiquetado. Empleo esta metáfora del envase porque los formatos digitales son el recipiente que contiene, preserva e informa igual que un envase envuelve, conserva e identifica alimentos de los productos. Cada formato está diseñado con unas propiedades técnicas que lo hacen idóneo para ciertas situaciones de uso.

¿Qué nos interesa entonces? Usar formatos abiertos y libres de patentes porque, al estar libres de finalidades comerciales, se propagan con más facilidad. Y si el formato, además, se usa de forma generalizada, será poco probable que se vuelva obsoleto e impulsará que el propio mercado produzca muchas más aplicaciones para crear, manipular y representar ficheros almacenados en este formato. Y si admite metadatos abundantes, permitirá hacer búsquedas rápidas y operaciones de selección y organización.