Todo lo que necesita saber sobre los formatos de archivo y sus propiedades

Usamos la palabra archivo intercambiablemente: música, imagen, hoja de cálculo, presentación de diapositivas, etc. Pero, ¿qué hace que un archivo sea un archivo? Probemos y comprendamos esta parte fundamental de la informática.

Usamos la palabra archivo intercambiablemente: música, imagen, hoja de cálculo, presentación de diapositivas, etc.  Pero, ¿qué hace que un archivo sea un archivo?  Probemos y comprendamos esta parte fundamental de la informática.
Anuncio

El archivo es una de las partes fundamentales de la experiencia informática. Pero, ¿qué es un "archivo" de todos modos? Es un ícono en su escritorio, una entrada en una lista que abre su presupuesto como una hoja de cálculo y un nombre que puede darle a su última selfie. Al final del día, un "archivo" es una colección de bits (ceros y unos) dispuestos en un patrón que entiende alguna aplicación.

Los desarrolladores pueden mantener estos patrones en secreto, lo que puede hacer que los usuarios mantengan un programa en particular a pesar de las alternativas. La Guía completa de convertidores de archivos de Microsoft Office. La guía completa de convertidores de archivos de Microsoft Office Si alguna vez ha convertido un archivo de texto, como PDF a Word, está familiarizado con el reto. A veces es tan fácil como imprimir, otras veces necesita herramientas especiales. Ingrese esta guía de conversión. Lee mas . Otros desarrolladores pueden alentar la adopción de sus formatos. En algunos casos, puede abrir e interpretar fácilmente el formato, o puede ser imposible de usar fuera de su aplicación nativa. Exploraremos ejemplos de todo lo anterior en este artículo.

Formatos de archivo basados ​​en texto vs. archivos binarios

El primer aspecto importante de los diferentes tipos de archivos es si es binario o está basado en texto. Miremos cada uno de estos a su vez.

Formatos basados ​​en texto

El archivo de texto es el formato de archivo más básico. Se puede leer con cualquier sistema que tenga procesador. Este formato es una secuencia de bits (unos y ceros) que se adhiere al estándar ASCII (pasaremos por alto Unicode por el momento), lo que significa que una computadora puede interpretar cada byte (8 bits) como un personaje de entre los siguientes:

  • AZ (incluidas mayúsculas y minúsculas)
  • 0-9
  • Carácter espacial
  • Una selección de símbolos (por ejemplo, puntuación)
  • Caracteres de control (p. Ej., "DEL")

formatos de archivo ascii structure

Dado que los datos se almacenan como texto, puede ver el contenido de un archivo abriéndolo en un editor de texto, incluso los más simples como el Bloc de notas de Windows. 2 Editores de texto minimalistas. Probablemente nunca haya oído hablar de [Windows]. 2 Editores de texto minimalistas. Nunca escuché de [Windows] Además de estar basado preferiblemente en tiempos de carga enérgicos, algunas aplicaciones simplemente no requieren demasiadas funciones de uso intensivo de recursos. Las aplicaciones minimalistas son minúsculas y están limpias, y mientras hagan el trabajo, entonces usted ... Leer más (o equivalentes para Mac Los mejores editores de texto de Mac para usar en 2018 Los mejores editores de texto de Mac para usar en 2018 ¿Necesita un texto nuevo? editor para su Mac? Aquí están los mejores editores de texto macOS gratuitos y pagados para texto plano, codificación y todo lo demás. Leer más, Linux Editores de texto Linux avanzados comparados: kate vs gedit Editores de texto avanzados de Linux comparados: kate vs gedit Cualquier Linux El usuario le dirá que un buen editor de texto es un componente vital de un sistema informático, sin importar si es un usuario nuevo o un profesional experimentado. Mientras usa un texto de terminal ... Leer más, iOS Aplicación de escritura: un hermoso iOS Editor de texto con soporte de Markdown y docenas de acciones Aplicación de escritura: un hermoso editor de texto de iOS con soporte de Markdown y docenas de acciones Las aplicaciones de escritura para iPad y iPhone son abundantes. Tenemos la suerte de vivir en un momento en que los desarrolladores se están acercando nuevas formas de editar texto usando características únicas en aplicaciones. Esto ... Leer más, y Android 7 editores de texto sin distracciones para Android comparados: ¿Cuál es el mejor? 7 editores de texto sin distracciones para Android comparados: ¿cuál es el mejor? Realice un trabajo real en su dispositivo Android utilizando uno de estos increíbles editores de texto. Lee mas ). Dado que casi todas las plataformas informáticas incluyen un editor de texto básico, puede poner cierta información (de texto) en uno de estos archivos y tener la seguridad de que siempre podrá acceder a ella. Otras aplicaciones no necesitan saber nada más para, al menos, leer los datos correctamente.

Sin embargo, las cosas se vuelven más complicadas cuando necesita representar algo como la fuente de texto o una fecha de autocompletado en la portada. En estos casos, los caracteres ASCII contribuyen a un formato basado en texto como Markdown What Is Markdown? 4 razones por las que debería aprender ahora ¿Qué es Markdown? 4 razones por las que debería aprender ahora ¿Cansado de los editores HTML y WYSIWYG? Entonces Markdown es la respuesta para ti sin importar quién eres. Lea más o XML. Si bien esto confiere los beneficios del texto sin formato, como la transparencia, estos archivos a menudo requieren más espacio para elementos como etiquetas. Considere el siguiente archivo de una frase en texto sin formato, y luego en el formato "Flat ODT" (FODT) del formato de documento abierto, que usa XML. La imagen de abajo muestra que la versión de texto plano es de 53 bytes, mientras que la versión de ODT tiene 25, 000 bytes .

formatos de archivo como muo

Formatos Binarios

En contraste, formatos binarios ¿Qué es Binario? [Tecnología explicada] ¿Qué es binario? [Explicación de la tecnología] Dado que el binario es tan absolutamente fundamental para la existencia de las computadoras, parece extraño que nunca antes hayamos abordado el tema, así que hoy pensé en dar una breve descripción de lo binario ... Leer Más son los archivos que una aplicación construirá bit por bit. Puede intentar abrir estos archivos con un editor de texto, pero es probable que no sepa cómo interpretarlos. A continuación, se muestra el resultado de intentar abrir un archivo de Microsoft Excel con un editor de texto.

Formatos de archivo editor de texto xls

La aplicación necesita procesar los datos en un archivo binario de una manera específica. Al abrir un archivo XLS, una aplicación debe tratar los primeros dieciséis bytes del archivo como el marcador "principio de archivo" (BOF). Dentro de ese marcador, el quinto elemento es un solo bit que indica si el archivo fue o no editado por última vez en la plataforma de Windows ("fWin"). Viene después de otros cuatro elementos, cada dos bytes, lo que significa que el elemento "fWin" es el 65º bit en el archivo de Excel.

formatos de archivo xls bof
Crédito de la imagen: Microsoft

Como vimos, si intenta abrirlo con una aplicación que no maneja el 65º bit como el indicador "fWin", esa aplicación no lo abrirá correctamente. Puede mostrar un montón de caracteres ilegibles en la pantalla (como se muestra arriba), manejarlo correctamente con un mensaje de error (también mostrado arriba, porque Linux), o bloquearse. En cualquier caso, no sabrá cómo leer los datos correctamente, por lo que no los mostrará correctamente. Pero las aplicaciones, una vez programadas, pueden manejar tantos formatos de archivo como se desee.

Formatos abiertos vs. propietarios

La siguiente consideración es si un formato de archivo está abierto (es decir, está disponible para que otros lo puedan usar fácilmente) o si es propietario. Tenga en cuenta que "propietario" no es lo mismo que cerrado, al menos no en todos los casos. Si bien el debate anterior "text vs. binary" fue técnico, "open vs. proprietary" tiene más que ver con los términos de licencia de un formato de archivo. Más sobre esto en las siguientes secciones.

Formatos abiertos

Los formatos abiertos son aquellos en los que la licencia permite a los usuarios adoptarlos para sus propias aplicaciones. Un organismo normativo de algún tipo también debería supervisar su desarrollo continuo por parte de una comunidad de contribuyentes para que los formatos sean verdaderamente "abiertos". Los formatos abiertos también están libres de costos y restricciones de licencias; pueden ser utilizados por cualquier persona, para cualquier propósito. Tal vez el formato abierto más famoso es el formato de documento abierto (ODF) 9 Formatos de archivos de Office raros que debe saber 9 Formatos de archivos de Office raros que debe saber ¿Alguna vez se ha encontrado con formatos de archivo extraños en su suite ofimática? Le daremos una introducción rápida sobre tipos de archivos de oficina raros pero útiles y para qué los puede usar. Lea más, publicado por primera vez en 2005 por OASIS. Su objetivo era ofrecer una alternativa al bloqueo que Microsoft tenía en el mercado de la productividad.

Con formatos abiertos, nunca debe temer que su información esté bloqueada dentro de un archivo en particular. Considere lo siguiente, que muestra nuestro archivo de formato Flat ODT. Si bien hay mucha información extraña a su alrededor, puede ver los datos reales allí, claros como el día.

formatos de archivo muo como odt source

Otro beneficio de los formatos abiertos es su exhaustiva documentación. Una cosa es que un archivo sea fácil de leer. Un programador todavía (a través de prueba y error) necesita averiguar qué hace exactamente cada una de sus funciones. Pero en el caso de ODF, la especificación de la versión 1.2 brinda a los programadores todo lo que necesitan saber para implementar el soporte de manera eficiente.

Formatos propietarios

Por último, los formatos propietarios están protegidos por sus desarrolladores. Puede ser porque incluyen secretos comerciales, a los efectos de la seguridad (percibida), o simplemente porque el desarrollador no quiere compartir su trabajo. Sea cual sea el motivo, estos formatos son propiedad en virtud de los Acuerdos de licencia de usuario final (EULA) u otros términos que prohíben al usuario intentar realizar ingeniería inversa o "descifrar" el formato de archivo.

Una vez simplemente "prohibido", la Ley de Derechos de Autor del Milenio Digital ¿Qué es la Ley de Derechos de Autor de los Medios Digitales? ¿Qué es la Ley de derechos de autor de medios digitales? Leer más (DCMA) ha cambiado las cosas. Los desarrolladores ahora tienen el respaldo legal para perseguir a aquellos que realizan ingeniería inversa en su trabajo. Debería pensar en el futuro antes de invertir en una aplicación que utiliza un formato propietario. ¿Tendrá que migrar esa información a otro lugar en el futuro? Si es así, ¿qué tan doloroso será? ¿La compañía estará presente en un año o cinco? Debería considerar si las características de una aplicación valen la pena si también significa estar bloqueado en ese desarrollador debido a formatos propietarios.

Ejemplos de formatos de archivos

Si miras lo anterior, un par de combinaciones saltarán hacia ti. Es cierto que los formatos de archivo basados ​​en texto se prestan a ser abiertos . Del mismo modo, si el objetivo de un formato es ser propietario, es más fácil mantenerlo de esa manera haciéndolo binario. Pero este no es siempre el caso.

El formato de imagen XCF del GIMP es un formato abierto que también es binario. El proyecto incluye una descripción detallada de cómo el formato contiene los gráficos, el texto y las capas que componen un archivo GIMP como bits y bytes sin formato (como se muestra a continuación). Los desarrolladores pueden usar esto para codificar su propia implementación, por lo que aplicaciones externas como ImageMagick Cómo recortar y cambiar el tamaño de imágenes en Linux Cómo recortar y cambiar el tamaño de imágenes en Linux fácilmente Si quiere hacer un recorte y cambio de tamaño básico en Linux, quizás para ayudar con un proyecto o hacer que una imagen sea más fácil de cargar en sus redes sociales favoritas; luego pruebe estas ... Read More toolkit puede importarlas.

formatos de archivo xcf structure

Por el contrario, el formato más reciente de Microsoft Visio (VSDX) es un formato basado en XML (y por lo tanto basado en texto). Publica una referencia detallada de la composición de estos archivos. Sin embargo, el documento de referencia señala que Microsoft "tiene patentes que podrían cubrir su implementación" del soporte de .VSDX. Además, la Biblioteca del Congreso indica que el uso de la especificación VSDX "no garantiza la licencia libre de regalías de todas las patentes relevantes" si la usa. Esta es otra forma de decir que puedes tirar los dados e incluir este apoyo. Pero Microsoft puede o no querer que pagues más adelante, dependiendo de qué tan de cerca compita con Visio.

Si cree que son complicados, ¿qué le parece el formato ODT no plano? Es un archivo de formato ZIP (binario y abierto, a menos que también esté utilizando su encriptación) que contiene el texto de un documento ( content.xml, formato abierto basado en texto) y gráficos (por ejemplo, PNG, binario pero abierto).

formatos de archivo muo como odt compress

¿Qué tan importantes son los formatos de archivo, realmente?

Esta es una pregunta dificil. Por un lado, algunos sistemas operativos como iOS han tratado de aislar a los usuarios de tratar con archivos en absoluto. Tienes la aplicación que creó el archivo para abrirlo, ¿a quién le importa su estructura o cuál es su extensión? Sin embargo, muchas organizaciones (especialmente los gobiernos) han estado presionando para asegurarse de que los datos públicos estén en un formato abierto.

Si eres un idealista de software (no es que haya nada de malo en eso), entonces cuando estés evaluando nuevas aplicaciones asegúrate de que estén en un formato abierto (preferiblemente) basado en texto. Si solo desea trabajar, los formatos propietarios pueden no ser un problema para usted.

¿Qué piensas? ¿Exige que su información resida en formatos abiertos y basados ​​en texto que pueda convertir y verificar? ¿O son suficientes para usted los formatos que utilizan los desarrolladores, propietarios o no? Háganos saber a continuación en los comentarios!

Créditos de las imágenes: Edilus / Shutterstock

In this article