¿Cómo funciona la compresión de archivos?

La compresión de archivos es la base de cómo funciona la web moderna, podría argumentarse, porque nos permite compartir archivos que de otra manera tardarían demasiado en transferirse. pero como funciona?

La compresión de archivos es la base de cómo funciona la web moderna, podría argumentarse, porque nos permite compartir archivos que de otra manera tardarían demasiado en transferirse.  pero como funciona?
Anuncio

Todos hemos oído hablar de la compresión de archivos. Cualquiera que descargue regularmente archivos de la web está familiarizado con formatos como ZIP y RAR, y cualquier persona que edite archivos multimedia sabe que la compresión es necesaria para compartir imágenes, música y videos en la web sin utilizar todo el ancho de banda. La compresión de archivos es el núcleo de cómo funciona la web, podría argumentar, porque nos permite compartir archivos que de otra manera tardarían demasiado en transferirse. pero como funciona?

No es nada mágico, pero es el resultado de mucho trabajo arduo por parte de muchas personas muy inteligentes. Exploremos cómo funciona la compresión de archivos mirando los dos tipos principales de compresión: sin pérdida y con pérdida.

Solo una advertencia: voy a simplificar demasiado las cosas aquí en un intento de hacer que esto sea legible por estudiantes que no son de matemáticas. Consulte los artículos de Wikipedia vinculados para obtener más información y las fuentes de Wikipedia para obtener aún más.

Compresión sin perdidas

La compresión sin pérdida básicamente funciona al eliminar la redundancia. Qué significa eso? Simplifiquemos las cosas. Esta pila de ladrillos representará nuestros datos:

¿Cómo funciona la compresión de archivos?

Como puede ver, tenemos dos ladrillos rojos, cinco amarillos y tres azules. La forma más sencilla de representar esto es como ve arriba: los ladrillos mismos. Pero no es la única forma en que puedo representar esto. Yo también podría hacer esto:

cómo funciona la compresión de archivos

En la imagen de arriba puede ver exactamente la misma información, dos rojas, cinco amarillas y tres azules, pero ocupa mucho menos espacio. Representé ladrillos redundantes usando números, lo que significa que necesito solo tres ladrillos para representar diez.

Esto le da una idea aproximada de cómo es posible la compresión sin pérdidas. La información que es redundante se reemplaza por instrucciones que le dicen a la computadora cuántos datos idénticos se repiten. Otro ejemplo simplificado:

fffffffuuuuuuuuuuuu

Se puede "comprimir" para:

f7u12

Este es solo un método de compresión sin pérdida, por supuesto, pero apunta a cómo es posible. Se usan otros trucos matemáticos, pero lo más importante que hay que recordar sobre la compresión sin pérdida es que, mientras que el espacio se guarda temporalmente, es posible reconstruir el archivo original completamente desde el comprimido. Si ves tres ladrillos con números, sabes exactamente cómo hacer la pila. No se pierde información, al igual que el nombre lossless implica.

Los programas como WinZip se basan en la compresión sin pérdida. Eliminan esta información redundante al comprimir (o "comprimir") el archivo y restaurarlo cuando descomprime (o "descomprime"). Nada está perdido.

En el mundo de la imagen, los archivos PNG también usan compresión sin pérdida. Es por eso que ofrecen un tamaño de archivo más pequeño para imágenes con mucho espacio uniforme: la información redundante se representa mediante instrucciones.

Por supuesto, todo esto es una simplificación excesiva, pero tiene el punto básico. Obtenga más información acerca de la compresión sin pérdida en Wikipedia, si le interesa.

Pérdida de compresión

Por supuesto, hay mucho que puedes lograr usando solo métodos sin pérdida. Afortunadamente, no son la única opción: también puede simplemente eliminar información. Esto se llama compresión con pérdida, y no es tan loco como suena; de hecho, es probable que tenga muchos archivos en su computadora hechos con compresión con pérdida.

Un MP3, por ejemplo. Si eres como la mayoría de la gente, tu computadora almacena miles de ellos para ti, pero ¿sabías que no contienen toda la información de audio que hizo la grabación original? Algunos sonidos, que los humanos no pueden o apenas pueden oír, se eliminan como parte de la compresión. Cuanto más se comprima un archivo, más información se eliminará, por lo que un archivo excesivamente comprimido comenzará a sonar embarrado.

La compresión con pérdida suele utilizarse principalmente para archivos multimedia: imágenes, sonido y video. Usar compresión con pérdida para un archivo de texto sería problemático, ya que la información resultante sería confusa. Sin embargo, no siempre es necesario que los archivos multimedia incluyan toda la información.

Otro ejemplo de compresión con pérdida es la imagen JPEG. En general, las imágenes vistas en la web no necesitan ser tan de alta calidad como las imágenes destinadas a la impresión. Como tal, puede eliminar una gran cantidad de información redundante en una imagen web, incluso si hacerlo se vería mal impreso.

Por supuesto, la compresión repetida de un archivo con métodos con pérdida disminuye la calidad: cada vez que lo haces, se pierden más datos. Debajo hay una foto que compré tres veces para demostrar esto:

¿Cómo funciona la compresión de archivos?

Puede ver de izquierda a derecha cómo disminuye la calidad. Puede que no importe, dependiendo de para qué se utilizará la imagen, y es por eso que existe la compresión con pérdida.

Es importante recordar que los archivos comprimidos con métodos con pérdida realmente pierden datos, lo que significa que no puede volver a crear el archivo original de uno comprimido utilizando métodos con pérdida. Es obvio cuando lo piensas, pero muchos proyectos de impresión se han arruinado por falta de comprensión de este punto clave.

Realmente solo he arañado la superficie aquí, así que por favor: lea más sobre la compresión con pérdida en Wikipedia. Es fascinante.

Conclusión

La compresión ayudó a que la web sea lo que es. En los días de acceso telefónico, las imágenes comprimidas traían fotos a nuestro navegador, al menos no a una velocidad aceptable. El video comprimido hace que sitios como YouTube sean posibles, y cualquiera que use redes para compartir archivos está familiarizado con los archivos ZIP y RAR.

¿Tienes algo que añadir? Estoy seguro de haber omitido algunos puntos clave, así que infórmenme a mí (y a los demás lectores) en los comentarios a continuación.

Crédito de la imagen: Imagen de primavera a través de Shutterstock

In this article