Menú
Está libre
registro
hogar  /  Instalacion y configuracion/ ¿Quién es el administrador de sistemas? Algoritmos de compresión de datos sin pérdida.

¿Quién es el administrador de sistemas? Algoritmos de compresión de datos sin pérdida.

  • Traducción

Primera parte - histórico.

Introducción

Los algoritmos de compresión de datos existentes se pueden dividir en dos grandes clases: con pérdida y con pérdida. Los algoritmos con pérdida se utilizan comúnmente para comprimir imágenes y audio. Estos algoritmos permiten alcanzar relaciones de compresión elevadas debido a la pérdida selectiva de calidad. Sin embargo, por definición, es imposible recuperar los datos originales del resultado comprimido.
Los algoritmos de compresión sin pérdida se utilizan para reducir el tamaño de los datos y funcionan de tal manera que es posible restaurar los datos exactamente como estaban antes de la compresión. Se utilizan en comunicaciones, archivadores y algunos algoritmos para comprimir información gráfica y de audio. A continuación, solo consideraremos los algoritmos de compresión sin pérdidas.
El principio básico de los algoritmos de compresión se basa en el hecho de que la información se repite parcialmente en cualquier archivo que contenga datos no aleatorios. Utilizando modelos matemáticos estadísticos, puede determinar la probabilidad de repetir una determinada combinación de símbolos. A continuación, puede crear códigos para las frases seleccionadas y asignar los códigos más cortos a las frases que se repiten con más frecuencia. Para esto se utilizan diferentes técnicas por ejemplo: codificación de entropía, codificación de repetición y compresión de diccionario. Con su ayuda, un carácter de 8 bits, o una cadena completa, se puede reemplazar con solo unos pocos bits, eliminando así la información innecesaria.

Historia

Jerarquía de algoritmos:

Aunque la compresión de datos se generalizó en Internet y después de la invención de los algoritmos por Lempel y Ziv (algoritmos LZ), se pueden citar varios ejemplos anteriores de compresión. Morse, inventando su código en 1838, asignó inteligentemente las letras más utilizadas en idioma en Inglés, "E" y "t", las secuencias más cortas (punto y guión, respectivamente). Poco después de la aparición de los mainframes en 1949, se inventó el algoritmo Shannon-Fano, que asignaba códigos a los caracteres de un bloque de datos en función de la probabilidad de que ocurrieran en el bloque. La probabilidad de que aparezca un carácter en un bloque era inversamente proporcional a la longitud del código, lo que permitió comprimir la representación de los datos.
David Huffman era un estudiante en la clase de Robert Fano y como trabajo educativo eligió buscar un método de codificación de datos binarios mejorado. Como resultado, pudo mejorar el algoritmo Shannon-Fano.
Las primeras versiones de los algoritmos Shannon-Fano y Huffman usaban códigos predefinidos. Posteriormente, para ello comenzaron a utilizar códigos generados dinámicamente a partir de datos destinados a la compresión. En 1977, Lempel y Ziv publicaron su algoritmo LZ77, basado en el uso de un diccionario creado dinámicamente (también llamado "ventana deslizante"). En 78, publicaron el algoritmo LZ78, que primero analiza los datos y crea un diccionario, en lugar de crearlo dinámicamente.

Problemas de derechos

Los algoritmos LZ77 y LZ78 ganaron gran popularidad y provocaron una ola de potenciadores, de los cuales DEFLATE, LZMA y LZX han sobrevivido hasta el día de hoy. La mayoría de los algoritmos populares se basan en LZ77, porque el algoritmo LZW derivado de LZ78 fue patentado por Unisys en 1984, después de lo cual comenzaron a engañar a todos, incluido incluso el uso de imágenes GIF. En este momento, se utilizó una variación del algoritmo LZW llamado LZC en UNIX y, debido a problemas de permisos, tuvieron que eliminarse gradualmente. Se dio preferencia al algoritmo DEFLATE (gzip) y la transformada de Burrows-Wheeler, BWT (bzip2). Lo que era lo mejor, ya que estos algoritmos casi siempre superan a LZW en compresión.
En 2003, la patente expiró, pero el tren ya se había ido y el algoritmo LZW se conservó, quizás solo en Archivos GIF... Los algoritmos basados ​​en LZ77 son dominantes.
En 1993, hubo otra batalla de patentes, cuando Stac Electronics descubrió que Microsoft estaba utilizando su algoritmo LZS en el programa de compresión de disco que venía con MS-DOS 6.0. Stac Electronics presentó una demanda y ganó el caso, lo que resultó en más de $ 100 millones.

El aumento de la popularidad de Deflate

Las grandes corporaciones utilizaron algoritmos de compresión para almacenar cantidades cada vez mayores de datos, pero la verdadera difusión de los algoritmos llegó con el nacimiento de Internet a fines de la década de 1980. El ancho de banda de los canales era extremadamente estrecho. Para comprimir los datos transmitidos a través de la red, se inventaron los formatos ZIP, GIF y PNG.
Tom Henderson inventó y lanzó el primer archivador ARC comercialmente exitoso en 1985 (por System Enhancement Associates). ARC era popular entre los usuarios de BBS porque fue una de las primeras en comprimir varios archivos en un archivo, además de que sus fuentes estaban abiertas. ARC utilizó un algoritmo LZW modificado.
Phil Katz, inspirado por la popularidad de ARC, lanzó un programa shareware llamado PKARC, en el que mejoró los algoritmos de compresión reescribiéndolos en Assembler. Sin embargo, Henderson lo demandó y lo declaró culpable. PKARC copiaba ARC tan abiertamente que a veces incluso repetía errores tipográficos en los comentarios de su código fuente.
Pero Phil Katz no se sorprendió, y en 1989 cambió enormemente el archivo y lanzó PKZIP. Después de ser atacado en relación con la patente del algoritmo LZW, también cambió el algoritmo básico por uno nuevo, llamado IMPLODE. El formato fue reemplazado nuevamente en 1993 con el lanzamiento de PKZIP 2.0, y el reemplazo fue DEFLATE. Entre las nuevas características estaba la función de dividir el archivo en volúmenes. Esta versión todavía se usa ampliamente, a pesar de su venerable edad.
El formato de imagen GIF (Graphics Interchange Format) fue creado por CompuServe en 1987. Como usted sabe, el formato admite la compresión de imágenes sin pérdida y está limitado a una paleta de 256 colores. A pesar de todos los esfuerzos de Unisys, no pudo detener la difusión de este formato. Todavía es popular hoy en día, especialmente por su soporte de animación.
Ligeramente preocupado por los problemas de patentes, CompuServe lanzó el formato Portable Network Graphics (PNG) en 1994. Al igual que ZIP, utilizó el nuevo y elegante algoritmo DEFLATE. Aunque DEFLATE fue patentado por Katz, no hizo ningún reclamo.
Ahora es el algoritmo de compresión más popular. Además de PNG y ZIP, se utiliza en gzip, HTTP, SSL y otras tecnologías de transferencia de datos.

Lamentablemente, Phil Katz no vivió para ver el triunfo de DEFLATE; murió de alcoholismo en 2000 a la edad de 37 años. Ciudadanos - ¡El consumo excesivo de alcohol es peligroso para su salud! ¡Puede que no vivas para ver tu triunfo!

Archivadores modernos

ZIP reinó supremo hasta mediados de los 90, pero en 1993 un simple genio ruso Evgeny Roshal ideó su propio formato y algoritmo RAR. Sus últimas versiones se basan en los algoritmos PPM y LZSS. Ahora ZIP, quizás el más común de los formatos, RAR, hasta hace poco, era el estándar para la distribución de diversos contenidos de baja legalidad a través de Internet (gracias al aumento banda ancha cada vez con mayor frecuencia los archivos se distribuyen sin archivar), y 7zip se utiliza como el formato con la mejor compresión con un tiempo de ejecución aceptable. En el mundo UNIX, se usa tar + gzip (gzip es un archivador y tar combina varios archivos en uno, ya que gzip no puede hacer esto).

Aprox. transl. Personalmente, además de los enumerados, también me encontré con el archivador ARJ (Archivado por Robert Jung), que fue popular en los años 90 durante la era BBS. Mantuvo archivos de varios volúmenes y, al igual que RAR después, se utilizó para distribuir juegos y otros vares. También había un archivador HA de Harri Hirvola, que usaba compresión HSC (no encontró una explicación clara, solo "modelo de contexto limitado y codificación aritmética"), que hizo un buen trabajo al comprimir mucho archivos de texto.

En 1996, apareció la variante bzip2 de código abierto del algoritmo BWT y rápidamente ganó popularidad. En 1999, apareció el programa 7-zip con el formato 7z. En términos de compresión, compite con RAR, su ventaja es la apertura, así como la posibilidad de elegir entre algoritmos bzip2, LZMA, LZMA2 y PPMd.
En 2002, apareció otro archivador, PAQ. El autor Matt Mahoney usó una versión mejorada del algoritmo PPM usando una técnica llamada combinación de contexto. Permite utilizar más de un modelo estadístico para mejorar la predicción de la tasa de símbolos.

El futuro de los algoritmos de compresión

Por supuesto, Dios lo sabe, pero parece que PAQ está ganando popularidad debido a su muy buena relación de compresión (aunque es muy lenta). Pero gracias al aumento de la velocidad de las computadoras, la velocidad del trabajo se vuelve menos crítica.
Por otro lado, el algoritmo LZMA de Lempel-Ziv-Markov es un compromiso entre la velocidad y la relación de compresión y puede generar muchas ramificaciones interesantes.
Otra tecnología interesante es la "enumeración de subcadenas" o CSE, que todavía se utiliza poco en los programas.

En la siguiente parte veremos lado técnico de los algoritmos mencionados y los principios de su trabajo.

- 67,00 Kb

INFORMACIÓN GENERAL SOBRE ARCHIVO DE ARCHIVOS

Comprender el proceso de archivo de archivos

Uno de los tipos de programas de servicio más extendidos son los programas diseñados para archivar, empaquetar archivos comprimiendo la información almacenada en ellos.

La compresión de información es el proceso de convertir la información almacenada en un archivo en una forma en la que se reduce la redundancia en su representación y, en consecuencia, se requiere menos memoria para el almacenamiento.

La compresión de información en archivos se realiza eliminando la redundancia de varias formas, por ejemplo, simplificando códigos, eliminando bits constantes de ellos, o representando símbolos repetidos o una secuencia repetida de símbolos en forma de factor de repetición y símbolos correspondientes. Se utilizan varios algoritmos para tal compresión de información.

Se pueden comprimir uno o varios archivos, que se colocan en forma comprimida en un llamado archivo de almacenamiento o archivo.

Un archivo de almacenamiento es un archivo especialmente organizado que contiene uno o más archivos en forma comprimida o sin comprimir e información de servicio sobre los nombres de los archivos, la fecha y hora de su creación o modificación, tamaños, etc.

El propósito de empaquetar archivos suele ser proporcionar una ubicación más compacta de información en un disco, para reducir el tiempo y, en consecuencia, el costo de transmitir información a través de canales de comunicación en redes de computadoras. Además, empaquetar un grupo de archivos en un archivo de almacenamiento simplifica enormemente su transferencia de una computadora a otra, reduce el tiempo de copia de archivos en discos, protege la información del acceso no autorizado y ayuda a protegerse contra infecciones por virus informáticos.

La relación de compresión de archivos se caracteriza por el coeficiente Кс, definido como la relación del volumen archivo comprimido V s al volumen del archivo fuente V 0, expresado como porcentaje:

La cantidad de compresión depende del programa que esté utilizando, el método de compresión y el tipo de archivo de origen. Los archivos de imágenes gráficas, archivos de texto y archivos de datos para los cuales la relación de compresión puede alcanzar el 5 - 40% son los que mejor se comprimen, los archivos de programas ejecutables y los módulos de carga están comprimidos menos - 60 - 90%. Los archivos de archivo apenas se comprimen. Los programas de archivo difieren en los métodos de compresión utilizados, lo que, en consecuencia, afecta la relación de compresión.

Archivado (empaquetado): colocar (cargar) archivos de origen en un archivo de almacenamiento en forma comprimida o sin comprimir.

Desempaquetar (desempaquetar): el proceso de restaurar archivos de un archivo
exactamente como estaban antes de que se cargaran en el archivo. Al desembalar
los archivos se extraen del archivo y se colocan en el disco o en la RAM .__

Los programas que empaquetan y descomprimen archivos se denominan programas de archivo.

Los archivos de almacenamiento de gran tamaño se pueden ubicar en varios discos (volúmenes). Estos archivos se denominan multivolumen. Tom es componente archivo multivolumen. Al crear un archivo de varias partes, puede escribir partes de él en varios disquetes.

Los principales tipos de programas de archivo.

Actualmente, se utilizan varias docenas de programas de archivo, que difieren en la lista de funciones y parámetros operativos, pero los mejores tienen aproximadamente las mismas características. Entre los programas más populares se encuentran: ARJ, RKRAK, LHA, ICE, HYPER, ZIP, RAC, ZOO, EXPAND, desarrollados en el extranjero, así como AIN y RAR, desarrollados en Rusia. Por lo general, el mismo programa realiza el empaquetado y desempaquetado de archivos, pero en algunos casos lo hacen diferentes programas, por ejemplo, PKZIP empaqueta archivos y PKUNZIP descomprime archivos.

Los programas de archivo también le permiten crear archivos que no requieren ningún programa para extraer los archivos que contienen, ya que los archivos de almacenamiento en sí pueden contener un programa de descompresión. Estos archivos de almacenamiento se denominan archivos autoextraíbles.

Un archivo de almacenamiento autoextraíble es un módulo ejecutable de arranque que es capaz de autoextraer los archivos que contiene sin utilizar un programa de archivado.

El archivo autoextraíble se llama SFX-archive (SelF-eXtracting). Los archivos de este tipo en MS DOS generalmente se crean en forma de archivo .EXE.

Muchos programas de archivo descomprimen archivos descargándolos en el disco, pero también existen aquellos que están diseñados para crear un módulo (programa) ejecutable empaquetado. Como resultado de dicho empaquetado, se crea un archivo de programa con el mismo nombre y extensión que, cuando se carga en la RAM, es autoextraíble y se inicia inmediatamente. Al mismo tiempo, también es posible la conversión inversa del archivo de programa al formato descomprimido. Estos archivadores incluyen programas PKLITE, LZEXE, UNP.

El programa EXPAND, que forma parte de las utilidades del sistema operativo MS DOS y el shell de Windows, se utiliza para descomprimir archivos para productos de software suministrados por Microsoft.

Los programas de archivo RAR y AIN, además del modo de compresión habitual, tienen un modo sólido, en el que se crean archivos con una alta relación de compresión y una estructura de organización especial. En tales archivos, todos los archivos se comprimen como un flujo de datos, es decir, el área de búsqueda de secuencias repetidas de caracteres es la colección completa de archivos cargados en el archivo y, por lo tanto, descomprimir cada archivo, si no el primero, está asociado con el procesamiento de otros. Es preferible utilizar archivos de este tipo para archivar una gran cantidad de archivos similares.

Métodos de gestión del programa archivador

El programa del archivador se controla de dos formas:

Utilizando la línea de comandos de MS DOS, en la que se forma un comando de inicio, que contiene el nombre del programa archivador, el comando de control y sus claves de configuración, así como los nombres del archivo y los archivos fuente; un control similar es típico para los archivadores ARJ, AIN, ZIP, RAC, LHA, etc.;

Con la ayuda de un shell integrado y paneles de diálogo que aparecen después de que se inicia el programa y permiten el control mediante menús y teclas de función, lo que crea un entorno de trabajo más cómodo para el usuario. El programa archivador RAR tiene ese control.

Al realizar las acciones prescritas, el programa de archivo, por regla general, muestra un protocolo de su trabajo en la pantalla. Todos los programas de archivo modernos están equipados con pantallas de ayuda que se abren cuando ingresa solo un nombre de programa o un nombre con la tecla /? En la línea de comando. La ayuda puede ser breve, en una pantalla o ampliada, en varias. Muchos archivadores tienen pantallas de ayuda con ejemplos de comandos de escritura para realizar diversas operaciones. La información de ayuda generalmente se muestra en inglés u otro idioma internacional.

Teniendo en cuenta la similitud de los principios de gestión de la mayoría de los programas de archivo, consideraremos las principales características del programa ARJ, que es conocido como uno de los mejores en términos del conjunto de funciones proporcionadas al usuario, la relación de compresión y la velocidad de trabaja. ARJ es especialmente eficaz cuando se trabaja con archivos de base de datos y archivos de texto.

1. Archivadores de MS DOS

1.1 Archivador ARJ

Funciona desde la línea de comandos. Realiza todas las funciones de mantenimiento de archives.arj, incl. soporte para archivos multivolumen.

Obtenga ayuda sobre las claves del archivador arj usando los comandos:

arj (ayuda regular)

arj /? (ayuda detallada)

Arj tiene una gran cantidad de claves. Puede automatizar muchas acciones: crear una copia de seguridad del disco, archivar desde una fecha determinada, agregar la fecha actual al nombre del archivo (arh970821.arj), archivar un archivo desde una ubicación específica, varios niveles de compresión, etc. En la versión 2.55, es posible trabajar con nombres largos.

Ventajas: una gran cantidad de teclas, lo que permite automatizar una gran cantidad de funciones. Archivo de protección contra daños.

Desventajas: falta de modo de diálogo, algunos inconvenientes de trabajo en presencia de alguna tecla en Variable ambiental(ARJ_SW) y la línea de inicio: destrucción mutua.

1.2 PKZIP

Funciona desde la línea de comandos. Diferentes programas realizan varias funciones para mantener archivos .zip:

pkzip - archivos de almacenamiento

pkunzip - extraer archivos del archivo

zip2exe: crea un archivo autoextraíble

pkzipfix: recuperación de un archivo dañado.

Explore la ayuda para trabajar con el archivador pkzip usando los comandos:

1.3 RAR

Archiver RAR v2.50 para DOS: programa de gestión de archivos integrado

RAR es una herramienta muy poderosa para crear y administrar archivos. Características RAR:

Interfaz interactiva de pantalla completa (conmutable);

Soporte de mouse y menú;

Soporte para archivos no RAR;

Interfaz de línea de comando estándar;

Algoritmo original de compresión de datos altamente eficiente;

Algoritmo especial para comprimir archivos multimedia;

Mejor relación de empaque que productos similares debido al uso del modo de compresión "continuo";

Archivos regulares y multivolumen autoextraíbles (SFX);

Recuperación de archivos dañados físicamente;

Lenguaje de programación para la instalación de archivos SFX;

Bloqueo, cifrado, lista de orden de archivos, etiquetas de volumen, etc.

1.4 QUARK

Quark es un archivador clásico que utiliza el algoritmo LZ77 para comprimir los datos originales codificando secuencias repetidas de bytes (algoritmo RSE), seguido de la compresión secundaria del flujo comprimido con códigos Huffman. Los tres líderes en el campo del empaquetado de datos utilizan métodos similares: archivadores ARJ, LHA, PkZIP.

Sin embargo, Quark logra mejores resultados en la compacidad de los datos a una velocidad mejor que LHA, no menos que la de ARJ y no muy diferente de la velocidad de PkZIP, cuando se usa así. máxima compresión de datos. Esto se debe a varias razones:

1) Quark funciona con un tamaño de ventana flotante de 32 Kb a 64 Kb (frente a los 16 Kb fijos para LHA y 32 Kb para PkZIP y ARJ).

2) Quark realiza optimización de Tipo I (optimización de las direcciones de enlace LZ77) y optimización de Tipo II (optimización de la cobertura de enlace del flujo).

3) Quark utiliza la reducción de texto para archivos de texto.

4) Quark archiva un mínimo de información de servicio, sin pretender que otras plataformas de hardware y sistemas operativos.

1,5 GZIP

Gzip reduce el tamaño de los archivos dados mediante la codificación Ziv-Lemel (LZ77). Siempre que sea posible, cada archivo se reemplaza por un archivo ".gz", manteniendo el propietario, los modos, el acceso y los tiempos de modificación (otras extensiones son "-gz" para VMS, "z" para MSDOS, OS / 2, FAT, y Atari). Si no se especifica ningún archivo o el nombre del archivo es "-", la entrada estándar se empaqueta y se imprime en la salida estándar. Gzip intenta empaquetar solo archivos normales, en particular GZip ignora los enlaces simbólicos.

Gzip utiliza el algoritmo Ziv-Lemel, así como Zip, PKZIP. El tamaño final del archivo resultante después de la compresión depende del tamaño del archivo original y de la presencia de subcadenas comunes en él. Normalmente, el texto, como el código fuente o el texto en inglés, se reduce entre un 60 y un 70%. Empacar usando este algoritmo es generalmente mejor que usar LZW (Compress lo usa), codificación Huffman (Pack lo usa) o codificación Huffman adaptada (Compact).

El empaquetado ocurre independientemente de si el tamaño del archivo empaquetado ha aumentado en comparación con el original o no. El motivo de la extensión son unos pocos bytes para el encabezado del archivo Gzip, más 5 bytes por cada bloque de 32K, o una proporción de extensión del 0.015% de la longitud del archivo. Tenga en cuenta que el número real de bloques utilizados en el disco nunca aumenta. Gzip conserva los modos de acceso, los propietarios y los tiempos de modificación de los archivos al empaquetar y desempacar.

1.6 ARJZ

ARJZ (pronunciado "arzh-zet" a voluntad del autor del programa) es un archivador basado en el famoso programa ARJ de Robert Young. A diferencia de las herramientas de archivo modernas como RAR y UC2, ARJZ utiliza un formato de archivo, una línea de comandos y opciones que son compatibles con uno de los programas de compresión de datos más populares, y esto tiene sus ventajas. En particular:

1) Casi todo el software diseñado para llamar a ARJ funcionará igual con ARJZ sin ninguna modificación. Por ejemplo, no necesitará volver a escribir ARCVIEW, NC 4.0, DN o los archivos BAT que haya creado mientras usa ARJ.

2) Para utilizar las funciones de ARJZ "y cuando trabaje con sus archivos antiguos, no necesita volver a archivarlos en absoluto.

3) También casi te deshaces de la necesidad de aprender un nuevo archivador. Sabiendo cómo comienza ARJ, sabes cómo comienza ARJZ.

Breve descripción

Uno de los tipos de programas de servicio más extendidos son los programas diseñados para archivar, empaquetar archivos comprimiendo la información almacenada en ellos.
La compresión de información es el proceso de convertir la información almacenada en un archivo en una forma en la que se reduce la redundancia en su representación y, en consecuencia, se requiere menos memoria para el almacenamiento.

Vadim Tukaev (Saratov)

Es posible que haya encontrado archivos con la extensión ".arj" en su camino. Si hace clic en un archivo de este tipo, seguramente se iniciará WinRAR (o lo que sea que haya instalado como archivador estándar), lea con calma su contenido y descomprímalo donde desee. Sin embargo, si tiene una mente inquisitiva (o simplemente un poco de curiosidad), entonces se preguntará: ¿por qué el creador de ese archivo usó este archivador en particular? Hoy en día, es raro encontrar algo que no sea ".zip" y ".rar". Bueno, los uniksoides a menudo se encuentran con ".tgz" (estrictamente hablando, que no es un formato de archivo especial, sino una abreviatura de ".tar.gz", es decir, esta extensión significa que el archivo se archivó primero con el programa tar y luego comprimido con el programa gzip, pero esa es una historia completamente diferente). Érase una vez, había muchos algoritmos de archivo (ARC, HA, LHA, PAK, UC2, ZOO), y cada uno tenía adeptos.

Uno de los más comunes fue ARJ, que compitió en igualdad de condiciones con ZIP. La razón por la que ZIP se ha convertido en el estándar de facto es por su algoritmo muy rápido y su buena relación de compresión. Si hubiera archivadores que comprimieran mejor (por ejemplo, RAR), esto se logró mediante un gasto desproporcionadamente grande de recursos del sistema. En términos generales, se tardó 10 veces más en comprimir un 10% mejor. Además, PKZIP se distribuyó en forma de shareware y era completamente gratuito para la mayoría de las personas. La investigación moderna muestra que el 60% de todos los archivos de archivos existentes están en formato ZIP. Phil Katz, el creador del algoritmo ZIP, el programa PKZIP y fundador de la empresa que lo distribuye PKWARE (PK - Phil Katz), se convirtió en un hombre rico y famoso, lo que no le trajo felicidad. Bebió él mismo y murió a los 37 años. Sin embargo, esta es nuevamente una historia completamente diferente, aunque muy instructiva. Por cierto, ARJ significa Archivado por Robert Jung. No encontré ninguna información sobre el autor de ARJ. Quizás esto tenga algo que ver con su profunda religiosidad. Por ejemplo, el propio Lord es seriamente nombrado socio principal de ARJ Software.

Ventajas de ARJ:

1. Funciona muy rápido, lo cual no es sorprendente, porque la primera versión del programa apareció en 1990 (luego de 16 bits Procesador Intel El 80286 se consideró irrazonablemente genial, ¡y el 80386 de 32 bits era un sueño imposible!) Y el algoritmo no ha cambiado nada desde entonces. Por las mismas razones, no exige volumen. memoria de acceso aleatorio(Tuve un caso en el que no pude descomprimir un archivo rar en mi computadora anterior solo porque tenía muy poca memoria).

2. Total compatibilidad de arriba hacia abajo, de abajo hacia arriba y donde quiera. Cualquier versión de ARJ abrirá cualquier archivo arj. Compare esta situación con RAR. Él, por supuesto, se desarrolla y mejora, pero esto lleva al hecho de que versión antigua Es posible que RAR no descomprima el archivo rar de próxima generación. Ella simplemente no entenderá que le está pasando esto.

3. Una gran cantidad de opciones y opciones de personalización para sus necesidades específicas, muy superior a cualquier otro archivador. Algunas funciones de ARJ ni siquiera están en un archivador JAR muy similar, sino más moderno, del mismo autor.

4. Disponibilidad para casi cualquier sistema operativo: DOS, Windows, Linux, FreeBSD, OS / 2 y, lo que es más importante, soporte para las características específicas de estos sistemas operativos. Por ejemplo, OS / 2 EA (atributos extendidos). Esto también incluye la capacidad de descomprimir archivos con nombres largos en DOS, que no los entiende. Tenga en cuenta que ARJ Software ha creado solo versiones de consola para DOS y Windows, todo lo demás es de código abierto o (como en el caso de ARJ / 2 y WinArj) desarrollado por terceros.

5. Por último, pero no menos importante (proverbio inglés, traducido libremente - "el último en la lista, pero no en el significado"): multivolumen. En la mayoría de los casos, fue sobre esta base que el usuario tomó la decisión final entre ZIP y ARJ. Imagine la siguiente situación: necesita transferir de una computadora a otra un archivo de tal tamaño que, incluso cuando está empaquetado, es más grande que cualquier medio de almacenamiento externo disponible. Lea: "no cabe en un disquete", porque solía ser el único medio generalmente aceptado y disponible públicamente para compartir archivos. No todo el mundo tenía discos magneto-ópticos, cintas de transmisión, discos de Bernoulli, etc. El CD-R era la misma innovación inaccesible para el profano, como lo es ahora la grabadora de discos BlueRay. ¿Qué hacer? Utilice ARJ, que pudo crear archivos de varios volúmenes, es decir, archivos que constan de varios archivos. Incluso hubo casos en los que se utilizó ARJ por su efecto secundario (cortar el archivo en pedazos), y no el principal (reducirlos de tamaño). Por ejemplo, los archivos se archivaron primero con PKZIP y luego el enorme archivo zip resultante se colocó en un archivo arj de varios volúmenes. Tenía sentido si se contaba cada byte, y este conjunto particular de archivos en el formato "zipun" resultaba ser más pequeño que en el formato "arzhan".

Desventajas de ARJ (que, como suele ser el caso, reflejos de espejo sus méritos):

1. El archivador no se desarrolla, porque no hay nada especial que desarrollar allí. Cualquier innovación importante contradice la ideología de ARJ: todo debe desempaquetarse con la primera versión de la muestra de 1990.

2. En particular, no se admite el trabajo con archivos de más de dos gigabytes. Y ahora es poco probable que alguna vez sea compatible, dado que la reelaboración código fuente esto requerirá uno sustancial, y el autor parece haber perdido interés en su creación. Ahora está desarrollando un archivador JAR que sigue la misma filosofía pero no es compatible con ARJ.

3. Los archivos sólidos no lo son y nunca lo serán. Para aquellos que no sepan de qué se trata, lo explicaré usando el ejemplo RAR (hasta donde yo sé, fue en él donde se implementó por primera vez esta brillante idea). Digamos que tiene dos archivos que son muy similares en su contenido. Digamos dos textos sobre temas filosóficos. Seguramente ambos contendrán a menudo las mismas combinaciones de letras, por ejemplo, la característica terminación "ismo" (marxismo, leninismo, idealismo). Al archivar el primer archivo, RAR tomará nota de este hecho y guardará información sobre estos "ismos" en un "diccionario" especial. Cuando comprime el segundo archivo, ya no incluirá "ismo" en la lista de combinaciones de letras que ocurren con frecuencia, sino que simplemente se vinculará a la entrada correspondiente en el diccionario. Como resultado, el segundo archivo se archivará de manera mucho más eficiente. Por cierto, JAR admite archivos sólidos.

4. La relación de compresión ARJ no es mala, aproximadamente en el nivel ZIP (es imposible decir claramente cuál de los dos es mejor - diferentes archivos producen resultados diferentes), pero aún así los archivadores modernos comprimen mucho más eficientemente.

Pero a veces tiene sentido no solo esperar diez veces más para reducir los datos en una décima parte, sino que incluso para reducir solo una centésima, puede esperar cien veces más. Además, las computadoras modernas son muy poderosas y "cien veces más" puede significar "un segundo en lugar de una centésima de segundo". Además, según mis observaciones, una vez que se crea un archivo, rara vez es necesario actualizarlo y volver a empaquetarlo.

5. La necesidad de utilizar la interfaz de línea de comandos y recordar comandos y teclas específicos del programa ARJ. Ahora ha crecido toda una generación de usuarios que le temen a la "pantalla negra con letras" como el diablo del incienso. Aún así, te aconsejo que superes esta fobia. Aún no se ha inventado una forma más flexible de interactuar con los programas. Algún día será útil ... Al menos para evitar un "choque cultural" ante los sistemas UNIX.

Conclusiones:

ARJ se desarrolló no solo y no tanto para "apisonar" datos estáticos (por ejemplo, distribuciones de programas), sino para archivar convenientemente documentos actuales (por ejemplo, el árbol de fuentes de su propio programa), automatizar copias de seguridad periódicas y crear copias de seguridad de uso frecuente, modificadas y archivos actualizados. Es en estos casos que los trucos patentados de ARJ pasan a primer plano, como buscar en el archivo, varios tipos de archivos SFX (SelF-eXtracting - autoextraíble), escribir la fecha actual en el nombre del archivo, descomprimir archivos basados ​​en el presencia de una determinada línea de texto en ellos, poderosa la capacidad de recuperar archivos parcialmente dañados, la capacidad de cambiar el nombre de un archivo directamente dentro del archivo, la capacidad de tomar decisiones en caso de fuerza mayor sin la intervención del usuario ... No tiene sentido continuar. Basta ver la enorme lista de comandos, teclas y modificadores que produce el comando ARJ.EXE /? Su listado solo será más largo que este artículo. Aquí hay solo un ejemplo del uso de ARJ:

arj a -e -jt -jm -jh65535 -vav -g? -wC: \ TEMP -xMY_DIARY.TXT my_texts_ * .txt -h # -hcCLS

comando a: agrega archivos al archivo (si no hay ningún archivo con este nombre, se creará).

switch e: no guarda información sobre la estructura del directorio.

jt key: compruebe si los archivos se dañaron al empaquetarlos.

Tecla jm: usa el nivel máximo de compresión.

key jh: establece el tamaño del búfer para el algoritmo de Huffman (65535 es el máximo, 2048 es el mínimo, pero no existe una relación directa entre su tamaño y la relación de compresión, es decir, a veces un valor más pequeño proporciona una mejor compresión).

clave v: crear un archivo multivolumen, modificador "a" - use todo el espacio disponible en el medio para el volumen (es conveniente si no tiene disquetes "cero", sino solo medio vacíos y / o parcialmente dañados), "v" - después de escribir cada volumen "Beep" con el altavoz para que el usuario se despierte e inserte un nuevo disquete.

clave g: cifrar archivo, modificador "?" - solicite una contraseña inmediatamente antes de archivar.

clave w: especifica un directorio para archivos temporales.

switch x: ¡bajo ninguna circunstancia archive este archivo!

my_texts_ es el nombre del archivo (o su primera parte - vea la tecla h #).

* .txt: procesa todos los archivos de texto del directorio actual.

clave h #: agregue la fecha de hoy al nombre del archivo en formato AAMMDD, es decir, el archivo con fecha 13 de febrero de 2010 se llamará "my_texts_100213.ARJ".

key hc: ejecute un comando de DOS antes de comenzar a trabajar, en este caso CLS (CLear Screen - limpiar la pantalla).

Tema 2.1Trabajando con archivos

1. Archivadores y archivado.

2. Ver archivo de archivo en formato CÓDIGO POSTAL.

El problema de la compresión de datos existe desde hace mucho tiempo, desde la llegada de las computadoras.El propósito de empaquetar archivos suele ser proporcionar una ubicación más compacta de información en un disco, para reducir el tiempo y, en consecuencia, el costo de transmitir información a través de canales de comunicación en redes de computadoras. Además, empaquetar un grupo de archivos en un archivo de almacenamiento simplifica enormemente su transferencia de una computadora a otra, reduce el tiempo de copia de archivos en discos y ayuda a proteger la información del acceso no autorizado. Estos y otros problemas se resuelven con la ayuda de programas de archivo potentes y funcionales, cuyos desarrolladores ofrecen a los usuarios varios métodos para procesar datos. Además, los archivadores pueden ser tanto gratuitos como comerciales, y su elección depende de los requisitos que el usuario haga al programa para trabajar con archivos específicos. Entre los programas más populares se encuentran: WinRAR (versión comercial) y 7-Zip (programa gratuito).

Archivo de archivo es un archivo especialmente organizado que contiene uno o varios archivos en forma comprimida o sin comprimir e información de servicio sobre los nombres de los archivos, la fecha y hora de su creación o modificación, tamaños, etc.


Archivadores son programas que implementan el proceso de archivo, lo que le permite crear y descomprimir archivos
Archivar- esto es compresión, compactación, empaquetado de información.
Abrir la cremallera- proceso de recuperación de archivospescando desde el archivo exactamente en la forma que tenían antes de cargar enarchivo. Al desempaquetar, los archivos se extraen del archivo y se colocan se guardan en el disco.
Índice de compresión el archivo se caracteriza relación de compresión K c, que se define como la proporción del tamaño del archivo comprimido V c al volumen del archivo original V o, Expresado en%:

Aprendamos a crear archivos usando el programa WinRar.


Después de cargar el programa, vemos una ventana estándar con una interfaz clara.

Agregar: le permite archivar archivos seleccionados y agregarlos a un archivo existente.

Ver: muestra el contenido del archivo.

Eliminar: elimina el archivo / grupo de archivos seleccionado.

Arreglar: recupera un archivo dañado.

Tasa: proporciona una estimación aproximada para archivar el archivo / grupo de archivos seleccionado.

Extraer a: le permite especificar la ruta de extracción.

Prueba: prueba el archivo seleccionado en busca de errores.

Para archivar un archivo o grupo de archivos, selecciónelos y haga clic en el botón Agregar.


Al crear un archivo, debe especificar el nombre del archivo, si el archivo se crea en la carpeta actual.


o donde se guardó.


Al crear un archivo, puede elegir el formato de archivo RAR o ZIP

Al crear un archivo, puede elegir un método de compresión

El método máximo proporciona la relación de compresión más alta, pero a la velocidad más lenta. Por el contrario, el de alta velocidad se comprime mal, pero rápidamente. El método sin comprimir coloca los archivos en el archivo sin empaquetarlos. Para transmisión a través de Red de computadoras o para almacenamiento a largo plazo, tiene sentido elegir el método máximo para obtener la mejor compresión. Para diario respaldo el método habitual es el que se utiliza con mayor frecuencia.

Archivos multivolumen.

mi Si el archivo original destinado a la transmisión a través de Internet es muy grande, entonces es simplemente imposible transferirlo a través de la red por este motivo. Para que esto sea posible, dicho archivo se "corta" durante la compresión en fragmentos, cada uno de los cuales se denomina volumen de archivo. Como resultado, resulta, digamos, 10 volúmenes, que se descargan a su vez. Dicho archivo se llama multivolumen. Al desempaquetar el primer fragmento, todo el resto se desempaqueta automáticamente y el usuario recibe el archivo original en su forma original.


Archivo autoextraíble.

Para descomprimir dicho archivo, no necesita un programa especial, basta con ejecutar el archivo de almacenamiento para su ejecución, ya que es un archivo ejecutable.


Es posible establecer una contraseña.

Para extraer archivos del archivo, utilice el botón "extraer", indique la ruta y los parámetros para la extracción.


Trabajo practico:

1. Abra la carpeta Mi archivo.

2. Comprima cada archivo

3. Definir índice de compresión

4. Investigue el cambio de tamaño de los archivos de origen y los archivos resultantes.

5. Registre los resultados en la tabla.

P / p No.

Nombre del archivo

Tipo de archivo

Tamaño original

Tamaño del archivo de archivo

Índice de compresión

Conclusión sobre la tasa de compresión de archivos de diferentes tipos --__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Cómo comenzó todo Cuando los CD aún no habían recibido tal distribución y el único medio de comunicación de una computadora a otra, así como para Reserva copia, había disquetes, se necesitaban programas que comprimieran la información para que ocupara menos espacio y la guardaran en uno o más archivos para transferirlos a disquetes. Así es como nacieron los archiveros.
Como ya se señaló, los archivadores se utilizaron principalmente para realizar copias de seguridad y transferir información. Al almacenar copias de archivos en forma comprimida, ocupan menos espacio, además, es más conveniente operar con uno o más archivos que con gran cantidad archivos y directorios. Los archivadores no han perdido su relevancia ahora, sin embargo, los requisitos para esta categoría de productos de software para los usuarios han cambiado significativamente. Si antes, quizás lo más importante era el requisito de máxima compresión de información, al menos debido al alto costo de los medios de almacenamiento en ese momento, los archivadores que cumplían con este mismo requisito se distribuyeron en primer lugar, ahora la situación ha cambiado significativamente y la simplicidad y comodidad de uso.
Otro requisito importante para los archivadores a la hora de transferir información era su prevalencia, es decir, para que al transferir información no fuera necesario transferir el archivador en sí.
A lo largo de los años desde el inicio del primer programa de este tipo, se han escrito cientos de archivadores diferentes que admiten varios formatos de archivo. En el momento de la formación y desarrollo de los archivadores, el formato más común era ARJ, en segundo lugar casi inmediatamente después de ZIP, con algún margen seguido por archivadores como ARC, ACE, LZH. Por el momento, la situación ha cambiado significativamente. El primer lugar entre los formatos de archivo lo ocupa ZIP, que se lo ganó a ARJ, que ahora ha pasado a segundo plano, RAR ocupa el segundo lugar, y ACE, ARJ y otros formatos menos populares le siguen por un margen importante.
Por lo tanto, en nuestra revisión, nos interesan principalmente los archivadores de los formatos más comunes:


CÓDIGO POSTAL- el formato fue desarrollado por PKWARE.

RAR- el formato fue desarrollado por Eugene Roshal, el autor del archivador del mismo nombre y gracias a interfaz amigable el archivador ganó popularidad simultáneamente con una buena compresión.

Descripciones de archivadores

WinZip

El último Versión definitiva WinZip 8.1

WinZip es probablemente el archivador más popular, tiene soporte incorporado para descomprimir archivos .CAB y archivos de "formatos de Internet" populares como TAR, GZip, UUencode, BinHex y MIME. La descompresión de archivos ARJ, LZH y ARC se admite a través de los archivadores apropiados. WinZip es simple y fácil de usar, tiene una interfaz intuitiva que permite que incluso los usuarios novatos trabajen con él sin preparación. Se puede conectar un antivirus externo al programa para analizar los archivos de almacenamiento en busca de virus. El archivador puede trabajar en dos estilos: Asistente (asistente, asistente) Clásico (estándar, clásico). El estilo Wizard es para aquellos que aún no dominan el archivador o que les gusta trabajar paso a paso, respondiendo las preguntas correspondientes del programa.


El soporte para arrastrar y soltar archivos hacia / desde el archivo, así como la integración con el explorador, hacen de WinZip un archivador muy fácil de usar. Al hacer clic con el botón derecho del mouse en el explorador, se abre un menú contextual, que se puede configurar en las opciones. Los elementos del menú le permiten agregar archivos al archivo, crear un nuevo archivo, descomprimir archivos del archivo, crear un archivo autoextraíble, comprimir archivos y enviar por Email, Uso el cliente de correo instalado por defecto.


Si el archivo en el que se hace clic en el botón es un archivo ZIP, el menú del explorador se verá así:


De forma predeterminada, WinZip se asocia con las siguientes extensiones de archivo:


WinZip admite la creación de archivos de varios volúmenes.

Puede descargar complementos al programa:

Complemento de soporte de línea de comandos de WinZip- para trabajar con archivos desde la línea de comandos.

Complemento de compatibilidad con el navegador de Internet WinZip- para simplificar la descarga de archivos de Internet, descomprimiéndolos e instalando programas. El archivo se descarga automáticamente al directorio especificado en la configuración y, una vez finalizado, se abre en WinZip.

WinZip Self-Extractor: para crear archivos autoextraíbles. WinZip Self-Extractor, aunque puede funcionar como un complemento de WinZip, es independiente producto de software... Desde la versión 8.0, WinZip tiene un Edición personal de WinZip Self-Extractor con capacidades algo limitadas en comparación con WinZip Self-Extractor.

Probablemente el segundo archivador más popular después de WinZip, y en Rusia probablemente esté incluso por delante de él. La última versión final es WinRAR 2.90


WinRAR funciona en Windows 9x / ME / NT / 2000 / XP. Existe una versión de consola de Rar, así como versiones para Linux, BeOS, DOS, OS / 2 y varias plataformas Unix. WinRAR está disponible en muchos idiomas, incluido el ruso. El autor del programa es Evgeny Roshal de Chelyabinsk.
El programa implementa un algoritmo de compresión original que te permite comprimir bien archivos, especialmente ejecutables, bibliotecas y archivos de texto de gran tamaño, así como un algoritmo especial para comprimir archivos multimedia.
El formato ZIP es totalmente compatible, así como las operaciones básicas (ver contenido, desempaquetar, mostrar comentarios e información sobre archivos) para Archivos CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2 y JAR.


Se admite la capacidad de crear archivos continuos (sólidos), con un aumento de la tasa de compresión en un 10-50%, especialmente para una gran cantidad de archivos; creando archivos multivolumen y autoextraíbles. WinRAR está integrado en el explorador, cuando hace clic con el botón derecho en un tipo de archivo compatible, aparece un menú contextual:


Y cuando selecciona otros archivos (y directorios), un menú para agregar archivos al archivo (para iniciar WinRAR y especificar parámetros) y un menú para crear un archivo RAR a partir de los archivos y directorios seleccionados.
WinRAR también le permite proteger los archivos contra daños al almacenar información redundante, cerrar archivos de cambios, archivar con una contraseña y agregar comentarios a los archivos (con soporte para secuencias ANSI ESC) y una entrada sobre el creador (solo para usuarios registrados).

PowerArchiver 2001

Versión más reciente: PowerArchiver 2001 7.02.08


Soporte completo integrado para archivos ZIP, CAB, LHA (LZH), TAR, TAR.GZ, TAR.BZ2 y BH (BlakHole), así como archivos XXE y UUE. Soporte incorporado para descomprimir Archivos RAR, ARJ, ARC, ACE, ZOO, GZ y BZIP2. Visor interno incorporado para archivos TXT, RTF, BMP, ICO, WMF, EMF, GIF y JPG. Soporte para pieles. Posibilidad de imprimir una lista de archivos en el archivo o exportar la lista a archivos en formato TXT o HTML. Soporte para arrastrar y soltar archivos hacia / desde archivos. Hay opciones útiles para realizar copias de seguridad utilizando sus propios scripts, la capacidad de descomprimir varios archivos a la vez, reparar un archivo dañado (solo para ZIP), crear un archivo ZIP de varios volúmenes a partir de un archivo completo y viceversa, una función incorporada para determinar el tipo de archivo. La capacidad de conectar un antivirus externo. Dos modelos de visualización de archivos: clásico y tipo explorador, con dos ventanas separadas horizontalmente y que muestran una estructura de árbol. En términos de la cantidad de funciones integradas, el programa está por delante de sus competidores, por lo que rápidamente ganó popularidad entre los usuarios.

Integración en el explorador con menú personalizado:


En los archivos de almacenamiento, el menú emergente al hacer clic con el botón derecho del mouse se ve así.


Y se ve así cuando hace clic y selecciona archivos de otros formatos.


Adiciones al programa:

Soporte de parámetros de línea de comando - Complemento de soporte de línea de comandos de PowerArchiver o la línea de comandos de PowerArchiver.

Para crear archivos autoextraíbles: Complemento de PowerArchiver SFX Maker por David Cornish.

Para aquellos que quieran crear skins ellos mismos, los ayudaremos PowerArchiver Toolbar-ImageList Creator.

WinAce

Por el momento, la última versión es WinAce 2.11


Archivado en los siguientes formatos: ACE, ZIP, LHA, MS-CAB, JAVA JAR.


Descomprimir formatos ACE, ZIP, LHA, MS-CAB, RAR, ARC, ARJ, GZip, TAR, ZOO, JAR. Soporte para archivos multivolumen para archivos ACE, ZIP, CAB. Cree archivos autoextraíbles y restaure archivos para archivos ACE y ZIP. Acceso a la línea de comandos. Visor integrado para documentos de Word, HTML, archivos de texto y los principales formatos gráficos: TIFF (* .tif; * .tiff), Photoshop (* .psd, * .pdd), Paintshop Pro (* .psp), * .png (Gráfico de red portátil), GIF, BMP, mapa de bits estándar de Windows (* .bmp, * .rle, * .dib), * .ico, SGI (* .bw, * .rgb, * .rgba, * .sgi), Autodesk (* .cel; * .pic), Truevision (* .tga; * .vst; * .icb; * .vda; * .win), Pincel ZSoft (* .pcx, * .pcc), Word 5.x Capturas de pantalla (* .scr), Kodak Photo-CD (* .pcd), Mapa portátil de píxeles / grises (* .ppm, * .pgm, * .pbm), Dr. Halo (* .cut, * .pal), SGI Wavefront (* .rla, * .rpf) y fax GFI (* .fax). Función de optimización para archivos existentes. Integración del explorador: ventana emergente menús contextuales haciendo clic con el botón derecho y en una pestaña adicional al ver las propiedades del archivo (solo para archivos ACE y ZIP).



El formato ACE se utiliza a menudo en el intercambio de archivos en varios canales de servidor de IRC.

7 cremalleras

La última versión disponible actualmente es 7-Zip 2.30 Beta 12.


Es un archivador relativamente poco conocido que proporciona una relación de compresión bastante alta para el formato ZIP y también tiene su propio formato 7z con una alta relación de compresión. Además, 7-Zip es gratis. V esta reseña llegó a demostrar que los archivadores más populares enumerados anteriormente no siempre son los líderes en compresión máxima.
Por lo tanto, el archivador es totalmente compatible con los formatos ZIP, GZIP, BZIP2, TAR, 7z, proporciona descompresión de archivos RAR, CAB. Es posible trabajar desde la línea de comandos. Se integra en el explorador, agregando un menú simple de tres elementos:

Comparación de funcionalidad

Soporte de formato y otras características

Formato, funciónWinZIP 8.1WinRAR 2.90PowerArchiver 2001 7.02.08WinAce Archiver 2.047-Zip 2.30 Beta 12
CÓDIGO POSTALLlenoLlenoLlenoLlenoLleno
RARNoLlenoDesembalajeDesembalajeDesembalaje
ASNoDesembalajeDesembalajeLlenoNo
GzipDesembalajeDesembalajeDesembalajeDesembalajeLleno
TAXIDesembalajeDesembalajeLlenoLlenoDesembalaje
ALQUITRÁNDesembalajeDesembalajeLlenoDesembalajeLleno
LZHExternoDesembalajeLlenoLlenoNo
ARJExternoDesembalajeDesembalajeNoNo
BZ2NoDesembalajeDesembalajeNoLleno
FRASCONoDesembalajeNoDesembalajeNo
BhNoNoLlenoNoNo
ARCONoNoNoDesembalajeNo
ZOONoNoNoDesembalajeNo
UUEDesembalajeDesembalajeLlenoNoNo
OtroXXe, BinHex, MIME - XXE - 7z
Soporte para archivos multivolumenCÓDIGO POSTALRARCÓDIGO POSTALACE, ZIP, CABINANo
Soporte para la creación de archivos sólidosNoRARNoAS7z
Soporte de grabación AVNoRARNoASNo
IncorporadoVentanasWindows y DOSVentanasWindows y DOSVentanas
Soporte antivirus externoNoNo
Soporte de arrastrar y soltarNo
Soporte de línea de comandosa través del complemento de soporte de línea de comandos de WinZipLlenoOperaciones básicas. Completo: a través del complemento de soporte de línea de comandos de PowerArchiverLlenoLleno
Soporte para comentarios en archivosASCII para ZIPASCII y ANSI para RAR y ZIPASCII para ZIPASCII, ANSI y HTMLNo

Pruebas

El propósito de esta prueba fue obtener no un valor absoluto del tiempo de compresión, sino una comparación relativa de la velocidad de la relación de compresión de los archivadores que participan en la prueba. Relación de compresión: el tamaño del archivo de origen (conjunto de archivos) se tomó como 100%, la tabla como porcentaje indica el volumen del campo de compresión del archivo resultante en relación con el archivo original (conjunto de archivos).

La prueba se llevó a cabo en un sistema con la siguiente configuración:

Procesador Intel Celeron 450MHz
Disco duro Fujitsu 20Gb
256 MB de RAM
Windows 98 SE

Archivos .EXE y DLL 2017, tamaño 462,326,078 bytes

Programa de archivoOpcionesMétodo de compresiónFormato de archivoTiempo de archivo, min: segTamaño de archivo, bytesÍndice de compresión
WinRAR 2.90Tamaño del diccionario 1024 KBMejorRAR 16:57 185,829,854 40.19 %
WinRAR 2.90 MejorRAR 32:40:00 174,505,219 37.75 %
WinRAR 2.90 MejorCÓDIGO POSTAL 12:29 201,984,371 43.69 %
WinZIP 8.1 MáximoCÓDIGO POSTAL 16:10 202,072,691 43.71 %
7-Zip 2.30 Beta 12 MáximoCÓDIGO POSTAL 29:37:00 196,345,086 42.47 %
7-Zip 2.30 Beta 12 Máximo7Z 29:10:00 169,185,782 36.59 %
WinAce Archiver 2.04 MáximoCÓDIGO POSTAL 15:21 196,345,096 42.47 %
WinAce Archiver 2.04Sólido,MáximoACE 2.0 20:34 160,158,266 34.65 %
WinAce Archiver 2.04Tamaño del diccionario 4096 KB, compresión exe optimizadaMáximoACE 2.0 18:32 176,050,278 38.08 %
WinAce Archiver 2.04Tamaño del diccionario 4096KBMáximoAS 18:21 183,747,786 39.74 %
PowerArchiver 2001 7.02.08 MáximoCÓDIGO POSTAL 14:13 201,838,065 43.66 %

521 archivos de Word, tamaño 32,175,596 bytes

Programa de archivoOpcionesMétodo de compresiónFormato de archivoTiempo de archivo, min: segTamaño de archivo, bytesÍndice de compresión
WinRAR 2.90Tamaño del diccionario 1024 KBMejorRAR 1:14 8,068,122 25.08 %
WinRAR 2.90Sólido, tamaño de diccionario 1024 KBMejorRAR 1:30 5,538,095 17.21 %
WinRAR 2.90 MejorCÓDIGO POSTAL 1:03 9,462,371 29.43 %
WinZIP 8.1 MáximoCÓDIGO POSTAL 1:29 9,470,530 29.43 %
7-Zip 2.30 Beta 12 MáximoCÓDIGO POSTAL 2:22 9,087,254 28.24 %
7-Zip 2.30 Beta 12 Máximo7Z 2:05 7,302,364 22.70 %
7-Zip 2.30 Beta 12SólidoMáximo7Z 2:04 4,717,281 14.66 %
WinAce Archiver 2.04 MáximoCÓDIGO POSTAL 1:11 9,470,116 29.43 %
WinAce Archiver 2.04 MáximoACE 2.0 1:28 5,245,381 16.30 %
WinAce Archiver 2.04Tamaño del diccionario 4096 KB, compresión exe optimizadaMáximoACE 2.0 1:21 7,963,681 24.75 %
WinAce Archiver 2.04Tamaño del diccionario 4096KBMáximoAS 1:17 8,060,489 25.05 %
WinAce Archiver 2.04 MáximoAS 1:24 5,309,725 16.50 %
PowerArchiver 2001 7.02.08 MáximoCÓDIGO POSTAL 1:01 9,458,970 29.40 %

CÓDIGO POSTAL 1:53 48,639,712 97.28 %
7-Zip 2.30 Beta 12 Máximo7Z 3:57 48,555,679 97.11 %
WinAce Archiver 2.04 MáximoCÓDIGO POSTAL 1:11 48,452,915 96.90 %
WinAce Archiver 2.04Tamaño del diccionario 4096 KB, compresión exe optimizadaMáximoACE 2.0 3:08 48,571,875 97.14 %
WinAce Archiver 2.04Tamaño del diccionario 4096KBMáximoAS 3:08 48,571,875 97.14 %
PowerArchiver 2001 7.02.08 MáximoCÓDIGO POSTAL 0:51 48,452,892 WinZIP 8.1 MáximoCÓDIGO POSTAL 5:42 7,056,986 21.93 %
7-Zip 2.30 Beta 12 MáximoCÓDIGO POSTAL 4:36 7,041,872 21.89 %
7-Zip 2.30 Beta 12 Máximo7Z 9:59 5,824,793 18.10 %
7-Zip 2.30 Beta 12SólidoMáximo7Z 4:17 4,227,902 13.14 %
WinAce Archiver 2.04 MáximoCÓDIGO POSTAL 5:32 7,098,841 22.06 %
WinAce Archiver 2.04Sólido, tamaño de diccionario 4096 KB, compresión deltaMáximoACE 2.0 7:14 5,152,231 16.01 %
WinAce Archiver 2.04Tamaño del diccionario 4096 KB, compresión exe optimizadaMáximoACE 2.0 16:55 6,353,898 19.75 %
WinAce Archiver 2.04Tamaño del diccionario 4096KBMáximoAS 16:53 6,388,514 19.86 %
WinAce Archiver 2.04Sólido, tamaño de diccionario 4096 KB, compresión exe optimizadaMáximoAS 7:15 5,164,797 16.05 %
PowerArchiver 2001 7.02.08 MáximoCÓDIGO POSTAL 5:26 7,089,947 22.04 %

conclusiones

Basado en los resultados de la revisión:



Los formatos de archivo más comunes en la actualidad son ZIP, RAR, Gzip, TAR. Por lo tanto, un archivador que desee hacerse popular debería, si es posible, admitir estos formatos.

Los más comunes en la actualidad son los archivadores, que brindan al usuario la máxima comodidad y facilidad de uso y aseguran el desempeño de las funciones necesarias para el usuario. La tasa de compresión de la información se ha desvanecido en un segundo plano para los usuarios de hoy.

Basado en los resultados de la prueba:



Si solo tomamos formatos populares, entonces al archivar en formato ZIP, para lograr el tiempo de archivo más corto, se recomienda usar Archivadores WinRAR y PowerArchiver, para el archivo más pequeño: 7-Zip; archivos ejecutables mejor comprime WinAce; Los documentos de Word se comprimen mejor con WinAce y WinRAR; con muchos archivos pequeños, WinRAR hace el mejor trabajo.

La opción Sólido para crear archivos continuos, disponible en algunos archivadores, ayuda a la hora de comprimir una gran cantidad de archivos, reduciendo el tamaño de los archivos y reduciendo significativamente el tiempo de compresión (aunque con una pequeña cantidad de archivos, el tiempo de archivo usando esta opción aumenta ).
Además de los archivadores y formatos de archivo conocidos, existe un gran número de archivadores menos conocidos que soportan sus formatos, que en algunos casos, en sus características, en particular en la relación de compresión, pueden superar a sus homólogos conocidos. Un ejemplo de esto es el archivador 7-Zip con su formato 7z, que ganó casi todas las pruebas en términos de relación de compresión.