Tengo un requisito para generar dinámicamente y comprimir grandes lotes de archivos PDF.

Estoy considerando la costumbre de los algoritmos de

  • Zip
  • Ace
  • Rar

Cualquier otra sugerencia son bienvenidos.

Mi pregunta es que el algoritmo es probable que me dé el tamaño de archivo más pequeño. La velocidad y la eficiencia son también factores importantes pero el tamaño es mi principal preocupación.

También hace una diferencia si tengo muchos archivos pequeños, o menos archivos de mayor tamaño en cada archivo.

La mayor parte de mi tratamiento será realizado en PHP, pero estoy feliz de interfaz con terceros ejecutables si es necesario.

Edición:

Los documentos son principalmente las facturas y no debe contener ningún otro las imágenes, excepto para el logotipo de la empresa

  • Mucho de esto depende de si hay imágenes en el documento, y en qué formato aquellos que están en. Usted puede querer añadir algo de información.
  • Pero el PDF ya está comprimida, ¿no ? en.wikipedia.org/wiki/Portable_Document_Format
  • Gracias, hizo una edición. @Pierre Sí PDF ya está comprimida, pero creo que es posible comprimir además, también cada archivo contendrá varios archivos Pdf de manera que puede haber una diferencia allí.
  • Ver mi respuesta para una buena solución para el «ya comprimido» problema.
  • Podría haber problemas con el uso de un ‘no estándar’ formato de compresión, es decir,. el destinatario tendría que tener un programa que les permitirá descomprimir el archivo. Si el archivo se envía a la gente sin acceso de administrador en su equipo o alguien que es reacio a instalar software desconocido, entonces usted podría tener un problema. Así zip puede ser mejor, ya que puede ser descomprimido en windows, sin necesidad de ningún software. Obviamente todo depende de que usted está enviando el archivo a
  • Los archivos comprimidos son sólo para el archivado, El cliente recibiría un archivo PDF estándar

InformationsquelleAutor Neil Aitken | 2009-11-23

6 Comentarios

  1. 6

    No he tenido mucho éxito en la compresión de archivos Pdf. Como se ha señalado, ya están comprimidos cuando compuesta (aunque algunos PDF herramientas de composición permiten especificar un ‘nivel de compresión’). Si es posible, el primer enfoque que debería hacer es reducir el tamaño de los compuestos Pdf.

    Si usted guarda el Pdf en un solo archivo, que puede compartir los recursos comunes (imágenes, fuentes) y por lo tanto puede ser significativamente menor. Tenga en cuenta que esto significa que un archivo PDF de gran tamaño, no uno grande ZIP con varios archivos Pdf en el interior.

    En mi experiencia, es bastante difícil de comprimir las imágenes dentro de archivos Pdf, y de que las imágenes que hacer, con mucho, el mayor impacto en el tamaño del archivo. Asegurarse de que se han optimizado las imágenes antes de empezar. Es incluso la pena correr una prueba de funcionamiento sin sus imágenes, simplemente para ver cómo mucho el tamaño de las imágenes están contribuyendo.

    El otro componente es la fuente, y si está utilizando múltiples fuentes incrustadas, a continuación, usted está de embalaje más datos en el archivo. Sólo el uso de una fuente para mantener el tamaño de abajo, o el uso de fuentes que son comúnmente instalados de modo que no es necesario incrustar ellos.

  2. 1

    Creo 7z es el mejor actualmente con RAR de ser el segundo, pero yo recomendaría que usted tratando de ambos para encontrar lo que funciona mejor para usted.

  3. 1

    LZMA es el mejor si usted necesita tamaño de archivo más pequeño.

    Y, por supuesto, PDF se pueden comprimir en sí.

    • Gracias, parece nuevo 7z versiones realidad el uso de LZMA
    • Sí, 7zip utiliza LZMA método.
  4. 1

    Dudo que usted conseguirá mucho/cualquier reducción en el tamaño del fichero mediante la compresión de archivos Pdf. Sin embargo, si todo lo que estamos haciendo es recopilar varios archivos en uno, ¿por qué no tar es?

  5. 1

    Hemos hecho en el pasado para las grandes (y muchos) de los archivos Pdf que almacenar una gran cantidad de texto, Paquetes de Capacitación para la Formación de Organizaciones en Australia. Se trata de un 96% de texto (por supuesto, info, etc) y un par de pequeños diagramas. Los tamaños varían de 1-2 mb a 8 o 9Mb y por lo general vienen en los volúmenes de 4 o más.

    Hemos encontrado comprimir Zip OK para conseguir una buena compresión como el formato PDF es ya muy comprimido, que no era más que una facilidad de uso para nuestros usuarios a descargar todo como un proceso por lotes en lugar de preocuparse de la filesizes. Para darles una idea, un 2.31 Mb archivo – un montón de texto, varios de página completa diagramas comprimido a 1.92 Mb en ZIP y 1.90 Mb en RAR.

    Me gustaría recomendar el uso LZMA para obtener la mejor apariencia en el uso de recursos en comprimir y descomprimir demasiado.

    ¿Cuán grandes son estos archivos? Obtener una copia de WinRAR, WinAce y 7Zip y darle atrás.

    • Gracias por la completa información. Actualmente estoy jugando con los algoritmos diferentes para ver cuál da buenos precios. 7z ejecutando en LZMA parece ser la mejor hasta el momento
  6. 1

    Combinar mi ingeniosa herramienta Precomp con 7-Zip. Se descomprime el zLib corrientes dentro de la PDF para 7-Zip (o cualquier otro compresor) puede manejar mejor. Usted recibirá filesizes alrededor del 50% del tamaño original lossless. Esta herramienta funciona especialmente bien para los archivos PDF, pero también es bueno para otros comprimido (zLib/LZW) corrientes como ZIP/GZip/JAR/GIF/PNG…

    Para llevar los ejemplos de echar un vistazo aquí o aquí. La velocidad puede ser lento para la precompresión (PDF->PCF), pero va a ser muy rápido para la recompresión/reconstrucción (PCF->PDF) parte.

    Para incluso mejores resultados que con Precomp + 7-Zip, puede intentar lprepaq y prepaq variantes, pero ten cuidado, especialmente prepaq es slooww 🙂 – el lado positivo es que prepaq ofrece la mejor (PDF) de compresión disponibles en la actualidad.

    • Gracias voy a mirar a este. Puede tener que persuadir a los jefes de utilizar una herramienta desconocida, aunque.
    • La versión actual todavía es una versión de prueba, pero funciona bien. Para estar en el lado seguro de que usted puede asegurarse de que reconstruye los archivos Pdf tienen la misma md5sum o comparar a otros lugares.
    • Buena idea, estamos usando MD5 para validar la integridad de las importaciones de todos modos para almacenar un hash del archivo generado no es un problema.
    • Muy interesante – se hacen más grandes con el fin de hacerla más pequeña!

Dejar respuesta

Please enter your comment!
Please enter your name here