Eso seguramente es porque cada página de este PDF de La Prensa Gráfica es 100% una imágen de pagina completa, a diferencia del Diario de Hoy, que tiene más texto que imágenes. En la versión original en SWF la mayor parte también es texto.
Eso es correcto, es una imagen transformada en pdf.
Por ahora tengo la idea de que para todo esto basta con iTextPDF y probablemente con SWF Tools. ¿Es eso correcto? Quizás con uno de estos procedimientos:
- Extraer los contenidos con SWF Tools.
- En su defecto, anidar el SWF con iText.
- Renderizar como imágen con iText.
- Concatenar.
Escribo el procedimiento que se me ocurrio ayer durante la noche y es el que he seguido para obtener el pdf:
1) Se descargan todos los archivos swf que componen el epaper para un dia especifico
2) Se transforman cada uno de los swf en imagenes png con swftools
3) Se transforman cada una de esas imagenes png en archivos pdf usando el comando convert
4) Y luego se concatenan todos los archivos pdf creados en uno solo.
Como podes ver en realidad, las herramientas ya estaban ahi, solo era de tener un poco mas de imaginacion como utilizarlas. Ya con estos pasos, ya podrias reproducir el codigo, ahora solo queda ver como optimizar la generacion de los archivos para reducir su tamaño.
Y ver si es posible generarlos en un ambiente Windows sino yo con gusto tendria una pequeña app web para que sirva los archivos a aquellos que les interese.