Sé cómo hacer un PDF a partir de Látex. Es allí una manera de extraer el Látex de código a partir de un PDF que he creado anteriormente? ¿Y si alguien me envía un PDF y me gusta el formato. Puedo extraer el Látex de ella?

InformationsquelleAutor Mawnster | 2009-10-25

9 Comentarios

  1. 13

    De látex no tiene un uno-a-uno la conversión a PDF. Con respecto a tu primera pregunta, yo creo que esta conversión puede ser técnicamente posible, pero no creo una aplicación para hacerlo aún existe. Similar a la forma en ensamblador puede ser descompilados de nuevo en lenguaje de alto nivel, probablemente hay una manera de hacerlo. Sin embargo — un pdf pueden contener toda la materia de tipos de datos, dibujos de AutoCAD, gráficos JPEG, los archivos de fuentes, formularios, firmas digitales, etc. El látex no tiene idea de lo que son estas cosas. Así que en respuesta a la segunda pregunta es no, pues no hay manera de extraer el equivalente de Látex a partir de cualquier documento PDF.

  2. 8

    Hay una Herramienta que lee Archivos PDF como un programa de OCR y que intenta recrear el Látex de Código.
    Es casi perfecto, y llamó a «Infty Lector»!
    Debido a que el Látex es bastante extensible creo que no es de todos la necesidad de formatos de derecho.

    • InftyReader es para MS Windows.
  3. 6

    Esto sólo es posible si se incorpora la fuente del documento en el archivo PDF. Ver el attachfile paquete para hacer esto.

    • Alternativamente, usted puede agregar la pista de dar el uso de metadatos PDF etiquetado.
    • Sí, eso es cierto, pero yo no soy consciente de una pre-existente de la forma de transformar la fuente de LaTeX en un PDF a través de esta ruta. Alguna sugerencia?
    • Lo siento, no vi tu pregunta hasta hace poco. Ross Moore ha demostrado pdftex adiciones que permiten la generación de los PDFs, donde la matemática es etiquetado con el código Tex que los genera. Este es un largo camino a partir de una respuesta completa a la pregunta, pero creo que demuestra que es es posible. No hay más que quiero decir acerca de esta de la que cabe en un comentario – yo sólo voy a decir que podría hacer una gran tesis MSc.
    • Por qué enlace no funciona?
    • fijo.
  4. 5

    Versión corta: No.

    Versión larga: Es muy parecido a la descompilación: técnicamente es posible, pero ello implicaría un montón de adivinanzas y heurística.

    No estoy familiarizado con el PDF de las vísceras, pero es probable que se establezca fonts/tamaño/posición directamente, en lugar de definir un formato y su aplicación a los encabezados y tal, al igual que en el Látex.

  5. 3

    Es posible convertir el PDF a HTML y el código HTML para TEX usando pdftohtml y gnuhtml2latex.

    En efecto, usted está haciendo PDF a la conversión de Látex en 2 pasos. El resultado todavía es «como hacer una vaca de una hamburguesa», pero en combinación con algunos scripts de limpieza el resultado puede ser bastante decente.

    El blog «Rudimentaria PDF a la conversión de Látex en Linux» en GlobalBlindSpot tiene un ejemplo de script de Bash que convierte una .pdf a una .archivo tex y que una a una .archivo pdf de nuevo.

  6. 1

    Ver mi respuesta en la pregunta relacionada (cómo activar un DVI a tex?)

    Para amplificar – no hay ningún requisito para los caracteres en el orden de lectura (he encontrado los archivos Pdf en donde parte de la sdrawkcab sdaer txet (y depende de las coordenadas). Que es muy difícil de reconstruir, ya que puede depender de métricas de Fuente. Cual se puede usar la terrible ASCII86 protocolo.

  7. 1

    La mejor manera para la minería de datos a partir de archivos pdf (debido a su complicada formato) es abrir con adobe illustrator.
    A continuación, convertir el archivo pdf a un archivo svg y el uso de un svg analizador de la biblioteca de la escritura de algunos complicado código en sí mismo.

    Una eficiente svg analizador lib es batik

    (Para Linux es un poco complejo para la conversión de pdf a formato svg:
    calcmaster.net/personal_projects/pdf2svg/)

    PS
    He estado tratando desde mucho para encontrar una solución a la segunda parte de tu pregunta
    pero he encontrado en libros de «Visualización de Datos, Ben Fry, O’Reilly»
    que pdf especialmente pdf de Adobe es complejo de analizar, de modo que en lugar de utilizar un svg analizador lib.

    • OP pidió soluciones en Linux…
  8. 1

    Inkscape puede importar archivos Pdf y, a continuación, guardar como «de Látex con PSTricks macros» que básicamente funciona mediante la incorporación de PostScript en la fuente de LaTeX. Es más problemas de lo que vale la pena, y el resultado de Látex fuente tiene que ser procesados antes de que pueda ser de salida como un archivo PDF nuevo.

    De todos modos, incluso con unos hipotéticos PDF al Látex compilador, en el mejor de los que había algo donde la posición y tamaño de cada uno de los caracteres o palabra por separado especificado — al contrario de lo que quiere, que supongo que es para un denominador a ser la mitad de una fracción, en lugar de un número por debajo de una línea horizontal.

  9. -1

    Puede trabajar con texmacs, que incluye una importación de archivos pdf.

    • texmacs es abandonware que nunca trató de resolver este problema.
    • aún así, lo he hecho ya.
    • Cuéntame más! Me escribió texmacs hace varios años como un overengineered enfoque a un problema de que no necesita una revolución. Supongo que usted tiene un punto de vista diferente?

Dejar respuesta

Please enter your comment!
Please enter your name here