Quiero pantalla-raspadura de un sitio web que utiliza JavaScript.

Hay la mecanización de la, la programación navegador web para Python. Sin embargo, es (obviamente) no interpreta javascript. Es allí cualquier programática navegador para Python que hace? Si no, hay alguna JavaScript aplicación en Python que me podría utilizar para intentar crear uno?

OriginalEl autor Claudiu | 2009-12-16

7 Comentarios

  1. 11

    Usted puede ser mejor utilizar una herramienta como El selenio para automatizar el raspado utilizando un navegador web, por lo que el JS se ejecuta y que representa la página como lo haría para un usuario real.

    OriginalEl autor Annie

  2. 7

    La PyV8 paquete muy bien envuelve Google motor de Javascript V8 para Python. Es especialmente bueno porque no solo se puede llamar desde Python de código Javascript, pero puede volver a llamar desde Javascript de código de Python. Esto hace que sea muy sencillo de implementar el navegador habitual suministrados por los objetos (es decir, todo en el Javascript espacio de nombres global: «la ventana», «documento», y así sucesivamente), lo que tendría que hacer si se va a hacer un Javascript capaz de Python navegador emulador cosa, posiblemente mediante la conexión de este con la mecanización de la.

    OriginalEl autor Peter Hansen

  3. 5

    Mi favorito es PyPhantomJS. Se escribe usando Python y PyQt4. Es completamente aturdida y se puede controlar por completo de JavaScript.

    Sin embargo, si usted está buscando para ver la página, puede utilizar QWebView de PyQt4 así.

    Esto es en serio impresionante. Gracias.
    Desafortunadamente el proyecto mantenedor no es capaz de mantener el proyecto más. Pero va a ser compatible con la versión 1.4.0. Usted puede cambiar a PhantomJS sin pérdida de funtionality (excepto para toda la impresionante y nuevas características PyPhantomJS había en la comparación, tales como plug-in de apoyo….). Ellos están buscando a alguien para tomar el relevo de mantenimiento (core devopment), así que espero que no se van a morir. 🙂

    OriginalEl autor John Doe

  4. 2

    También se podría tratar de definir Chickenfoot página activa en las páginas en cuestión, la ejecución de las operaciones que desee en la página y guardar los resultados de la operación en un archivo local, y llamando a Firefox desde la línea de comandos dentro de su programa, seguido por la lectura del archivo.

    OriginalEl autor Reynolds

  5. 1

    recomiendo que le eches un vistazo a algunas de las opciones disponibles para usted en http://wiki.python.org/moin/WebBrowserProgramming – sorprendentemente, esto viene como una pregunta común (he encontrado tres en stackoverflow hoy en día, mediante la búsqueda de las palabras «python navegador» en google). si haces lo mismo que encontrará las otras respuestas que me dieron.

    OriginalEl autor user362834

Dejar respuesta

Please enter your comment!
Please enter your name here