Prefacio: tengo un amplio conocimiento de la universidad, de un puñado de lenguajes (C++, VB,C#,Java, muchos lenguajes de la web), por lo que cada vez que te gusta.

Quiero hacer una aplicación para android que compara los números, pero para ello tengo una base de datos. Soy un hombre de equipo, y los números se actualizan cada dos semanas así que me quieren agarrar los números de un wiki en el que se actualiza.

Así que mi pregunta es: ¿cómo puedo acceder a la información de un sitio web utilizando uno de los idiomas arriba?

5 Comentarios

  1. 4

    Lo que entiendo el problema: Algunos entidad genera un conjunto de datos (es decir, números) cada semana y usted tiene una necesidad de descargar los datos para el tratamiento (por ejemplo, clasificación).

    Idealmente, el sitio web de mantenimiento de la wiki proporcionaría un Servicio, como un Interfaz RESTful, a la facilidad de recolectar los datos. Si ese fuera el caso, me gustaría ir con cualquier lenguaje que permite una fácil manipulación de la solicitud HTTP & respuesta, y hace que su manipulación de datos fácil. Como una crítica anterior, dijo, Java que iba a funcionar bien.

    Si usted está atascado con la página de la wiki, tienes un par de opciones. Se puede analizar el código HTML de su navegador recibe (Perl viene a la mente como un decente idioma). O usted puede utilizar herramientas construidas para ese fin, tal como los mencionados Jsoup.

    Su pregunta también menciona algunos detalles de la implementación tales como la necesidad de una base de datos. Evidentemente, no hay suficiente información contextual para mí saber si eso es óptima, por lo que no voy a abordar este aspecto del problema.

  2. 2

    Considerar https://scraperwiki.com/ – es un sitio donde los usuarios pueden contribuir raspadores. Es gratuito siempre y cuando usted deje que su rascador de ser público. Los resultados de su rascador son expuestos como csv y JSON.

    Si usted no sabe lo que es un «raspador» es, google screen scraping» – es un largo y frustrante tradición para los programadores, que se han enfrentado con el mismo problema que tiene desde el comienzo de la computación en red.

Dejar respuesta

Please enter your comment!
Please enter your name here