parsing

Cómo extraer de nivel superior nombre de dominio (TLD) de la URL

¿cómo extraer el nombre de dominio de una dirección URL, con exclusión de cualquier subdominios? Mi inicial simplista intento fue: '.'.join(urlparse.urlparse(url).netloc.split('.'))...

Que HTML Parser es el mejor?

Como se encuentra actualmente, esta pregunta no es una buena opción para nuestro...

¿Cómo puedo extraer el ID del vídeo de YouTube en Python?

Sé que esto se puede hacer fácilmente usando PHP parse_url y parse_str funciones: $subject = "http://www.youtube.com/watch?v=z_AbfPXTKms&NR=1"; $url = parse_url($subject); parse_str($url, $query); var_dump($query); Pero, ¿cómo...

Necesita para convertir el resultado de .innerHTML a número de javascript

Tengo un html que contiene las tablas como en el siguiente ejemplo <td class="topiccell"> <span class="topicnormal"> ...

El uso de ANTLR 3.3?

Estoy tratando de empezar con ANTLR y C#, pero me estoy dando cuenta que es extraordinariamente difícil debido a la falta...

Analizar la cadena a decimal, comas y puntos

Cómo analizar la cadena de decimales por lo que para ambos formatos - w/comas y puntos? public void foo(){ var...

el análisis de HTML en el iPhone

Como se encuentra actualmente, esta pregunta no es una buena opción para nuestro...

Cómo obtener todo después de la última barra en una URL?

¿Cómo puedo extraer lo que sigue a la última barra en una dirección URL en Python? Por ejemplo, estas Url debe...

El análisis de UTF-8/unicode cadenas con lxml HTML

He estado tratando de analizar con etree.HTML() un texto codificado como UTF-8, sin éxito. → python Python 2.7.1 (r271:86832, Jun 16 2011,...