Estoy usando Spark versión 2.1 en Databricks. Tengo una estructura de datos denominada wamp a la que quiero agregar una columna denominada region que debe tomar el valor de la constante NE. Sin embargo, me sale un error que dice NameError: name 'lit' is not defined cuando ejecuto el siguiente comando:

wamp = wamp.withColumn('region', lit('NE'))

¿Qué estoy haciendo mal?

1 Comentario

  1. 13

    necesita importar lit

    ya sea

    from pyspark.sql.functions import *

    hará lit disponible

    o algo así

    import pyspark.sql.functions as sf
    wamp = wamp.withColumn('region', sf.lit('NE'))

Dejar respuesta

Please enter your comment!
Please enter your name here