Esto es un total noob la pregunta, lo siento por eso. En Spark, puedo usar seleccione como:

df.select("*"); //to select everything
df.select(df.col("colname")[, df.col("colname")]); //to select one or more columns
df.select(df.col("colname"), df.col("colname").plus(1)) //to select a column and a calculated column

Pero. ¿Cómo puedo seleccionar todas las columnas, ADEMÁS de un calculado? Obviamente
select("*", df.col("colname").plus(1)) no funciona (error de compilación). Cómo se puede hacer esto en JAVA?
Gracias!

InformationsquelleAutor lte__ | 2016-07-19

2 Comentarios

  1. 11

    Acaba de hacer:

    df.select(df.col("*"), df.col("colName").plus(1));
    • importación de co en el uso de pyspark: from pyspark.sql.functions import col
  2. 1

    Puede utilizar withColumn() método, esto va a crear una nueva columna a la DataFrame.

    df.select("*")
      .withColumn("ColName", col("colName").plus(1))
    • Yo, personalmente, prefiero este. Pone todas mis columnas calculadas juntos.

Dejar respuesta

Please enter your comment!
Please enter your name here