la construcción de árbol de clasificación de tener las variables categóricas mediante rpart

Tengo un conjunto de datos con 14 características y algunos de ellos se muestran a continuación, donde el sexo y el estado civil son variables categóricas.

height,sex,maritalStatus,age,edu,homeType

SEX
         1. Male
         2. Female

MARITAL STATUS
         1. Married
         2. Living together, not married
         3. Divorced or separated
         4. Widowed
         5. Single, never married

Ahora estoy usando rpart biblioteca de R para construir un árbol de clasificación utilizando el siguiente

rfit = rpart(homeType ~., data = trainingData, method = "class", cp = 0.0001)

Esto me da un árbol de decisión que no tiene en cuenta el sexo y el estado civil de los factores.

Estoy pensando en usar como.factor para esto :

sex = as.factor(trainingData$sex)
ms = as.factor(trainingData$maritalStatus)

Pero no estoy seguro ¿cómo puedo pasar esta información a rpart. Desde el argumento de datos en rpart() toma en «trainingData» marco de datos. Siempre tome los valores que están en este marco de datos.
Yo soy poco nuevo para R y agradecería que alguien lo ayudara en esto.

InformationsquelleAutor user4251309 | 2014-11-14

2 Kommentare

  1. 7

    Usted puede hacer los cambios a la trainingData marco de datos directamente, a continuación, ejecute rpart().

    trainingData$sex = as.factor(trainingData$sex)
    trainingData$maritalStatus = as.factor(trainingData$maritalStatus)
    rfit = rpart(homeType ~., data = trainingData, method = "class", cp = 0.0001)
    • Estoy tratando de aplicar que la respuesta a un ejemplo similar donde mi variable categórica es el de los días de la semana. Sólo para estar seguro de que me dejó sólo a esa variable en el conjunto de entrenamiento, pero cuando trato de entrenar el clasificador el modelo parece tener sólo un nodo raíz, lo que significa que yo no tome la variable en cuenta. ¿Tiene usted alguna idea de lo que podría ser el problema?
  2. -3

    En la práctica, usted puede transformar cualquier categórica valor en un valor ordinal, por ejemplo, ‘Estado Civil’ en las condiciones 1, 2, 3… Pero, en general, usted no debe hacer la transformación a menos que tenga una definición conceptual de cualquier valor continuo. Por ejemplo, si usted no puede definir lo que es un 1.2 Martital Estado, usted no debe hacer la transformación. En su lugar, a veces se puede utilizar un valor representativo, dependiendo del objetivo de su investigación. Por ejemplo, si usted está tratando de vincular los datos para predecir el tipo de hogar, el mínimo grado de confort » de cada estado civil es un valor ordinal que es capaz de ser interpretado si (digamos) es de 1.2.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Pruebas en línea