Digamos que tengo el siguiente conjunto de datos y que estoy ejecutando un modelo de regresión mediante glm en R. tengo los coeficientes, pero quiero predecir «próximos meses» valor » (visitas). ¿Cómo hago para que en este ejemplo.

d <- data.frame(month = c("jan", "feb", "mar", "apr", "may", "june"),
                visit =  c( 1,  2,  4,  8, 16, 32),
                click =  c(64, 62, 36,  5,  6,  3),
                conv =  c(1, 3, 6, 2, 3, 8))
d
dFit <- glm(visit ~ click + conv, data=d)

Para el mes de julio, ¿cómo puedo utilizar el predict() función en R para predecir el número de visitas (variable de respuesta)?

EDICIÓN:

Lo que estoy tratando de conseguir finalmente es un puesto donde tengo

Mon   Pred_clicks
jan   20
feb   25
mar   21
apr   31
may   15
june  21 
july  50

EDIT 2:

Esta no es la salida que me gustaría

> predict(dFit)
        1         2         3         4         5         6 
-3.452974  1.223969 13.533457 12.235771 14.113888 25.345890 
  • incluso sin tener que preocuparse acerca de si usted tiene los datos para el mes de julio, estoy teniendo un tiempo difícil ver a donde tu espera que los valores de predicción de, digamos, el de enero se viene?
InformationsquelleAutor ATMathew | 2013-08-27

2 Comentarios

  1. 2

    Ya que el entrenamiento del modelo con un data.frame que contiene las columnas month, click y conv, usted tendrá que proporcionar un data.frame para predecir los valores así:

     predict(dFit, data.frame(month="july", conv=mean(d$conv), click=mean(d$click)))

    La mean(d$conv) y mean(d$click) son los predijo los valores de las respectivas cantidades para el mes de julio. Si usted tiene los valores reales de conv y click para el mes de julio, los sustituya, en la declaración para obtener su predicción.

    Sin embargo, que es probablemente lo que usted está buscando y GLMs de regresión puede no ser el mejor modelo para este tipo de datos de series de tiempo. Creo que se desea utilizar VAR como su modelo predictivo.

  2. 1

    Suponiendo que se tiene una estructura de datos que contiene julio de datos de nombre newdata, usted acaba de hacer:

    predict(dFit,newdata)

    Si usted no tiene los datos para el mes de julio, entonces no es posible.

Dejar respuesta

Please enter your comment!
Please enter your name here