Tengo 2 columnas y varias filas de datos en excel. Cada columna representa un algoritmo y los valores de las filas son los resultados de estos algoritmos con diferentes parámetros. Quiero hacer la significación estadística de la prueba de estos dos algoritmos con excel. Puede alguien sugerir una función?

Como resultado, será bueno que diga algo como «Algoritmo realiza Un 8% mejor que el Algoritmo B con .9 probabilidad (o 95% intervalo de confianza)»

El artículo de la wikipedia explica exactamente lo que necesito:
http://en.wikipedia.org/wiki/Statistical_significance

Parece una tarea muy fácil, pero no pude encontrar un científico función de medición.

Cualquier consejo sobre una función de excel o en función de los fragmentos de código son apreciados.

Gracias..

Edición:

Después de tharkun los comentarios, me di cuenta de que debo aclarar algunos puntos:
Los resultados son simplemente números reales entre 1-100 (que son los valores de porcentaje). Como cada fila representa un parámetro, los valores en una fila representa un algoritmo resultado para este parámetro. Los resultados no dependen el uno del otro.
Cuando me saque el promedio de todos los valores de Algoritmo Un Algoritmo y B, veo que la media de todos los resultados que el Algoritmo de Un producidos son un 10% más que el Algoritmo B. Pero no sé si este es estadísticamente significativa o no. En otras palabras, tal vez para un parámetro del Algoritmo anotó Un 100 por ciento más alto que el Algoritmo B y para el resto del Algoritmo de B tiene mayor puntuación, pero sólo a causa de este resultado, la diferencia en promedio es de 10%.
Y quiero hacer este cálculo utilizando sólo excel.

  • usted estaría mucho mejor con el programa SPSS, Statistica o cualquier otro software de estadísticas de paquete.
InformationsquelleAutor someone | 2009-08-05

1 Comentario

  1. 3

    Gracias por la aclaración. En el caso de que usted desee hacer una T de muestras independientes Prueba. Lo que significa que se desea comparar las medias de dos conjuntos de datos independientes.

    Excel tiene una función PRUEBA.T, que es lo que usted necesita.

    Por su ejemplo, usted probablemente tendrá que usar dos colas y tipo 2.

    La fórmula de salida será de un valor de probabilidad conocida como la probabilidad de error alfa. Este es el error que usted haría si usted asumió los dos conjuntos de datos son diferentes pero no lo son. La parte inferior de la probabilidad de error alfa el mayor la probabilidad de que tus conjuntos son diferentes.

    Sólo debe aceptar la diferencia de los dos conjuntos de datos si el valor es menor que 0.01 (1%) o de resultados críticos incluso 0,001 o inferior. Usted también debe saber que en la prueba de t de las necesidades de al menos alrededor de los 30 valores por cada conjunto de datos a ser lo suficientemente confiable y que el tipo 2 de la prueba se supone igualdad de varianzas de los dos conjuntos de datos. Si varianzas iguales no son dados, usted debe utilizar el tipo 3 de la prueba.

    http://depts.alverno.edu/nsmt/stats.htm

    • Gracias por la respuesta. He intentado PRUEBA.T y con una bonita pequeña p-valor (8.13177 E-06). En la mirada más, este valor me dice que los valores de una columna son significativamente diferentes de los valores de la otra. Pero no me dicen si uno es mejor o no? Estoy en lo cierto?
    • no, no es así. ¿qué sería mejor, en tu caso?
    • Si los valores en una columna son más altos que los valores por debajo de la otra. Así que debe ser capaz de decir «Algoritmo tiene Un 10% más elevados que el Algoritmo B con .9 probabilidad»
    • pero eso es fácil. simplemente calcular la media de cada columna. el prueba.t compara los dos medios. así que se puede decir acerca de la mayor significa que esta columna tiene valores mucho más altos que los otros.

Dejar respuesta

Please enter your comment!
Please enter your name here