Un artículo MUY viejo en el que se trata de cubrir el gap entre el concepto matemático/estadístico de "grado de libertad" y su interpretación en situaciones prácticas: https://t.co/jLKi2mdbhY
Para actualizar la varianza, bastará con añadir al valor del sumatorio anterior los cuadrados de las diferencias del nuevo valor con los ya existentes y dividir el nuevo sumatorio por el cuadrado del número actual de datos.
Hace unos días planteé esta encuesta. Los resultados son los siguientes: el 61% de los que han respondido afirman que para calcular la varianza de un conjunto de datos es necesario calcular su media.
Esta fórmula resulta ventajosa en caso de que queramos ir actualizando la varianza de un conjunto de datos a medida que nos llegan nuevos datos. No será necesario calcular la nueva media y, otra vez, todas las diferencias entre los valores y la media actualizada.
Si uno de los dos elementos de la combinación -por ejemplo P(A|B)- es mayor que la media -P(A)-, entonces necesariamente el otro elemento de la combinación -P(A|~B)- tiene que ser menor que la media -P(A)-.
Consideremos dos sucesos A y B tales que 0<P(A),P(B)<1. Si saber que ha ocurrido B hace más probable que ocurra A, entonces saber que no ha ocurrido B hace menos probable que ocurra A.
La demostración es sencilla:
P(A)=P(A|B)P(B)+P(A|~B)P(~B) y como P(~B)=1-P(B) resulta que P(A) es una combinación lineal convexa de P(A|B) y P(A|~B), es decir, P(A) es una media ponderada de P(A|B) y P(A|~B).