Oficalc - Estadística

 

Estadística en Oficalc

© www.ofimega.es

Introducción: Esta aplicación, representa un conjunto de herramientas para el análisis de los datos que podrá utilizar para ahorrar pasos en el desarrollo de análisis estadísticos y/o tablas de frecuencia.

Conceptos básicos

Estadística: Estudio de las distribuciones de frecuencia y de probabilidad.

Definiciones básicas:

Población: Conjunto de todos los elemento que son objetos del estudio estadístico.

Individuo: Cada uno de los elementos de una población

Muestra: Subconjunto de una población

Tablas de frecuencias: Los valores obtenidos se presentan en una Tablas de sucesos u observaciones, que pueden ser:

1.      Lista de valores obtenidos: Cuando el número de observaciones o sucesos es pequeño

2.      Tabla de frecuencias (valores discretos): Cuando existen pocos valores pero muchas repeticiones. Esta repeticiones se muestran el la columna de frecuencia absoluta.

3.      Tabla de frecuencias con clases de valores: Cuando el número de valores es también muy grande pero continuo se reduce la tabla empleando para ello intervalos de valores o clases. El valor central de cada intervalo, equivale a la Marca de clase.

Columnas usuales en las tablas de frecuencias.

·       Frecuencia absoluta (f): Número de veces que se repite el valor x

·       Frecuencia acumulada (fa): Suma acumulada en orden creciente de las frecuencias absolutas inferiores. La última frecuencia acumulada debe corresponder al total de observaciones.

·       Frecuencia relativa (fr): Es la frecuencia absoluta dividido por el total de observaciones.

·       Percentil (%): Frecuencia porcentual. Es la frecuencia relativa multiplicada por cien y equivale al % de repeticiones sobre el total de observaciones.

·       Cuartil: Fraccionado en cuatro partes del total de observaciones.

·       Decil: Fraccionado en 10 partes del total de observaciones.

Parámetros de medición estadística: Englobados en:

·        Medidas de posición central o parámetros de centralización: En una distribución se busca la agrupación de los valores en un número mínimo de datos que la represente y permita realizar un estudio comparativo con otras distribuciones.

·        Medidas de dispersión o parámetros de dispersión: Complementan a las medidas de centralización informando sobre la dispersión de los valores de una distribución.

Medidas de posición

Medidas de dispersión

Moda: Valor más repetido o al que le corresponde mayor frecuencia

Mediana: En una lista en orden creciente, es el valor central.

Si el total de valores es par, se toma como mediana el promedio de los dos valores centrales.

Si la tabla de frecuencias se muestra en intervalos o clases, la mediana corresponde al primer intervalo cuya frecuencia acumulada supere la mitad.

Media (X): o media aritmética es la suma de todos los valores dividido por el número total de observaciones. X = Suma( xi ) / N

Si se dispone de frecuencias, entonces es la suma de los valores por la frecuencia que se repite, dividido por el número total de observaciones.

Recorrido: Es la diferencia entre el valor mayor y el menor

Desviación (d): Es la diferencia entre el valor (xi) y la media aritmética. (X).  El signo indica si la desviación está por encima o por debajo de la media.

Desviación media: Es la media de los valores absolutos (sin signo) de las desviaciones (xi - X).

Varianza: Media de los cuadrados de las desviaciones (xi - X

Desviación típica (estándar): También llamada desviación estándar o desviación cuadrática media . Es la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones. También equivale a la raíz cuadrada positiva de la varianza.

Presentaciones gráficas:

De valores: Representación de barras de las observaciones con longitudes proporcionales a los valores obtenidos.

De frecuencias: Presentación de barras de los valores con longitudes proporcionales a las frecuencias. fr(x)

Conceptos básicos de estadística avanzada:

Distribuciones bidimensionales:

Estudian dos características de una población (ejemplos: Peso y talla  o  gastos de publicidad y resultado en ventas).

La relación entre estas dos características puede ser funcional (función matemática) o estadística (correlativa). Si es estadística, (Correlación) su relación se representa mediante diagramas de dispersión, en el que se muestra una “nube de puntos” que pueden aproximarse a una recta de regresión lineal. La ecuación de esta recta nos puede servir para hacer predicciones de resultados.

Parámetros de medida bidimensional:

·         Covarianza: media aritmética de los productos de sus desviaciones por sus respectivas frecuencias. Si ésta es positiva o negativa nos indica si son de relación directa o inversa.

·         Coeficiente de correlación r:   r = Sxy / Sx·Sy   Indica el grado de aproximación de los puntos de la nube a la recta de regresión.

Funciones de distribución:

Al aumentar la cantidad de observaciones en una tabla de frecuencias, ésta se aproxima a una representación continua que puede ser estudiada como una función matemática. Las más importantes son:

·         La función de distribución Normal (o campana de Gauss) cuyo eje de simetría corresponde a la media y su ancho a la desviación estándar.

·         La distribución Normal Estándar: Mediante un cambio de variable, hace que su función sirva para cualquier población que tenga distribución Normal.

·         La distribución T Student: En lugar de la desviación estándar total, utiliza la desviación estándar de una muestra de la población. (más fácil de conseguir)

·         La distribución de promedios muestruales: Se utiliza cuando una población No es normal. Entonces se coge un grupo de promedios de la madre para que se aproximen a la normal. (Teorema Central del límite).

Otras funciones estadísticas:

  • Media geométrica: Devuelve la media geométrica de una matriz o de un rango de datos positivos. Por ejemplo, es posible utilizar la función para calcular la tasa de crecimiento promedio, dado un interés compuesto por tasas variables.
  • Análisis de Fourier: Resuelve problemas de sistemas lineales y analiza datos periódicos.
  • Test de Hipótesis: Se plantean dos hipótesis de valor opuesto y se calcula el estadístico Z para decidir entre ambas hipótesis.

 

 


Principal__ |__ Aviso legal __| __Privacidad__ | __Contacto__ |__ Facebook F |__ Tweter F |__ Tweter