domingo, 27 de septiembre de 2009

¿què indica cuando la desviaciòn estàndar es màs grande que la media?

La media es susceptible de la distorsión por la presencia de puntuaciones extremas, valores extremos y distribuciones sesgadas. Como se basa en desviaciones de la media, la desviación estándar es susceptible del mismo problema. La distorsión está determinada por el hecho de que las puntuaciones de desviación están elevadas al cuadrado.

Un tipo común de distribución sesgada es un sesgo positivo (o derecho), en el cual la mayoría de las personas tienen bajas puntuaciones, pero algunas obtienen altas puntuaciones. Por ejemplo, “la estancia en el hospital”, o el número de veces que una muestra aleatoria de personas mayores de 65 años han permanecido en un hospital durante el último año, es un sesgo derecho. la mayoría de las personas registrará cero en estancia; algunas ,uno; otras reportarán dos ,y pocas personas muy enfermas, anotarán estancias frecuentes. Este tipo de distribución se presenta en la siguiente tabla.



Incluso sin un histograma, los valores relativos de la media y de la desviación estándar para esta distribución proporcionan una señal de que la distribución sesgada. . Estos estadísticos se calculan como sigue:

X= estancias en el hospital= durante el último año, el número de veces

que una persona es admitida en un hospital y

pasa por lo menos una noche

x¯ =2.41 veces Sx= 3.69 veces n=17 casos

Observe que la desviación estándar es más grande que la media. Esto sugiere que una o más puntuaciones extremas inflaron la media y otra parte la desviación estándar, desde el momento en que se elevan al cuadrado los números en la desviación estándar, unas cuentas puntuaciones extremas pueden hacer “explotar” rápidamente su valor. Note, por ejemplo, la enorme contribución a la suma de cuadrados que los tres casos más grandes hicieron con sus estancias de 9,10 y 10 veces.

¿Por qué una desviación estándar más grande que la media indica un sesgo?

Recuerde que si una distribución no está sesgada (es decir, tiene una forma de campana normal), su rango tendrá una amplitud de aproximadamente 4 a 6 desviaciones estándar. Cuando, la curva es trazada la amplitud de 2 o 3 desviaciones estándar se ajustaran en cada lado de la media. Si el límite inferior de las puntuaciones X de una variable es cero, por lo menos la distancia de 2 desviaciones estándar debería ajustarse entre una puntuación X de cero y la media. Cuando la desviación estándar es más grande que la media, como en el caso de las estancias en el hospital, ni una sola amplitud de la desviación estándar puede lograr este ajuste. Otra manera de explicarlo es que la desviación estándar debería ser alrededor de la mitad del tamaño de la media o más o menos.

Dos reglas generales se aplican a los tamaños relativos de la media y de la desviación estándar:

1. Si la desviación estándar es más grande que la media, esto probablemente indica un sesgo, es decir, la presencia de valores extremos u otra peculiaridad en la forma de la distribución, como una distribución bimodal.

2. Si la desviación estándar no es de la mitad de tamaño de la media o menos, se debe tener cuidado al examinar la distribución para analizar la posible existencia de sesgo o valores extremos.

18 comentarios:

  1. BUENAS NOCHES COMPAÑEROS Y PROFESOR

    bueno indagando sobre el tema de la semana para complementar la informacion publicada por mis compañeras,encontre que la desviacion
    estandar es una medida de centralizacion o dispersion para variables de tipo razon e intervalo, ademas que son de gran utilidad en la ESTADISTICA DESCRIPTIVA.

    El desvío estándar nos permite identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media.

    La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con escalas de intervalos o razones.

    A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su media.
    Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia común, que es la media aritmética.

    Se entiende entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogeneo” que si el valor de la desviación estándar fuera más grande.
    Osea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.

    ResponderEliminar
  2. Según lo que yo leí al igual que Mayrita considero que la relación primordial entre la media y la desviación estándar está en que refleja qué tan homogéneos o heterogéneos son los resultados, es decir, la desviación estándar es el nombre que se le da a una forma de mirar qué tan concentrados o dispersos se encuentra un conjunto de datos, y esto con un solo número.

    Entre menos sea la desviación estándar más homogéneos son los resultados, y en el caso de ser elevada marca mayor dispersión y heterogeneidad.

    Por ejemplo, un grupo de personas presentan las pruebas ecaes, se espera entonces que el promedio sea alto, es decir, que tienda a 100 y que la desviación estándar sea baja, es decir, tienda a 0. Mostrando así si hay similitud en los puntajes individuales obtenidos o por el contrario hay algunos estudiantes con puntajes muy altos y otros con puntajes muy bajos.

    Si su desviación estándar está en 1,3 sobre 100. ¿Qué creen que significaría esto?

    ResponderEliminar
  3. La desviación estandar es más grande debido a que al tener datos de gran cantidad interfieren en el resultado ia ke van elevadas al cuadrado & al tomar datos muy grandes su datos quedan muy elevados & con gran diferencia con respecto a otros por esta razón la desviación de la media va ser la mitad de la estándar mientras que la media puede tomar valores de cero la estándar va tener como mínimo un valor 2 veces ala media por tal razón la desviación estándar es mas grande que la media esto probablemente indique un sesgo y si es al contrario se debe tener en cuenta que en los valores extremos no aya presencia de sesgos devido a que la desviación estándar es menor que la media.

    ResponderEliminar
  4. Hola segun lo leido puedo aportar lo siguiente:
    Como veiamos en el blogg pasado la media es a sensible a las puntuaciones extremas pero ademas a las distribuciones sesgadas y estos datos a su vez interfieren en la desviacion estandar porque las puntuaciones de desviacion estan elevadas al cuadrado.

    Debido a esto encontramos que la desviacion estandar es afectada de una manera radical cuando tiende a tener sesgos, el ejemplo de la tabla nos mostraba los dos casos la tendencia a puntuaciones bajas nos creaba un sesgo positivo; inicialmente esto ya creaba una distorsion en la desviacion estandar; pero los datos extremos en los casos nueve y diez a ser elevados afectaron en gran los resultados, arrojando como mayor la desviacion estandar en comparacion a la media y la media por consiguiente fue inflada por los datos extremos que se presentaron en los casos nueve y diez.

    Es necesario evaluar los resultados expresados en la desviacon estandar de acuerdo a las reglas es decir cuando la desviacion es mucho mayor que la media probablemente exista un sesgo en la distribucion ya que esta debe ser la mitad de la media o menos.

    Espero mi aporte sea claro y me puedan entender sino lo logran estare presta a explicar mi aporte bayyy

    ResponderEliminar
  5. Cuando la desviación estándar es mas grande que la media esta puede ser susceptible a una distorsión por las puntuaciones extremas, se puede decir que la distorsión está determinada por el hecho de que las puntuaciones de desviación están elevadas al cuadrado, osea la desviación estándar debería ser alrededor de la mitad del tamaño de la media, y cuando la desviación estándar no es de la mitad de tamaño de la media al examinarlo se debe ver la posible existencia de sesgo o valores extremos.
    La distribución sesgada también se puede decir que es un sesgo positivo en la cual se pueden presentar bajas puntuaciones en la mayoría de datos y en datos mas pequeños obtienen altas puntuaciones.
    Cuando una distribución tiene una forma de campana normal su rango tendrá una amplitud de aproximadamente 4 a 6 desviaciones estándar y si la curva es trazada la amplitud de 2 o 3 desviaciones estándar se ajustaran en cada lado de la media.
    Si la desviación estándar no es de la mitad de tamaño de la media o menos, se debe tener cuidado al examinar la distribución para analizar la posible existencia de sesgo o valores extremos.

    La desviación estándar (σ) mide cuánto se separan los datos.
    Se puede decir que la fórmula es:

    La raíz cuadrada de la varianza.

    Debemos tener en cuenta que la varianza es el cuadrado de la desviación estándar: σ2 y se define así:

    Es la media de las diferencias con la media elevadas al cuadrado.

    Elevar cada diferencia al cuadrado hace que todos los números sean positivos para evitar que los números negativos reduzcan la varianza,
    Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho más grande que 502=2,500.
    Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.

    Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

    ResponderEliminar
  6. Con base a la lectura entiendo que la desviacion estandar se puede utilizar en la observaciones que tenga medida de tipo escala de tipo razon o intervalo, ya que nos permite poder indentificar los posibles conjuntos de datos que son diferentes en los valores dados, pero poseen la misma Media, por este motivo es importante siempre de estar seguros de los resultados obtenidos.

    Se puede decir que la desviacion estandar es una medida de dispersion que se usa en la estadistica, en el cual nos da a concer la distancia que tiende a alejarse de los valores puntuales en una distribucion dada.

    La distorcion esta determinada por las pñpuntuaciones de desviacion que estan elevadas al cuadrado.

    ResponderEliminar
  7. En la lectura anterior se puede concluir que
    a mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia común, que es la media aritmética. Se entiende entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogeneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.
    Ninguno de los dos es el más importante, los dos son igualmente importantes. Para poder describir adecuadamente una Distribución se deben dar los dos parámetros.

    La Media indica el VALOR CENTRAL de la distribución. Es un valor representativo de todos los datos de la distribución.
    La Desviación Estándar indica qué tan representativa es esa Media. Si la dispersión es muy grande, la Media es menos representativa que cuando la DE es pequeña.

    ResponderEliminar
  8. Desviación estándar o desviación típica utiliza las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
    Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado
    La desviación estándar es una medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética.
    Si la desviación estándar es más grande que la media, esto probablemente indica un sesgo, es decir, la presencia de valores extremos, si la desviación estándar no es de la mitad de tamaño que la media o menos.
    Se puede decir que la distribución estándar es un sesgo positivo y se debe tener cuidado al examinar la distribución

    ResponderEliminar
  9. HOLa...
    segun lo leido y lo que pude entender:
    la desviacion estandar es un valor que esta sujeto al valor de la media, asi, de un modo casi directo, como los valores elevadamente mayores o menores en medio de otras puntuaciones tipicas alteran o inflan el valor real de la media asi tambien, la desviacion estandar es sesgada cuando dentro de un rango de puntuaciones comunes se hallan valores extremos que provocan una desproporcion de esta puntuacion con respecto del valor que normalmente deveria ser un aproximado a la mitad del tamaño de la media.
    como la desviacion estandar es un valor que muestra el grado de dispercion de los valores con respecto de la media, entonces cuanto mayor sea el tamaño de la D.E. menos compactos seran los valores y mayor sera la diferencia entre ellos y obviamente cuanto menor sea la D.E mas corelacionados y homogeneos estaran los valores.
    asi, la presencia de un sesgo indicara que el valor de la desviacion estandar probablemente posea un valor mayor al tamaño de la media y que halla sido alterada por la presencia de valores extremos dentro de sus puntuaciones.

    ResponderEliminar
  10. BUENAS NOCHES
    Según lo que leí y entendí puedo decir lo siguiente:

    La desviación estándar, como su nombre lo indica es una medida de dispersión, la cual nos dice cuanto tiende a alejarse los valores puntuales del promedio en una distribución, la desviación estándar es el promedio de la distancia que hay entre cada punto del promedio.

    Esta se representa s o .

    Podemos decir que cuando el valor de la desviación estándar es más grande que la media esta se vuelve susceptible a la distorsión por la gran presencia de valores extremos y distribuciones sesgadas. También podemos determinar que las puntuaciones desviadas están elevadas al cuadrado.

    La presencia de valores extremos en una indica que la desviación estándar está siendo más grande que la media, pero también tenemos que tener cuidado al analizar la distribución ya que esta puede dar una posible existencia valores extremos si la desviación estándar no es el tamaño de la media.

    ResponderEliminar
  11. BUENAS TARDES:
    LA DESVIACION ESTANDART ES UNA MEDIDA DEL GRADO DE DISPERSION DE LOS DATOS CON RESPECTO AL VALOR PROMEDIO, OSEA ES EL PROMEDIO DE LA DISTANCIA DE CADA PUNTO RESPECTO DEL PROMEDIO, ES UNA MEDIDA DE CUANTO SE DESVIAN LOS DATOS DE SU MEDIA.COMO DICE LA LECTURA LA DESVIACION ESTANDAR ES SUCEPTIBLE DE LAS PUNTUACIONES EXTEMAS POR ESTA RAZON SE DEBE TENER PROFUNDO CUIDADO A LA HORA DE ESTABLECER PROMEDIOS Y ESTANDARES SOBRE UN TEMA DETERMINADO PUES LAS PUNTUACIONES INDICARAN QUE TAN ALEJADAS ESTAN DE LA MEDIA PUES ENTRE MAYOR SEA ESTE MAYOR SERA LA VARIABILIDAD EN LA CURVA INDICANDO SI ES POSITIVAMENTE SESGADA, NEGATIVAMENTE SESGADA O NORMAL. DE LAS PUNTUACIONES TAMBIEN DEPENDE EL RANGO,LA AMPLITUD Y LA DESVIACION.

    ResponderEliminar
  12. Cuando el valor de este es más pequeño los desvios son menores y por esto son homogeneos, que si este valos fuera mas grande.Cuando tiende a tener sesgos se ve afectada de una manera radical.

    Sencillamenta la desviacion estandar nos indica el alejamiento puntual de un promedio de tipo escala tipo razon o intervalo.

    Ahora cuando es mas grande que la media nos indica que existen valores extremos y cuando esta no es de la mitad de la media o menos se debe tener cuidado para analizar esta distribucion para la posible existencia de sesgo o valores extremos.

    ResponderEliminar
  13. La desviaciòn estandar me permite observar y analizar las frtecuentes distorciones o cambios que se dan en las distribuciones de las variables sin importar su media o su distribuciòn es asi como podemos calcular valores muy extremos o encontremos sesgos de los mismos valores extremos.
    Es hay donde tenemos que tener una mejor comprensiòn de estos valores ya que si su media es mayor su corvatura en la tabla de desviaciòn sera mayor.

    ResponderEliminar
  14. holas..
    Respecto al tema y a la lectura se puede decir primeramente que la media y la desviacion estandar de un proceso o de una distribucion se puede conocer:
    - el coeficiente de variacion
    - los valores extremos(limite inferior y limite superior)de la variable del proceso.
    - los porcentajes de aceptacion y rechazo.

    Deacuerdo a lo leido e investigado para mayor comprension se difiere que la desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con escalas de intervalos o razones.

    A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia común, que es la media aritmética.

    Se entiende entonces que cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más “homogeneo” que si el valor de la desviación estándar fuera más grande. O sea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor homogeneidad.

    Es un valor REPRESENTATIVO de todos los valores obtenidos.
    La separación de una medición respecto a la media, se conoce como Desviación o Error = valor observado - Valor de la Media.
    La Desviación Estándar (DE) es la Media de la desviación de todos los datos, es decir, indica cuánto se separan, en promedio, los valores observados, respecto a la propia Media

    ResponderEliminar
  15. Buenos días para todos…

    Según con lo que leí e investigue con respecto al tema de la desviación estándar y la media, es que la media tiene una utilidad como:

    Conociendo la Media y la Desviación Estándar de un proceso, o de una distribución aislada, se puede obtener información valiosa sobre ese proceso o esa distribución. Se puede conocer:
    * El Coeficiente de Variación (CV) del proceso.
    * Los valores extremos (Límite Inferior y Límite Superior) de la variable del proceso.
    * La Estandarización z de cualquier valor de la variable x del proceso.
    * Los Porcentajes de Aceptación y Rechazo del producto, según los Límites de Tolerancia impuestos por regulaciones estatales o por el mismo cliente.

    La utilidad que tiene el uso de parámetros

    Entre las muchas ventajas, podemos mencionar las siguientes:

    * Facilita el manejo de los datos: cualquiera sea el número de datos de la distribución, estos son reducidos a dos valores únicamente.
    * La Teoría de la Probabilidad tiene técnicas especiales para determinar el comportamiento de toda la distribución, basándose en esos dos parámetros de exactitud y precisión, siempre y cuando el proceso sea razonablemente NORMAL. (más adelante veremos cuándo un proceso es NORMAL).
    * Con esos dos parámetros se puede comparar el comportamiento de un proceso con el de otros procesos similares. Es decir, se puede determinar el que tenga mejor exactitud o mayor precisión.
    * Se puede pronosticar el comportamiento del proceso, es decir, las consecuencias que tendría una variación en la exactitud o en la precisión.

    ResponderEliminar
  16. Buenos días….

    Para entender un poco mas sobre lo leido volvi a retomar la teoria de cada una.

    ¿Qué significa la MEDIA?

    1) Es un valor REPRESENTATIVO de todos los valores obtenidos. Es como si todos los datos obtenidos en las mediciones tuviesen un mismo valor, igual a la media.
    Ejemplo: si decimos que la edad promedio de un grupo de participantes en un Curso de Computación, es decir su media, es 21.6 años, debemos entender que es como si todos los participantes en el curso tuviesen esa edad.
    Aunque esto no es así, aunque sea una ficción, sin embargo, para efectos prácticos, para tomar decisiones, funciona muy bien. Por ejemplo, se puede comparar con un grupo similar que anteriormente recibió este mismo curso y con edad promedio de 26.7 años. Este segundo grupo, es un grupo más joven y eso debe ser tenido en cuenta, quizá para dar un enfoque diferente a este nuevo curso.
    2) Es un valor NIVELADOR, es decir, se puede afirmar que todos los datos son iguales a la media: quita a los que están sobre la media, para completar lo que le falta a los que están bajo la media. Ejemplo: si un alumno obtuvo dos calificaciones en sus exámenes: 7 y 9, la media es 8. Es como si hubiese obtenido 8 en ambos exámenes. Al 9 se le quita un punto, y se lo agrega al 7: ambas quedan iguales a 8., quedan niveladas.

    C. LA DESVIACIÓN ESTÁNDAR

    22 ¿Qué significa DESVIACIÓN ESTÁNDAR (DE)?

    Expliquemos, primeramente, el concepto de DISPERSIÓN. Ésta indica cómo están ubicados los datos, respecto a la media. Si hay muchos datos, muy separados de la Media, tanto por exceso como por defecto, se dice que los datos están muy dispersos. El RANGO es una medida de Dispersión, pero la más usada es la DESVIACIÓN ESTÁNDAR.
    La separación de una medición respecto a la media, se conoce como Desviación o Error.

    Desviación o Error de una medición = Valor observado - Valor de la Media.

    La Desviación Estándar (DE) es la Media de la desviación de todos los datos, es decir, indica cuánto se separan, en promedio, los valores observados, respecto a la propia Media.

    NOTA: La DE no es un concepto intuitivo, no es fácil de entender, como sí lo es, el concepto de la Media. La forma de comprender un poco la DE es aplicándola a determinar los valores extremos de una distribución, como se verá más adelante.

    ¿Cuál de los dos parámetros es el más importante?

    Ninguno de los dos es el más importante, los dos son igualmente importantes. Para poder describir adecuadamente una Distribución se deben dar los dos parámetros.

    La Media indica el VALOR CENTRAL de la distribución. Es un valor representativo de todos los datos de la distribución.
    La Desviación Estándar indica qué tan representativa es esa Media. Si la dispersión es muy grande, la Media es menos representativa que cuando la DE es pequeña.

    NOTA: con solo la Media no se pueden tomar decisiones correctas. Generalmente en muchos casos de investigaciones, solo dan la Media de los resultados obtenidos, olvidan la DE., con lo cual no le dan importancia a la dispersión del proceso. Recuérdese que la dispersión está ligada con la Calidad del proceso.

    ResponderEliminar
  17. Considerando inicialmente que la desviación estandar es útil para describir cuánto se apartan de la media de la distribución los elementos individuales y que es afectada por el valor de cada observación; lo que indicaría que la S fuera más grande que la media, sería básicamente que nos llevara a una distorsión de la información (por decirlo de esta manera). Al igual que la lectura anterior, se puede observar que en este caso una o más puntuaciones extremas inflarán la media y otra parte de la desviación estandar, es decir, si la media es menor que la S, estará relacionado directamente con la presencia de valores extremos lo cual indicaría un sesgo.


    Entonces, se hace necesario y recomendable tener en cuenta las reglas generales propuestas para que no se ponga en evidencia este tipo de debilidades y pues al mismo tiempo tener la capacidad de análisis para poder identificar estos posibles sesgos o distorsiones en determinado momento.

    ResponderEliminar
  18. La separación de una medición respecto a la media, se conoce como o desviación o error.
    Desviación: valor observado –valor de la media.
    La desviación estándar (DE) es la media de la desviación de todos los datos, es decir. Indican cuando se separan, en promedio, los valores observados, respecto a la propia media.

    Saber lo que pude investigar la desviación estándar es la medida de dispersión de variables de tipo intervalo y razón. Estos es de mucha utilidad ya que con esto podemos concluir que a pesar de tener datos muy distintos en términos de valores, estos poseen la misma media. Entre menos sea la desviación estándar más homogéneos son sus resultados, y si esta llega a ser elevada mayor dispersión.

    ResponderEliminar

Nota: solo los miembros de este blog pueden publicar comentarios.