Header Image - MCM Alchimia 5

Variables correlacionadas

by admin 0 Comments

Frecuentemente se utilizan modelos de ensayo que contienen dos o más magnitudes con algun grado de correlación, esto es, que sistemáticamente al modificar el valor de una de ellas, la otra aumenta o disminuye. Los coeficientes de correlación entre dos variables varían entre -1 y 1, donde el valor nos indica la fuerza de la correlación, mientras que el signo nos indica la dirección. De este modo, entendemos que si la correlación es = 1 existe una proporcionalidad directa absoluta entre las magnitudes mientras que si el valor es -1 la proporcionalidad es inversa. Por otra parte, un valor cero para el coeficiente de correlación indica que las variables son independientes.

Si conocemos los coeficientes de relación entre las magnitudes del modelo matemático de nuestro ensayo podemos utilizar el panel de correlaciones. La matriz de correlaciones se construye automáticamente con las variables de nuestro modelo para que nosotros indiquemos el coeficiente de correlación entre ellas. Cuando completemos la matriz, pulsamos el botón <conectar al proyecto> y luego de chequear que la matriz sea correcta, la luz verde del botón indicará que está conectada.

En este caso la simulación se hará con variables correlacionadas. Si en algun momento deseamos trabajar con magnitudes independientes nuevamente, solo tenemos que demarcar la casilla de chequeo <correlacionadas> sobre el botón de simulación. De este modo podemos alternar entre ambos estados sin corregir cada vez la matriz de correlaciones.

Regresión

by admin 0 Comments

NOTA: Esta herramienta solo está disponible para modelos con curvas conectadas (Ver trabajo con curvas) 

Al final de la lista de distribuciones, MCM Alchimia deja disponible a partir de su versión ‘infinito’, esta herramienta que permite asignar parámetros de regresión a nuestro modelo de ensayo. De esta forma, tenemos 3 opciones relacionadas con nuestra curva conectada para escoger:

 

  • B0. Coeficiente independiente (ordenada en el origen) de la curva conectada.
  • B1. Coeficiente de primer orden de la curva conectada.

Tanto B0 como B1 tendrán incertidumbres asociadas que corresponden al resultado de la simulación, es decir, si al menos uno de los valores que se utilizaron para construír la curva tenía incertidumbre, la simulación producirá necesariamente una sucesión de curvas para cada juego de valores simulados, cada una con coeficientes B0 y B1 que tendrán algún grado de variación. La magnitud de esta variación esta relacionada con la magnitud de la incertidumbre de los datos de entrada en ambos ejes.

  • Incluir residuos. En caso que esta opción esté seleccionada, las incertidumbres asociadas al coeficiente que hayamos seleccionado (B0 o B1) se utilizarán incrementadas en una magnitud determinada por la contribución debida a residuos de mínimos cuadrados. De modo que la incertidumbre asociada a ambos parámetros comprenderan las contribuciones de simulación y de residuos
  • Incertidumbre debida al ajuste. Si asignamos esta opción a nuestro parámetro lo que obtendremos es la incertidumbre estandar de la curva conectada debida a residuos, centrada en cero (solo como contribución de incertidumbre). Este valor es el encontrado en regresiones hechas en hoja de cálculo como error típico o error estándar de regresión.

Nota: Es importante hacer notar que si simulamos aisladamente el error típico de una curva, el resultado de desvío estándard de la población resultante es un poco mayor que el mismo parámetro obtenido en una hoja de cálculo. Esto es debido a que si bien la variable se define como de media 0 y desvío = a la incertidumbre típica, la distribución de simulación en MCM Alchimia para este caso no es una Normal, sino una t Student con los grados de libertad que determinan el Nº de puntos con los cuales se construyó la curva, resultando en un desvío mayor para el mesurando.

Experimental (datos crudos)

by admin 0 Comments

Esta distribución no es una distribución en sí misma, sino una potente y exclusiva forma de MCM Alchimia infinito de ingresar valores crudos de repetibilidad al modelo de nuestro ensayo sin necesidad de realizar ningún tipo de dato previo en una hoja de cálculo.

Como puede verse en el gráfico, el panel de datos de entrada tiene varios selectores para definir las características de entrada de nuestro contribuyente de incertidumbre.

  1. Juego de datos de entrada

A la izquierda del panel tenemos 5 botones de radio (selectores), que indicarán al software la forma que se ingresarán los datos de entrada. Tendremos entonces 5 formas de entrada:

  • Directa. Seleccionando esta opción le estaremos diciendo a MCM Alchimia que entraremos los datos uno por uno. De estos datos, el software obtendrá automáticamente la media, desvío estándar de las medias muestrales y grados de libertad, estadísticos necesarios para realizar la simulación.
  • Indirecta SX. Esta opción indica que deseamos que la aplicación nos solicite dos columnas de datos, de los cuales cada valor para la repetibilidad se obtendrá de la resta Valor = (X – S). Un ejemplo donde se puede utilizar esta opción es cuando se calibran por comparación dos instrumentos digitales, y se desea calcular la repetibilidad de los errores. Indicamos la lectura del patrón en la columna de S y la lectura de la muestra en X. También puede utilizarse cuando se desea obtener el peso de una sustancia contenida en un crisol,  traves del peso del crisol vacío y con el contenido. En este caso puede indicarse en S los valores de masa del crisol vacío y en X la masa del crisol con el contenido.
  • Indirecta SXXS. En determinados casos los valores de error se obtienen a partir de un juego de medidas conocido también como formato como ABBA, el que se solicitará en una tabla de 4 columnas. Este formato es utilizado en ocasiones cuando se desea eliminar el sesgo provocado por la deriva potencial de los instrumentos de medida. De este modo, cada valor será obtenido del cálculo Valor = (X1 + X2) / 2 – (S1 + S2) / 2.
  • Indirecta X/S. En este formato indirecto, cada valor para las repeticiones se obtendrá de la relación Valor = X/S, indicada a traves de una tabla de dos columnas.
  • Indirecta SXS.  Este formato es similar a SXXS, solo que en tres columnas. Los valores serán obtenidos automáticamente por la aplicación, a traves de la operación: Valor = X – (S1 + S2) / 2.

2. Ingreso de valores.

En el extremo superior derecho del panel MCM Alchimia dispone un campo donde debemos indicar el número de repeticiones al que queremos estimar los parámetros de simulación, esto es, la media y el desvío estándar de las medias. Por defecto la aplicación dispone 10 valores, sin embargo este valor puede cambiarse editando manualmente el número o con las flechas de incremento/decremento.

Luego de indicar el número de mediciones que se ingresarán hacemos click en el botón «Valores», donde se abrirá una grilla para ingreso de valores. Según el formato de ingreso elegido en el selector de juego de valores, la tabla tendrá el número de columnas necesarias:

3.- Distribución de simulación.

Esta sección del panel pone a disposición dos formas de realizar la simulación a partir de los parámetros de la distribución definida anteriormente a partir de los valores ingresados:

t (Student). Seleccionando esta opción, MCM Alchimia infinito calculará la media y el desvío estandar de las medias muestrales a partir de la tabla de valores ingresada. Luego generará aleatorios distribuídos de acuerdo a la función t Student, con un número de grados de libertad igual a la cantidad de valores -1.

Normal. En este caso, el software realizará los mismos cálculos que antes, luego tomará el valor inverso de la función t (factor de covertura k) para la probabilidad de cobertura elegida y los grados de libertad calculados. La simulación entonces se hará con pseudoaleatorios de distribución normal de media calculada y desvio estandar s1= k.s/k’, siendo k’ el valor inverso de la distribución t para la misma probabilidad de cobertura, pero infinitos grados de libertad.

Para un numero alto de grados de libertad ambas simulaciones tendrá características similares o idénticas. En cambio, para un número de grados de libertad < 10 los resultados obtenidos a partir de ambas simulaciones podrían presentar diferencias significativas.

¿Entonces cual elegir?

Según la utilidad que querramos darle a esta aplicación podemos requerir una u otra distribución de simulación, sin embargo para técnicos no expertos en estadística aconsejamos seguir la siguiente regla:

  1. Para validación de estimaciones de cálculo tradicional según GUM (JCGM 101), ensayos de rutina de laboratorios, ensayos de aptitud comparacioes, etc. simular de acuerdo a una Normal.
  2. Para investigación, estadística, economía y casos donde se requiera conocer en profundidad el impacto de una variable en la incertidumbre del mesurando, simular de acuerdo a una distribución t Student.

4. Forzar media = 0.

Esta opción está prevista cuando queremos que el contribuyente al que se aplique esta distribución solo se ingrese con fines de incertidumbre. De esta forma se anulará el corrimiento de la función para que la media sea = 0 y no aporte valor. Esto es especialmente útil cuando tenemos componentes del modelo que tienen más de una incertidumbre, por ejemplo la resolución y la repetibilidad. De esta forma se puede indicar como variables sumadas, 1 constante con el valor del parámetro y el resto solo como contribuyentes de incertidumbre con media cero. En este caso las Tipo A pueden ponerse como experimentales. El ejemplo de esta ayuda utiliza esta herramienta.


 

La distribución t Student

by admin 0 Comments

Desde hace décadas es usual suponer en todo tipo de análisis, ensayos o calibraciónes que los eventos repetitivos, sin estímulos externos que varíen sus probabilidades, se distribuirán de acuerdo a una distribución Normal o Gaussiana definida por la media y la desvíación estándar calculada en la muestra. En rigor esto solamente es cierto cuando el número de repeticiones es grande, gracias al teorema central del límite, sin embargo cuando no tenemos suficiente información para describir las propiedades de esta Normal debido a que nuestra muestra en estudio no es lo suficientemente grande, suponer que se cumplen igualmente estas condicione, nos arrojará seguramente valores de incertidumbre subestimados para nuestro mesurand .o, gomo lo indica la guía JCGM 100 – Guide to the expression of uncertainty in measurement.

Este mismo problema se lo planteó William Gosset, quien firmaba sus trabajos como Student por razones de confidencialidad empresarial de la compañía donde trabajaba. Gosset necesitaba estimar a partir de datos experimentales, una distribución que representara muestraa pequeñas de varianza desconocida. Esta función distribución propuesta por Gosset se conoce como t Student, y responde a la ecuación general siguiente:

En toda población normalmente distribuída, la distribución t Student permite incrementar el ancho de la distribución normal resultante para incrementar la incertidumbre asociada al mesurando como resultado de la pobreza de información que aporta una muestra pequeña sobre el lote total. En la medida que esta muestra sea mayor, la distribución t se irá acercando a la Normal obtenida a partir del desvio estandar de la muestra hasta ser identica a esta última para infinitas repeticiones del evento.

Lo correcto entonces en todo tipo de análisis es asignar a eventos repetitivos la distribución t con un parámetro gl que serán los grados de libertad, cuyo valor será la cantidad de repeticiones menos 1. MCM Alchimia infinito permite simular la distribución t Student, no solo con este parámetro de forma, sinó con parámetros de escala y de posición, a traves del desvío estandar y la media respectivamente, para que pueda utilizarse en cualquier situación donde corresponda, sin operaciones adicionales.

Parametros de entrada:

  • Media. Este parámetro define el desplazamiento de la función en el eje de abscisas. Corresponde al valor medio, o promedio de la variable aleatoria. La colección de datos de esta variable, por tanto, se distribuirán a ambos lados de esta función. En el caso de esta distribución, al igual que en todas las funciones simétricas la media coincidirá con la moda.
  • Grados de libertad. Corresponde al número de repeticiones menos 1, Representa el numero de valores que pueden variar sin modificar el valor de la media muestral.
  • Desvío estandar. Medida de la dispersión de los valores respecto de la media muestral. Si se utiliza esta distribución para componentes de incertidumbre Tipo A (estadísticos), este valor puede calcularse según la ecuación:

    donde n es el número de valores o repeticiones. Por otra parte, si lo que se desea conocer es el desvío estándar de las medias muestrales, este valor puede obtenerse dividiendo s/√n.

 

Constante

by admin 0 Comments

Esta no es una distribución en si misma, sino un valor con incertidumbre cero, como pueden serlo la constante de disociación del agua, la gravedad normal, la temperatura de referencia de un ensayo, la capacidad nominal de un material volumétrico etc. También puede utilizarse para componentes del modelo con varios contribuyentes de incertidumbre, escribiendo el modelo como una constante sumada a una lista de conribuyentes de incertidumbre con valor cero y distribuciones variadas.


Más ayuda

Distribución triangular

by admin 0 Comments

La distribución triangular continua se caracteriza por estar acotada a dos extermos como en el caso de la rectangular, pero además tiene una moda (o valor más probabe) dentro de ese intervalo. La probabilidad en cualquier subintervalo de igual longitud irá aumentando linealmente hasta la moda y luego descenderá de la misma forma hasta la cota superior. Esta distribución es muy utilizada en variables donde la información es limitada, como en el caso de la uniforme, pero donde se tiene un conocimiento aproximado del valor Modal, es decir, donde, si bien no se conoce el punto exacto de este valor, se tiene información de la region o subintervalo donde encontrarlo.

Importante: En el caso de MCM Alchimmia, solo está disponible la triangular centrada, esto es, la Moda estadística corresponderá al valor medio del intervalo AB.

La ecuación general entonces, estará definida para el intervalo AB, mientras que fuera de esos extremos la función distribución será 0. La fórmula entonces será:

Parametros de entrada:

  • Media. Valor medio y valor modal de la variable aleatoria.
  • Semi intervalo. Corresponde a la mitad del intervalo al cual se aplica esta distribución, esto es (B-A)/2, siendo A y B, las cotas superior e inferior del intervalo. Cuando esta función es aplicada a la incertidumbre por resolución de un instrumento analógico, este parámetro corresponderá a la apreciación (o estimación <e>). También en el área de química es usual tomar la tolerancia del material volumétrico o incluso de los materiales de referencia como contribuyentes de incertidumbre de distribución tringular (EURACHEM/QUAM:2012 8.1.6). En ambos casos mencionados, el semi intervalo corresponderá al valor e tolerancia del material.

Más ayuda

Distribución Rectangular (Uniforme)

by admin 0 Comments

Esta distribución continua se caracteriza por se igualmente probable cualquier valor del intervalo. Es ampliamente utilizada para contribuciones de incertidumbres tipo B en las cuales se conocen únicamente las cotas mayor y menor del intervalo, por ejemplo en la división o resolución de un instrumento digital. En muchos caso tambien puede asignarse esta distribución cuando se tiene poca información sobre la variable aleatoria, en datos de bibliografía o cuando no se conoce el factor de cobertura de una incertidumbre,

La fórmula general de esta distribución está definida para todos los valores de x para los cuales A ≤ x ≤ B, de acuerdo a la ecuación:

Parametros de entrada:

  • Media. Valor medio, de la variable aleatoria.
  • Semi intervalo. Corresponde a la mitad del intervalo al cual se aplica esta distribución, esto es (B-A)/2, siendo A y B, las cotas superior e inferior del intervalo. Si esta función es aplicada a la incertidumbre por resolución de un instrumento digital, este parámetro corresponderá a la mitad de la división menor (d/2). En ocasiones también se aplica a instrumentos análogos tomando la apreciación (o estimación <e>) como si fuera una division estimativa, más alla de la cual no se tiene información. En este caso el semi intervalo será e/2.

Más Ayuda

Distribución Normal (Gaussiana)

by admin 0 Comments

Esta distribución es la que más frecuentemennte se encuentra representando eventos naturales y sociales.  Gran parte de las pruebas de la estadística clásica, así como de la estimación de incertidumbres se apoyan en la suposición que los datos se ajustan a una distribución normal. Desde la perspectiva teórica, el Teorema del Límite Central sostiene que dada una muestra aleatoria de tamaño suficientemente, grande se observará que la distribución de medias sigue una distribución aproximadamente normal. La fórmula general de esta distribución es:

donde μ representa la localización y σ la escala de la función.  Con el fin de estimar incertidumbres de ensayo, μ corresponde al valor medio y moda de la variable aleatoria, mientras que σ es el desvío estándar.

Parametros de entrada:

  • Media. Valor medio, o promedio de la variable aleatoria. La colección de datos de esta variable, por tanto, se distribuirán a ambos lados de esta función. En el caso de esta distribución Normal o Gaussiana, la media coincidirá con la moda.
  • Desvío estandar. Medida de la dispersión de los valores respecto de la media muestral. Si se utiliza esta distribución para componentes de incertidumbre Tipo A (estadísticos), este valor puede calcularse según la ecuación:

    donde n es el número de valores o repeticiones. Por otra parte, si lo que se desea conocer es el desvío estándar de las medias muestrales, este valor puede obtenerse dividiendo s/√n.

Si el parámetro al que se asigna esta distribución corresponde al aporte de incertidumbre proveniente de un certificado de calibración, el desvío estandar corresponde a la incertidumbre estandar (u), o a la incertidumbre expandida dividido el factor de cobertura.


Más ayuda

Distribución Lognormal

by admin 0 Comments

Lognormal.

Esta distribución representa a variables aleatorias cuyos logaritmos estan distribuídos de acuerdo a una distribución normal. La distribución lognormal toma diferentes formas según sea el valor de su parámetro de escala y es de uso frecuente en fiabilidad de productos de alta tecnología y también en conteos microbiológicos ya que se basa en el modelo de crecimiento multiplicativo.

Parámetros de entrada:

Como se indicó, los logaritmos de los valores de la variable aleatoria de distribución lognormal se distribuyen de acuerdo a una función Normal. Esta función distribución puede definirse a partir de dos juegos de parámetros según se seleccione en los botones de radio de la derecha del panel de datos.

  • μ(Y). Media de la población Y de datos. Esta población Y quedará definida según el grupo de datos al que deseamos referirnos, esto es, a la población lognormal o a la normal de sus logaritmos.
  • s(Y).  Desvío estándar de Y. Con Y de acuerdo a las características indicadas arriba.
  • Y = X (LogNormal)  /   Y = ln(X) (Normal). Este selector permite elegir a qué grupo de datos se estén refiriendo los parámetros de entrada.
    • Y = X (LogNormal). En este primer caso los valores pseudoaleatorios generados conformarán una distribución lognormal cuya Media será μ(Y) y su desvío estandar sera s(Y).
    • Y = ln(X) (Normal). En este caso los valores generados estarán distribuidos en forma LogNormal. El conjunto formado por los logaritmos de estos datos tendrá distribución Normal cuya Media será μ(Y) y su desvío estandar será s(Y).

Más ayuda

Distribución Xi Cuadrado

by admin 0 Comments

Xi Cuadrado (Pearson).

Esta distribución de probabilidad continua en el campo de los reales positivos, está íntimamente relacionada con la distribución Normal, por ejemplo, es la distribución muestral de σ². La distribución Xi (o Chi) Cuadrado queda definida con un único parámetro que son los grados de libertad. La función siempre es asimétrica y sesgada a la derecha. Esta distribución se utiliza muy frecuentemente en diversas ramas de la ciencia ya que permite analizar conjuntos de datos y determinar si la diferencia entre ellos es debida al azar (hipótesis nula) o a otro factor externo.

Parámetros de entrada:

  • Grados de libertad. Representa la cantidad de valores que están libres para variar sin influir en el resultado.

 Más ayuda