- Cuartil
- Caculos de cuartil por datos agrupados
Ejercicios de cuartiles (Primero, Segundo, Tercero)
- Deciles
- Ejercicios de deciles (Primero, Segundo, ... Noveno)
- Percentiles
Y demás cosas esenciales de la Estadística
Aquí hay mas sobre ESTADÍSTICA
Un poco sobre la biografía de SIMEÓN DENIS POSSION creador de la "Distribución de Possion" que es el tema que les dejaremos en esta oportunidad esperamos les sirva de ayuda.
También algo de Fisher y las pruebas de significación
SIMÉON DENIS POISSON
BIOGRAFÍA:
Simeón
Denis Poisson fue un físico y matemático francés al que se le conoce por sus
diferentes trabajos en el campo de la electricidad, también hizo publicaciones
sobre la geometría diferencial y la teoría de probabilidades.
El
trabajo más importante de Poisson fue una serie de escritos de las integrales
definidas, y cuando tan solo tenía 18 años, escribió una memoria de diferencias
finitas.
En
1809 fue nominado como profesor de matemática pura en la nuevamente abierta
facultad de ciencias.
En
1837 publicó en Rerecherchés sur la probabilite des jugements, un trabajo
importante en la probabilidad, en el cual describe la probabilidad como un
acontecimiento fortuito ocurrido en un tiempo o intervalo de espacio bajo las
condiciones que la probabilidad de un acontecimiento ocurre es muy pequeña,
pero el número de intentos es muy grande, entonces el evento ocurre algunas
veces.
Durante
toda su vida publicó entre 300 y 400 trabajos matemáticos incluyendo
aplicaciones a la electricidad, el magnetismo y la astronomía.
DISTRIBUCIÓN DE POISSON:
INTRODUCCION:
La
distribución de Poisson fue desarrollada por Simeón‐Denis Poisson (1781‐1840). Esta distribución de
probabilidades es muy utilizada para situaciones donde los sucesos son
impredecibles o de ocurrencia aleatoria. En general, utilizaremos la
distribución de Poisson como aproximación de experimentos binomiales donde el
número de pruebas es muy alto (n→∞), pero la probabilidad de éxito muy baja
(p→0).
DEFINICIÓN:
La
distribución de Poisson es una distribución de probabilidad discreta que
expresa la probabilidad de un determinado número de eventos que ocurren en un
intervalo fijo de tiempo y / o espacio si estos eventos se producen con una
tasa media conocida y de forma independiente del tiempo desde el último evento.
La distribución de Poisson también puede ser utilizado para el número de
eventos en otros intervalos especificados como la distancia, área o volumen.
La distribución Poisson es,
junto con la distribución binomial, una de las más importantes distribución de
probabilidad para variables discretas, es decir, sólo puede tomar los valores
0, 1, 2, 3, 4, ..., k.
LA DISTRIBUCIÓN DE POISSON SE EMPLEA PARA DESCRIBIR VARIOS PROCESOS, ENTRE OTROS:
-
El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes de los semáforos) durante un periodo definido de tiempo.
El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes de los semáforos) durante un periodo definido de tiempo.
- El número de
errores de ortografía que uno comete al escribir una única página.
- El número de
llamadas telefónicas en una central telefónica por minuto.
- El número de
servidores web accedidos por minuto.
- El número de
defectos en una longitud específica de una cinta magnética.
- El número de
mutaciones de determinada cadena de ADN después de cierta cantidad de
radiación.
- El número de
defectos por metro cuadrado de tela.
- El número de
estrellas en un determinado volumen de espacio.
Cada una de estas variables
aleatorias representa el número total de ocurrencias de un fenómeno durante un
periodo de tiempo fijo o en una región fija del espacio.
- Expresa la probabilidad de
un número k de ocurrencias sucedidas en
un tiempo fijo, si estos eventos ocurren con una frecuencia media conocida y
son independientes del tiempo discurrido desde la última ocurrencia o suceso.
La
finalidad del presente objeto de aprendizaje, es adquirir la destreza y
conocimiento necesario para la correcta utilización de la distribución de
Poisson en el cálculo de probabilidades.
Para ayudar a su
comprensión. Finalmente, destacaremos los conceptos básicos de aprendizaje con
respecto a la distribución de Poisson y sus aplicaciones prácticas.
_
Identificar las propiedades de una distribución Poisson, así como sus
parámetros característicos, esperanza y varianza.
_
Estimar el valor promedio, la λ,
característico de las variables de Poisson a partir de la frecuencia o
probabilidad de ocurrencia, p, y
el número de veces que se presenta un suceso, n.
_
Establecer las bases para el cómputo de las probabilidades para variables
Poisson
Definición de variable aleatoria (v.a.):
Corresponde
al valor resultante de un determinado experimento. Por ejemplo, si contamos el
número de empleados ausentes en un determinado turno de trabajo, el resultado
podría ser 0, 1, 2, ...., este número de ausencias es la variable aleatoria.
Distinguiremos entre variables aleatorias discretas y
continuas.
Diremos
que una variable aleatoria es discreta cuando sólo puede tomar un número
contable de valores. Estos valores no necesariamente han de ser enteros, pero
sí han de tener valores claramente definidos.
Serían
v.a. discretas, p.e., X1 = “nº” de hermanos de cada uno de nuestros amigos”, o X2 = “nota, con una cifra decimal, obtenida en un examen por cada alumno
de un aula”.
Por
el contrario, una v.a. continua es
aquella que puede tomar cualquier valor dentro de un intervalo real.
Serían
v.a. continuas, p.e., X3 = “altura, en cm., de los jugadores de un equipo de
baloncesto” (1.9, 1.92, 1.923,...), o X4
= “distancia entre dos ciudades”.
TENDENCIA
Es el movimiento
suave de la serie a largo plazo. La tendencia es cuando observamos que los
datos estudiados presentan preferencia a estar de una forma u otra, es decir
cuando vemos datos que tienden a elevarse en el grafico esa es una tendencia al
aumento en largo plazo.
Medidas de de
tendencia central
La medidas de centralización nos indican en torno a qué
valor (centro) se distribuyen los datos. Las medidas de centralización son:
MODA.- La moda es el valor que tiene mayor frecuencia
absoluta. Se representa por Mo.
Definición de distribución de probabilidad:
Es
aquella que permite calcular todos los resultados probables de ocurrir de un
experimento determinado, así como la probabilidad de ocurrencias de estos
resultados.
Las
características más importantes a tener en cuenta en una distribución de
probabilidad son:
-
La probabilidad de un resultado específico está entre cero y uno.
-
La suma de las probabilidades de todos los resultados mutuamente excluyentes es
1.
Li-1 es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a
la en clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior
a la clase modal.
ai es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un
valor aproximado de ésta:
DISTRIBUCIÓN DE POISSON Y FÓRMULA:
Consideremos
X una variable que da el número de individuos que presentan una cierta
característica por unidad de tiempo, volumen, superficie,… Entonces diremos que
X sigue una distribución de Poisson.
Ejemplos:
X=
Número de coches que cruzan un cruce en una hora.
Y=
Número de enfermos de Sida por año y por Comunidad Autónoma.
La
función de probabilidad de la distribución de Poisson es:
Donde
λ es el número medio de ocurrencias
durante un intervalo específico de tiempo, superficie, .. e es la constante exponencial y
x es el número de ocurrencias (éxitos).
Observamos
de la expresión de la función de probabilidad que el parámetro λ caracteriza las variables con
distribución de Poisson. Otra característica de la Poisson es que su media es
igual a su varianza y ambas son igual al parámetro λ:
μ = λ , σ = λ
Observamos
además que una variable con distribución Poisson toma infinitos valores, 0,1,…Ahora bien, las probabilidades van
disminuyendo cada vez más rápidamente cuando el valor es alto, haciéndose
prácticamente nulas a partir de un valor. Por esto muchas veces la distribución
de Poisson también se la llama distribución de los sucesos “raros” o poco
probables.
Función de Distribución de
Poisson
Si
la probabilidad de p es
tan pequeña, de forma que la función solamente es significativa para valores
pequeños de x, entonces la distribución
de eventos se puede aproximar mediante la distribución de Poisson. Bajo estas
condiciones, resulta una aproximación razonable de la distribución binomial
exacta de eventos.
En
el cálculo de la función de distribución, los valores de la media y desviación
estándar se realizan a través de la distribución binomial. En las condiciones
en las se aplica la distribución de Poisson, la desviación típica se puede
aproximar por la raíz cuadrada de la media.
Guía para un ejemplo:
Si la probabilidad de un simple evento es p =
. y hay n = . eventos,
entonces el valor de la función de distribución de Poisson para el valor x = . es x . 10^ . . En estas condiciones, el
número medio de eventos es . y la
desviación típica es .
DEFINICIÓN DE FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD
La
función de probabilidad de una variable aleatoria es la probabilidad acumulada
hasta un valor determinado de la variable. Dada una variable aleatoria X,
diremos que F(a) es la función de distribución tal que:
F(a) = P(X≤a)
La
función de distribución de probabilidad cumple 0 ≤ F(x) ≤ 1.
En
el caso de las variables discretas la función de probabilidad se asocia con la
función de probabilidad, función que da la probabilidad de cada posible valor
que toma la variable.
En
el caso de las continuas como estas pueden tomar infinitos valores en un
intervalo su función de probabilidad viene definida como la probabilidad a
intervalos de valores. De hecho, la probabilidad de que la variable tome un
determinado valor es nula. Las variables aleatorias continuas se caracterizan
por una función denominada función de densidad.
Definición de función de
probabilidad para una variable aleatoria discreta:
Dada
una variable aleatoria discreta X, diremos que f(xi) es la función de
probabilidad que asocia a cada valor xi de la variable su probabilidad, i.e., f(xi) = P(X=xi).
De
este modo: F(a) = P(X≤a) es igual a
la suma de todos los P(X=xi) tales
que xi son menores que a.
Definición de función de
densidad para una variable aleatoria continua:
Dada
una variable aleatoria continua X la
función de densidad f(x) asociada a
una variable aleatoria continua X
caracteriza la función de distribución de probabilidad de X donde:
LA
DISTRIBUCIÓN BINOMIAL.
Consideremos una variable aleatoria X que da
el número de éxitos que aparecen al repetir n veces de forma independiente un
experimento en idénticas condiciones. En esta situación diremos que X sigue una
distribución Binomial.
Ejemplos:
X=
número de huevos defectuosos en un paquete de 12.
Y= número de 2 al
tirar 10 veces un dado.
Las
características principales de este modelo de distribución son:
1. Repetir n pruebas independientes unas de otras.
2. Para cada una de las pruebas sólo pueden
darse dos resultados: éxito o fracaso
3. La probabilidad de éxito en cada prueba es
de p.
En tales condiciones, diremos que la v.a. X = “nº de éxitos en las n
pruebas” sigue una distribución Binomial
de parámetros n y p, y lo escribiremos como X ∼
B(n,p) .
Observamos que la v.a. X sólo puede tomar los valores 0, 1, 2, 3, … , n siendo por tanto una v.a. discreta.
Así pues, las funciones de probabilidad y de distribución
de una distribución binomial son las siguientes:
Fisher y Las Pruebas de Significación
BIOGRAFÍA:
Ronald Fisher (1890-1962) es considerado uno de los padres de la estadística moderna. Desde niño mostró un gran talento por las matemáticas, Igualmente, fue pionero en la aplicación de métodos estadísticos aplicados al diseño de experimentos científicos.
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la estimación intermediante entre la estimación interna
Esta
razón F fue creada por Ronald Fisher (1890-1962), matemático británico, cuyas
teorías estadísticas hicieron mucho más precisos los experimentos científicos.
Sus proyectos estadísticos, primero utilizados en biología, rápidamente
cobraron importancia y fueron aplicados a la experimentación agrícola, médica e
industrial. Fisher también contribuyó a clarificar las funciones que desempeñan
la mutación y la selección natural en la genética, particularmente en la
población humana.
El
valor estadístico de prueba resultante se debe comparar con un valor tabular de
F, que indicará el valor máximo del valor estadístico de prueba que ocurría si
H0 fuera verdadera, a un nivel de significación seleccionado. Antes de proceder
a efectuar este cálculo, se debe considerar las características de la
distribución F.
En muchos casos, el test F puede resolverse mediante un proceso directo. Se requieren
dos modelos de regresión, uno de los cuales restringe uno o más de los
coeficientes de regresión conforme a la hipótesis nula. El test entonces se
basa en un cociente modificado de la suma de cuadrados de residuos de los dos
modelos como sigue:
Dadas n observaciones, donde el modelo 1
tiene k coeficientes no restringidos, y el modelo 0 restringe m coeficientes,
el test F puede calcularse como
El valor resultante debe entonces compararse con
la entrada correspondiente de la tabla de valores críticos.
Características de la
distribución Fisher
- Existe una distribución F que se aplica
cuando se toman cinco muestras de seis
observaciones cada una, al igual que
una distribución F diferente para cinco muestras de siete observaciones cada
una. A propósito de esto, el número distribuciones de muestreo diferentes
es tan grande que sería poco práctico hacer una extensa tabulación de
distribuciones.
La razón más pequeña es 0. La razón no puede
ser negativa, ya que ambos términos de la razón F están elevados al cuadrado.
Por otra parte, grandes diferencias entre los
valores medios de la muestra, acompañadas de pequeñas variancias muéstrales
pueden dar como resultado valores extremadamente grandes de la razón F.
- La forma de cada distribución de muestreo
teórico F depende del número de grados de libertad que estén asociados a ella.
Tanto el numerador como el denominador tienen grados de libertad relacionados.
Determinación de los grados
de libertad
Los grados de libertad para el numerador y el
denominador de la razón F se basan en los cálculos necesarios para derivar cada
estimación de la variancia de la población. La estimación intermediarte de
variancia (numerador) comprende la división de la suma de las diferencias
elevadas al cuadrado entre el número de medias (muestras) menos uno, o bien, k - 1. Así, k - 1 es el
número de grados de libertad para el numerador.
En forma semejante, el calcular cada
variancia muestral, la suma de las diferencias elevadas al cuadrado entre el
valor medio de la muestra y cada valor de la misma se divide entre el número de
observaciones de la muestra menos uno, o bien, n - 1. Por tanto, el promedio de las variancias muestrales se
determina dividiendo la suma de las variancias de la muestra entre el número de
muestras, o k. Los grados de
libertad para el denominador son entonces, k(n
-l).
Cálculo de la razón Fisher a
partir de datos muestrales
Para calcular Fisher se debe
seguir el siguiente procedimiento:
1 1 ) Calcular
la estimación interna (Denominador)
2) Calcular
la estimación intermediante (Numerador)
EJEMPLO
ILUSTRATIVO
Los pesos en kg por 1,7 m de estatura se
ilustran en la siguiente tabla. La finalidad es determinar si existen
diferencias reales entre las cuatro muestras. Emplear un nivel de significación
de 0,05
Solución:
Las hipótesis Nula y
Alternativa son:
Calculando las medias
aritméticas se obtiene:
Se llena la siguiente
tabla para calcular las varianzas muestrales:
Remplazando los datos
en la fórmula de la varianza se obtienen las varianzas de las 4 muestras.
Calculando la estimación interna de varianza
se obtiene:
Para calcular la estimación intermediante de
varianza primero se calcular la varianza de las medias aritméticas
Se llena la siguiente tabla:
Se remplaza los datos de la tabla para
calcular varianza de las medias aritméticas
Calculando la estimación
intermediante de varianza se obtiene:
Los cálculos en Excel se muestran en la
siguiente figura:
Decisión:
PRONÓSTICO
Definición:
Es el proceso de estimación en situaciones de
incertidumbre. El término predicción es similar, pero más general, y
generalmente se refiere a la estimación de series temporales o datos
instantáneos. El pronóstico ha evolucionado hacia la práctica del plan de
demanda en el pronóstico diario de los negocios. La práctica del plan de
demanda también se refiere al pronóstico de la cadena de suministros.
Se puede clasificar en:
1.
PRONÓSTICOS A CORTO PLAZO:
En las empresas modernas, este tipo de pronóstico se efectúa cada mes o menos,
y su tiempo de planeación tiene vigencia de un año. Se utiliza para programas
de abastecimiento, producción, asignación de mano de obra a las plantillas de
trabajadores, y planificación de los departamentos de fabricación.
2.
PRONÓSTICOS A MEDIANO PLAZO:
Abarca un lapso de seis meses a tres años. Este se utilizan para estimar planes
de ventas, producción, flujos de efectivo y elaboración de presupuestos.
3.
PRONÓSTICOS A LARGO PLAZO:
Este tipo de pronóstico se utiliza en la planificación de nuevas inversiones,
lanzamiento de nuevos productos y tendencias tecnológicas de materiales,
procesos y productos, así como en la preparación de proyectos. El tiempo de
duración es de tres años o más.
PRECISIÓN
DEL PRONÓSTICO
El error del pronóstico es la diferencia
entre el valor real y el pronosticado del período correspondiente.
Donde
es el error del pronóstico del período,
es el valor real para ese período y
el valor que se había pronosticado. Medidas de error:
·
Error
absoluto de la media (MAD)
·
Error
absoluto porcentual de la media (MAPE)
·
Desviación
porcentual absoluta de la media (PMAD)
·
Error
cuadrático de la media (MSE)
·
Raíz
del error cuadrático de la media (RMSE)
MUY BUEN APORTE ME AYUDO MUUUUUCHO GRACIAS SIGAN ASÍ...!!!
ResponderEliminar