Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Inferência Estatística: Estimação Pontual e IntervalarEstimação Pontual e Intervalar Média Variância Proporção Inferência Estatística POPULAÇÃO Conjunto de métodos de análise estatística que permitem tirar conclusões sobre uma população com base em somente uma parte dela, a amostra. Parâmetros: Média µ Desvio-padrão σ Proporção θ AMOSTRA Estatísticas: média desvio-padrão s proporção p x Tipos de Inferência Estatística Inferência sobre Estimação de µ Intervalo de Confiança Inferência sobre o parâmetro µ Teste de Hipóteses sobre µ Teste de Hipóteses Estimação Exemplo: de posse de uma amostra de 1000 eleitores de um Estado, deseja-se estimar a proporção θ de eleitores desse Estado que votarão no candidato Fulano. O valor de θ é desconhecido e pode ser estimado de duas formas: θEstimação Somente um valor é dado como estimativa para θ. Ex.: proporção amostral de eleitores de Fulano, p = 0.60. Estimação pontual: Estimação intervalar: Um intervalo de valores é dado como estimativa para θ. Ex.: [ p margem de erro ] = [ 0.60 0.03 ] = [ 0.57 ; 0.63 ] . ± ± Conceitos Básicos em Estimação Parâmetro Estimador (do parâmetro) Valor populacional desconhecido: Ex.: média, variância, proporção, etc., representado por letras gregas (µ, σ, θ, …) . Função das variáveis aleatórias X1,…,Xn que compõem a amostra. (do parâmetro) Estimativa (do parâmetro) que compõem a amostra. Ex.: 1 n i i X X n = = ∑ ( )2 1 1 n i i X X s n = − = − ∑ Valor do estimador quando aplicado aos dados observados na amostra. Ex: 34.5x = Estimação Intervalar Intervalo de Confiança = estimativa pontual ±±±± margem de erro Exemplo: Em uma amostra de 40 alunos da UFMG, encontrou-se uma renda familiar média de 1600 reais (estimativa pontual), com desvio- padrão igual a 323 reais. A margem de erro foi calculada em 100 reais. Assim, a estimativa intervalar para a renda familiar média do aluno da UFMG é de [1600 ± 100] = [1500 ; 1700] reais. Lembrando que… Seja uma amostra aleatória x1, x2, . . . , xn de uma v.a. X com distribuição Normal com média µ e dp σ. X, o estimador de µ, tem distribuição Normal com média µ e desvio padrão σ / com média µ e desvio padrão σ / n Intervalo de 100(1-α)% de Confiança para uma Média µ / 2 100(1 )% .IC x z n α α µ σ − = ± Margem de Erro estimativa da variabilidade de x Nível de confiança do intervalo estimativa pontual de µ Fator para redução da confiança / 2zα α/2é o percentil da distribuição Normal- padrão que deixa uma área de α/2 acima dele / 2zα Intervalo de 100(1-α)% de Confiança para µ / 2 100(1 )% .IC x z n α α µ σ − = ± Nível de confiança do intervalo = 1 - α - É um valor entre 0 e 1; - Expressa nossa “confiança” de que o intervalo englobe o valor (desconhecido) µ. Distribuição de probabilidade dos valores populacionais Distribuição de probabilidade dos valores da média amostral em amostras de tamanho 50 da população à Utilizando a distribuição de probabilidade do estimador do parâmetro população à esquerda. / 2 100(1 )% .IC x z n α α µ σ − = ± Essa expressão para o IC de µ pode ser usada quando: 1. a variável em estudo tiver distribuição Normal 2. a variável em estudo não tiver distribuição Normal, mas o tamanho da amostra (n) for grande ( n > 30). É preciso conhecer σ, o d.p. populacional Resultado 1 TCL PROBLEMA: Essa substituição resulta em uma nova variável ns xT / µ− = Substituir σ por s na variável Z SOLUÇÃO (quando não se conhece σσσσ) s / 2;( 1) 100(1 )% .n sIC x t n α α µ − − = ± Intervalo de 100(1-α)% de Confiança para µ quando σσσσ for desconhecido / 2;( 1) 100(1 )% .n sIC x t n α α µ − − = ± é o percentil da distribuição t-Student com (n-1) graus de liberdade que deixa uma área de α/2 acima dele. / 2 ;( 1)ntα − / 2;( 1)ntα − α/2 ( 1)nt − Intervalo de Confiança para a média µ A amostra é grande SIM SIM NÃO / 2 100(1 )% .IC x z n α α µ σ − = ± / 2 100(1 )% . sIC x z n α α µ − = ± σ é conhecido ? é grande (n > 30) ? NÃO Os dados são Normais ? SIM NÃO / 2;( 1) 100(1 )% .n sIC x t n α α µ − − = ± Métodos não- paramétricos O que entendemos por confiança ? EXEMPLO: estimar µ, a renda média familiar dos alunos que ingressaram na UFMG este ano. Experimento: 1. cada um de vocês tem acesso a uma amostra de 100 calouros para estimar µ.para estimar µ. 2. Todos vocês construirão um intervalo de 95% de confiança utilizando os dados da nossa amostra. Resultado esperado: Intervalos de confiança com limites e comprimentos diferentes para cada um de vocês. Como saber qual é o intervalo “correto” ? Interpretação Gráfica do Nível de Confiança na Estimação Intervalar Para um intervalo de 95% de confiança para µ, temos a uma confiança de 95% de que este intervalo em uma confiança de 95% de que este intervalo em especial contenha o valor desconhecido de µ. Exemplo 1: estimar a média da resistência a compressão (em psi) da liga alumínio-lítio 2 0 0 2 5 0 R e s i s t e n c i a a c o m p r e s s a o , e m p s i n = 80 corpos-de-prova Nível de confiança : 95% 162.66x = 33.77s = 1 0 0 1 5 0 2 0 0 R e s i s t e n c i a a c o m p r e s s a o , e m p s i Nível de confiança : 95% 100(1-α) = 0.95 � α = 0.05 1.960.025z = / 2 100(1 )% . sIC x z n α α µ − = ± Exemplo 1: continuação 95% 33.77162.66 1.96 80 ICµ = ± ⋅ [ ]95% 162.66 7.40ICµ = ± [ ]95% 155.26 ; 170.06ICµ = A média da resistência a compressão da liga alumínio- lítio está entre 155.26 psi e 170.06 psi, com 95% de confiança. Exemplo 2: estimar a carga média no ponto-de- falha de corpos feitos com a liga U-700 Um artigo* descreve os resultados de testes trativos de adesão em 22 corpos-de-prova de liga U-700. A carga no ponto-de-falha de corpo-de-prova foi medida em megapascal. A carga média nessa amostra é igual a 13.71 megapascalA carga média nessa amostra é igual a 13.71 megapascal e o desvio-padrão é de 3.55 megapascal. Materials Engineering, vol. II, n. 4, pp. 275-281, 1989 Amostra pequena � verificar a suposição de distribuição Normal para os dados Nível de confiança: 99% Verificando a suposição de normalidade P e r c e n t 99 95 90 80 70 60 50 40 30 Mean 0.838 13.71 StDev 3.554 N 22 AD 0.211 P-Value Gráfico de Probabilidade Normal Normal Boxplot of Carga Carga 22.520.017.515.012.510.07.55.0 20 10 5 1 C a r g a 20 18 16 14 12 10 8 6 Boxplot of Carga Exemplo 2: (continuação) / 2;( 1) 100(1 )% .n sIC x t n α α µ − − = ± 99% 0.005;21 3.5513.71 22 IC tµ = ± ⋅ [ ]99% 13.71 2.83 0.76ICµ = ± ⋅ [ ]99% 13.71 2.15ICµ = ± [ ]99% 11.56 ; 15.86ICµ = A carga média no ponto-de-falha de corpos feitos com a liga U-700 está entre 11.56 e 15.86 megapascal, com 99% de confiança. Como reduzir o comprimento do Intervalo de Confiança ? / 2 100(1 )% .IC x z n α α µ σ − = ± margem de erro (ε)margem de erro (ε) Reduzindo margem de erro� aumentar n. Qual deve ser o tamanho mínimo da amostra para que a margem de erro na estimação de µ seja menor ou igual a εεεε em um intervalo de 100(1-α)% de confiança ? / 2 100(1 )% .IC x z n α α µ σ − = ± n margem de erro (ε) Exemplo: energia de impacto em placas de aço A238 O teste Charpy V-notch (CVN) mede a energia de impacto (em J) e é frequentemente usado para determinar se um material experimenta ou não uma transição dúctil-frágil com um decréscimo de temperatura. Considerando que a energia de impacto em placas de aço A238,Considerando que a energia de impacto em placas de aço A238, cortadas a 60o C, seja normalmente distribuída com σ = 1.0 J, qual seria o tamanho de amostra necessário para construir um intervalo de 95% de confiança para a energia de impacto média (µ) nessas placas de modo que o comprimento do intervalo não seja maior do que 1.0 J ? n=? α=0.05 σ=1.0 J 2E=1.0 J � α/2=0.025 � Zα/2=1.96 � E=0.5 J / 2 2 .n z E α σ = Exemplo: energia de impacto em placas de aço A238 21.01.96 15.37n = × = 1.96 15.370.5 n = × = O número mínimo de corpos-de-prova de aço A238 a ser utilizado nos ensaios deve ser de 16 unidades. Lembrando que … Se x1, x2, . . . xn é uma amostra aleatória de uma população Normal com média µ e desvio-padrão σ, a variável onde S2 é o desvio-padrão amostral, tem distribuição Qui-Quadrado com (n-1) graus de liberdade. X 2 ~ χ2n-1 Intervalo de 100(1-α)% de Confiança para a Variância σσσσ2 de uma População Normal Exemplo: Garrafas de refrigerente enchidas em máquinas automáticas. A variabilidade do volume do líquido dispensado deve ser controlada. Em uma amostra de tamanho n=30, encontrou-se variância amostral igual a s2 = 25 ml2 (desvio-padrão amostral igual s = 5 ml). O Intervalo de Confiança de 95% para a variância σ2 é [ ] ][;; 0.45;915 1.16 725 7.45 725 ][ )25(29 ][ )25(29%95 22 29;975.029;025.0 2 . IC == = ⋅⋅ χχσ ml2 O Intervalo de Confiança de 95% para a variância σ é Intervalo de Confiança para uma Proporçao Intervalo de 100(1-α)% de Confiança para a Proporçao p Estimação da média µµµµ com variância σσσσ2 conhecida (amostra grande) Estimação da média µµµµ com variância desconhecida (população Normal) Estimação da variância σσσσ2 (população Normal) Estimação da proporção p (amostra grande)