Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Ponto dos Concursos www.pontodosconcursos.com.br Atenção. O conteúdo deste curso é de uso exclusivo do aluno matriculado, cujo nome e CPF constam do texto apresentado, sendo vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação e distribuição. É vedado, também, o fornecimento de informações cadastrais inexatas ou incompletas – nome, endereço, CPF, e-mail - no ato da matrícula. O descumprimento dessas vedações implicará o imediato cancelamento da matrícula, sem prévio aviso e sem devolução de valores pagos - sem prejuízo da responsabilização civil e criminal do infrator. Em razão da presença da marca d’ água, identificadora do nome e CPF do aluno matriculado, em todas as páginas deste material, recomenda-se a sua impressão no modo econômico da impressora. ESTATÍSTICA P/ ICMS-SP 1 PROFESSOR VÍTOR MENEZES AULA 06 XIV DISTRIBUIÇÃO UNIFORME DISCRETA ....................................................................................... 2 XV DISTRIBUIÇÃO DE BERNOULLI ........................................................................................................ 3 XVI DISTRIBUIÇÃO BINOMIAL ............................................................................................................. 6 1 Introdução ................................................................................................................................................... 6 2 Média e variância da variável binomial.................................................................................................... 18 3 Proporções ................................................................................................................................................ 21 XVII DISTRIBUIÇÃO DE POISSON ........................................................................................................ 26 XVIII DISTRIBUIÇÃO UNIFORME CONTÍNUA.................................................................................... 36 XIX DISTRIBUIÇÃO NORMAL .............................................................................................................. 44 1 Teorema do limite central.......................................................................................................................... 46 2 Utilização das tabelas ............................................................................................................................... 50 3 Aproximação da distribuição binomial com a distribuição normal .......................................................... 70 XX AMOSTRAGEM ..................................................................................................................................... 75 1 Amostragem aleatória simples .................................................................................................................. 75 2 Amostragem estratificada.......................................................................................................................... 76 3 Amostragem por conglomerado ................................................................................................................ 76 4 Amostragem sistemática ............................................................................................................................ 77 LISTA DAS QUESTÕES DE CONCURSO ..................................................................................................... 80 GABARITO DAS QUESTÕES DE CONCURSO............................................................................................ 90 TABELA PARA A VARIÁVEL NORMAL ..................................................................................................... 91 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 2 PROFESSOR VÍTOR MENEZES Aula passada vimos algumas noções de variáveis aleatórias. Estudamos que, quando temos variáveis discretas, podemos nos referir à probabilidade da variável aleatória assumir um dado valor. E, quando temos variáveis contínuas, a probabilidade da variável assumir um dado valor é sempre nula. Para caracterizar a variável aleatória, nesses casos, usamos a função densidade de probabilidade que, de forma semelhante a um histograma, nos permite calcular a probabilidade de um intervalo de valores. XIV DISTRIBUIÇÃO UNIFORME DISCRETA A distribuição uniforme discreta é o tipo mais simples de variável aleatória. É a variável em que todos os valores têm a mesma probabilidade de ocorrer. Um exemplo bem simples, e que já temos trabalhado, é o caso do lançamento do dado de seis faces. A variável que designa o resultado do lançamento é discreta (podem ocorrer apenas os valores 1, 2, 3, 4, 5 e 6). Além disso, se o dado for honesto, todos os resultados são equiprováveis. Dizemos que a variável em questão é discreta e uniforme. Seja X a variável discreta uniforme que pode assumir ‘n’ resultados diferentes ( 1x , x2 , x3 , ..., xn ). A esperança de X fica: E[ X ] = 1 n × ∑ xi n i =1 A esperança é simplesmente a média aritmética de todos os valores que podem ocorrer. EXERCÍCIOS PROPOSTOS EP 1 Considere uma variável aleatória X, uniforme e discreta, que pode assumir os valores 5, 6, 7 e 8. Calcule a esperança desta variável. EP 2 Para a variável aleatória definida no exercício anterior, faça o esboço do gráfico da função de distribuição de probabilidade. Resolução do EP 1. RESOLUÇÃO DOS EXERCÍCIOS PROPOSTOS A variável é uniforme discreta. A esperança é simplesmente a média dos valores que X pode assumir. E[ X ] = 1 × ( )5 + 6 + 7 + 8 = 4 26 = 6 5, 4 A esperança de X é 6,5. Resolução do EP 2. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 3 PROFESSOR VÍTOR MENEZES A variável aleatória é discreta. A FDP vai apresentar saltos (lembra? Matéria da aula passada). Será em forma de escada. Os saltos ocorrem justamente nos valores em que X assume. Os tamanhos dos degraus correspondem às probabilidades de cada valor ocorrer. Para x entre 4 e 5, a FDP é nula. A título de exemplo, tomemos x = 4,5. A probabilidade de X assumir valores menores ou iguais a 4,5 é zero. Não há nenhum caso favorável dentre os casos possíveis. Em x = 5, a FDP dá um salto. A probabilidade de X assumir valores menores ou iguais a 5 é de 1/4. Temos 1 caso favorável (o próprio 5) em 4 possíveis. Para x entre 5 e 6, a FDP segue em 1/4. Como exemplo, tomemos o valor x = 5,5. A probabilidade de x ser menor ou igual a 5,5 continua sendo de 1/4 (temos um caso favorável – 5 – em 4 possíveis – 5, 6, 7, 8). Em x = 6 temos outro salto. A probabilidade de X assumir valores menores ou iguais a 6 é de 2/4. Temos dois casos favoráveis (5 e 6) em quatro possíveis. Em x = 7 temos outro salto. A FDP passa para 3/4. Em x = 8 temos o último salto. A FDP vai para 4/4. A probabilidade de X assumir valores menores ou iguais a 8 é de 100%. 1 0,75 0,5 0,25 0 0 1 2 3 4 5 6 7 8 9 10 x XV DISTRIBUIÇÃO DE BERNOULLI São de grande importância alguns tipos de experimento em que a variável de interesse pode assumir apenas dois valores. Podemos falar em sucessos e fracassos. Um exemplo é o lançamento de uma moeda. Temos dois resultados possíveis (cara e coroa). Podemos considerar que “cara” é sucesso e “coroa” é fracasso. Em casos assim, é comum atribuirmos ao sucesso o valor 1. E ao fracasso o valor zero. Seja X a variável aleatória que assume o valor 1 quando o resultado do lançamento da moeda é cara e que assume o valor 0 quando o resultado do lançamento é coroa. A variável aleatória X assume apenas os valores 0 e 1. É uma variável de Bernoulli. Além disso, X é também uma variável discreta (pois assume apenas alguns valores, quais sejam, 0 e 1). Caso a moeda seja honesta, então a probabilidade de sucesso é igual à probabilidade de fracasso (e ambas valem 50%). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 4 PROFESSOR VÍTOR MENEZES Mudemos de exemplo. Considere o lançamento de um dado de seis faces. Se sair um múltiplo de 3, consideramos sucesso. Se não sair um múltiplo de 3, consideramos fracasso. A nossa variável aleatória I, portanto, vai se comportar da seguinte forma. Se o resultado do lançamento do dado for 1, 2, 4, 5, teremos fracasso. Então I assume valor zero. Se o resultado do lançamento do dado for 3 ou 6, teremos sucesso. Então I assume valor 1. Dizemos que I é uma variável de Bernoulli. Ela tem a seguinte distribuição de probabilidade: I P 0 2/3 1 1/3 A probabilidade de I assumir o valor zero é 2/3. E a probabilidade de I assumir o valor 1 é 1/3. Variável de Bernoulli: assume apenas os valores 0 e 1. A probabilidade de a variável assumir o valor zero não necessariamente é igual à probabilidade de assumir o valor 1. A grande importância da variável de Bernoulli, em termos de concursos, é que ela serve pra gente estudar uma outra variável: a Binomial. EP 3 Considere a distribuição de probabilidades para a variável Y: Y Probabilidade 1 0,5 2 0,2 3 0,3 a) a variável Y é discreta ou contínua? b) a variável Y é uniforme? Por quê? c) a variável Y tem distribuição de Bernoulli? Por quê? EP 4 Considere a distribuição de probabilidades para a variável Z: Z Probabilidade 1,24 0,25 2 0,25 6,55 0,25 100 0,25 a) a variável Z é discreta ou contínua? b) a variável Z é uniforme? Por quê? c) a variável Z tem distribuição de Bernoulli? Por quê? www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 5 PROFESSOR VÍTOR MENEZES EP 5 Considere a distribuição de probabilidades para a variável K: K Probabilidade 0 0,5 1 0,5 a) a variável K é discreta ou contínua? b) a variável K é uniforme? Por quê? c) a variável K tem distribuição de Bernoulli? Por quê? EP 6 Considere a distribuição de probabilidades para a variável T: T Probabilidade 0 0,75 1 0,25 a) a variável T é discreta ou contínua? b) a variável T é uniforme? Por quê? c) a variável T tem distribuição de Bernoulli? Por quê? Resolução do EP 3. RESOLUÇÃO DOS EXERCÍCIOS PROPOSTOS Foi dada a seguinte distribuição de probabilidade. Y Probabilidade 1 0,5 2 0,2 3 0,3 A variável Y é discreta. Ela não pode assumir qualquer valor em um dado intervalo real. A variável Y não pode ser classificada como uniforme. Na variável discreta uniforme, as probabilidades de ocorrência de cada valor são todas iguais entre si. Não é o caso desta questão. A probabilidade de Y ser igual a 1 é maior que a probabilidade de Y ser igual a 2. A variável Y também não pode ser classificada como de Bernoulli. A variável Y não assume apenas os valores zero e 1. Portanto, não tem distribuição de Bernoulli. Resolução do EP 4. Foi dada a seguinte distribuição: Z Probabilidade 1,24 0,25 2 0,25 6,55 0,25 100 0,25 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 6 PROFESSOR VÍTOR MENEZES A variável Z assume apenas alguns valores (são apenas 4). Ela é uma variável discreta. Muita gente confunde isso. O fato de uma variável aleatória assumir valores não inteiros (como 1,24 ou como raiz de 2) não significa que ela seja contínua. Se a variável Z fosse contínua ela poderia assumir qualquer valor real contido num dado intervalo. Note que as probabilidades de todos os valores são iguais entre si (todas valem 1,25). A variável Z é, portanto, uniforme. Por outro lado, como ela não assume apenas os valores zero e 1, ela não pode ser classificada como de Bernoulli. Resolução do EP 5. Foi dada a seguinte distribuição de probabilidade: K Probabilidade 0 0,5 1 0,5 A variável K assume apenas alguns valores. Ela é discreta. Além disso, as probabilidades são todas iguais entre si (valem 0,5 cada uma). Podemos classificar a variável K como uniforme. Por fim, a variável K assume apenas os valores zero e 1. Isso faz com que ela, além de ser discreta uniforme, tenha distribuição de Bernoulli. Resolução do EP 6. T Probabilidade 0 0,75 1 0,25 A variável T é discreta. Contudo, não é uniforme, pois as probabilidades não são iguais entre si (a probabilidade de T ser igual a zero é maior que a probabilidade de T ser igual a 1). De modo diverso, T pode ser classificada como de Bernoulli, pois assume apenas os valores zero e 1. XVI DISTRIBUIÇÃO BINOMIAL 1 Introdução A distribuição binomial é aplicável quando temos vários experimentos independentes e, a cada um deles, associamos apenas dois resultados. Podemos pensar em resultados favoráveis e resultados desfavoráveis. Ou em sucessos e fracassos. Por exemplo: vamos lançar um dado. Vamos considerar um resultado favorável (sucesso) se sair um múltiplo de 3. Vamos considerar um resultado desfavorável (fracasso) se não sair um múltiplo de 3. Seja “I” a variável que, em caso de sucesso, assume o valor 1. E, em caso de fracasso, assume o valor zero. A cada lançamento, a probabilidade de ocorrer um evento favorável é de 1/3 (ou seja, a probabilidade de I = 1 é de 1/3). E a probabilidade de ocorrer um evento desfavorável é 2/3 (a probabilidade de I = 0 é 2/3). Como já vimos, “I” é uma variável de Bernoulli. Segue a distribuição de probabilidades da variável I: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 7 PROFESSOR VÍTOR MENEZES I Probabilidade 0 0,75 1 0,25 Muito bem, só que não vamos lançar o dado uma única vez. Vamos lançar o dado três vezes. A variável aleatória X vai representar o número de sucessos em três lançamentos. Um possível resultado dos três lançamentos seria: 2, 4, 3. Vamos ver como se comporta a variável “I” em cada um destes lançamentos. • 1º lançamento: 2 � I = 0 (tivemos um fracasso, pois não saiu um múltiplo de 3) • 2º lançamento: 4 � I = 0 (tivemos outro fracasso, pois não saiu um múltiplo de 3) • 3º lançamento: 3 � I = 1 (tivemos um sucesso, pois saiu um múltiplo de 3). Nesse caso, em três lançamentos, o número de casos favoráveis foi de 1 (X = 1). Se somarmos todos os valores que “I” assume, temos exatamente 1. Ou seja, “X” é igual à soma de todos os valores de “I”. Vamos mudar um pouco o exemplo. Suponhamos agora que os resultados dos três lançamentos foram: 3, 1, 6. Vamos ver como se comporta a variável I em cada lançamento: • 1º lançamento: 3 � I = 1 • 2º lançamento: 1 � I = 0 • 3º lançamento: 6 � I = 1 Nesse outro caso, em três lançamentos, o número de casos favoráveis foi de 2 (X=2). Se somarmos todos os valores que “I” assume, temos exatamente 2. Novamente, X é igual à soma de todos os valores de “I”. Esta variável X é dita binomial. Ela representa o número de casos favoráveis em um conjunto de experimentos que só admitem dois resultados possíveis (sucesso ou fracasso). Ela é a soma de várias variáveis de Bernoulli. Variável binomial: corresponde à soma de várias variáveis de Bernoulli. Tem relação com o número de resultados favoráveis em ‘n’ experimentos. É muito importante o candidato saber a fórmula da probabilidade da variável binomial. No nosso exemplo, a variável binomial X só pode assumir quatro valores (0, 1, 2 e 3). São três lançamentos do dado. Ou não temos nenhum sucesso. Ou apenas 1. Ou 2. Ou então, em três lançamentos, temos três sucessos (múltiplos de 3 em todos os lançamentos). Vamos calcular a probabilidade de X assumir cada um desses valores. Para X ser igual a zero, precisamos que, nos três lançamentos, tenhamos números que não são múltiplos de 3. Queremos que ocorram, simultaneamente, os três eventos: • Fracasso no primeiro lançamento • Fracasso no segundo lançamento www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 8 PROFESSOR VÍTOR MENEZES • Fracasso no terceiro lançamento Observe que o resultado de um lançamento não tem qualquer influência no resultado dos demais lançamentos. São três eventos independentes. Todos eles têm probabilidade de 2/3 de ocorrer. Nesse caso, como já vimos na aula passada, a probabilidade da intersecção dos eventos é igual ao produto das probabilidades. P( X = )0 = 2 2× 2× 33 3 P( X = )0 3 = � 2 � � � � 3 � Para X ser igual a 1, precisamos ter exatamente 1 lançamento com sucesso. Temos as seguintes hipóteses: • Sucesso no primeiro lançamento, fracasso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, sucesso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, fracasso no segundo lançamento, sucesso no terceiro lançamento. Vamos ver a probabilidade para o primeiro caso. Temos: • Sucesso no primeiro lançamento • Fracasso no segundo lançamento • Fracasso no terceiro lançamento São três eventos independentes. O primeiro tem probabilidade 1/3. Os demais têm probabilidade de 2/3 de ocorrer. A probabilidade da intersecção fica: 1 × 2 × 2 33 3 Para os demais casos, a conta é exatamente a mesma. Ou seja, a probabilidade de X ser igual a 1 fica: P( X = )1 = 3 × � 1 × 2 × 2 � 3� 3 3 � Para X ser igual a 2, precisamos de dois sucessos e um fracasso. Temos as seguintes hipóteses: • Sucesso no primeiro lançamento, sucesso no segundo lançamento, fracasso no terceiro lançamento; • Fracasso no primeiro lançamento, sucesso no segundo lançamento, sucesso no terceiro lançamento; • Sucesso no primeiro lançamento, fracasso no segundo lançamento, sucesso no terceiro lançamento. Vejamos a probabilidade da primeira hipótese. São três eventos independentes. A probabilidade de sucesso é 1/3. A de fracasso é 2/3. Ficamos com: 1 × 1 × 2 33 3 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 9 PROFESSOR VÍTOR MENEZES Para as demais hipóteses, as contas são análogas. A probabilidade de X ser igual a 2 fica: P( X = )2 = 3 × � 1 × 1 × 2 � 3� 3 3 � 2 × � == � × � 2 � P( X )2 3 � 1 � � � � 3 � � 3 � Finalmente, para X ser igual a 3, precisamos de sucessos nos três lançamentos. Ficamos com: × × 1 = = � � P( X )3 1� 1 � 3� 3 3 � Pronto. Calculamos as probabilidades de X assumir cada um dos valores possíveis. Seja ‘n’ o número de experimentos. Seja ‘p’ a probabilidade de sucesso em cada experimento. Seja ‘q’ a probabilidade de fracasso. Nesse nosso exemplo, lançamos o dado 3 vezes (n = 3). E a probabilidade de sucesso em cada lançamento era de 1/3 (p = 1/3). A probabilidade de fracasso em cada experimento era de 2/3 (q = 2/3). Para não precisarmos ficar fazendo todas essas contas que fizemos acima para cada problema diferente, existe uma fórmula que indica a probabilidade da variável binomial assumir um dado valor. É a que segue: P( X � n � = k ) = × p k × q n−k� k � � � � Não custa relembrar o significado do símbolo de combinação que vimos na aula passada: � n � = !n � (n − k )!×k! �k � � � Vamos ver a aplicação da fórmula ao nosso exemplo do dado. Lançamos o dado três vezes (n=3). Consideramos sucesso se der múltiplo de 3. Assim, a probabilidade de sucesso é 1/3 (p=1/3) e a probabilidade de fracasso é 2/3 (q=2/3). Vamos calcular, a título de exemplo, a probabilidade de X ser igual a 2 (k=2). P( X � n � = k ) = × p k × q n−k� k � � � � ( 2) 2 3 � × 1 � × � 2 � 3−2 XP = �= � � � � � � � 3 � �2 � � � 3 � � ( ) 2 2 !3 × � 1 � × � 2 � 3−2 2 = 3 × � 1 � 1 × � 2 � XP = = �� � � �� � � !1× !2 � 3 � � 3 � � 3 � � 3 � Que é o mesmo resultado que tínhamos achado antes, sem a fórmula. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 10 PROFESSOR VÍTOR MENEZES Lembrete de variável binomial Seja X nossa variável binomial. Ela representa o número de sucessos em “n” experimentos (onde cada experimento pode resultar em sucesso ou em fracasso). A fórmula da variável binomial é a que segue. A probabilidade de termos k sucessos em n experimentos é: P( X � n � = k ) = × p k × q n−k� k � � � � Onde p é a probabilidade de sucesso em cada experimento e q é a probabilidade de fracasso em cada experimento. Vamos praticar um pouco. EP 7 Qual a probabilidade de lançarmos uma moeda três vezes e obtermos exatamente duas caras? RESOLUÇÃO DO EP 7. Vamos considerar que cada lançamento é um experimento. O sucesso é sair cara. O fracasso é sair coroa. A probabilidade de sucesso é igual à de fracasso que é igual a 50%. p = q = 0 5, São três experimentos. n = 3 Queremos que X assuma valor 2 (queremos dois sucessos). k = 2 A probabilidade fica: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )2 = � 3 � × 0 5, � 2 � � � 2 × 0 5, 3−2 � P( X = )2 = !3 × 0 5, !2 × !1 2 × 0 5, 3−2 P( X = )2 = 3 × 0 5, 2 × 0 5, 1 = 3 8 EC 1 Analista Previdenciário Pleno – Área estatística – Paraná Previdência/2002. [CESPE] Parte das atribuições do analista previdenciário é a participação na elaboração de sistemas de informações previdenciárias. As informações, em geral, vêm de diversas www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 11 PROFESSOR VÍTOR MENEZES fontes. É importante que um sistema de informações forneça com detalhes todo o processo metodológico, desde a obtenção dos dados até a sua disponibilização para o usuário final. Para assegurar a fidedignidade dos dados, as possíveis fontes de erros devem ser monitoradas e os erros, quando detectados, devem ser corrigidos. Nesse sentido, considere por hipótese, que o departamento DDD de determinada empresa deva coletar e enviar diariamente um conjunto de informações para a previdência. Ao longo do procedimento de envio dessas informações, há várias situações problemáticas, como dificuldades de transmissão dos dados, perda acidental de dados, atraso na coleta dos dados etc. Suponha que, ocorrendo uma dessas situações problemáticas, uma nova tentativa seja feita apenas no dia seguinte. Suponha ainda que, em 1.000 dias, um relatório gerencial tenha apresentado os seguintes resultados. Situação Quantidade de ocorrências em dias Impossibilidade de coleta das informações dentro do prazo 300 Problema na transmissão dos dados coletados 140 Problema na recepção dos dados transmitidos 56 Julgue o item seguinte, com base na situação hipotética descrita acima. 1. Assumindo-se independência entre os dias e que as probabilidades permaneçam constantes ao longo do tempo, a probabilidade de haver sucesso na coleta das informações nos dois dias seguintes aos 1.000 dias de observação é superior a 0,50. Questão do CESPE. De cada 1000 dias, em 300 temos fracassos (impossibilidade de coleta da informação dentro do prazo). Portanto, em 700 dias nós temos sucessos (sucesso na coleta das informações). Vamos considerar que em cada dia nós temos um experimento. Se num dado dia a informação foi coletada, temos sucesso. Do contrário, se não foi possível coletar a informação, temos um fracasso. Seja “I” a variável que assume o valor zero em caso de fracasso, e assume o valor 1 em caso de sucesso. A distribuição de probabilidade da variável “I” fica: I Probabilidade 0 0,7 1 0,3 Pois bem, só que a coleta não é feita num único dia. O enunciado descreve uma situação em que a coleta é feita por dois dias. Seja X o número de sucessos nesses dois dias. X é uma variável binomial, em que a probabilidade de sucesso é 0,7 e a probabilidade de fracasso é 0,3. · p = 0,7 · q = 0,3 São dois experimentos (são dois dias). Portanto, n = 2. Queremos que nossa variável assuma o valor 2 (queremos que o número de sucessos seja 2). Logo, k = 2. · n = 2 · k = 2 Aplicando a fórmula: P( X � n � = k ) = × p k × q n−k� k � � � � www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 12 PROFESSOR VÍTOR MENEZES P( X = )2 = � 2 � × ( )0 7, � 2 � � � 2 × ( ,0 )3 2−2 � P( X = )2 = !2 × ( )0 7, !2 × !0 2 × ( ,0 )3 0 P( X P( X = )2 = )2 = 1× ( )0 7, = ,0 49 2 ×1 A probabilidade procurada é inferior a 0,5. O item está errado. EC 2 Analista de Meio Ambiente e de recursos hídricos – Área estatística ou matemática. SEAMA/ES – 2007. [CESPE] X Classificação Probabilidade 80 < X ≤ 100 Ótima/muito 80 boa 40 < X ≤ 80 Boa/aceitável 15 0 < X ≤ 40 Imprópria 5 Com base nas informações da tabela acima, em que são dadas a distribuição e a classificação do índice de qualidade da água (X), instrumento para avaliação das condições bacteriológicas e físico-químicas de um corpo d’água, julgue os itens seguintes. 1. Considere-se uma amostra aleatória simples de índices X1, X2 e X3. Neste caso, a probabilidade de que exatamente dois desses índices resultem na classificação da água como ótima ou muito boa é inferior a 0,5. 2. Na situação considerada, X é uma variável aleatória discreta e assimétrica. Outra questão do CESPE. Temos costumeiramente designado por X a variável binomial. Como neste exercício já existe uma outra variável X (que indica o índice de qualidade da água) vamos chamar a nossa variável binomial de Y. Primeiro item. A variável binomial Y vai indicar o número de ocorrências de sucesso. O sucesso (ou caso favorável) acontece se o índice de qualidade da água for maior que 80 (=água classificada como ótima ou muito boa). São três experimentos (n = 3). Queremos que em dois deles o resultado seja favorável (k = 2). A probabilidade de sucesso é 80% (basta consultar a tabela fornecida). Portanto, p = 0,8. A probabilidade de fracasso é 20%. Portanto, q = 0,2. · n = 3 · k = 2 · p = 0,8 · q = 0,2 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 13 PROFESSOR VÍTOR MENEZES Aplicando a fórmula: P Y( � n � = k ) = × p k × q n−k� k � � � � P(Y = )2 = � 3 � × 0 8, � 2 � � � 2 × ,0 23−2 � P(Y = )2 = !3 × 0 8, !1× !2 2 × ,0 23−2 P(Y = )2 = 3 × 0 8, P(Y = )2 = 0 384, 2 × ,0 21 A probabilidade procurada é inferior a 0,5. O primeiro item está correto. O segundo item é bom pra revisarmos o conceito de variável discreta. Repare que a variável X pode assumir qualquer valor real no intervalo de 0 a 100. Portanto, é uma variável contínua. O item está errado. EC 3 Auditor Fiscal/MG – 2005 [ESAF]. Suponha que a probabilidade de que se encontre um erro contábil grave em uma auditoria seja 0,2. Se dez auditorias independentes são realizadas, assinale a opção que dá a probabilidade de que não mais do que uma detecte erro contábil grave. a) 2 8, × 4 / 5 b) 0,400 c) 0,210 d) 2 8, e) 2 8, × ( )4 / 5 10 × ( )4 / 5 9 Questão da ESAF. Podemos pensar que cada auditoria é um experimento. Em cada experimento, o sucesso ocorre quando é encontrado um erro grave. Queremos que o número de sucessos seja zero ou 1. Podemos dividir o problema em duas partes. Primeiro: calculando a probabilidade de termos zero sucessos (k = 0). · n = 10 · p = 0,2 · q = 0,8 · k = 0 A probabilidade fica: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 14 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )0 = �10 � ,0 20 × ,0 108 −0 × �� � � 0� P( X P( X = )0 = )0 = 1×1× ,0 108 −0 = ,0 108 Segundo: calculando a probabilidade de termos um sucesso (k=1). · n = 10 · p = 0,2 · q = 0,8 · k = 1 A probabilidade fica: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )1 = �10 � ,0 21 × ,0 108 1− × �� �1 � � P( X P( X = )1 = )1 = 10 × ,0 21 × 0 8, 9 = 10 × ,0 21 × 0 8, 9 P( X = )1 = 2 × 0 8, 9 Somando as duas probabilidades, ficamos com: P( X = 0 � X = )1 = ,0 108 + 2 × 0 8, 9 P( X = 0 � X = )1 = 0 8, 9 × (0 8, + )2 Lembrando que 0 8, = 4 / 5 , temos: P( X = 0 � X = )1 = 4 / 59 × ( ,2 )8 Resposta: E. EC 4 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] Um procedimento de controle de qualidade foi planejado para garantir o máximo de 5% de itens defeituosos na produção. A cada 20 minutos sorteia-se uma amostra aleatória de 10 itens e, havendo mais de 10% defeituosos, nesta amostra, interrompe-se a produção para verificação. A probabilidade de uma interrupção desnecessária é: a) 1 − ,0 1095 b) 1 − ,1 45 × 0 95, 9 c) ,0 1005 d) 9 × 0 05, 9 × 0 95, www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 15 PROFESSOR VÍTOR MENEZES e) 1 − 0 5, × 0 95, 9 Não gostei muito da redação do exercício não. O que a questão quis dizer foi o seguinte. Suponha que o percentual de itens defeituosos seja, realmente, de 5%, exatamente o máximo aceitável pela equipe de controle de qualidade. Nessa situação, qualquer interrupção será desnecessária (eis que a qualidade desejada estaria sendo obedecida). Nesse contexto, qual a probabilidade de uma interrupção desnecessária? Ou seja, qual a probabilidade de, em uma amostra de 10 itens, termos dois ou mais defeituosos? Podemos considerar que a análise de cada item da amostra seja um experimento. Temos 10 experimentos (n=10). Vamos considerar sucesso quando o item analisado é defeituoso. E vamos considerar fracasso quando o item analisado não é defeituoso. Certamente vocês vão estar se perguntando: como pode chamar de sucesso um item defeituoso? E aí vale lembrar da observação que fizemos logo no comecinho aula 5. A nomenclatura sucesso/fracasso (ou caso favorável/desfavorável) não traz nenhum juízo de valor sobre o que é bom ou ruim, certo ou errado. Apenas serve para distinguir os resultados em que estamos interessados daqueles que não são de nosso interesse. Neste exercício, o interesse recai sobre os itens defeituosos. É sobre eles que atua o controle de qualidade. Por isso estou chamando de sucesso ao fato do item analisado ser defeituoso. A cada item analisado temos um experimento. Em cada experimento, a probabilidade de sucesso (item defeituoso), é de 5%. A probabilidade de termos zero itens defeituosos é: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )0 = �10 � × 0 05, 0 × ,0 10 95 −0 = ,0 1095 � � 0 � � � A probabilidade de termos 1 item defeituoso é: P( X = )1 = �10 � × ,0 10 5 × ,0 1095 1− = 10 × 0 05, × 0 95, 9 = 0 5, × 0 95, 9 � �1 � � � A probabilidade de termos zero ou item defeituoso é: P( X = 0 � X = )1 = P( X = )0 + P( X = )1 = ,0 10 95 + 0 5, × 0 95, 9 A interrupção na produção ocorrerá se X for maior que 1. Logo, a probabilidade de interrupção corresponde à probabilidade de X ser maior que 1. P( X > )1 = 1 − ( ,0 10 95 + 0 5, × 0 95, 9 ) Vamos separar o 0,9510 em duas partes: 0 95, 10 = 0 95, 9 × 0 95, P( X > )1 = 1 − (0 95, 9 × 0 95, + 0 5, × 0 95, 9 ) www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 16 PROFESSOR VÍTOR MENEZES Colocando o 0,959 em evidência: P( X > )1 = 1 − 0 95, 9 (0 95, + 0 5, ) P( X > )1 = 1 − 0 95, 9 × ,1 45 Resposta: B. EC 5 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] A probabilidade de sucesso em um experimento aleatório é p. Seja X o número de experimentos independentes realizados até se obter o primeiro sucesso. Qual a probabilidade de X = k, onde k=1,2,3,.... a) (1-p)k-1. b) p(1-p)k-1. c) k pk-1(1-p). d) pk-1(1-p). e) k(1-p)k-1 p. Cuidado para não confundir. Nesse caso, X não é uma variável binomial. X não representa o número de sucessos em ‘n’ experimentos. X representa quantos experimentos são realizados até que se obtenha o primeiro sucesso. São feitos k experimentos. Em cada experimento, a probabilidade de sucesso é ‘p’. A probabilidade de fracasso é ‘1- p´. Seja I a variável que, em cada experimento, assume o valor zero em caso de sucesso e o valor 1 em caso de fracasso. Para que X seja igual a k, deve ocorrer a seguinte situação: • primeiro experimento: fracasso � I = 0 • segundo experimento: fracasso � I = 0 • terceiro experimento: fracasso � I = 0 • ... • No experimento de número k-1: fracasso � I = 0 • No experimento de número k: sucesso � I = 1 Nos k-1 primeiros experimentos, temos fracasso. No último experimento, temos um sucesso. Para que X seja igual a k, queremos que ocorram k-1 fracassos e 1 sucesso, nesta seqüência. Como todos esses eventos são independentes, a probabilidade da intersecção é igual ao produto das probabilidades. P( X = k ) = 1( − p) k −1 × p Resposta: B. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 17 PROFESSOR VÍTOR MENEZES EC 6 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja X uma variável aleatória discreta com função de probabilidade binomial f ( x) , onde (f k ) = Cn,k p x 1( p− ) n −k e Cn,k é o número de combinações de n elementos tomados k a k. Sendo n=6 e p=1/3, determine f(6). a) 1/729 b) 1 c) 0 d) 64/729 e) 8/729 Temos uma variável binomial. O exercício pediu para calcularmos a probabilidade de X=6. Basta aplicar a fórmula que vimos (e que o próprio exercício forneceu). P( X � n � = k ) = × p k × q n−k� k � � � � XP = = � − � 6� � × 1( ( )6 / )3 6 × (2 / )3 6 6 = 1( / )3 6 = 1 / 729 � 6 � � Resposta: A. EC 7 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja F(k) a função de distribuição da variável aleatória definida na questão anterior, determine F(0). a) 0 b) 1/729 c) 64/729 d) 243/729 e) 1. A função de distribuição nos fornece a probabilidade de X ser menor ou igual a um dado valor k. Se k=0, a função nos dirá qual a probabilidade de X ser menor ou igual a zero. Como X é uma variável binomial, ela só assume valores maiores ou iguais a zero. Lembrem-se de que a variável binomial tem relação com o número de casos favoráveis em um número ‘n’ de experimentos (não dá pra ter, por exemplo, menos dois casos favoráveis). Assim, F(0) corresponde à probabilidade de X=0. Aplicando a fórmula: P( X � n � = k ) = × p k × q n−k� k � � � � XP = = � − � 6� � × 1( ( )0 / )3 0 × (2 / )3 6 0 = (2 / )3 6 = 64 / 729 � 0 � � Resposta: C. EC 8 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 18 PROFESSOR VÍTOR MENEZES Seja X a soma de ‘n’ variáveis aleatórias independentes de Bernoulli, isto é, que assumem apenas os valores 1 e 0 com probabilidades p e 1-p, respectivamente. Assim, a distribuição de X é: a) binomial com parâmetros “n” e “p” b) gama com parâmetros “n” e “p” c) qui quadrado com “n” graus de liberdade d) laplace e) “t” de student com n-1 graus de liberdade Resposta: A. 2 Média e variância da variável binomial Vamos continuar com o lançamento do dado. O resultado é considerado favorável se sair um múltiplo de 3. É desfavorável se não sair um múltiplo de 3. Vamos lançar o dado 3 vezes. Nossa variável aleatória X vai representar o número de casos favoráveis nesses lançamentos. É, portanto, uma variável binomial. Vamos calcular a probabilidade de X assumir cada valor. Já até fizemos essa conta quando começamos a estudar a variável binomial. Mas ok, vamos lá de novo. Para X assumir valor zero, precisamos que os três lançamentos sejam desfavoráveis. · n = 3 · k = 0 · p = 1/3 · q = 2/3 ( 0) 0 3 � × 1 � × � 2 � 3−0 XP = �= � � � � � � � 3 � �0� � � 3 � � ( )0 0 !3 × � 1 � × � 2 � 3−0 = 8 XP = = �� � � !3 × !0 � 3 � � 3 � 27 Para X assumir valor 1, precisamos que exatamente um dos três lançamentos resulte em múltiplo de 3. · n = 3 · k = 1 · p = 1/3 · q = 2/3 ( )1 1 !3 × � 1 � × � 2 � 3 1− 1 = 3 × � 1 � 2 × � 2 � = 12 XP = = �� � � �� � � !2 × !1 � 3 � � 3 � � 3 � � 3 � 27 Para X assumir o valor 2, precisamos que exatamente dois dos três lançamentos resultem em múltiplo de 3. · n = 3 · k = 2 ESTATÍSTICA P/ ICMS-SP 19 PROFESSOR VÍTOR MENEZES · p = 1/3 · q = 2/3 ( )2 2 !3 × � 1 � × � 2 � 3−2 2 = 3 × � 1 � 1 × � 2 � = 6 XP = = �� � � �� � � !1× !2 � 3 � � 3 � � 3 � � 3 � 27 Por fim, para X assumir o valor 3, precisamos que todos os lançamentos resultem em múltiplo de 3. · n = 3 · k = 3 · p = 1/3 · q = 2/3 ( )3 3 !3 × � 1 � × � 2 � 3−3 3 = 1× � 1 � 0 × � 2 � = 1 XP = = �� � � �� � � !0 × !3 � 3 � � 3 � � 3 � � 3 � 27 Queremos calcular a média desta variável aleatória. Vimos como fazer isto na aula passada. Basta considerarmos que as probabilidades são freqüências relativas. PX X × P 0 8/27 0 1 12/27 12/27 2 6/27 12/27 3 1/27 3/27 Total 1 1 E a média da nossa variável X fica: μ = 1 = 1 1 Vamos agora calcular a sua variância. X e 2 P e 2 × P E a variância de X seria: σ 2 = 18 = 2 0 1 8/27 8/27 1 0 12/27 0 2 1 6/27 6/27 3 4 1/27 4/27 Total 1 18/27 27 3 Só que todo esse passo a passo dá muito trabalho. Quando X for uma variável aleatória binomial, um jeito mais rápido de calcular a sua média e sua variância é: μ = np σ 2 = npq Para calcular a média, basta multiplicar o número de experimentos (no nosso caso, lançamos o dado três vezes, n = 3) pela probabilidade de sucesso em um experimento (neste caso, em um lançamento, a probabilidade de sair um múltiplo de 3 é 1/3). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 20 PROFESSOR VÍTOR MENEZES Logo: μ = np μ = 3 × 1 = 1 3 E para variância fazemos a mesma coisa. Só que, além dos passos acima, multiplicamos pela probabilidade de fracasso em um experimento (neste caso, em um lançamento, a probabilidade de sair um número que não seja múltiplo de 3 é 2/3). σ 2 = npq σ 2 = 3 × 1 × 2 = 2 33 3 Outro exemplo. EP 8 Seja X o número de resultados “coroa” em cinco lançamentos de uma moeda honesta. Calcule a média e a variância de X. RESOLUÇÃO DO EP 8. A cada lançamento da moeda, podemos ter um sucesso (sair coroa) ou um fracasso (sair cara). A variável X está relacionada com o número de sucessos. Portanto, é uma variável binomial. Temos as seguintes informações: · n = 5 (são 5 experimentos, ou cinco lançamentos da moeda) · p = 0,5 (a probabilidade de sucesso é 50%) · q = 0,5 (a probabilidade de fracasso é 50%) A média fica: μ = np μ = 5 × 0 5, = 2 5, . A variância é dada por: σ 2 = npq σ 2 = n × p × q = ,1 25 O que isto significa? Significa que, se fosse possível repetir este experimento inúmeras vezes (ou seja, se fosse possível fazer infinitas vezes a seqüência de 5 lançamentos da moeda), em média, obteríamos 2,5 coroas para cada seqüência de 5 lançamentos. Não estamos dizendo que, para um dado conjunto de 5 lançamentos, serão obtidas 2,5 coroas. Pra falar a verdade, isso é impossível (não dá para obter um número “quebrado” de coroas; não faz sentido dizer que obtivemos meia coroa). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 21 PROFESSOR VÍTOR MENEZES Podemos pensar o seguinte. Por cem mil vezes nós fazemos os 5 lançamentos. Observem que cem mil é um número bem grandão. Em cada um destes cem mil conjuntos de 5 lançamentos, nós anotamos quantas caras foram obtidas (= valor de X, que pode variar de zero a 5). Obteremos cem mil valores para X. A média de todos esses cem mil valores de X será bem próxima de 2,5. É isto que estamos dizendo. E mais: quanto mais aumentarmos o número de experimentos, mais a média de X se aproxima de 2,5. O mesmo vale para a variância. A variância destes cem mil valores de X será bem próxima de 1,25. Média e variância da variável binomial μ = np σ 2 = npq 3 Proporções A distribuição binomial é muito aplicada quando estamos interessados em proporções de uma dada população. Considere uma cidade com 100.000 habitantes. Sabemos que 2/5 deles são favoráveis a uma dada política urbana. Ou ainda: a proporção de habitantes favoráveis à política urbana é de 40%. Vamos entrevistar cinco pessoas ao acaso. A nossa variável aleatória X vai designar o número de pessoas entrevistadas que são favoráveis à política urbana. Primeiramente, vamos supor que nosso processo ocorre com reposição. Como assim? O que significa “processo com reposição”? Listamos todas as pessoas. Sorteamos uma. Entrevistamos tal pessoa. E o nome dela volta para a lista, podendo ser sorteada novamente. A nossa variável X pode assumir os valores 0, 1, 2, 3, 4, 5. É um caso análogo ao lançamento do dado. São cinco experimentos independentes e, em cada um deles, a probabilidade de ocorrer o resultado favorável é de 2/5. Como X designa o número de pessoas favoráveis à política (= número de sucessos), X é uma variável binomial. Assim, temos: · n = 5 (número de experimentos) · p = 2/5 (probabilidade de resultado favorável em um experimento – é o mesmo valor da proporção de pessoas favoráveis à política) · q = 3/5 (probabilidade de resultado desfavorável em um experimento) A probabilidade de X assumir cada um dos valores possíveis é dada abaixo: X P 0 0,07776 1 0,2592 2 0,3456 3 0,2304 4 0,0768 5 0,01024 Todos os valores acima foram calculados com a fórmula da variável binomial dada abaixo. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 22 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � É por isso que a proporção está relacionada com a variável binomial. Ela tem relação com a probabilidade de sucesso e fracasso (valores de p e q). Vamos agora mudar um pouco o exemplo. Poderíamos fazer a entrevista de um modo um pouco diferente. Podemos fazer um experimento sem reposição, o que é até mais comum. Não queremos entrevistar a mesma pessoa duas vezes. Uma vez que um nome é sorteado, ele não volta para lista, de modo que uma pessoa jamais poderia ser sorteada mais de uma vez. Neste caso, não temos mais uma variável binomial. Continuamos tendo cinco experimentos. Só que eles não são mais independentes entre si (e, para termos variável binomial, os n eventos têm que ser independentes). A probabilidade de, no segundo experimento, ser entrevistada uma pessoa favorável à política urbana depende do resultado do primeiro experimento. São 100.000 habitantes. 40.000 são favoráveis à referida política. 60.000 são contrários. Suponhamos que a primeira pessoa entrevistada foi favorável à política. Entrevistada a primeira pessoa, a situação é a seguinte: · temos agora 99.999 pessoas · restaram 39.999 favoráveis à política A probabilidade de a segunda pessoa também ser favorável é: 39.999/99.999. Este número é diferente de 2/5. De outro modo, se a primeira pessoa foi contrária à referida política, temos: · 99.999 pessoas ainda restam com chances de serem entrevistadas · todas as 40.000 favoráveis à política ainda podem ser entrevistadas A probabilidade da segunda pessoa ser favorável é: 40.000/99.999, que também é diferente de 2/5. Notem que a probabilidade de sucesso e fracasso no segundo experimento (na segunda entrevista) depende do resultado do experimento anterior. Ou seja, os experimentos não são independentes. Conclusão: não temos uma variável binomial. Mesmo nossa variável não sendo exatamente binomial, obedecidas algumas condições, podemos considerá-la aproximadamente binomial. É exatamente o caso acima. Para ficar mais claro, vamos para uma situação extrema. Suponha que as quatro primeiras pessoas entrevistadas foram favoráveis à política. Qual a probabilidade da quinta pessoa também ser? · restam 99.996 pessoas · destas, 39.996 são favoráveis à política urbana Portanto, a probabilidade procurada é: 39.996/99.996 = 0,399976. Este número é muito próximo de 2/5 (=0,4). A proximidade é tanta que podemos considerar que esta distribuição é praticamente binomial. Ou seja, mesmo que não haja reposição, podemos considerar que, a cada novo entrevistado, a probabilidade de a pessoa ser favorável à política urbana é de 2/5. Isto porque, mesmo na situação extrema acima, o valor obtido ainda foi muito próximo de 2/5. Utilizaremos esta propriedade nas próximas aulas. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 23 PROFESSOR VÍTOR MENEZES Então, resumindo, temos que: • a variável binomial é útil para estudarmos proporções • as probabilidades de sucesso e fracasso têm relação com a proporção de ocorrência de um dado fenômeno/resultado/valor/etc. Vejamos praticar um pouco. EC 9 Prefeitura Municipal de Vila Velha – Técnico de Nível Superior. Área estatística. [CESPE] Determinado fornecedor informou que 5% dos produtos comercializados por ele apresentam algum tipo de defeito. Uma prefeitura efetuará uma compra desse fornecedor de um grande lote desses produtos. Como parte do procedimento de controle de qualidade dessa prefeitura, uma amostra aleatória de dez produtos do lote enviada pelo fornecedor será retirada. O lote só será aceito pela prefeitura se a amostra não apresentar produtos defeituosos. Caso a amostra apresente um ou mais produtos defeituosos, todo o lote será devolvido ao fornecedor. Com base nas informações apresentadas nessa situação hipotética, julgue os itens que se seguem. 1. A probabilidade de um lote ser devolvido é superior a 0,25. 2. A variância do número de produtos defeituosos na amostra é inferior a 0,40. 3. A moda da distribuição do número de produtos defeituosos na amostra é igual a 1. Questão do CESPE. A questão envolve proporção. Proporções estão relacionadas com variáveis binomiais. Seja X o número de produtos defeituosos na amostra. X é uma variável binomial. A probabilidade de sucesso é igual a 5% (probabilidade de um dado item ser defeituoso). A probabilidade de fracasso é 95%. Não custa nada relembrar o comentário que já fizemos na aula passada. Estamos interessados nos produtos defeituosos. Por isso, associamos a eles os casos favoráveis (ou sucessos). Não estamos fazendo qualquer juízo de valor. Até porque, em regra, um produto defeituoso não é algo bom. Mesmo assim, chamamos de casos favoráveis, pois neles é que estamos interessados. Continuando com o exercício. A probabilidade de sucesso coincide com a proporção de produtos defeituosos fabricados pelo fornecedor. No item 1, queremos calcular a probabilidade de X assumir algum dos valores: 1, 2, 3, 4, ..., 10. Isto porque se houver um ou mais produtos defeituosos, o lote será devolvido. Assim, se o número de produtos defeituosos (=X) não for zero, isto é, se nem todos os produtos funcionarem, o lote não será aceito. Lembrando a fórmula de cálculo vista no começo da aula: P( X � n � = k ) = × p k × q n−k� k � � � � Teríamos que aplicar esta fórmula dez vezes. Uma vez para X = 1. Outra para X = 2. Outra para X = 3. E assim por diante, até X = 10. Só que isto dá muito trabalho. É mais fácil fazer o seguinte. Em vez de calcularmos a probabilidade do lote se devolvido, vamos calcular a probabilidade do lote ser aceito. Para que o lote seja aceito, todos os produtos devem estar funcionando. Ou seja, queremos calcular a probabilidade de X ser igual a 0. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 24 PROFESSOR VÍTOR MENEZES P( X = )0 = �10 � × 0 5, 0 × ,0 1095 � � � �0 � P( X P( X = )0 = )0 = !10 × 0 ( !10 ) × !0 5, = ,0 1095 0 × ,0 1095 P( X = )0 = 0 598737, Percebeu a diferença? Precisamos aplicar a fórmula uma só vez. Foi muito menos trabalhoso. A probabilidade do lote ser aceito é de 59,87%. Portanto, a probabilidade de ele ser devolvido é de 40,13%. O item está correto, pois a probabilidade de devolução é superior a 25%. Na versão da prova que eu tenho não consta nenhuma tabela de valores do tipo a b . Algo que permitisse que não fizéssemos a conta ,0 10 95 . Talvez, para esta prova, tenha sido distribuído calculadora. Isto porque não é típico do CESPE fazer os candidatos perderem tempo com contas. Caso não tenha sido fornecida calculadora, nem qualquer tabela que agilizasse as contas, destaco que não era necessário fazer o cálculo ,0 10 95 para responder à questão. Não se pediu a probabilidade do lote ser devolvido. Apenas precisávamos saber se a probabilidade de devolução do lote era maior ou menor que 0,25. Como descobrir se o item é falso ou verdadeiro, sem calculadora? É só adotar o seguinte procedimento: Partimos do valor 1. De 1, retiramos 5%. Ficamos com 0,95. Do valor 0,95, retiramos 5% (de 0,95). Ficamos com 0,9025. Do valor 0,9025 retiramos 5% (de 0,9025). Ficamos com 0,857375. Se repetirmos isto por 10 vezes, o valor final obtido será ,0 1095 . Isto porque retirar 5% é o mesmo que multiplicar por 0,95. Portanto, a conta que fizemos foi multiplicar o valor 1 por 0,9510. Pois bem, em vez de retirarmos 5% (o que dá muito trabalho, pois envolve contas de multiplicação), vamos retirar 0,025. Partimos do valor 1. Retiramos 0,025. Ficamos com 0,975. Do valor 0,975, retiramos 0,025. Ficamos com 0,95. Do valor 0,95, retiramos 0,025. Ficamos com 0,925. Se repetirmos isto dez vezes, o valor final obtido será 0,75. Em cada vez que retiramos 0,025, na verdade, nós retiramos menos que 5% do respectivo valor base. Portanto, o valor 0,75 é certamente maior que ,0 1095 . www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 25 PROFESSOR VÍTOR MENEZES Concluímos que: 0 95, 10 < 0 75, Nós queremos calcular a probabilidade do lote ser devolvido. Ou seja, queremos 1 − ,0 1095 . Partindo da desigualdade 0 95, 10 < 0 75, , ficamos com: 0 95, 10 < 0 75, � 0− 95, 10 > 0 − 75, − 0 95, 10 > 0 − 75, � 1 − 0 95, 10 > 1 − 0 75, 1 − 0 95, 10 > 1 − 0 75, � 1 − 0 95, 10 > ,0 25 Portanto: 1 − 0 95, 10 > ,0 25 Ou seja, mesmo sem calculadora, temos como afirmar que a referida probabilidade é superior a 25%. Este método é interessante por descartar as multiplicações, o que torna mais rápida a solução. Vamos para o segundo item. Pede-se a variância de uma variável binomial. Basta aplicar a fórmula. σ 2 = npq São 10 elementos na amostra. n = 10 Chamando a probabilidade de um produto ser defeituoso de p, temos: p = 0 05, q = 1 − p = 0 95, E a variância fica: σ 2 = 10 × 0 05, σ 2 = ,0 475 . × 0 95, A variância não é inferior a 0,40. O item está errado. Vamos ao terceiro item. Afirma-se que a moda da distribuição do número de produtos defeituosos é igual a 1. Nós vimos que a moda é o termo que mais se repete. Quando temos uma seqüência de números, a moda é o termo que tem maior freqüência. No caso de variável aleatória, temos probabilidades no lugar de freqüências. Vimos na aula anterior que a probabilidade corresponde à freqüência relativa que seria obtida num número muito grande de experimentos. Pois bem, para que um número seja a moda, a probabilidade de ele ocorrer tem que ser maior que a probabilidade de ocorrer qualquer outro número. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 26 PROFESSOR VÍTOR MENEZES Para que a moda seja 1, a probabilidade de X ser igual a 1 tem que ser maior que a probabilidade de X assumir qualquer outro valor. Vamos calcular a probabilidade de X ser igual a 1. P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )1 = �10 � × ,0 10 5 × 0 95, 9 � � � �1 � P( X = )1 = !10 × ,0 105 !1× !9 × 0 95, 9 P( X = )1 = 10 × ,0 10 5 × 0 95, 9 P( X = )1 = 0 3151, No primeiro item, vimos que a probabilidade de X assumir o valor zero é igual a 59,87%. A probabilidade de X assumir o valor 1 é 31,51%. Portanto a moda não é 1. Há pelo menos um valor cuja probabilidade é superior à probabilidade de 1 ocorrer. Caso não tenha sido fornecida calculadora, destaco, novamente, que não era preciso calcular 0 95, 9 . Bastava fazer o seguinte. P( X P( X = )1 = )0 = 10 × ,0 10 5 = ,0 1095 × 0 95, 9 Dividindo a segunda probabilidade pela primeira: ( 0) ,0 1095 XP = = P( X = )1 10 × ,0 05 × 0 95, 9 P( X = )0 = 0 95, P( X = )1 10 × 0 05, P( X = )0 = 0 95, P( X = )1 0 5, P( X P( X = )0 = 1 9, = )1 Portanto, a probabilidade de X assumir o valor 0 é maior que a probabilidade de X assumir o valor 1. O item está errado. XVII DISTRIBUIÇÃO DE POISSON Vimos que a distribuição binomial é útil para calcularmos a probabilidade de, em “n” experimentos, termos k casos favoráveis. A fórmula estudada foi: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 27 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � Vamos retomar o EC 9. Calculamos a probabilidade da variável binomial assumir o valor zero (ou seja, do lote ser aceito). Ela era, aproximadamente, igual a 0,598737. Para tanto, fizemos o seguinte cálculo: P( X = )0 = �10 � × 0 05, � 0 × ,0 1095 −0 � � 0 � � Pois bem. É possível demonstrar que, quando “n” é grande e “p” é pequeno, a fórmula P( X � n � = k ) = × p k × q n−k pode ser aproximada por:� k � P( X � � = k ) = e � − np × ( )knp k! O símbolo “ e ” representa um número real, que vale aproximadamente 2,7. Segundo Bussab e Morettin, no livro Estatística Básica, a aproximação é boa se np ≤ 7 . Vamos resolver o mesmo exercício, agora usando essa aproximação. Com o auxílio de uma calculadora, temos: e = −10×0,05 ( )0 P( X = )0 × 10 × 0 05, � 0 606531, !0 Muitos tipos de variáveis são bem descritas por meio da distribuição de probabilidades − = k ) = np × ( )k dada por P( X e np . Essa é a distribuição de Poisson. É comum substituir o !k produto np pela letra λ (lâmbda). Como a esperança da variável binomial é dada por np , dizemos que λ corresponde ao número esperado de ocorrências. A distribuição de Poisson descreve muito bem o número de ocorrências ao longo do tempo (ou ao longo de uma superfície). Alguns exemplos seriam: • O número de carros que passam por uma cabine de pedágio, durante 5 minutos; • O número de telefonemas recebido por uma central de atendimento, durante 2 horas; • O número de clientes que entram na fila de um banco, durante 1 hora. • O número de defeitos observados em 2 metros quadrados de material; www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 28 PROFESSOR VÍTOR MENEZES Distribuição de poisson. − = k ) = λ × (λ )k P( X e k! Pode ser usada no lugar da distribuição binomial, quando o número de experimentos é grande (n grande) e quando a probabilidade de sucesso é pequena (p pequeno). Muito útil para representar alguns tipos de ocorrências em um determinado tempo/superfície. EC 10 Analista Judiciário. Especialidade: estatística. TRF 1ª Região/2001 [FCC] A probabilidade de que um item produzido por uma máquina seja defeituoso é de 10%. Uma amostra de 30 itens produzidos por esta máquina é selecionada ao acaso. Use a aproximação pela distribuição de Poisson para determinar a probabilidade de que não mais do que um item defeituoso seja encontrado nesta amostra. a) 4e 3− b) 4e 2− c) 3e 3− d) 1 − 4e 3− e) 1 − 3e 3− Antes de resolvermos a questão da maneira solicitada pelo enunciado, vamos usar a distribuição binomial. Podemos considerar que, a cada item selecionado, temos um experimento. Estamos interessados nos itens defeituosos. Se o item sorteado for defeituoso, consideramos um caso favorável. Caso contrário, consideramos um caso desfavorável. A probabilidade de sucesso, em um experimento, é de 10% (p=0,1). O número de experimentos é de 30 (n=30). Seja X o número de itens defeituosos na amostra de 30 itens. Queremos a probabilidade de X ser igual a zero ou 1. Basta aplicar a fórmula: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )0 = � 30 � × ,0 01 × 0 9, 30 � � � �0 � Usando a calculadora: P( X P( X = )0 = )1 � 0 04239, = � 30 � × ,0 1 × 0 9, 29 � � �1 � � Novamente com o auxilio de calculadora: P( X = )1 = 30 × 0 1, 1 × 0 9, 29 � 0 14130, Assim, a probabilidade de termos um ou nenhum item defeituoso na amostra é de: 0 14130, + 0 04239, = 0 183 69, www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 29 PROFESSOR VÍTOR MENEZES Pronto. Achamos a probabilidade, considerando a distribuição binomial. Acontece que nós vimos que, em certas situações, a fórmula da distribuição binomial pode ser aproximada por: −λ = k ) = × ( )λ k P( X e k! Onde λ é o número esperado de ocorrências. Em média, 10% dos itens produzidos são defeituosos. Numa amostra com 30 itens, espera-se que existam 3 itens defeituosos ( λ = 3 ). Note que: λ = np = 30 × 0 1, = 3 . A probabilidade de termos zero itens defeituosos fica: ( ) 3 P( X = )0 3− 3 0× = e = e − !0 A probabilidade de termos 1 item defeituoso na amostra é de: ( ) 3 P( X = )1 1 = e 3− × 3 !1 = 3e − Assim, a probabilidade de termos zero ou um item defeituoso é de: e 3− + 3e 3− = 4e 3− Resposta: A Por curiosidade, usando a calculadora, temos: 4e 3− � 0 19915, O resultado foi relativamente próximo daquele calculado sem a aproximação (usando a distribuição binomial). Pergunta: Vítor, como vou saber quando é para usar a distribuição binomial e quando vou utilizar a distribuição de Poisson? Neste exercício em particular, era perfeitamente possível usar a distribuição binomial. Em geral, se for possível usar a binomial, use-a! Neste caso, só usamos a distribuição de Poisson porque a questão disse expressamente para fazer isso. Do contrário, usaríamos a distribuição binomial mesmo. EC 11 Analista Ministerial MPE PE/2006. Área: estatística [FCC] O número de falhas de certo tipo de placa térmica tem distribuição de Poisson, com taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é necessário cobrir uma superfície de 2m por 2m com essa placa. A probabilidade de que haja pelo menos uma falha nessa superfície é de: a) e 0− 1, b) 1 − e 0− 1, c) 1 − e 0− , 4 d) e 0− , 4 e) 1 − ,1 4e 0− , 4 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 30 PROFESSOR VÍTOR MENEZES Exercício bem parecido com o anterior. Seja X a variável que designa o número de falhas. Vamos calcular a probabilidade de X seja igual a zero. −λ = k ) = × ( )λ k P( X e k! A taxa média é de 0,1 defeito por m2. Em 4 m2, o número esperado é de 0,4 defeitos ( λ = ,0 4 ). −λ = k ) = × ( )λ k P( X e k! ( ) 0, 4 P( X = )0 0− , 4 e = × ,0 4 0 0! = e − Portanto, a probabilidade que não haja defeitos na placa é de e 0− , 4 . Desse modo, a probabilidade de haver pelo menos uma falha nessa placa é de: 1 − e 0− , 4 Resposta: C. Interessante notar o seguinte. O exercício pediu para usarmos a distribuição de Poisson. Mas, mesmo que ele não tivesse dito nada a respeito, necessariamente teríamos que usar a distribuição de Poisson. Não dá para usar a distribuição binomial aqui. Por quê? Tanto na distribuição binomial quanto na de poisson, a variável de interesse é o número de ocorrências de alguma coisa. Vamos retomar o EC 10. Lá a variável de interesse era o número de itens defeituosos produzidos pela máquina. Trata-se de uma variável discreta, que pode assumir apenas os valores 0, 1, 2, 3, ...., 29, 30. Pois bem, a cada item analisado, temos um experimento. A probabilidade de sucesso (=item defeituoso) é de 10%. A probabilidade de fracasso é de 90%. Se, a título de exemplo, quisermos calcular a probabilidade de termos exatamente 1 item defeituoso, usamos a fórmula da variável binomial. Ela vai nos dar a probabilidade de haver exatamente zero 1 defeituoso (e, consequentemente, 29 itens sem defeito). Ficaria assim: P( X = )1 = 0 � ,0� 3 ×� � � � 1 × 0 9, 29 1 � Pois bem, estamos calculando a probabilidade de: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 31 PROFESSOR VÍTOR MENEZES · Termos 1 item defeituoso · Termos 29 itens não defeituosos · Tudo isso, verificado em 30 experimentos Mudemos de exercício. Vamos agora para o EC 11. Vamos calcular a probabilidade de ter exatamente uma falha na superfície, usando a distribuição binomial. Vamos considerar sucesso sempre que observarmos uma falha. Vamos considerar fracasso sempre que não observarmos qualquer falha. Pergunta: quanto experimentos foram realizados? Não dá para saber. O que seria um experimento? Seria a análise de 1 m2 de superfície? Seria a análise de 1 cm2 de superfície? Não temos como contar quantos experimentos foram feitos. E mais: não sabemos quantos fracassos ocorreram. Estamos interessados em calcular a probabilidade de exatamente uma falha no material. Estamos considerando que cada falha é um caso favorável (=sucesso). Ou seja, queremos saber a probabilidade de, em uma placa de 4m2, termos exatamente 1 falha. Queremos a probabilidade de 1 caso favorável. Ok, para os casos favoráveis é tranqüilo. Contudo, não dá para contar quantos seriam os casos desfavoráveis. Quantas falhas deixaram de ocorrer? Outra vez, não temos resposta. Sempre que estivermos diante de situações assim, não dá para usar a distribuição binomial. Daí partimos para a distribuição de Poisson. A variável que apresenta distribuição de poisson é discreta. É sempre número de ocorrências de alguma coisa (portanto, só pode assumir os valores 0, 1, 2, 3, 4, ...). Mas, em geral, é um número de ocorrências contado sobre uma base contínua. Neste exercício, tínhamos o número de ocorrências de falhas em uma área (a área tem natureza contínua: pode assumir qualquer valor real maior que zero). Outro caso típico é o número de chamadas telefônicas numa central de atendimento. Novamente, estamos contando o número de ocorrências (a variável de interesse é discreta). Mas o tempo é contínuo. O tempo pode assumir qualquer valor real maior que zero. Novamente, teremos as mesmas dificuldades: como contar quantos experimentos aconteceram? Cada segundo é um experimento? Cada minuto? Cada hora? Como contar os casos desfavoráveis? Como contar quantas chamadas não ocorreram? Como contar quantas ligações não foram feitas? Binomial versus Poisson Sempre que for possível usar a variável binomial, use-a (exceto se o exercício disser usar a variável de poisson). Há casos em que não é possível usar a distribuição binomial. São casos em que o número de ocorrências é contado num campo contínuo (como espaço/área e tempo). Nestas situações: use a distribuição de poisson Apenas por curiosidade, a idéia da distribuição de poisson é a seguinte. No caso das falhas na superfície de 4 m2, supõe-se que seria possível dividir esta superfície em áreas muito pequenas. Muito pequenas mesmo. Áreas infinitesimais. Isto www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 32 PROFESSOR VÍTOR MENEZES de tal forma que a probabilidade de ocorrência de duas ou mais falhas em cada uma destas pequenas áreas seja igual a zero. Cada “áreazinha” é analisada, para ver se contempla uma falha. Ou seja, a cada área temos um experimento. Se a área apresentar uma falha, temos sucesso. Do contrário, temos fracasso. Feito isso, aplica-se a fórmula da distribuição binomial. Só que como as áreas têm que ser bem pequenas mesmo, então o número de experimentos é bem grandão. Quando ‘n’ é bem grande e ‘p’ é pequeno, daí é possível demonstrar que a fórmula da variável − = k ) = λ × (λ )k binomial tende a P( X e . k! Ou seja: a fórmula da variável de poisson é baseada na distribuição binomial. Seria uma distribuição binomial “especial” (especial porque se aplica a casos em que o número de experimentos é bem grandão, uma vez que as ocorrências são contadas num campo contínuo). EC 12 Analista Ministerial MPE PE/2006. Área: estatística [FCC] Considerando os dados da questão anterior, responda ao que segue. Na confecção de 3 superfícies deste tipo, a probabilidade de que exatamente duas não apresentem defeito é: a) 3 1( − e −0, 4 ) 2 e 0− , 4 b) 3e 0− 1, c) 3 1( d) 3 1( e) 3 1( − e 0− , 2 ) − e 0− 1, ) 2 e 0− 1, − e −0, 4 ) 2 e 0− ,8 Já sabemos que a probabilidade de uma peça de 4 m2 ser defeituosa é de 1 − e 0− , 4 . Queremos saber a probabilidade de exatamente duas peças não serem defeituosas. Temos três possibilidades: • A primeira peça é defeituosa (e as demais são normais) • A segunda peça é defeituosa (e as demais são normais) • A terceira peça é defeituosa (e as demais são normais) • A primeira e a última são defeituosas Vamos trabalhar com a primeira hipótese. Queremos que três eventos, independentes, ocorram simultaneamente (a primeira peça é defeituosa, a segunda peça é normal, e a terceira peça é normal). Como os três eventos são independentes, a probabilidade da intersecção é igual ao produto das probabilidades: P( primeira _ defeituosa) = (1 − e 0− , 4 )× e 0− , 4 × e 0− , 4 = (1 − e 0− , 4 )× e 0− ,8 Para as duas outras hipóteses, as contas são análogas. Somando as probabilidades das três possibilidades, ficamos com: P(exatamente _ duas _ normais) = 3 × (1 − e 0− , 4 )× e 0− ,8 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 33 PROFESSOR VÍTOR MENEZES Resposta: E. Outra forma de resolver é aplicar direto a fórmula da distribuição binomial. Note que aqui a situação muda completamente. No exercício anterior, estávamos contando quantas falhas ocorriam em uma área (contínua). Usamos a distribuição de Poisson. Agora mudou tudo. Estamos contando quantas placas de 4m2 apresentam defeitos. A contagem não se dá mais em função de uma superfície/área. A contagem é por placa de 4m2. Cada placa analisada corresponde a um experimento. Se a placa apresentar falhas, temos um caso favorável. Do contrário, temos um caso desfavorável. Dá para contar quantos são os experimentos, quantos são os sucessos e quantos são os fracassos. Temos: · n = 3 (são confeccionadas três placas) · p = 1 − e 0− , 4 (a probabilidade de caso favorável – placa defeituosa – foi calculada no exercício anterior. · q = e 0− , 4 (probabilidade de caso desfavorável – placa sem defeitos) · k = 1 (queremos exatamente uma placa com defeito – 1 caso favorável) Aplicando a fórmula da variável binomial: P( X � n � = k ) = × p k × q n−k� k � � � � P( X = )1 = � 3� × ( )1 − e −0, 4 1 × (e −0, 4 )3 1−� 1 � � � � P( X = )1 = 3 × ( )1 − e −0, 4 × (e −0, 4 )2 P( X = )1 = 3 × (1 − e 0− , 4 )× (e 0− ,8 ) E obtivemos o mesmo resultado. EC 13 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] O número de pacientes atendidos por um clínico geral segue uma distribuição de Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente consulte o clínico geral em um período de 15 minutos é: a) 1 − e 1− b) 1 − e 4− c) e 4− d) e 4 e) e 1− Notem que a contagem de pacientes se dá por tempo (que é contínuo). É o caso típico de utilização da distribuição de poisson. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 34 PROFESSOR VÍTOR MENEZES Antes de fazer qualquer conta, notem que a letra D é totalmente absurda. O número “e” é aproximadamente igual a 2,7. Quando elevado à quarta potência, fica ainda maior. Portanto, na letra D temos uma probabilidade maior que 1, o que é impossível. Uma probabilidade, no máximo, é de 100%. Se em uma hora, em média, são atendidos 4 pacientes, então o número esperado de pacientes no período de 15 minutos é 1 (basta fazer regra de três). Portanto, λ = 1 Seja X a variável que designa o número de pacientes atendidos. Queremos calcular a probabilidade de X ser maior que zero. Para tanto, primeiro vamos calcular a probabilidade de X ser igual a zero. −λ = k ) = × ( )λ k P( X e k! ( ) 1 P ( X = )0 = e −1 1 0 × !0 = e − Portanto: P( X ≠ )0 = 1 − e 1− Resposta: A. EC 14 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Sabe-se que a variável aleatória X é bi-modal para x=1 e x=2 e que tem distribuição de Poisson. Sabendo que X é diferente de zero, a probabilidade de X assumir um valor menor do que 3 é dada por: 4 a) b) 2e 4 e 2 − 1 2 c) e d) 1 − e) 4 e 2 4 1 − e 2 Exercício diferente dos anteriores. Acho que é uma questão muito boa porque cobra diversos conceitos (moda, distribuição de poisson e probabilidade condicional). Quando temos um conjunto de dados, a moda é o termo que mais se repete (matéria das duas primeiras aulas). Quando temos uma variável aleatória discreta, a moda é o valor que tem a maior probabilidade de ocorrer. Portanto, o exercício está nos dizendo que a probabilidade de X assumir os valores 1 e 2 são iguais entre si e, além disso, são maiores que as probabilidades de X assumir qualquer outro valor. −λ = k ) = × ( )λ k P( X e k! e −λ × ( )λ 1 P( X = )1 = !1 www.pontodosconcursos.com.br e −λ × ( )λ 2 ESTATÍSTICA P/ ICMS-SP 35 PROFESSOR VÍTOR MENEZES P( X = )2 = !2 Igualando as duas probabilidades: e −λ ( )λ 1 e −λ × (λ )2 × = !1 ( )1 !2 ( )2 λ = 1 λ � λ = 2 2 Tendo o valor de λ , podemos achar a probabilidade de X ser igual a zero. ( ) 2 P ( X = )0 = e −2 × 2 0 !0 = e − Consequentemente, a probabilidade de X ser diferente de zero é de: P( X ≠ )0 = 1 − e 2− Vamos agora calcular a probabilidade de X ser igual a 1: ( ) 2 P ( X 2− = )1 e= 2× 1 !1 = 2e − A probabilidade de X ser igual a 2 também é de esta igualdade ocorresse). 2 e 2− (pois achamos λ de forma que P( X = )2 = 2e 2− A probabilidade de X ser menor que 3 é dada por: P( X < )3 = P( X = 0 � X = 1 � X = )2 Como os eventos X=0, X=1 e X=2 são excludentes, podemos separar a probabilidade da união em soma das probabilidades: P( X < )3 = P( X = )0 + P( X = )1 + P( X = )2 = 5e 2− Só que o exercício não pediu a probabilidade de X ser menor que 3. O que foi pedido foi a probabilidade de X ser menor que 3 dado que X é diferente de zero. Usando a fórmula de probabilidade condicional vista na aula passada, temos: P( X < 3 X ≠ )0 = P( X < 3 ∩ X ≠ )0 ≠ )0 P( X P( X < 3 X ≠ 0) = P( X = 1 � X ≠ = 2) = P( X = )1 + P( X ≠ = 2) = 4e 2− e − P( X 0) P( X 0) −1 2 Multiplicando o numerador e o denominador por e 2 : P( X < 3 X ≠ )0 = 4 e −2 − 1 Resposta: B. ESTATÍSTICA P/ ICMS-SP 36 PROFESSOR VÍTOR MENEZES EC 15 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Tem-se que (f x) = Cn, x × p x 1( p− ) n − x , onde Cn, x é o número de combinações de n elementos tomados x a x, f ( x) é a função de probabilidade de uma variável aleatória binomial. Fazendo-se na sua expressão p → 0 e n → ∞ , mas com np = λ , f ( x) tem como limite a função de probabilidade de uma variável aleatória de Poisson, que é: xλ − λ a) λx e − λ b) e c) !x λe − λx d) λe − x / λ e) λx − 1e − x / Γ(λ ) Vimos que, quando ‘n’ é grande e ‘p’ é pequeno, a expressão P( X � n � = k ) = × p k × q n−k� k � � � � pode ser aproximada por: − = k ) = np × ( )k P( X e np !k Vimos também que é comum chamar o produto np de λ . − λ = k ) = × ( )λ k P( X e k! Em vez de usar a letra k , a questão está usando x (minúsculo). Resposta: B. XVIII DISTRIBUIÇÃO UNIFORME CONTÍNUA No início da aula estudamos a distribuição uniforme discreta. É a distribuição em que todos os possíveis valores assumidos pela variável aleatória têm a mesma chance de ocorrer. Agora, veremos também uma variável uniforme. Só que, em vez de ser discreta (ou seja, assumir apenas alguns valores), ela é contínua. Sabemos, desde a aula anterior, que, no caso de uma variável contínua, não podemos falar em probabilidade de ocorrer um dado número. Podemos falar apenas em probabilidades relacionadas a intervalos de valores. E essas probabilidades podem ser calculadas a partir do gráfico da função densidade de probabilidade. Pois bem, as variáveis contínuas são estudadas a partir de seu gráfico de densidade de probabilidade. Vejamos um exemplo de variável uniforme contínua. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 37 PROFESSOR VÍTOR MENEZES Observemos a figura acima. Temos o desenho de um gráfico de uma função densidade de probabilidade (fdp). Ela assume o valor 0,5, quando X pertence ao intervalo [1;3]. Quando X não pertence a este intervalo, a função assume o valor zero. O que caracteriza uma variável uniforme? No intervalo em que a fdp é diferente de zero, ela é constante. No presente caso, no intervalo de 1 a 3 a fdp vale sempre 0,5. Variável uniforme contínua: é igual a zero em toda a reta real, com exceção de um dado intervalo, onde assume um valor constante. Achar a média da variável uniforme é bem simples. Tomamos o intervalo em que ela é diferente de zero. O ponto médio desse intervalo corresponde à média da variável. No exemplo acima, a média de X é igual a 2 (pois o ponto médio do intervalo [1;3] é 2. Na aula passada nós vimos o seguinte exercício: Técnico Científico – Área estatística – BASA – 2007 [CESPE] Considere duas variáveis aleatórias independentes X e Y idênticas e uniformemente distribuídas no intervalo (0, 1). Acerca da distribuição da soma Z = X + Y, julgue os seguintes itens. 61 A média de Z é igual a zero. 62 A variância de Z é igual à variância da diferença X – Y. 63 A covariância entre Z e X é igual a 1/12. Na oportunidade, nós ainda não sabíamos o que era uma variável uniformemente distribuída. Agora nós sabemos. É uma variável uniforme. Sua função densidade de probabilidade é sempre zero. Com exceção do intervalo entre 0 e 1. Sua fdp fica: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 38 PROFESSOR VÍTOR MENEZES a -2 -1 0 1 2 3 x No intervalo entre 0 e 1, a fdp é igual a uma constante (que estamos chamando de ‘a’ – destacado em vermelho na figura acima). Para descobrir que constante é essa é bem fácil. Sabemos que a variável aleatória X só assume valores entre 0 e 1. Portanto, a probabilidade de X estar entre 0 e 1 é de 100%. Logo, a área abaixo da curva da fdp, entre 0 e 1, é de igual a 1 (=100%). A área é um retângulo de base 1 e altura ‘a’. Sua área fica: Area = 1× a 1 = 1× a � a = 1 O gráfico da fdp fica assim: 1 0,75 0,5 0,25 0 -2 -1 0 1 2 3 x Ainda nesse exercício, nós precisamos achar a esperança de X e de Y. Na aula passada, eu dei essa informação para vocês. Agora vocês já sabem que basta pegar o ponto médio do intervalo. O ponto médio entre 0 e 1 é 0,5. Portanto: E[ X ] = [E Y ] = 0 5, www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 39 PROFESSOR VÍTOR MENEZES EC 16 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] A temperatura T de destilação do petróleo é uma variável aleatória com distribuição uniforme no intervalo [150,300]. Seja C o custo para se produzir um galão de petróleo. Determine o lucro esperado por galão, supondo que o preço de venda por galão é uma variável aleatória Y dada por: Y = a , se T ≥ 200 Y = b , se T < 200 a) (a + b2 ) / 3 − C b) (a − C ) / 150 + (b − C ) / 150 c) (a + b) / 3 − C d) (a + b) / 150 − C e) (2a + b) / 3 − C A variável T é uniforme no intervalo de 150 a 300. Sua fdp fica: 0,00667 0 100 150 200 250 300 350 400 t A fdp é zero em quase toda a reta real. E é igual a 1 � 0 00667, 150 no intervalo de 150 a 300. Como eu sei que nesse intervalo ela vale 1/150? É que a variável só assume valores nesse intervalo (entre 150 e 300). A área do retângulo acima tem que ser igual a 1. Para que isso aconteça, a altura tem que ser o inverso da base. Se a base é 150, a altura só pode ser igual a 1/150. Vejamos agora a probabilidade de T assumir valores menores que 200. Queremos a área verde da figura abaixo. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 40 PROFESSOR VÍTOR MENEZES Temos um retângulo de base 50 e altura 1/150. A probabilidade procurada fica: P(T < )2 00 = Area = 50 × 1 = 1 150 3 Consequentemente, a probabilidade de T assumir valores maiores ou iguais a 200 é de 2/3. O exercício disse que o preço de venda (Y), é uma variável tal que: Y = a , se T ≥ 200 Y = b , se T < 200 Assim, a probabilidade de Y assumir o valor “a” é de 2/3. E a probabilidade de Y assumir o valor “b” é de 1/3. Vamos calcular a esperança de Y? [E Y ] = a × 2 + b × 1 = 2a + b 33 3 O lucro do galão é igual ao preço de venda menos o custo. O lucro (L) fica: L = Y − C , onde C é uma constante. O exercício pediu a esperança de L. [E L] = ? Usando as propriedades da esperança: [E L] = [E Y − C] A esperança da diferença é igual à diferença das esperanças: [E L] = [E Y ] − [E C ] A esperança da constante é igual à própria constante. E[L] = E Y[ ] − C E[L] = 2a + b − C 3 Resposta: E www.pontodosconcursos.com.br. ESTATÍSTICA P/ ICMS-SP 41 PROFESSOR VÍTOR MENEZES EC 17 Analista Ministerial MPE PE/2006. Área: estatística [FCC] Seja X uma variável aleatória, com densidade Uniforme no intervalo [ ]− α ; α , o valor de α que satisfaz à condição P( X > 1 / )2 = 2P( X < − )1 é: a) 2 b) 3/2 c) 1 d) 1/2 e) 1/4 Um primeiro esboço do gráfico da fdp dessa variável é: α− α A fdp só é diferente de zero no intervalo entre [− α ; 1 α ]. Nesse intervalo a fdp é constante e vale . Como sabemos disso? É o mesmo raciocínio dos exercícios 2α anteriores. A altura tem que ser o inverso da base. Como a base vale α2 , a altura vale 1 , de modo que a área do retângulo seja igual a 1. 2α A probabilidade de X ser maior que 1/2 é igual à área verde abaixo: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 42 PROFESSOR VÍTOR MENEZES A área fica: P( X > 1/ )2 = Area _ verde = 1 × (α − 1/ )2 2α E a probabilidade de X ser menor que -1 é igual à área amarela abaixo: P( X < − )1 = Area _ amarela = 1 × ( )− 1 − ( α− ) = α2 1 × ( )− 1 + α α2 Queremos que a área verde seja o dobro da área amarela. 1 × α( α2 − 1 / )2 = 2 × 1 × ( )− 1 + α α2 (α − 1/ 2) = 2 × ( )− 1 + α α − 1 / 2 = −2 + α2 α = 1 5, Resposta: B. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 43 PROFESSOR VÍTOR MENEZES EC 18 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] O tempo necessário para um medicamento contra dor fazer efeito segue um modelo com densidade Uniforme no intervalo de 5 a 15 (em minutos). Um paciente é selecionado ao acaso entre os que tomaram o remédio. A probabilidade do medicamento fazer efeito em até 10 minutos, neste paciente, é: a) 0,8 b) 0,7 c) 0,5 d) 0,4 e) 0,3 O gráfico da função densidade de probabilidade fica: 0,15 0,1 0,05 0 0 5 10 15 20 x A fdp vale zero em toda a reta real, com exceção do intervalo entre 5 e 15. Nesse intervalo a fdp é constante e igual a 0,1. Como sabemos disso? É a mesma coisa dos exercícios anteriores. A base vale 10. A altura é o inverso da base. Portanto, vale 0,1. O exercício perguntou qual a probabilidade da variável aleatória assumir valores menores ou iguais a 10. Ou seja, precisamos da área verde da figura abaixo: P( X < )1 0 = Area _ verde = 5 × 0 1, = 0 5, Resposta: C. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 44 PROFESSOR VÍTOR MENEZES XIX DISTRIBUIÇÃO NORMAL Nesta e na aula anterior estudamos a função densidade de probabilidade, que serve para caracterizar variáveis aleatórias contínuas. A resolução das questões passava por desenhar seus gráficos e calcular áreas abaixo das curvas. Uma função densidade de probabilidade muito importante é a função da variável gaussiana (ou normal). Sua fórmula é a seguinte: 2 f ( x) = 1 � − ( x − μ ) � 2πσ 2 ��exp � σ2 2 � � Onde μ é a média da variável aleatória (=esperança), σ é o desvio padrão e “exp” é a função exponencial em que a base é o número de Euler. Nem precisa ficar preocupado em decorar ou entender a função acima. Nós só a citamos e nem vamos comentar novamente. É claro que nós não vamos ficar desenhando seu gráfico para, em seguida, ficar calculando áreas abaixo da curva. Como a distribuição normal é muito importante, o que geralmente vem na prova são tabelas que nos fornecem as informações das áreas abaixo da curva. O que nós vamos aprender é simplesmente como consultar tais tabelas. Então vamos resumir. Sabemos que existe uma variável aleatória que é muito importante, que se chama normal (ou gaussiana). Ela tem uma função densidade de probabilidade meio complicada, por isso a prova vai nos fornecer tabelas com as contas prontas. Temos apenas que saber como olhar na tabela. Mesmo que a gente não precise saber como desenhar o gráfico, vamos ver alguns deles, gerados no excel (função “dist.norm”). É útil para visualizarmos algumas propriedades da variável normal. Para desenhar o gráfico, precisamos saber a média e o desvio padrão da variável aleatória normal em análise. O gráfico abaixo representa a função densidade de probabilidade quando a variável aleatória normal tem média zero e desvio padrão unitário. Figura 1 - Função densidade de probabilidade para variável aleatória normal com média zero e desvio padrão unitário. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 45 PROFESSOR VÍTOR MENEZES Algumas características da função densidade de probabilidade da variável normal. Primeiro: o ponto de máximo corresponde à média da variável aleatória (=esperança). Neste caso, a média é zero. Corresponde também à moda e à mediana da distribuição. Segundo: a função é simétrica. Poderíamos colocar um espelho bem em cima do zero (ponto de máximo, que coincide com a média), que as duas metades da função se sobreporiam com perfeição. Isto quer dizer que o valor da função em -0,5 é igual ao valor da função em +0,5. Por quê? Porque esses dois valores estão igualmente afastados da média. Este gráfico acima, que representa a variável aleatória normal com média zero e desvio padrão unitário, é o mais importante. Isto porque as tabelas que nós estudaremos mais adiante fornecem áreas abaixo da curva justamente para este gráfico. Se no exercício tivermos uma outra variável aleatória normal que não tenha média zero e desvio padrão unitário, vamos precisar fazer algumas transformações para utilizar as tabelas. A variável normal com média zero e desvio padrão unitário é comumente chamada de variável normal reduzida. Ou ainda, de variável normal padrão. Seu símbolo usual é “Z”. Z → variável normal reduzida (média zero e desvio padrão unitário). Terceiro: à medida que x assume valores muito grandes (tendendo a + ∞ ) ou muito pequenos (tendendo a − ∞ ), a função tende para zero. Quarto: a área abaixo da curva inteira (considerando valores de x tendendo ao infinito, bem como aqueles tendendo a menos infinito) é 1. Isto porque a probabilidade de x assumir um valor qualquer em toda a reta real é 100%. A seguir o gráfico de uma função densidade de probabilidade para uma variável normal com média zero e desvio padrão igual a 1,6. Figura 2 - Função densidade de probabilidade para variável aleatória normal com média zero e desvio padrão igual a 1,6 Observe que o ponto de máximo é o mesmo do gráfico anterior. Isto porque a média, nos dois casos, é zero. Mas o gráfico da Figura 2 é mais suave que o gráfico da Figura 1. À medida que os valores de x ficam muito grandes, os valores da função vão para zero de forma mais lenta. Isto porque, na variável aleatória representada na Figura 2, o desvio padrão é ESTATÍSTICA P/ ICMS-SP 46 PROFESSOR VÍTOR MENEZES maior. Ou seja, é uma variável que apresenta valores mais dispersos, mais afastados da média. Se os valores são mais dispersos, então a probabilidade de encontrarmos valores mais afastados da média é maior. Por isso a curva cai lentamente, de forma que a área abaixo dela, para valores mais afastados da média, não seja tão pequena quanto no caso da Figura 1. Vamos para um terceiro exemplo. Figura 3 - Função densidade de probabilidade para variável normal com média 2 e desvio padrão unitário Agora a média é 2. Portanto, o ponto de máximo não fica em zero, sim em 2. Mas o gráfico continua sendo simétrico. Só que nosso espelho agora tem que ficar em cima de 2. Assim, a função assume os mesmos valores, tanto em x igual a 1 quanto em x igual a 3. Por quê? Porque esses dois valores estão igualmente afastados da média. O mesmo vale para os valores de x iguais a 4 e a 0. Ambos estão igualmente afastados da média. Note que o desvio padrão é unitário. É o mesmo desvio da variável da Figura 1. Portanto, as duas curvas têm exatamente o mesmo formato. Só houve um deslocamento horizontal ao longo do eixo x. 1 Teorema do limite central Não vamos ver este teorema a fundo. Não vou demonstrá-lo nem apresentar seus resultados em notação matemática. Mas vamos tentar entender o que ele quer dizer. É possível demonstrar que, se somarmos diversas variáveis aleatórias independentes, a variável aleatória resultante terá distribuição próxima de uma gaussiana. Quanto mais o número de variáveis somadas cresce, mais a variável aleatória resultante se aproxima da distribuição normal. Este é o teorema do limite central. Vamos supor que nossa variável aleatória seja o resultado do lançamento de um dado de seis faces. A variável pode assumir os valores 1, 2, 3, 4, 5 e 6, todos com probabilidade de 1/6. Para entender o que acontece neste teorema, o ideal seria desenharmos a função densidade de probabilidade para esta variável. Só que, no caso de variáveis discretas, o desenho da fdp depende de alguns conceitos que nós não estudamos. Uma opção para entender o teorema do limite central seria trabalhar com o histograma. Alguns livros fazem isso. Aqui vou optar por algo ligeiramente diferente. Vamos criar uma “fdp” adaptada. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 47 PROFESSOR VÍTOR MENEZES Então vamos fazer a tal adaptação. Vamos desenhar o gráfico abaixo. Figura 4 - Função densidade de probabilidade adaptada para o lançamento de um dado A função vale zero em quase todos os valores de x. Para x indo de 0,95 até 1,05, a função vale 10/6. Assim, se quisermos saber qual a probabilidade da variável X assumir valores neste intervalo, teríamos que calcular a área abaixo da curva, entre esses limites. Corresponderia à área verde da figura a seguir. Figura 5 - Cálculo da probabilidade de x assumir valores entre 0,95 e 1,05 A probabilidade seria igual a 1/6. Sabemos que isto é apenas uma adaptação. Na verdade, X não assume valores em todo o intervalo de 0,95 a 1,05. Neste intervalo, ela assume apenas o valor 1, com probabilidade de 1/6. Se o gráfico tivesse sido desenhado de maneira fiel, em x igual a 1 teríamos um retângulo de base zero e altura infinita, de forma que o produto fosse 1/6. Mas não vamos estudar aqui conceitos de limite para entender como ficaria tal gráfico. Entendido que se trata apenas de uma adaptação, vamos agora mudar um pouco o problema. Vamos supor que lançamos dois dados. E somamos os resultados. Nossa variável aleatória será a soma dos resultados obtidos nos dois dados. Agora os valores possíveis de nossa variável aleatória são: 2, 3, ..., 10, 11, 12. A tabela abaixo representa todas as possíveis somas. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 48 PROFESSOR VÍTOR MENEZES Resultados Combinações que geram tal soma 2 (1+1) 3 (1+2) (2+1) 4 (1+3) (3+1) (2+2) 5 (1+4) (4+1) (2+3) (3+2) 6 (1+5) (5+1) (2+4) (4+2) (3+3) 7 (1+6) (6+1) (2+5) (5+2) (3+4) (4+3) 8 (2+6) (6+2) (3+5) (5+3) (4+4) 9 (3+6) (6+3) (4+5) (5+4) 10 (4+6) (6+4) (5+5) 11 (5+6) (6+5) 12 (6+6) Observem que agora nem todos os resultados possíveis têm a mesma probabilidade. O valor 12 só acontece se os resultados forem 6 e 6. É mais difícil de sair uma soma 12. Já o valor 7 tem probabilidade maior. São várias as combinações que resultam em 7. As probabilidades de cada soma ficariam: Resultados Probabilidade 2 1/36 3 2/36 4 3/36 5 4/36 6 5/36 7 6/36 8 5/36 9 4/36 10 3/36 11 2/36 12 1/36 E a nossa fdp adaptada ficaria assim: Figura 6 - Função densidade de probabilidade adaptada para a soma dos resultados dos lançamentos de dois dados www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 49 PROFESSOR VÍTOR MENEZES Agora, em vez de dois dados, vamos supor que temos três dados. A nossa variável aleatória agora será dada pela soma dos resultados dos três dados. Os valores possíveis agora são 3, 4, 5 ..., 15, 16, 17, 18. A tabela de probabilidades fica: E o gráfico ficaria: Resultados Probabilidade 3 1/216 4 3/216 5 6/216 6 10/216 7 15/216 8 21/216 9 25/216 10 27/216 11 27/216 12 25/216 13 21/216 14 15/216 15 10/216 16 6/216 17 3/216 18 1/216 Figura 7 – Função de densidade de probabilidade adaptada para o lançamento de três dados Quando tínhamos um dado apenas, o gráfico era bem diferente do gráfico da variável normal. Com dois dados, o formato já mudou bastante. Com três dados, já estamos com um perfil que lembra uma variável normal. Se aumentássemos bastante o número de dados lançados, estaríamos com um gráfico muito próximo ao da curva normal, com a única diferença de estarmos diante de um caso de uma variável discreta, quando a função densidade de probabilidade da variável normal é contínua. Então pra gente o que importa é saber isto: a soma de um número muito grande de variáveis aleatórias independentes resulta numa variável cuja distribuição é próxima da distribuição normal. Há mais algumas condições a serem obedecidas para que isto seja aplicável, mas para o nosso curso saber até aqui já está ótimo. Por isto a variável normal ou gaussiana é importante. Muitas variáveis, resultantes de um número muito grande de outras variáveis, podem ser aproximadas por uma curva normal. Aqui vou dar um exemplo tirado do livro “Estatística para economistas”, do www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 50 PROFESSOR VÍTOR MENEZES Rodolfo Hoffmann. Tomemos a altura de indivíduos adultos. A altura é influenciada por diversas variáveis que podem ser tomadas como independentes: carga genética, alimentação, doenças (talvez as doenças não sejam realmente independentes das demais, mas é só um exemplo), entre outros. Com tantas variáveis diferentes, é razoável esperar que a variável resultante em questão (a altura) siga mais ou menos uma distribuição normal. Não vamos ver problemas com este teorema. Na verdade ele serve para que muitas propriedades que veremos daqui pra frente sejam demonstradas. Para esse nosso curso acho que basta apenas saber da existência deste teorema, pois ajuda a entender porque a variável normal é tão importante. 2 Utilização das tabelas Gerei a seguinte tabela com o excel (função “dist.norm”). Na prova vai vir esta tabela (ou uma parte dela). Esta tabela também está reproduzida ao final da aula. PROBABILIDADE DE Z ESTAR ENTRE 0 E Z0 Segunda casa decimal de Z0 Z0 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 Vejamos o seguinte exemplo: EP 9 Calcule a probabilidade de uma variável aleatória normal, com média zero e desvio padrão unitário, assumir valores entre 1 e 2. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 51 PROFESSOR VÍTOR MENEZES Precisaríamos traçar o gráfico da fdp desta variável e, em seguida, calcular a área abaixo da curva entre os valores 1 e 2. Ficaria assim: Figura 8 – Área correspondente à probabilidade de x assumir valores entre 1 e 2 Só que nós vimos que a fdp da variável normal é meio complicada. Não vamos calcular esta área como fazíamos na aula anterior, quando os gráficos eram mais tranqüilos (áreas de triângulos, retângulos e trapézios). Vamos usar a tabela. O que a tabela fornece é a probabilidade de X estar entre zero e Z0. Quando Z0 for igual a 2, o que temos? A probabilidade de X estar entre 0 e 2. Vamos consultar a tabela. Procuramos pelo valor Z0 = 2. Encontramos a seguinte probabilidade: 0,4772. A tabela está nos dizendo que a seguinte área é de 0,4772: Figura 9 – Área correspondente à probabilidade de X estar entre 0 e 2 (basta consultar tabela para Z0 = 2) E se Z0 for igual a 1? Consultamos a tabela e encontramos a seguinte probabilidade: 0,3413. Ou seja, a probabilidade de X assumir valores entre 0 e 1 é de 0,3413. Ou ainda, a área abaixo é igual a 0,3413: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 52 PROFESSOR VÍTOR MENEZES Figura 10 - Área correspondente à probabilidade de X estar entre 0 e 1 (basta consultar tabela para Z0 = 1) Então, para obter a área entre 1 e 2, basta subtrair a área verde da Figura 9 da verde da Figura 10. Ficamos com: 0,4772 - 0,3413 = 0,1359 Figura 11 – Área correspondente à probabilidade de X assumir valores entre 1 e 2 Logo, a área entre 1 e 2 é de 0,1359. Portanto, X assume valores entre 1 e 2 com probabilidade de 13,59%. EP 10 Considerando o mesmo caso do exercício anterior, qual a probabilidade de X assumir valores maiores do que 2? Queremos a seguinte área: ESTATÍSTICA P/ ICMS-SP 53 PROFESSOR VÍTOR MENEZES Figura 12 – Área correspondente à probabilidade de X assumir valores maiores que 2 Consultando a tabela, só conseguimos descobrir a probabilidade de X estar entre 0 e 2. Mas queremos a probabilidade de X estar entre 2 e ∞ . Figura 13 – Comparação entre as probabilidades de X estar entre 0 e 2 (em vermelho) e de X estar entre 2 e infinito (verde). A tabela nos dá a área vermelha. Nós queremos a área verde. Como sabemos que a função é simétrica, a área à esquerda de zero é igual à área à direita de zero. E as duas somadas dão 100%. Portanto, a área à direita de zero é igual a 0,5 (ou 50%) Somando as áreas vermelha e verde temos, portanto, 0,5. Como a área vermelha é igual a 0,4772 (basta consultar a tabela), a área verde é dada pela diferença: 0,5 – 0,4772 = 0,0228. Portanto, a probabilidade de X assumir valores maiores que 2 é de 2,28%. Vamos a um outro exemplo. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 54 PROFESSOR VÍTOR MENEZES EP 11 Calcule a probabilidade de uma variável aleatória normal, de média 2 e desvio padrão 4, assumir valores entre 2 e 8. Agora temos um problema. A tabela nos fornece apenas áreas abaixo da curva fdp da variável normal com média 0 e desvio padrão 1 (variável normal reduzida). Não é o caso da nossa variável em análise. Precisamos fazer uma transformação. Seja X a nossa variável aleatória em análise, com média 2 ( μ X = 2 ) e desvio padrão 4( σ X = 4 ). Seja Z a nossa variável transformada. Vamos fazer a seguinte transformação: =Z X − μ X σ X Para obter cada valor de Z, pegamos cada valor de X, subtraímos da média e dividimos pelo desvio padrão. Relembrando propriedades da média (matéria da primeira aula). Quando subtraímos, somamos, dividimos ou multiplicamos uma variável por uma dada constante, a média sofre a mesma variação. A média da nova variável Z fica: Zμ = Xμ − σ μ X = 0 Relembrando propriedades do desvio padrão (matéria da quarta aula). Somas e subtrações não interferem no desvio padrão. Quando multiplicamos ou dividimos uma variável por uma dada constante, o desvio padrão sofre a mesma variação. O desvio padrão da nova variável Z fica: σ = σ X = 1 Z σ X A nova variável Z tem média zero e desvio padrão unitário. Para ela sim nós podemos consultar a tabela. A dica é sempre esta. Sempre que tivermos uma variável X que não tem média zero e desvio padrão unitário, nós precisaremos obter a variável reduzida Z (para então consultar a tabela). E a transformação para obter a variável Z (de tal modo que ela tenha média zero e desvio padrão unitário) será assim: Z = X − μ σ Voltando ao nosso exemplo. Queríamos saber a área correspondente ao valor 8 da variável X. Em vez de consultar o valor 8, consultamos o que lhe é correspondente. O valor correspondente da variável Z é: www.pontodosconcursos.com.br 8 − 2 = 1 5, 4 ESTATÍSTICA P/ ICMS-SP 55 PROFESSOR VÍTOR MENEZES Também queríamos saber a área correspondente ao valor 2 da variável X. Em vez de consultar o valor 2, consultamos o valor que lhe é correspondente. O valor correspondente da variável Z é: 2 − 2 = 0 4 Agora sim. Podemos utilizar a tabela dada. Procuraremos pela área entre os valores 0 e 1,5. Consultando a tabela, a probabilidade da variável Z assumir valores entre 0 e 1,5 é 0,4332. Portanto, a probabilidade da variável X assumir valores entre 2 e 8 também é de 0,4332. Friso novamente! Esta transformação é muito importante!!! É bastante usual nos exercícios daqui pra frente. A variável Z é chamada de variável normal reduzida. Sempre que tivermos uma variável normal X e quisermos obter a respectiva variável reduzida Z, fazemos a seguinte transformação: Z = X − μ σ E para esta variável Z nós podemos consultar a tabela. Vamos agora a um exemplo um pouco diferente. EP 12 Para a mesma variável X, normal, de média 2 e desvio padrão 4, determine qual o intervalo centrado na média que contém 92,5% dos valores. Para podermos consultar a tabela, temos que utilizar os valores da variável Z: Z = X − μ σ O intervalo procurado é centrado na média. Vamos dividi-lo em duas partes. 92 5, = ,46 25 . 2 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 56 PROFESSOR VÍTOR MENEZES Figura 14 – Intervalo centrado na média (para a variável reduzida Z) que contém 92,5% dos valores. Estamos procurando valores tais que a área vermelha seja igual à área verde, com ambas iguais a 0,4625 (de modo que a soma seja 92,5%). Consultando a tabela, vemos que o valor procurado, de tal forma que a área vermelha seja de 0,4625 é 1,78. Como a tabela corresponde ao gráfico de uma função densidade de probabilidade de uma variável aleatória com média zero, sabemos que se trata de um gráfico simétrico. Portanto, o outro valor procurado (que delimita a área verde) é -1,78. Estes valores são valores da variável Z (que tem média zero e desvio padrão unitário). Vamos achar os valores correspondentes da variável X. Z = X − μ σ Z = X − 2 4 X = Z × 4 + 2 Quando Z for 1,78, X vale: X = 1 78, X = 9 12, × 4 + 2 Quando Z for -1,78, X vale: X = 1− 78, × 4 + 2 X = 5− 12, Portanto, 92,5% dos valores de X estão entre -5,12 e 9,12. Repare que este intervalo é ( ) centrado na média de X (pois: 9 12, − 5 12, = )2 . 2 Vamos para alguns exercícios de concurso. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 57 PROFESSOR VÍTOR MENEZES EC 19 Estatístico – IBGE/99 As alturas das pessoas adultas, sexo feminino, numa certa população seguem uma distribuição normal com média 160cm e variância 100cm2. A porcentagem de mulheres dessa população que medem mais de 172cm é, aproximadamente, de: (A) 2,2% (B) 10,3% (C) 11,5% (D) 22,8% (E) 38,5% A variável dada (altura das mulheres) tem distribuição normal com média 160 e desvio padrão 10. Queremos saber a percentagem de mulheres com altura maior que 172 cm. Nosso interesse, portanto, seria consultar a tabela normal para o valor 172. Só que não podemos fazer a consulta direto porque a tabela é só para variável normal com média 0 e desvio padrão unitário. Precisamos fazer a transformação. Z = X − μ σ Z = X − 160 10 Portanto, em vez de consultar o valor 172, vamos consultar o valor que lhe é correspondente: Z = 172 − 160 = ,1 2 10 Vamos consultar a tabela para o valor 1,2. O resultado é 0,3849. Figura 15 – Probabilidades da variável Z assumir valores entre 0 e 1,2 (vermelho) e valores maiores que 1,2 (verde) ESTATÍSTICA P/ ICMS-SP 58 PROFESSOR VÍTOR MENEZES A tabela nos diz que a área vermelha é 0,3849. Só que nós queremos a área verde. Sabemos que a soma das duas é 0,5. Fazendo a diferença descobrimos a área verde: 0 5, − 0 3849, = ,0 .11507 A proporção de valores acima de 1,2 é de 11,507% (isto para a variável normal de média zero e desvio padrão unitário). Para a variável original (de média 160 e desvio padrão 10), temos que 11,507% dos valores estão acima de 172. Resposta: C (11,5% das mulheres têm altura superior a 172 cm). EC 20 Fiscal de Rendas/MS – 2006 [FGV]. Se X tem distribuição normal com média 4 e variância 9, a probabilidade de X>6 vale, aproximadamente: a) 0,25 b) 0,28 c) 0,33 d) 0,37 e) 0,46 Na prova foi fornecida a tabela de áreas para a variável normal com média zero e variância unitária. Para consultar a tabela, temos que fazer a transformação. Z = X − μ σ Z = X − 4 3 Em vez de consultarmos o valor 6, da variável X, consultamos o valor correspondente da variável reduzida. Z = 6 − 4 = 2 = 0 66, 3 3 Consultando a tabela, temos que a área verde abaixo é igual a 0,2454. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 59 PROFESSOR VÍTOR MENEZES Figura 16 – Probabilidade de Z assumir valores entre 0 e 2/3 Mas nós queremos a área vermelha da figura abaixo. Figura 17 – probabilidades de Z assumir valores entre 0 e 2/3 (área verde) e probabilidade de Z assumir valores maiores que 2/3 (área vermelha) As duas áreas somadas dão 0,5. Logo, a área vermelha é dada por: 0,5 – 0,2454 = 0,2546. Portanto, a probabilidade de Z assumir valores maiores que 0,66 é de 0,2546. E a probabilidade de X assumir valores maiores que 6 também é de 0,2546. Resposta: letra A. Para resolver as questões de números EC 21 e EC 22 considere a tabela a seguir, que dá valores das probabilidades P(Z ≥ z) para a distribuição normal padrão. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 60 PROFESSOR VÍTOR MENEZES z P(Z ≥ z) 0,00 0,50 0,25 0,40 0,50 0,31 0,75 0,23 1,00 0,16 1,25 0,11 1,50 0,07 EC 21 Analista BACEN/2006 – Área 5 [FCC] As empresas de um determinado setor têm uma situação líquida bem descrita por uma distribuição normal, com média igual a 2,5 milhões de reais e desvio padrão de 2 milhões de reais. Selecionando-se uma empresa aleatoriamente deste setor, a probabilidade dela apresentar uma situação líquida negativa ou nula é de: a) 11% b) 16% c) 23% d) 39% e) 50%. Queremos saber a probabilidade da variável X, normal de média 2,5 e desvio padrão 2 (em milhões de reais), assumir valores menores ou iguais zero. Para consultar a tabela, precisamos usar valores da variável reduzida Z. Z = X − μ σ Z = X − 2 5, 2 Para X igual a zero, Z vale: Z = 0 − 2 5, = − ,1 25 2 Se acharmos a probabilidade de Z assumir valores menores ou iguais a -1,25, automaticamente estaremos encontrando a probabilidade de X assumir valores menores ou iguais a zero. Figura 18 – Probabilidades de Z assumir valores menores que -,125 (área verde) e maiores que 1,25 (área vermelha) www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 61 PROFESSOR VÍTOR MENEZES A tabela da prova forneceu a área vermelha (=0,11). Nós queremos a área verde. Como o gráfico é simétrico, as duas áreas são iguais. A probabilidade de Z ser menor ou igual a -1,25 é de 11%. Portanto, a probabilidade de X ser menor ou igual a zero também é de 11%. Resposta: A. EC 22 Analista BACEN/2006 – Área 5 [FCC] Os valores de determinado título no mercado de investimentos apresentam uma distribuição considerada normal. Sabe-se que os valores de 16% dos títulos são superiores ou iguais a R$ 10.000,00 e que os valores de 60% dos títulos são inferiores a R$ 7.000,00. A média dos valores destes títulos é: a) R$ 8.500,00 b) R$ 8.000,00 c) R$ 7.500,00 d) R$ 6.500,00 e) R$ 4.500,00 Seja X a variável que representa os valores do título. Segundo a tabela dada, sabemos que 16% dos valores de Z são iguais ou superiores a 1. Sabemos também que 40% dos valores de Z são iguais ou superiores a 0,25. Portanto, 60% dos valores de Z são inferiores a 0,25. Assim, os valores 1 e 0,25, da variável Z, correspondem aos valores 10.000 e 7.000 da variável X. Z = X − μ σ Isolando o X: X = Z × σ + μ Quando Z vale 1, X vale 10.000. 10 000. = 1× σ + μ (equação I) Quando Z vale 0,25, X vale 7.000. 7 000. = ,0 25 × σ + μ Multiplicando todos os termos por 4, a igualdade não se altera: 28 000. = 1× σ + 4μ (equação II). Subtraindo a primeira equação da terceira: 28 000. 10 000. 18 000. = 1× σ + 4μ = 1× σ + μ = μ3 μ = 6 000. Resposta: D. ESTATÍSTICA P/ ICMS-SP 62 PROFESSOR VÍTOR MENEZES EC 23 Técnico de controle externo III – TCE/MG – 2007. Área – Economia [FCC] Os valores nominais de um determinado título no mercado apresentam uma distribuição normal. Verificou-se que 40% destes títulos apresentam valores nominais inferiores a R$ 500,00 e que apenas 10% apresentam valores nominais superiores a R$ 2.980,00. Utilizando os valores das probabilidades z P(Z ≤ z) para a distribuição normal padrão: P(Z ≤ z) 0,25 0,60 0,52 0,70 0,67 0,75 0,84 0,80 1,30 0,90 tem-se que o valor médio dos valores nominais destes títulos é: a) R$ 900,00 b) R$ 1.000,00 c) R$ 1.500,00 d) R$ 1.600,00 e) R$ 1.740,00 Seja X a variável que representa os valores do título no mercado. Figura 19 – Probabilidade de Z assumir valores menores que 0,25 (área verde) e maiores que 0,25 (área vermelha) Da tabela, temos que a área verde é de 0,60. Como conseqüência, a área vermelha é de 0,40. Como o gráfico é simétrico, a área amarela da figura abaixo é de 0,40. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 63 PROFESSOR VÍTOR MENEZES Figura 20 – Área amarela: probabilidade de Z assumir valores menores ou iguais a -0,25 Portanto, 40% dos valores de Z são menores ou iguais a -0,25. Sabemos também que 40% dos valores de X são menores que R$ 500,00. Logo, o valor de X igual a 500 corresponde a Z valendo -0,25. Ainda da tabela do enunciado, temos que 90% dos valores de Z são menores ou iguais a 1,30. Portanto, 10% dos valores de Z são maiores que 1,30. Sabemos que 10% dos valores de X são maiores que R$ 2.980. Portanto, quando X vale 2.980, Z vale 1,3. A relação entre Z e X é dada por: Z = X − μ σ Isolando o X: X = Z × σ + μ Quando X vale 500, Z vale -0,25. 500 = − ,0 25 × σ + μ Isolando o desvio padrão: σ = 4μ − 2 000. (equação I). Quando X vale 2.980, Z vale 1,3. 2 980. = 1 3, × σ + μ (equação II). Substituindo I em II: 2 980. 2 980. = 1 3, = 1 3, × σ + μ × (4μ − .2 )000 + μ 2 980. = ,5 2μ − 2 600. + μ 5 580. = ,6 2μ � μ = 900 Resposta: A. ESTATÍSTICA P/ ICMS-SP 64 PROFESSOR VÍTOR MENEZES EC 24 Fiscal ICMS/SP – 2006 [FCC] Verificou-se que os valores arrecadados dos tributos em uma cidade apresentam uma distribuição normal. Sabe-se que 10% destes valores são superiores a R$ 1.770,00 e que 60% são menores ou iguais a R$ 1.350,00. z P(0 ≤ Z ≤ z) Dados: valores das probabilidades 0,00 0,00 0,25 0,10 0,50 0,19 0,75 0,27 1,00 0,34 1,10 0,36 1,20 0,38 1,30 0,40 1,40 0,42 1,50 0,43 P(0 ≤ Z ≤ z) para a distribuição normal padrão. A média e o desvio padrão destes valores calculados utilizando a tabela acima são, respectivamente: a) R$ 1.250,00 e R$ 400,00 b) R$ 1.250,00 e R$ 20,00 c) R$1.410,00 e R$ 400,00 d) R$ 1.410,00 e R$ 20,00 e) R$ 1.560,00 e R$ 20,00. A tabela dada nos diz que a área verde abaixo é de 0,40. Figura 21 – Are verde: probabilidade de Z assumir valores entre zero e 1,3; área vermelha: probabilidade de Z assumir valores maiores que 1,3 Como a área à direita de zero é de 0,5, concluímos que a área vermelha é de 0,10. Portanto, 10% dos valores de Z são superiores a 1,3. A tabela também nos diz que a área verde da figura abaixo é de 0,10. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 65 PROFESSOR VÍTOR MENEZES Figura 22 – Área verde: probabilidade de Z assumir valores entre 0 e 0,25 Como a área à esquerda de zero é de 0,5, então a área vermelha da figura abaixo é de 0,6. Figura 23 – Probabilidade de Z assumir valores menores que 0,25 Portanto, 60% dos valores de Z são menores ou iguais a 0,25. Seja X a variável que representa os valores dos tributos arrecadados. 10% dos valores de X são superiores a R$ 1.770,00. E 10% dos valores de Z são superiores a 1,3. 60% dos valores de X são menores ou iguais a R$ 1.350,00. E 60% dos valores de Z são menores ou iguais a 0,25. A relação entre Z e X é dada por: Z = X − μ σ Isolando o X: X = Z × σ + μ Quando X vale 1.770, Z vale 1,3. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 66 PROFESSOR VÍTOR MENEZES 1770 = 1 3, × σ + μ (equação I) Quando X vale 1.350, Z vale 0,25. 1350 = ,0 25 × σ + μ (equação II) Subtraindo a segunda equação da primeira: 420 = 1 05, × σ � σ = 400 Voltando na equação II: 1350 = ,0 25 × σ + μ 1350 = ,0 25 × 400 + μ � μ = 1250 Resposta: A. EC 25 Fiscal ISS/SP – 2007 [FCC] Para responder à questão seguinte, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z tem distribuição normal padrão, então: P(0 < Z < )1 = 0 341, P(0 < Z < ,1 )6 P(0 < Z < )2 = ,0 445 = ,0 477 Os depósitos efetuados no banco B, num determinado mês, têm distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre todos os referentes ao mês em questão. A probabilidade de que o depósito exceda a R$ 6.000,00 é de: a) 97,7% b) 94,5% c) 68,2% d) 47,7% e) 34,1% Seja X a variável que representa os depósitos feitos no banco B. X tem distribuição normal com média 9000 e desvio padrão 1500. O exercício pediu a probabilidade de X>6000. Para achá-la, precisamos do valor correspondente de Z (normal reduzida). Z = X − μ σ Z = 6000 − 9000 = −2 1500 Vamos achar a probabilidade de Z ser maior que -2. Sabemos que a área verde da figura abaixo é de 0,477. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 67 PROFESSOR VÍTOR MENEZES Figura 24 – Área amarela: probabilidade de Z assumir valores menores que -2; área verde: probabilidade de Z assumir valores entre zero e 2; área vermelha: probabilidade de Z assumir valores maiores que 2. Como a área à direita de zero é de 0,5, à área vermelha é de 0,023 (=0,5 – 0,477). Uma vez que o gráfico é simétrico, concluímos que a área amarela também é igual a 0,023. Desse modo, a probabilidade de Z assumir valores menores ou iguais a -2 é de 2,3%. Consequentemente, a probabilidade de Z assumir valores maiores que -2 é de 97,7%. E a probabilidade de X assumir valores maiores que 6.000 (valor de X que corresponde a Z = -2) também é de 97,7%. Resposta: A EC 26 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] Para responder à questão seguinte considere, dentre os dados abaixo, aqueles que julgar apropriados. Se Z tem distribuição normal padrão, então: P(Z > )2 = 0 023, ; P(0 < Z < ,1 )6 = ,0 445 ; P(Z < )1 = 0 84, ; P(0 < Z < ,2 )3 3 = ,0 49 O tempo para ocorrência de defeitos em máquinas, de uma determinada fabricação, tem distribuição normal com média de 1000 dias e desvio-padrão de 100 dias. Ao desejar que apenas 1% das máquinas sejam substituídas antes do término da garantia, o tempo de garantia que o fabricante deve dar às máquinas vendidas deve ser de: a) 767 dias; b) 584 dias; c) 429 dias; d) 403 dias; e) 356 dias. Exercício bem parecido com os outros. Poderíamos, novamente, ficar desenhando os gráficos da fdp da normal reduzida. Se você já tiver fixado bem o formato do gráfico, dá para ir resolvendo a questão sem desenho. Veja como fica. Considerando que P(0 < Z < ,2 )3 3 = ,0 49 e, tendo em mente que a distribuição normal reduzida é simétrica em torno de zero, concluímos que: P(Z < ,2 )3 3 = 0 5, + ,0 49 = 0 99, Por conseqüência: www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 68 PROFESSOR VÍTOR MENEZES P(Z > ,2 )3 3 = 0 01, Como o gráfico da fdp é simétrico, então: P(Z < − ,2 )3 3 = 0 01, 1% dos valores de Z é menor que -,233. =Z X − μ � X σ = σ × Z + μ X = 100 × (− ,2 )3 3 + 1000 = 767 1% das máquinas apresentam defeito em até 767 dias. Resposta: A. EC 27 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Para resolver a questão seguinte, utilize, dentre as informações dadas a seguir, as que julgar apropriadas. Se Z tem distribuição normal padrão, então: P(Z > )2 = 0 023, ; P(Z < ,1 )6 4 = 0 945, ; P(0 < Z < ,1 )5 = ,0 433 ; P(Z < ,1 )3 4 = 0 91, O padrão de qualidade de uma impressora recomenda que os pontos impressos estejam entre 3,6 e 4,4 mm. Uma impressora imprime pontos com diâmetro X, onde X é aproximadamente normal com média 4 mm e desvio padrão σ . Se a probabilidade de um ponto da impressora estar dentro do padrão de qualidade é de 95,4%, o valor de σ , em mm, é igual a: a) 0,54 b) 0,35 c) 0,29 d) 0,22 e) 0,20. Para a variável X, o intervalo fornecido é centrado na média. Basta notar que: 3 6, + ,4 4 = 4 2 Vamos achar os valores da variável normal padrão (Z), centrados na média (=zero), que delimitem 95,4% dos valores de Z. Será um procedimento análogo ao do EP 12. Vamos dividir esse percentual em dois. 0 954, = ,0 477 2 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 69 PROFESSOR VÍTOR MENEZES Figura 25 – Áreas verde e azul: delimitam 95,4% dos valores de Z Procuramos valores de Z, centrados em zero, tal que a soma das áreas verde e azul seja de 0,954. Como o gráfico é simétrico, então a área verde é igual à área azul e ambas valem 0,477. Como a área à direita de zero é igual a 0,5, concluímos que a área vermelha é de 0,0233. E o enunciado nos disse que P(Z > )2 = ,2 %33 . Portanto, os valores de Z que estamos procurando são de 2 e -2. A relação entre X e Z é: =Z X − μ � X σ = σ × Z + μ Quando X vale 3,6, Z vale -2. 3 6, = σ × (− )2 + 4 � σ = ,0 2 Resposta: E. EC 28 Auditor Fiscal – ICMS/MG [ESAF] As vendas em um mês de determinado produto, de custo unitário, em reais, tem distribuição aproximadamente normal com média de R$ 500,00 e desvio padrão de R$ www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 70 PROFESSOR VÍTOR MENEZES 50,00. Se a empresa decide fabricar, em dado mês, 600 unidades do produto, assinale a opção que dá a probabilidade de que a demanda não seja atendida. (Em sua resposta faça uso da tabela da função de distribuição φ ( x) da normal padrão dada abaixo). x φ ( x) 1,85 0,968 1,96 0,975 2,00 0,977 2,12 0,983 a) 5,0% b) 3,1% c) 2,3% d) 2,5% e) 4,0% Como o produto tem custo unitário, caso as vendas do citado mês sejam superiores a R$ 600,00, então a demanda não será atendida. A pergunta pode ser traduzida como: qual a probabilidade das vendas, neste mês, serem superiores a R$ 600,00? Ou ainda: qual a probabilidade de uma variável aleatória com média 500 e desvio padrão 50 assumir valores maiores que 600? O exercício forneceu a tabela da função distribuição de probabilidade para a normal reduzida (variável Z). Vamos, então, achar o valor de Z correspondente. Z = X − μ σ Quando X vale 600, Z vale: Z = 600 − 500 = 2 50 A probabilidade de X ser maior que 600 é igual à probabilidade de Z ser maior que 2. Da tabela fornecida no exercício, temos que: P(Z ≤ )2 = 0 977, � P(Z > )2 = 0 023, A probabilidade de X ser maior que 600 é de 2,3% Resposta: C. 3 Aproximação da distribuição binomial com a distribuição normal Vamos voltar ao lançamento do dado. Fala sério hein! Esse professor só sabe dar exemplo com o tal do dado! O título do curso deveria ser: “a estatística dos dados”. Brincadeiras a parte, acho que o exemplo do lançamento de um dado é algo bem corriqueiro, simples, que todo mundo consegue imaginar com tranqüilidade. Então tá. Vamos ao dado pela “enésima” vez. Queremos que o resultado seja um múltiplo de 3. Sempre que sair um múltiplo de três, temos um resultado favorável. Vamos lançar do dado n vezes. X vai designar o número de resultados favoráveis. Vamos para o caso de três lançamentos (n = 3). X pode assumir os valores 0, 1, 2 e 3. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 71 PROFESSOR VÍTOR MENEZES Seja “I” a variável que, em cada lançamento, assume valor 1 quando o resultado for favorável. E assume valor 0 quando o resultado for desfavorável. “I” tem distribuição de Bernoulli. Deste modo, em três lançamentos, X pode ser escrito assim: 3 X = ∑ I i i =1 Sabemos que X é uma variável binomial. Ela corresponde à soma de várias variáveis de Bernoulli. Vimos que, pelo teorema do limite central, uma variável aleatória correspondente à soma de inúmeras outras variáveis aleatórias independentes pode ser aproximada por uma variável aleatória normal. Se o número de lançamentos crescer muito, o número de variáveis independentes que somamos também aumenta. Se o valor de ‘n’ for muito grande, a variável X vai ser praticamente normal (aplicação do teorema do limite central). E nós vamos poder utilizar a tabela com as áreas da variável normal. Segundo o livro “Estatística elementar”, do Hoel, a aproximação é muito boa quando: np > 15 e n 1( − p) > 15 Mas já é comum utilizar a aproximação quando np > 5 e n 1( − p) > 5 . Esta propriedade é bastante útil em alguns exercícios. Resumindo: obedecidas algumas condições, para uma variável binomial nós podemos utilizar a tabela com as áreas da variável normal. EC 29 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Em determinadas circunstâncias, uma variável aleatória binomial pode ser bem aproximada por uma variável aleatória normal. Seja X uma variável aleatória binomial com n=400 e p=1/2. Calcule o valor mais próximo de P(181 ≤ X ≤ 219) usando a aproximação da variável binomial pela normal, dado que F(1,96) = 0,975, F(2,17) = 0,985, F(2,33) = 0,99, F(2,41) = 0,992 e F(2,58) = 0,995, onde F(z) é a função de distribuição de uma variável aleatória normal padrão Z. a) 0,95. b) 0,97. c) 0,98. d) 0,984. e) 0,99. Em vez de o exercício fornecer a tabela de áreas para a variável normal, forneceu valores de FDP. Só que nós vimos na aula passada que a FDP também serve para cálculo de www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 72 PROFESSOR VÍTOR MENEZES probabilidade, estando intimamente relacionada com o gráfico da função densidade de probabilidade (fdp). Muito bem, queremos saber a probabilidade de X assumir valores entre 181 e 219. Aqui vem a propriedade que estamos estudando. X é uma variável binomial. Atendidas certas condições, podemos considerá-la praticamente normal. É o que faremos neste exercício. As condições que estudamos eram: np > 15 e n 1( − p) > 15 . Lembrando: · n é o número de experimentos · p é a probabilidade de sucesso em cada experimento. · q é a probabilidade de fracasso em cada experimento (q = 1 - p). Para este exercício ficamos com: np = 400 × 0 5, = 200 n 1( − p) = 400 × 0 5, = 200 As condições foram atendidas. É claro que nem precisava verificar se as condições seriam atendidas. O exercício disse que era para aproximar a distribuição binomial pela distribuição normal. Se o exercício mandou fazer assim, a gente faz, sem discutir. Conclusão: para esta variável binomial X, que atende a certas condições, nós podemos utilizar a tabela de áreas da variável normal. Nesta aula nós vimos como calcular a média de uma variável binomial. μ = np Vimos também a fórmula da variância da variável binomial. σ 2 = npq Para a variável binomial do exercício, a média e a variância ficam: μ = np � μ = 400 × 0 5, = 200 σ 2 = npq � σ 2 = 400 × 0 5, × 0 5, = 100 E o desvio padrão fica: σ = 10 Portanto esta variável binomial X é muito próxima a uma variável normal de média 200 e desvio padrão igual a 10. A pergunta do enunciado pode ser reescrita assim: qual a probabilidade de uma variável normal de média 200 e desvio padrão 10 assumir valores entre 181 e 219? Gostaríamos de consultar a tabela de áreas da variável normal de média 200 e desvio padrão 10. Mas só nos foram fornecidos valores para a variável Z (variável normal reduzida). Vamos, portanto, achar os valores de Z correspondentes. A transformação para chegar à variável reduzida é: Z = X − μ σ www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 73 PROFESSOR VÍTOR MENEZES Quando X vale 181, Z vale: Z = 181 − 200 = 1− 9, 10 Quando X vale 219, Z vale; Z = 219 − 200 = 1 9, 10 Não foram fornecidos quaisquer dados para 1,9 ou -1,9. O valor mais próximo para o qual o exercício forneceu probabilidade é 1,96. A FDP para Z igual a 1,96 é 0,975. Se F(1,96) = 0,975, isto significa que a probabilidade de Z assumir valores menores ou iguais a 1,96 é de 97,5%. Ou seja, a área verde da abaixo é de 97,5%. Figura 26 – Área verde: probabilidade da variável normal reduzida Z assumir valores menores ou iguais a 1,96 Sabemos que a área inteira da figura acima é igual a 1 (a probabilidade de Z assumir um valor qualquer é de 100%). A área verde é de 97,5%. Portanto, a área amarela é de 2,5%. Como o gráfico é simétrico, a área à esquerda de -1,96 também é de 2,5%. Deste modo, a área verde da figura abaixo é de 95%. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 74 PROFESSOR VÍTOR MENEZES Figura 27 – Área verde: probabilidade de Z assumir valores entre -1,96 e 1,96 Os valores -1,96 e 1,96 delimitam o intervalo centrado em zero que contém 95% dos valores de Z. Ou seja, 95% dos valores de Z estão entre -1,96 e 1,96. Só que nós gostaríamos de saber qual a porcentagem entre -1,9 e 1,9. Esta nós não temos como calcular. Por isto o exercício perguntou o valor que mais se aproxima. Assim, aproximadamente 95% dos valores de Z estão entre -1,9 e 1,9. Disto temos que aproximadamente 95% dos valores de X estão entre 181 e 219. Resposta: A. EC 30 Analista de Controle Externo – TCU/2008 [CESPE] Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos de 2005 a 2007. Ano Número de imóveis Ofertados (X) Vendidos (Y) 2005 1.500 100 2006 1.750 400 2007 2.000 700 [...] Considerando que em 2008 sejam ofertados 2.500 imóveis, dos quais sejam vendidos Y imóveis nesse mesmo ano, nesse caso, se a probabilidade de um imóvel ofertado em 2008 ser vendido no mesmo ano for igual a 0,4, e se Y seguir uma distribuição binomial, então a probabilidade de se observar o evento Y ≥ 1.000 imóveis será inferior a 0,41. Para resolver a questão, com exatidão, precisaríamos fazer o seguinte. Partiríamos da fórmula vista, que nos dá a probabilidade de cada valor em uma distribuição binomial. P Y( � n � = k ) = × p k × q n−k� k � � � � www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 75 PROFESSOR VÍTOR MENEZES Primeiro, calcularíamos a probabilidade de Y ser igual a 1.000. P(Y = .1 )0 00 = � 2500 � × ,0 41000 × 0 6, � 1 � � 000 � 2500 1000− � Depois, fazemos a mesma coisa para outros valores. Calculamos a probabilidade de Y ser igual a 1001. Depois, 1002. E assim por diante, até 2500. Só que isso vai dar um trabalho muito grande. O que fazer??? Note que o número de imóveis é bem grande. A variável binomial Y é uma soma de 2500 variáveis independentes com distribuição de Bernoulli. A soma de um número muito grande de variáveis independentes tem distribuição próxima de uma normal. Assim, a variável Y, além de ser binomial, se aproxima de uma distribuição normal. A média de Y é: Yμ = n × p = ,0 4 × 2500 = 1.000 A média de Y é de 1.000 imóveis. Como Y tem distribuição próxima de uma normal, sabemos que seu gráfico é simétrico em torno de sua média. Desse modo, a probabilidade de Y ser maior que 1000 é igual à probabilidade de Y ser menor que 1000, e ambas são iguais a 50%. 50% não é inferior a 0,41. O item está errado. XX AMOSTRAGEM De acordo com o cronograma inicial, deveríamos, antes de “amostragem”, ver algumas outras distribuições (faltam ainda a distribuição T e a de qui-quadrado). Mas vou deixá- las para a próxima aula. Mudemos de tópico. Entraríamos agora em “amostragem” e “estimadores”. E aí vem outra alteração. Vou deixar os “estimadores” também para a próxima aula. Lá na aula 1 nós vimos que uma amostra é um subconjunto da população. Estamos interessados em estudar a população inteira. Mas, por alguma limitação (de tempo, de custo, impossibilidade física, etc), não é possível faze-lo. Assim, selecionamos uma amostra para, a partir dela, tentar tirar conclusões sobre a população. 1 Amostragem aleatória simples A amostragem aleatória simples é a mais cobrada em provas de concursos. De forma bem resumida, podemos dizer que se trata da amostragem feita de forma que cada elemento da população tem a mesma chance de ser escolhido. Por exemplo: queremos escolher algumas pessoas de uma empresa para realizar uma entrevista. Escrevemos os nomes de todos os funcionários em pedaços de papel de mesmo tamanho. Colocamos todos os nomes em um saco. Misturamos bem todos os papéis. Feito isto sorteamos 5 nomes. Este é um exemplo de amostragem aleatória simples. Quando a população é descrita por uma variável contínua, não podemos mais falar em probabilidade de ocorrer um dado valor. Nesse caso, segundo Stevenson, a amostra é aleatória se “a probabilidade de incluir na amostra qualquer intervalo de valores é igual à percentagem da população que está naquele intervalo” www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 76 PROFESSOR VÍTOR MENEZES 2 Amostragem estratificada Há diversos outros tipos de amostragem. Na prática, muitas vezes a amostragem aleatória simples pode não ser a mais indicada. Mas, para concursos, é a mais importante. Uma alternativa à amostragem aleatória é a amostragem estratificada. Nela, dividimos nossa população em extratos. Cada extrato abriga elementos mais ou menos homogêneos. Exemplo: estamos fazendo uma pesquisa sobre o perfil de consumo das pessoas de uma cidade. É possível que, para o tipo de produto a que se refere a pesquisa, seja interessante separar a população por idade. Dividimos nossa população em extratos. Um extrato para crianças e jovens. Outro para adultos. E um terceiro para idosos. Dentro de cada extrato fazemos uma amostragem aleatória. Qual a vantagem disso? Se cada estrato for realmente homogêneo, a variabilidade dos dados, dentro de cada estrato, será pequena, o que permite que trabalhemos com amostras menores. Vejamos um caso extremo. Que bom seria (para quem está fazendo a pesquisa) se todos os idosos do nosso estrato tivessem exatamente o mesmo perfil de consumo. Poderíamos tomar apenas um deles como a amostra (a amostra teria tamanho 1), de forma que conheceríamos muito bem o comportamento de todos eles. Para que a amostragem seja boa, é importante que os tamanhos das amostras a serem feitas em cada extrato sejam proporcionais ao tamanho do extrato. Assim, se 30% da população desta cidade é formado por crianças/jovens e nós iremos entrevistar ao todo 100 pessoas, seria interessante que 30 pessoas fossem crianças/jovens. Outros critérios de formação de extratos poderiam ser: sexo, região geográfica, renda, profissão. 3 Amostragem por conglomerado Nesta amostragem nós dividimos novamente a população. Só que não nos preocupamos em separar a população em extratos com características semelhantes. Dividimos a população em conglomerados. Conglomerado são subconjuntos da população que, idealmente, são bastante heterogêneos, representando bem o que ocorre na população inteira. Uma das grandes vantagens da amostragem por conglomerado é a redução de custos. Compõem o conglomerado elementos que estão fisicamente muito próximos. Por essa condição, embora fosse bem interessante que cada conglomerado tivesse elementos bem heterogêneos, isso acaba não ocorrendo. Vejamos um exemplo, para ficar mais claro. O exemplo que segue foi retirado do livro “Estatística Geral e Aplicada” do Gilberto Martins. Desejamos selecionar uma amostra de chefes de família de uma cidade. Suponha que, para o tipo de pesquisa, seria útil separar os chefes de família por idade. Até 30 anos; de 31 a 45; e de 45 em diante. Seria uma amostragem estratificada. Só que isso às vezes pode ser meio difícil. Às vezes não se tem, previamente, uma lista com todos os chefes de família (e suas respectivas idades). Às vezes até se tem parte dessa informação, mas pode ser que chefes de família de um mesmo estrato estejam muito espalhados na cidade, o que tornaria mais demorada (e cara) a amostragem. Uma outra opção é a amostragem por conglomerado. Aqui entramos, de fato, no exemplo do livro do Martins. Podemos separar a cidade em quarteirões. Cada quarteirão é um conglomerado. Fazemos uma seleção dos conglomerados que serão pesquisados, por meio de uma amostra aleatória simples. Escolhidos os quarteirões, nos dirigimos a eles e entrevistamos todos os chefes de família que nele residem. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 77 PROFESSOR VÍTOR MENEZES Seria ótimo se, em cada quarteirão, tivéssemos elementos bem heterogêneos, que representassem bem toda a população. Assim, precisaríamos de poucos quarteirões (poucos conglomerados) para ter uma boa noção do que ocorre na população. Só que, pelo fato de os elementos de cada conglomerado estarem fisicamente ligados (todos os chefes de família de um quarteirão são vizinhos, moram perto uns dos outros), é difícil que os conglomerados sejam realmente heterogêneos. É bem possível que quarteirões formados por casas grandes tenham chefes de famílias com idade mais elevada, que já constituíram família, têm filhos, precisam de mais espaço. Pessoas que moram num mesmo quarteirão geralmente têm mesmo nível de renda, freqüentam os mesmos estabelecimentos (que ficam nas proximidades), etc, o que, dependendo da pesquisa, pode revelar elementos mais semelhantes (com tendência à homogeneidade) do que diferentes. Para minimizar esse problema, é importante escolher um número maior de conglomerados. 4 Amostragem sistemática Caso os valores que se pretendam investigar não estejam em nenhuma ordem específica (relacionada com a variável pesquisada), é possível fazer a amostragem de forma “periódica”. Poderíamos, por exemplo, a cada dez itens da população, escolher um. Tomaríamos apenas o 10°, o 20°, o 30° e assim por diante. Repare que o fato de os dados estarem ordenados não atrapalha na amostragem sistemática. O problema pode surgir quando há relação entre o critério de ordem dos dados e a variável estudada. Vejamos um primeiro exemplo. Estamos estudando a altura de um certo grupo de pessoas. Poderíamos tomar uma lista de nomes em ordem alfabética e escolher um a cada 20 nomes. Esta é uma amostragem sistemática. Escolhidos os nomes, medimos as alturas das pessoas selecionadas. É razoável que a ordem alfabética não guarde qualquer relação com a altura da pessoa. A amostragem sistemática poderia ser feita sem problemas. O problema que pode ocorrer na amostragem sistemática é os elementos estarem organizados segundo um critério que tenha relação com a variável pesquisada. Um exemplo interessante, tirado do livro “Estatística Aplicada à Administração”, do Stevenson, é o que segue. Imagine que queiramos pesquisar dados sobre imóveis de uma dada região. Vamos escolher os imóveis a serem pesquisados a partir da lista telefônica. Caso a nossa lista telefônica traga as casas conforme sua ordem na rua, é possível que tenhamos um problema. É possível que casas de esquina (que nesta situação estariam igualmente espaçadas) tenham características diferentes. Podem ser mais caras, terem um terreno maior, pagarem mais imposto, etc. Assim, pode ser que a amostragem sistemática resulte em tomarmos predominantemente casas de esquina, o que certamente vai trazer um erro na nossa conclusão sobre a distribuição dos dados para aquele bairro. Neste caso, o problema foi que havia uma certa relação entre a variável pesquisada e a ordem segundo a qual estavam organizados os itens pesquisados. Treinemos um pouco os conceitos de amostragem. EC 31 Analista Previdenciário Pleno – Área: Estatística – Paraná Previdência 2002. [CESPE] Julgue os itens seguintes, relativos a técnicas de amostragem. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 78 PROFESSOR VÍTOR MENEZES 1. No caso de uma amostra aleatória de tamanho n extraída de uma população de N elementos, a probabilidade de seleção de cada uma das combinações amostrais possíveis é igual a 1/N. 2. Considere a seguinte situação hipotética. Uma determinada população pode ser dividida em subgrupos com características semelhantes, como sexo, faixa etária, rendimento mensal etc. Os subgrupos formam uma partição da população e os elementos selecionados são resultantes de uma amostra aleatória simples efetuada em cada subgrupo. Nessa situação, o desenho amostral é conhecido como amostragem por conglomerados. 3. Considere a seguinte situação hipotética. Uma empresa quer estudar a renda de empregados rurais existentes em uma área do interior do estado do Paraná. Devem ser aplicados 1.200 questionários, mas a empresa não possui um cadastro contendo dados sobre os empregados rurais. A inexistência do cadastro impede o sorteio aleatório de tais empregados. Além disso, o custo de contactar diretamente as famílias rurais dispersas em uma grande área é muito elevado. Para viabilizar o estudo, a área do interior do estado foi dividida em pequenas subáreas disjuntas. Foram selecionadas aleatoriamente algumas subáreas e a pesquisa procurou entrevistar todos os empregados rurais dentro delas. Nessa situação, o desenho amostral é conhecido como amostragem estratificada. Questão do CESPE. Primeiro item. Vamos colocar números para ficar mais fácil de entender. A população tem 5 elementos (1, 2, 3, 4, 5). Vamos fazer amostras com tamanho 2. As amostras possíveis são: 1,2; 1,3; 1,4; 1,5; 2,3; 2,4; 2,5; 3,4; 3,5; 4,5. São possíveis 10 amostras. A probabilidade de seleção de cada uma das possíveis amostras é 1/10. O exercício afirma que esta probabilidade é de 1/5. O item está errado. O exercício pretendeu confundir o candidato. Quando temos N elementos na população e vamos escolher um, de forma aleatória, a sua probabilidade de ser escolhido é 1/N. Quando vamos escolher amostras de tamanho ‘n’, temos que ver quantas combinações são possíveis. Se a amostra for aleatória simples, cada combinação terá a mesma chance de ser escolhida. Segundo item. A amostragem descrita é a amostragem estratificada. Item errado. Terceiro item. A amostragem descrita é por conglomerados. Item errado. EC 32 Perito Criminal – Formação em estatística. SEAD/PA/2007. [CESPE] www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 79 PROFESSOR VÍTOR MENEZES Considere um levantamento por amostragem sistemática que consiste em entrevistar um indivíduo a cada 5 indivíduos que entram em determinada fila. Nessa situação, a fração amostral é igual a: a) 0,05 b) 0,20 c) 0,80 d) 1,00 Questão do CESPE. Achou estranho? Pois é, CESPE também faz prova de múltipla escolha. Se estamos entrevistando um indivíduo a cada cinco que entram na fila, estamos fazendo uma amostragem sistemática. A fração amostral é dada pela relação entre o tamanho da amostra e o tamanho da população. Neste caso, é de 1/5 (ou 0,20). Resposta: B. EC 33 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Uma pesquisa pretende estimar o valor médio mensal dos salários recebidos pelos professores de 4 escolar do bairro Saúde. Para a pesquisa primeiramente foram listados todos os professores para as 4 escolas segundo o sexo resultando em 2000 professores do sexo feminino e 1500 professores do sexo masculino. Foram propostos dois planos amostrais distintos. O primeiro plano previa um sorteio com reposição de 350 professores do total de 3500. Na segunda proposta, o total da população de professores foi dividido em dois grupos (um grupo do sexo feminino e outro grupo do sexo masculino) e seriam sorteados 10% de cada grupo com reposição. Segundo a teoria geral da amostragem, o primeiro e o segundo plano são, respectivamente: a) amostragem aleatória simples e amostragem estratificada b) amostragem aleatória simples e amostragem estratificada c) amostragem estratificada e amostragem aleatória simples d) amostragem aleatória simples e amostragem por conglomerado em dois estágios e) amostragem aleatória simples e amostragem por conglomerados. No primeiro plano, todas as combinações de 350 professores são igualmente prováveis. Temos uma amostragem aleatória simples. No segundo plano, nem todas as combinações são possíveis. Não é possível, por exemplo, que todos os 350 professores escolhidos sejam do mesmo sexo. Na segunda amostragem, separamos a população em extratos (conforme o sexo). E fizemos com que os tamanhos das amostras, dentro de cada extrato, sejam proporcionais ao tamanho dos estratos dentro da população. É uma amostragem estratificada. Resposta: A Ficamos por aqui nesta sexta aula. Bons estudos! Vítor www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 80 PROFESSOR VÍTOR MENEZES EC 1 LISTA DAS QUESTÕES DE CONCURSO Analista Previdenciário Pleno – Área estatística – Paraná Previdência/2002. [CESPE] Parte das atribuições do analista previdenciário é a participação na elaboração de sistemas de informações previdenciárias. As informações, em geral, vêm de diversas fontes. É importante que um sistema de informações forneça com detalhes todo o processo metodológico, desde a obtenção dos dados até a sua disponibilização para o usuário final. Para assegurar a fidedignidade dos dados, as possíveis fontes de erros devem ser monitoradas e os erros, quando detectados, devem ser corrigidos. Nesse sentido, considere por hipótese, que o departamento DDD de determinada empresa deva coletar e enviar diariamente um conjunto de informações para a previdência. Ao longo do procedimento de envio dessas informações, há várias situações problemáticas, como dificuldades de transmissão dos dados, perda acidental de dados, atraso na coleta dos dados etc. Suponha que, ocorrendo uma dessas situações problemáticas, uma nova tentativa seja feita apenas no dia seguinte. Suponha ainda que, em 1.000 dias, um relatório gerencial tenha apresentado os seguintes resultados. Situação Quantidade de ocorrências em dias Impossibilidade de coleta das informações dentro do prazo 300 Problema na transmissão dos dados coletados 140 Problema na recepção dos dados transmitidos 56 Julgue o item seguinte, com base na situação hipotética descrita acima. 1. Assumindo-se independência entre os dias e que as probabilidades permaneçam constantes ao longo do tempo, a probabilidade de haver sucesso na coleta das informações nos dois dias seguintes aos 1.000 dias de observação é superior a 0,50. EC 2 Analista de Meio Ambiente e de recursos hídricos – Área estatística ou matemática. SEAMA/ES – 2007. [CESPE] X Classificação Probabilidade 80 < X ≤ 100 Ótima/muito 80 boa 40 < X ≤ 80 Boa/aceitável 15 0 < X ≤ 40 Imprópria 5 Com base nas informações da tabela acima, em que são dadas a distribuição e a classificação do índice de qualidade da água (X), instrumento para avaliação das condições bacteriológicas e físico-químicas de um corpo d’água, julgue os itens seguintes. 1. Considere-se uma amostra aleatória simples de índices X1, X2 e X3. Neste caso, a probabilidade de que exatamente dois desses índices resultem na classificação da água como ótima ou muito boa é inferior a 0,5. 2. Na situação considerada, X é uma variável aleatória discreta e assimétrica. EC 3 Auditor Fiscal/MG – 2005 [ESAF]. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 81 PROFESSOR VÍTOR MENEZES Suponha que a probabilidade de que se encontre um erro contábil grave em uma auditoria seja 0,2. Se dez auditorias independentes são realizadas, assinale a opção que dá a probabilidade de que não mais do que uma detecte erro contábil grave. a) 2 8, × 4 / 5 b) 0,400 c) 0,210 d) 2 8, e) 2 8, × ( )4 / 5 10 × ( )4 / 5 9 EC 4 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] Um procedimento de controle de qualidade foi planejado para garantir o máximo de 5% de itens defeituosos na produção. A cada 20 minutos sorteia-se uma amostra aleatória de 10 itens e, havendo mais de 10% defeituosos, nesta amostra, interrompe-se a produção para verificação. A probabilidade de uma interrupção desnecessária é: a) 1 − ,0 10 95 b) 1 − ,1 45 × 0 95, 9 c) ,0 10 05 d) 9 × 0 05, 9 × 0 95, e) 1 − 0 5, × 0 95, 9 EC 5 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] A probabilidade de sucesso em um experimento aleatório é p. Seja X o número de experimentos independentes realizados até se obter o primeiro sucesso. Qual a probabilidade de X = k, onde k=1,2,3,.... a) (1-p)k-1. b) p(1-p)k-1. c) k pk-1(1-p). d) pk-1(1-p). e) k(1-p)k-1 p. EC 6 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja X uma variável aleatória discreta com função de probabilidade binomial f ( x) , onde (f k ) = Cn,k p x 1( p− ) n −k e Cn,k é o número de combinações de n elementos tomados k a k. Sendo n=6 e p=1/3, determine f(6). a) 1/729 b) 1 c) 0 d) 64/729 e) 8/729 Temos uma variável binomial. O exercício pediu para calcularmos a probabilidade de X=6. Basta aplicar a fórmula que vimos (e que o próprio exercício forneceu). www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 82 PROFESSOR VÍTOR MENEZES P( X � n � = k ) = × p k × q n−k� k � � � � XP = = � − � 6� � × 1( ( )6 / )3 6 × (2 / )3 6 6 = 1( / )3 6 = 1 / 729 � 6 � � Resposta: A. EC 7 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja F(k) a função de distribuição da variável aleatória definida na questão anterior, determine F(0). a) 0 b) 1/729 c) 64/729 d) 243/729 e) 1. EC 8 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Seja X a soma de ‘n’ variáveis aleatórias independentes de Bernoulli, isto é, que assumem apenas os valores 1 e 0 com probabilidades p e 1-p, respectivamente. Assim, a distribuição de X é: a) binomial com parâmetros “n” e “p” b) gama com parâmetros “n” e “p” c) qui quadrado com “n” graus de liberdade d) laplace e) “t” de student com n-1 graus de liberdade EC 9 Prefeitura Municipal de Vila Velha – Técnico de Nível Superior. Área estatística. [CESPE] Determinado fornecedor informou que 5% dos produtos comercializados por ele apresentam algum tipo de defeito. Uma prefeitura efetuará uma compra desse fornecedor de um grande lote desses produtos. Como parte do procedimento de controle de qualidade dessa prefeitura, uma amostra aleatória de dez produtos do lote enviada pelo fornecedor será retirada. O lote só será aceito pela prefeitura se a amostra não apresentar produtos defeituosos. Caso a amostra apresente um ou mais produtos defeituosos, todo o lote será devolvido ao fornecedor. Com base nas informações apresentadas nessa situação hipotética, julgue os itens que se seguem. 1. A probabilidade de um lote ser devolvido é superior a 0,25. 2. A variância do número de produtos defeituosos na amostra é inferior a 0,40. 3. A moda da distribuição do número de produtos defeituosos na amostra é igual a 1. EC 10 Analista Judiciário. Especialidade: estatística. TRF 1ª Região/2001 [FCC] A probabilidade de que um item produzido por uma máquina seja defeituoso é de 10%. Uma amostra de 30 itens produzidos por esta máquina é selecionada ao acaso. Use a www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 83 PROFESSOR VÍTOR MENEZES aproximação pela distribuição de Poisson para determinar a probabilidade de que não mais do que um item defeituoso seja encontrado nesta amostra. a) 4e 3− b) 4e 2− c) 3e 3− d) 1 − 4e 3− e) 1 − 3e 3− EC 11 Analista Ministerial MPE PE/2006. Área: estatística [FCC] O número de falhas de certo tipo de placa térmica tem distribuição de Poisson, com taxa média de 0,1 defeitos por m2. Na confecção da superfície de um armário, é necessário cobrir uma superfície de 2m por 2m com essa placa. A probabilidade de que haja pelo menos uma falha nessa superfície é de: a) e 0− 1, b) 1 − e 0− 1, c) 1 − e 0− , 4 d) e 0− , 4 e) 1 − ,1 4e −0, 4 EC 12 Analista Ministerial MPE PE/2006. Área: estatística [FCC] Considerando os dados da questão anterior, responda ao que segue. Na confecção de 3 superfícies deste tipo, a probabilidade de que exatamente duas não apresentem defeito é: a) 3 1( − e −0, 4 ) 2 e −0, 4 b) 3e 0− 1, c) 3 1( d) 3 1( e) 3 1( − e −0, 2 ) − e −0 1, ) 2 e −0 1, − e −0, 4 ) 2 e −0,8 EC 13 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] O número de pacientes atendidos por um clínico geral segue uma distribuição de Poisson com taxa de 4 pacientes por hora. A probabilidade de que pelo menos um paciente consulte o clínico geral em um período de 15 minutos é: a) 1 − e 1− b) 1 − e 4− c) e 4− d) e 4 e) e 1− EC 14 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Sabe-se que a variável aleatória X é bi-modal para x=1 e x=2 e que tem distribuição de Poisson. Sabendo que X é diferente de zero, a probabilidade de X assumir um valor menor do que 3 é dada por: 4 4 2 1 4 4 a) b) 2e c) e 2 − 1 e d) − e) e 2 1 − e 2 www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 84 PROFESSOR VÍTOR MENEZES EC 15 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Tem-se que (f x) = Cn, x × p x 1( p− ) n − x , onde Cn, x é o número de combinações de n elementos tomados x a x, f ( x) é a função de probabilidade de uma variável aleatória binomial. Fazendo-se na sua expressão p → 0 e n → ∞ , mas com np = λ , f ( x) tem como limite a função de probabilidade de uma variável aleatória de Poisson, que é: xλ − λ a) λx e − λ b) e c) !x λe − λx d) λe − x / λ e) λx − 1e − x / Γ(λ ) EC 16 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] A temperatura T de destilação do petróleo é uma variável aleatória com distribuição uniforme no intervalo [150,300]. Seja C o custo para se produzir um galão de petróleo. Determine o lucro esperado por galão, supondo que o preço de venda por galão é uma variável aleatória Y dada por: Y = a , se T ≥ 200 Y = b , se T < 200 a) (a + b2 ) / 3 − C b) (a − C ) / 150 + (b − C ) / 150 c) (a + b) / 3 − C d) (a + b) / 150 − C e) (2a + b) / 3 − C EC 17 Analista Ministerial MPE PE/2006. Área: estatística [FCC] Seja X uma variável aleatória, com densidade Uniforme no intervalo [ ]− α ; α , o valor de α que satisfaz à condição P( X > 1 / )2 = 2P( X < − )1 é: a) 2 b) 3/2 c) 1 d) 1/2 e) 1/4 EC 18 Analista – Área documentação. Especialidade – Estatística – MPU/2007 [FCC] O tempo necessário para um medicamento contra dor fazer efeito segue um modelo com densidade Uniforme no intervalo de 5 a 15 (em minutos). Um paciente é selecionado ao acaso entre os que tomaram o remédio. A probabilidade do medicamento fazer efeito em até 10 minutos, neste paciente, é: a) 0,8 b) 0,7 c) 0,5 d) 0,4 e) 0,3 ESTATÍSTICA P/ ICMS-SP 85 PROFESSOR VÍTOR MENEZES EC 19 Estatístico – IBGE/99 As alturas das pessoas adultas, sexo feminino, numa certa população seguem uma distribuição normal com média 160cm e variância 100cm2. A porcentagem de mulheres dessa população que medem mais de 172cm é, aproximadamente, de: (A) 2,2% (B) 10,3% (C) 11,5% (D) 22,8% (E) 38,5% EC 20 Fiscal de Rendas/MS – 2006 [FGV]. Se X tem distribuição normal com média 4 e variância 9, a probabilidade de X>6 vale, aproximadamente: a) 0,25 b) 0,28 c) 0,33 d) 0,37 e) 0,46 Para resolver as questões de números EC 21 e EC 22 considere a tabela a seguir, que dá valores das probabilidades P(Z ≥ z) para a distribuição normal padrão. z P(Z ≥ z) 0,00 0,50 0,25 0,40 0,50 0,31 0,75 0,23 1,00 0,16 1,25 0,11 1,50 0,07 EC 21 Analista BACEN/2006 – Área 5 [FCC] As empresas de um determinado setor têm uma situação líquida bem descrita por uma distribuição normal, com média igual a 2,5 milhões de reais e desvio padrão de 2 milhões de reais. Selecionando-se uma empresa aleatoriamente deste setor, a probabilidade dela apresentar uma situação líquida negativa ou nula é de: a) 11% b) 16% c) 23% d) 39% e) 50%. EC 22 Analista BACEN/2006 – Área 5 [FCC] www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 86 PROFESSOR VÍTOR MENEZES Os valores de determinado título no mercado de investimentos apresentam uma distribuição considerada normal. Sabe-se que os valores de 16% dos títulos são superiores ou iguais a R$ 10.000,00 e que os valores de 60% dos títulos são inferiores a R$ 7.000,00. A média dos valores destes títulos é: a) R$ 8.500,00 b) R$ 8.000,00 c) R$ 7.500,00 d) R$ 6.500,00 e) R$ 4.500,00 EC 23 Técnico de controle externo III – TCE/MG – 2007. Área – Economia [FCC] Os valores nominais de um determinado título no mercado apresentam uma distribuição normal. Verificou-se que 40% destes títulos apresentam valores nominais inferiores a R$ 500,00 e que apenas 10% apresentam valores nominais superiores a R$ 2.980,00. Utilizando os valores das probabilidades z P(Z ≤ z) para a distribuição normal padrão: P(Z ≤ z) 0,25 0,60 0,52 0,70 0,67 0,75 0,84 0,80 1,30 0,90 tem-se que o valor médio dos valores nominais destes títulos é: a) R$ 900,00 b) R$ 1.000,00 c) R$ 1.500,00 d) R$ 1.600,00 e) R$ 1.740,00 EC 24 Fiscal ICMS/SP – 2006 [FCC] Verificou-se que os valores arrecadados dos tributos em uma cidade apresentam uma distribuição normal. Sabe-se que 10% destes valores são superiores a R$ 1.770,00 e que 60% são menores ou iguais a R$ 1.350,00. z P(0 ≤ Z ≤ z) Dados: valores das probabilidades 0,00 0,00 0,25 0,10 0,50 0,19 0,75 0,27 1,00 0,34 1,10 0,36 1,20 0,38 1,30 0,40 1,40 0,42 1,50 0,43 P(0 ≤ Z ≤ z) para a distribuição normal padrão. A média e o desvio padrão destes valores calculados utilizando a tabela acima são, respectivamente: a) R$ 1.250,00 e R$ 400,00 b) R$ 1.250,00 e R$ 20,00 c) R$1.410,00 e R$ 400,00 d) R$ 1.410,00 e R$ 20,00 e) R$ 1.560,00 e R$ 20,00. www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 87 PROFESSOR VÍTOR MENEZES EC 25 Fiscal ISS/SP – 2007 [FCC] Para responder à questão seguinte, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z tem distribuição normal padrão, então: P(0 < Z < )1 = 0 341, P(0 < Z < ,1 )6 P(0 < Z < )2 = ,0 445 = ,0 477 Os depósitos efetuados no banco B, num determinado mês, têm distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre todos os referentes ao mês em questão. A probabilidade de que o depósito exceda a R$ 6.000,00 é de: a) 97,7% b) 94,5% c) 68,2% d) 47,7% e) 34,1% EC 26 Especialista em regulação de saúde suplementar. Especialidade: Estatística. Ministério da Saúde/2007 [FCC] Para responder à questão seguinte considere, dentre os dados abaixo, aqueles que julgar apropriados. Se Z tem distribuição normal padrão, então: P(Z > )2 = 0 023, ; P(0 < Z < ,1 )6 = ,0 445 ; P(Z < )1 = 0 84, ; P(0 < Z < ,2 )3 3 = ,0 49 O tempo para ocorrência de defeitos em máquinas, de uma determinada fabricação, tem distribuição normal com média de 1000 dias e desvio-padrão de 100 dias. Ao desejar que apenas 1% das máquinas sejam substituídas antes do término da garantia, o tempo de garantia que o fabricante deve dar às máquinas vendidas deve ser de: a) 767 dias; b) 584 dias; c) 429 dias; d) 403 dias; e) 356 dias. EC 27 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Para resolver a questão seguinte, utilize, dentre as informações dadas a seguir, as que julgar apropriadas. Se Z tem distribuição normal padrão, então: P(Z > )2 = 0 023, ; P(Z < ,1 )6 4 = 0 945, ; P(0 < Z < ,1 )5 = ,0 433 ; P(Z < ,1 )3 4 = 0 91, O padrão de qualidade de uma impressora recomenda que os pontos impressos estejam entre 3,6 e 4,4 mm. Uma impressora imprime pontos com diâmetro X, onde X é aproximadamente normal com média 4 mm e desvio padrão σ . Se a probabilidade de um ponto da impressora estar dentro do padrão de qualidade é de 95,4%, o valor de σ , em mm, é igual a: a) 0,54 b) 0,35 c) 0,29 d) 0,22 e) 0,20. EC 28 Auditor Fiscal – ICMS/MG [ESAF] As vendas em um mês de determinado produto, de custo unitário, em reais, tem distribuição aproximadamente normal com média de R$ 500,00 e desvio padrão de R$ 50,00. Se a empresa decide fabricar, em dado mês, 600 unidades do produto, assinale a www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 88 PROFESSOR VÍTOR MENEZES opção que dá a probabilidade de que a demanda não seja atendida. (Em sua resposta faça uso da tabela da função de distribuição φ ( x) da normal padrão dada abaixo). x φ ( x) 1,85 0,968 1,96 0,975 2,00 0,977 2,12 0,983 a) 5,0% b) 3,1% c) 2,3% d) 2,5% e) 4,0% EC 29 AFC/CGU - 2008. Área: Estatística e cálculos atuariais. [ESAF] Em determinadas circunstâncias, uma variável aleatória binomial pode ser bem aproximada por uma variável aleatória normal. Seja X uma variável aleatória binomial com n=400 e p=1/2. Calcule o valor mais próximo de P(181 ≤ X ≤ 219) usando a aproximação da variável binomial pela normal, dado que F(1,96) = 0,975, F(2,17) = 0,985, F(2,33) = 0,99, F(2,41) = 0,992 e F(2,58) = 0,995, onde F(z) é a função de distribuição de uma variável aleatória normal padrão Z. a) 0,95. b) 0,97. c) 0,98. d) 0,984. e) 0,99. EC 30 Analista de Controle Externo – TCU/2008 [CESPE] Uma agência de desenvolvimento urbano divulgou os dados apresentados na tabela a seguir, acerca dos números de imóveis ofertados (X) e vendidos (Y) em determinado município, nos anos de 2005 a 2007. Ano Número de imóveis Ofertados (X) Vendidos (Y) 2005 1.500 100 2006 1.750 400 2007 2.000 700 [...] Considerando que em 2008 sejam ofertados 2.500 imóveis, dos quais sejam vendidos Y imóveis nesse mesmo ano, nesse caso, se a probabilidade de um imóvel ofertado em 2008 ser vendido no mesmo ano for igual a 0,4, e se Y seguir uma distribuição binomial, então a probabilidade de se observar o evento Y ≥ 1.000 imóveis será inferior a 0,41. EC 31 Analista Previdenciário Pleno – Área: Estatística – Paraná Previdência 2002. [CESPE] www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 89 PROFESSOR VÍTOR MENEZES Julgue os itens seguintes, relativos a técnicas de amostragem. 1. No caso de uma amostra aleatória de tamanho n extraída de uma população de N elementos, a probabilidade de seleção de cada uma das combinações amostrais possíveis é igual a 1/N. 2. Considere a seguinte situação hipotética. Uma determinada população pode ser dividida em subgrupos com características semelhantes, como sexo, faixa etária, rendimento mensal etc. Os subgrupos formam uma partição da população e os elementos selecionados são resultantes de uma amostra aleatória simples efetuada em cada subgrupo. Nessa situação, o desenho amostral é conhecido como amostragem por conglomerados. 3. Considere a seguinte situação hipotética. Uma empresa quer estudar a renda de empregados rurais existentes em uma área do interior do estado do Paraná. Devem ser aplicados 1.200 questionários, mas a empresa não possui um cadastro contendo dados sobre os empregados rurais. A inexistência do cadastro impede o sorteio aleatório de tais empregados. Além disso, o custo de contactar diretamente as famílias rurais dispersas em uma grande área é muito elevado. Para viabilizar o estudo, a área do interior do estado foi dividida em pequenas subáreas disjuntas. Foram selecionadas aleatoriamente algumas subáreas e a pesquisa procurou entrevistar todos os empregados rurais dentro delas. Nessa situação, o desenho amostral é conhecido como amostragem estratificada. EC 32 Perito Criminal – Formação em estatística. SEAD/PA/2007. [CESPE] Considere um levantamento por amostragem sistemática que consiste em entrevistar um indivíduo a cada 5 indivíduos que entram em determinada fila. Nessa situação, a fração amostral é igual a: a) 0,05 b) 0,20 c) 0,80 d) 1,00 EC 33 Analista Judiciário. Área apoio especializado. Especialidade: Estatística. TRF 2ª Região/2007 [FCC] Uma pesquisa pretende estimar o valor médio mensal dos salários recebidos pelos professores de 4 escolar do bairro Saúde. Para a pesquisa primeiramente foram listados todos os professores para as 4 escolas segundo o sexo resultando em 2000 professores do sexo feminino e 1500 professores do sexo masculino. Foram propostos dois planos amostrais distintos. O primeiro plano previa um sorteio com reposição de 350 professores do total de 3500. Na segunda proposta, o total da população de professores foi dividido em dois grupos (um grupo do sexo feminino e outro grupo do sexo masculino) e seriam sorteados 10% de cada grupo com reposição. Segundo a teoria geral da amostragem, o primeiro e o segundo plano são, respectivamente: a) amostragem aleatória simples e amostragem estratificada b) amostragem aleatória simples e amostragem estratificada c) amostragem estratificada e amostragem aleatória simples d) amostragem aleatória simples e amostragem por conglomerado em dois estágios www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 90 PROFESSOR VÍTOR MENEZES e) amostragem aleatória simples e amostragem por conglomerados. GABARITO DAS QUESTÕES DE CONCURSO EC 1 ERRADO EC 2 CERTO; ERRADO EC 3 E EC 4 B EC 5 B EC 6 A EC 7 C EC 8 A EC 9 CERTO; ERRADO;ERRADO EC 10 A EC 11 C EC 12 E EC 13 A EC 14 B EC 15 B EC 16 E EC 17 B EC 18 C EC 19 C EC 20 A EC 21 A EC 22 D EC 23 A EC 24 A EC 25 A EC 26 A EC 27 E EC 28 C EC 29 A EC 30 ERRADO EC 31 ERRADO; ERRADO; ERRADO EC 32 B EC 33 A www.pontodosconcursos.com.br ESTATÍSTICA P/ ICMS-SP 91 PROFESSOR VÍTOR MENEZES TABELA PARA A VARIÁVEL NORMAL Tabela gerada com o Excel. Z é a variável normal reduzida (média zero e desvio padrão unitário). PROBABILIDADE DE Z ESTAR ENTRE 0 E Z0 Segunda casa decimal de Z0 Z0 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 www.pontodosconcursos.com.br