Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” Faculdade de Engenharia – Campus de Ilha Solteira NOÇÕES DE PROBABILIDADE E ESTATÍSTICA PROFª BERENICE CAMARGO DAMASCENO 2011 unesp Noções de Probabilidade e Estatística 1 Profª Berenice C. Damasceno PROBABILIDADE E ESTATÍSTICA 1.0 ALGUMAS DEFINIÇÕES DE ESTATÍSTICA Etimologicamente a palavra estatística vem de “status” expressão latina que significa, ”sensu lato”, o estudo do estado. Os primeiros a empregarem esse termo foram os Alemães seguidos pela Itália, França, Inglaterra e ainda por outros paises. Para Levasseur a estatística é: “O estudo numérico dos fatos sociais”. Yule define estatística como: “Dados quantitativos afetados marcadamente por uma multiplicidade de causas”. Uma definição mais usual nos dias de hoje seria: “Um método científico que permite a análise, em base probabilística, de dados coligados e condensados”. Ou ainda podemos dizer que Estatística é um conjunto de métodos quantitativos, que servem para a coleta, organização, redução e apresentação de dados, análise dos mesmos e a obtenção de conclusões válidas e tomadas de decisões a partir de tais análises. Estatística pode ser entendida como sendo a ciência de aprendizagem a partir de dados. No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas. Assim podemos dizer que a Estatística fornece métodos que auxiliam o processo de tomada de decisão. 1.1 POR QUE ESTUDAR ESTATÍSTICA? O raciocínio estatístico é largamente utilizado no governo e na administração; assim, é possível que, no futuro, um empregador venha a contratar ou promover um profissional por causa do seu conhecimento de estatística. Essa é uma razão, esperamos que ao final deste trabalho o leitor encontre suas próprias razões. 1.2 A NATUREZA DOS DADOS Os dados estatísticos constituem a matéria prima das pesquisas estatísticas, eles surgem quando se fazem mensurações ou se restringem observações. Estatística descritiva: Trata-se da descrição e resumo dos dados. Probabilidade: É um estudo que envolve o acaso. Inferência: É a análise e interpretação de dados amostrais (Amostragem). Modelos: São versões simplificadas (abstrações) de algum problema ou situação real. Noções de Probabilidade e Estatística 2 Profª Berenice C. Damasceno 1.3 TIPOS DE DADOS Quantitativos Contínuos Discretos Qualitativos Nominais Por postos As variáveis contínuas podem assumir qualquer valor num intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ex.: peso, comprimento, espessura onde se usa a mensuração. As variáveis discretas assumem valores inteiros de dados discretos são os resultados da contagem de números de itens. Ex.: alunos da sala de aula, número de defeitos num carro novo, acidentes de uma fábrica. Os dados nominais surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. Atuam dentro das variáveis “Qualitativas”, às quais devemos associar a valores numéricos para que possamos processar estatisticamente. Ex.: cor dos olhos (azuis, verdes, castanhos), sexo (masculino e feminino), desempenho (excelente, bom, sofrível, mau), etc. Os dados por postos consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, quarto, etc. Ex.: concurso de beleza se classificam em 1ª, 2ª, 3ª colocadas. TABELA 1: A mesma população pode originar diferentes tipos de dados. TIPOS DE DADOS POPULAÇÕES CONTÍNUOS DISCRETOS NOMINAIS POR POSTO Alunos de administração idade/peso N. de classes Homens/Mulheres 3º grau Noções de Probabilidade e Estatística 3 Profª Berenice C. Damasceno 1.4 TIPOS DE LEVANTAMENTOS Os levantamentos podem ser classificados em contínuos, periódicos e ocasionais: CONTÍNUOS: Quando os eventos vão sendo registrados à medida que ocorrem. Exemplos os registros civis dos fatos vitais (nascimento, óbitos e casamentos). PERIÓDICOS: Acontecem ciclicamente. Exemplo é o recenceamento, feito no Brasil a cada dez anos. A realização de um Censo Demográfico representa o desafio mais importante para um instituto de estatística, sobretudo em um país de dimensões continentais como o Brasil, com 8 514 215,3 km2, composto por 27 Estados e 5 507 municípios existentes na data de referência da pesquisa, abrangendo um total de 54 265 618 de domicílios pesquisados (dados do IBGE sobre o Censo de 2000). OCASIONAIS: São aqueles realizados sem a preocupação de continuidade ou periodicidade preestabelecidas, exemplos a maioria dos trabalhos de investigação cientifica. Os dados ainda podem ser classificados em: primários e secundários. DADOS PRIMÁRIOS: Quando o investigador não encontra dados publicados adequados ao seu estudo, parte para a realização de um inquérito, isto é, os dados são levantados diretamente na população no momento da investigação. DADOS SECUNDÁRIOS: Quando o investigador para verificar as suas hipóteses de trabalho utiliza-se de dados já existentes, arquivados, registrados ou publicados. Podem ser, até mesmo, dados gerados pelo Departamento de Estatística de Populações da Fundação Instituto Brasileiro de Geografia e Estatística (IBGE). Noções de Probabilidade e Estatística 4 Profª Berenice C. Damasceno 1.5 PLANEJAMENTO DE EXPERIMENTOS 1- Definição do problema: Um Estudo ou Uma Análise 2- Formular plano adequado para coleta de dados 3- Organizar os dados 4- Analisar e interpretar os dados 5- Relatar as conclusões EXERCÍCIOS 1- Identifique os seguintes exemplos em termos de tipos de dados: a- 17 gramas b- 3 certos, 2 errados c- 25 segundos d- 25 alunos na classe e- tamanho de camisa f- Km/litro g- O mais aprazível h- O mais lento i- 5 acidentes no mês de maio Responder as perguntas: 1- Defina o termo Estatística. 2- Responder a pergunta: Por que estudar estatística? 3- Dar exemplos de como você, na sua profissão, poderá se beneficiar do conhecimento de Estatística? Noções de Probabilidade e Estatística 5 Profª Berenice C. Damasceno 2.0 AMOSTRAGEM AMOSTRAGEM VERSUS CENSO: Uma amostra usualmente envolve o estudo de uma parcela dos ítens de uma população, enquanto que o censo requer o estudo de todos os ítens. Restrições ao Censo: - Custo - Populações infinitas - Dificuldade nos critérios (Precisão) - Produtos de testes Destrutivos (fósforos, munições) - Tempo despendido (atualização) - Tipos de informações mais restritivas Casos de excessão: - Populações pequenas - Amostras grandes em relação à população - Se exige precisão completa - Se já são disponíveis informações completas 2.1 DEFINIÇÕES: POPULAÇÃO: é o conjunto de indivíduos (ou objetos), que tem pelo menos uma variável comum observável. População é a totalidade dos elementos de um conjunto com uma dada característica, no qual se deseja fazer um determinado estudo. AMOSTRA: é qualquer subconjunto da população extraída para se realizar estudos estatísticos. . POPULAÇÃO AMOSTRA Noções de Probabilidade e Estatística 6 Profª Berenice C. Damasceno A estatística indutiva é a ciência que busca tirar conclusões probabilísticas sobre a população, com base em resultados verificados em amostras retiradas dessa população. Entretanto não basta que saibamos descrever convenientemente os dados da amostra para que possamos executar, com êxito, um trabalho estatístico completo. Antes de tudo é preciso garantir que a amostra ou amostras que serão utilizadas sejam obtidas por processos adequados. - O que é necessário garantir, em suma, é que a amostra seja “Representativa” da população. Dois aspectos nas amostras são fundamentais, e que dão a sua representatividade em termos: - Qualitativos: Amostras que representem todas as sub-populações, quando for o caso. - Quantitativos: Que possua quantidade de dados suficientes para representar a população. Na indústria onde amostras são freqüentemente retiradas para efeito de Controle da Qualidade dos produtos e materiais, em geral os problemas de amostragem são mais simples de resolver. Por outro lado, em pesquisas sociais, econômicas ou de opinião, a complexibilidade dos problemas de amostragem são normalmente bastante grandes. Inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte, ou a amostra, dele. A probabilidade e a amostragem estão estreitamente correlacionadas e juntas formam o fundamento da teoria de inferência. - Amostragem é o ato de retirar amostra, isto é, a ação. - Amostra é a quantidade de dados especificados para representar a população. Noções de Probabilidade e Estatística 7 Profª Berenice C. Damasceno Amostragem aleatória permite estimar o valor do erro possível, isto é, dizer “ quão próxima” está a amostra da população, em termos de representatividade. Amostragem não aleatória não apresenta esta característica. Há vários métodos para extrair uma amostra, talvez o mais importante seja a amostragem aleatória. De modo geral, a amostragem aleatória exige que cada elemento tenha a mesma oportunidade de ser incluído na amostra. Nas Populações discretas uma amostra aleatória é aquela em que cada item da população tem a mesma chance de ser incluído na amostra. Nas Populações contínuas, uma amostra aleatória é aquela em que a probabilidade de incluir na amostra qualquer intervalo de valores é igual à percentagem da população que está naquele intervalo. Populações finitas: é quando, temos constituído por números finitos, ou fixos de elementos, medidas ou observações. Ex.: Peso bruto de 3000 latas de tinta de um certo lote de produção. Populações infinitas: são aquelas que contém, pelo menos hipoteticamente, um número infinito de elementos. Ex.: Produção de carros V.W. produzidos no Brasil e a serem produzidos (universo volkswagem), processo probabilístico. 2.2 AMOSTRAGEM ALEATÓRIA BASEADA EM NÚMEROS ALEATÓRIOS (RANDÔMICOS) As tabelas de números aleatórios contém os dez algarismos 0,1,2,3,4,......,9. Esses números podem ser lidos isoladamente ou em grupos; podem ser lidos em qualquer ordem. A probabilidade de qualquer algarismo aparecer em qualquer ponto é 1/10. Portanto todas as combinações são igualmente prováveis. Noções de Probabilidade e Estatística 8 Profª Berenice C. Damasceno Conceitualmente, poderíamos construir uma tabela de números aleatórios numerando dez bolinhas com os algarismos de 0 a 9 , colocando-as numa urna, misturando bem e extraindo uma de cada vez, com reposição, anotando os valores obtidos. A titulo de ilustração poderíamos querer selecionar aleatoriamente 15 clientes de uma lista de 830 de um grande magazine, a finalidade poderia ser : Estimar a freqüência de compras; Determinar o valor médio de cada compra; Registrar as queixas contra o sistema. 2.3 OUTROS PLANOS DE AMOSTRAGEM Amostragem probabilística versus Amostragem não probabilística. Os planos de amostragem probabilística são delineados de tal modo que se conhece a probabilidade de todas as combinações amostrais possíveis. Em razão disso, pode-se determinar a quantidade de variável amostral numa amostra aleatória e uma estimativa do erro amostral. A amostragem aleatória é um exemplo da amostragem probabilística. A amostragem não probabilística é a amostragem subjetiva, ou por julgamento, onde a variabilidade amostral não pode ser estabelecida com precisão, conseqüentemente, não é possível nenhuma estimativa do erro amostral. A verdade é que, sempre que possível, deve-se usar a amostragem probabilística. 2.4 AMOSTRAGEM POR JULGAMENTO (NÃO PROBABILÍSTICA) Se o tamanho da amostra é bem pequeno; digamos, de uns 5 itens, a amostragem aleatória pode dar resultados totalmente não representativos, ao passo que uma pessoa familiarizada com a população pode especificar quais os itens mais representativos da população. Noções de Probabilidade e Estatística 9 Profª Berenice C. Damasceno Exemplo: Uma equipe médica deve trabalhar com pacientes que se apresentem como voluntários para testar um novo medicamento. Nenhum desses grupos podem ser considerados como uma amostra aleatória do público em geral, e seria perigoso tentar tirar conclusões gerais com base em tal estudo. Todavia, os resultados poderiam proporcionar uma base para a elaboração de um plano de amostragem aleatório para validar os resultados básicos. Os perigos inerentes à pesquisa médica, bem como outro tipo de pesquisa, freqüentemente obrigam a limitar a pesquisa inicial a um pequeno grupo de voluntários. Exemplo: A aplicação de hormônios em mulheres na menopausa, após um período de tempo notou-se o aumento das chances de adquirirem câncer de mama, doenças cardíacas etc. 2.5 AMOSTRAGEM PROBABILÍSTICA SISTEMÁTICA ESTRATIFICADA CONGLOMERADO AMOSTRAGEM SISTEMÁTICA É muito parecida com a amostragem aleatória simples. Podemos ter uma amostragem realmente aleatória, escolhendo-se cada K-ésima amostra, onde K obtem-se dividindo o tamanho da população pelo tamanho da amostra. K= N onde: N= Tamanho da População n n= Tamanho da Amostra EX. N= 200 e n=10 então K=200/10 = 20 Significa que será escolhido um item a cada seqüência de 20 de uma lista. Para iniciar pode-se usar uma tabela de números aleatórios de 0 a 9 para iniciar os grupos. Por exemplo se der o 9, escolhemos o 9º, 29º, 39º ,49º , etc. Noções de Probabilidade e Estatística 10 Profª Berenice C. Damasceno AMOSTRAGEM ESTRATIFICADA Pressupõe a divisão da população em sub-grupos Homogêneos (Estratos), procedendo então a amostragem de cada sub-grupo. Ex.: Para se fazer o inventário do estoque, é comum termos 10% dos itens representarem cerca de 60% do valor total em quanto que os 90% restantes representam só 40% do valor total (Curva A,B,C; Pareto; regra 80/20). AMOSTRAGEM POR CONGLOMERADO Pressupõe a disposição dos itens de uma população em sub-grupos heterogêneos (sub- populações) representativos da população global. Neste caso cada conglomerado pode ser encarado como uma minipopulação. Ex.: Estudo pré-eleitoral para medir a preferência dos eleitores. (Sub-grupos: sexo, educação, faixa etária, poder aquisitivo, região da habitação, etc.) Noções de Probabilidade e Estatística 11 Profª Berenice C. Damasceno RESUMO A finalidade da amostra é permitir fazer inferência sobre a população após inspeção de apenas parte dela. Fatores como custo, ensaios destrutivos e populações infinitas, tornam a amostragem preferível a um estudo completo (Censo) da população. Naturalmente espera-se que a amostra seja representativa da população da qual foi extraída. Potencialmente, este objetivo é atingido quando a amostragem é aleatória. Para populações discretas o termo “Aleatório” significa que cada item da população tem a mesma chance de participar na amostra. No caso de populações contínuas, significa que a probabilidade de incluir qualquer valor de um dado intervalo de valores é igual à proporção de valores naquele intervalo. As amostras aleatórias podem ser obtidas: - Através de um processo de mistura, como o embaralhamento de cartas; - Pela utilização de um processo mecânico (Misturadores); - Utilizando-se uma tabela de números aleatórios para proceder à seleção de uma lista. Em certas condições, podem ser mais eficientes variantes da amostragem aleatória simples, tais como amostragem sistemática (periódica), estratificada (sub-grupos Homogêneos), ou amostragem por aglomerados (sub-grupos convenientes e heterogêneos). A principal vantagem da amostragem aleatória é que se pode determinar o grau de variabilidade amostral, o que é essencial na inferência estatística. Para a amostragem não probabilística falta esta característica. Noções de Probabilidade e Estatística 12 Profª Berenice C. Damasceno QUESTÕES PARA RECAPITULAÇÃO 1- Em que circunstância é a amostragem preferível a um censo completo? 2- Quando se deve preferir um censo a uma amostragem? 3- Defina “Amostra Aleatória”. 4- Explique rapidamente as características: a- da amostragem por conglomerado; b- da amostragem estratificada; c- da amostragem sistemática. 5- O que é amostragem por julgamento e em que circunstância deve ser usada? 6- O que é amostragem probabilística e quando deve ser usada? 7- Explique o que é uma população: a- Finita; b- Infinita. Noções de Probabilidade e Estatística 13 Profª Berenice C. Damasceno 3.0 ANÁLISE EXPLORATÓRIA DE DADOS Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de analisar e entender uma massa de dados, relevantes ao seu particular objeto de estudos. De modo geral, podemos dizer que a essência da ciência é a observação e que seu objetivo básico é a inferência. Esta é a parte da metodologia da ciência que tem por objetivo a coleta, a redução, a análise e a modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população, da qual os dados (amostras) foram obtidos. 4.0 DISTRIBUIÇÃO DE FREQÜÊNCIA Para cada tipo de variável existem técnicas mais apropriadas para resumir as informações. Porém podemos usar algumas técnicas empregadas num caso e adaptá-las para outros. Quando se estuda uma variável, o maior interesse do pesquisador é conhecer a distribuição dessa variável através das possíveis realizações (valores) da mesma. Exemplo: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa Milsa. Ver resultados anotados na tabela abaixo. Noções de Probabilidade e Estatística 14 Profª Berenice C. Damasceno TABELA 1: Dados relativos a uma amostra de 36 funcionários de uma população de 2000 funcionários da empresa Milsa. Nº ESTADO GRAU DE Nº DE SALÁRIO IDADE REGIÃO DE CIVIL INSTRUÇÃO FILHOS (X SAL. MIN) ANOS MESES PROCEDÊNCIA 1 solteiro 1º grau --- 4 26 03 interior 2 casado 1º grau 1 4,56 32 10 capital 3 casado 1º grau 2 5,25 36 05 capital 4 solteiro 2º grau --- 5,73 20 10 outro 5 solteiro 1º grau --- 6,26 40 07 outro 6 casado 1º grau 0 6,66 28 00 interior 7 solteiro 1º grau --- 6,86 41 00 interior 8 solteiro 1º grau --- 7,39 43 04 capital 9 casado 2º grau 1 7,59 34 10 capital 10 solteiro 2º grau --- 7,44 23 06 outro 11 casado 2º grau 2 8,12 33 06 interior 12 solteiro 1º grau --- 8,46 27 11 capital 13 solteiro 2º grau --- 8,74 37 05 outro 14 casado 1º grau 3 8,95 44 02 outro 15 casado 2º grau 0 9,13 30 05 interior 16 solteiro 2º grau --- 9,35 38 08 outro 17 casado 2º grau 1 9,77 31 07 capital 18 casado 1º grau 2 9,8 39 07 outro 19 solteiro superior --- 10,53 25 08 interior 20 solteiro 2º grau --- 10,76 37 04 interior 21 casado 2º grau 1 11,06 30 09 outro 22 solteiro 2º grau --- 11,59 34 02 capital 23 solteiro 1º grau --- 12,00 41 00 outro 24 casado superior 0 12,79 26 01 outro 25 casado 2º grau 2 13,23 32 05 interior 26 casado 2º grau 2 13,6 35 00 outro 27 solteiro 1º grau --- 13,85 46 07 outro 28 casado 2º grau 0 14,69 29 08 interior 29 casado 2º grau 5 14,71 40 06 interior 30 casado 2º grau 2 15,99 35 10 capital 31 solteiro superior --- 16,22 31 05 outro 32 casado 2º grau 1 16,61 36 04 interior 33 casado superior 3 17,26 43 07 capital 34 solteiro superior --- 18,75 33 07 capital 35 casado 2º grau 2 19,40 48 11 capital 36 casado superior 3 23,30 42 02 interior Noções de Probabilidade e Estatística 15 Profª Berenice C. Damasceno TABELA 2: Freqüência e porcentagem da amostra de 36 empregados da empresa Milsa segundo o grau de instrução. TABELA 3: Freqüência e porcentagem dos 2000 empregados (População) da empresa Milsa (Censo x Probabilidade) GRAU DE INSTRUÇÃO TABULAÇÃO FRQÚÊNCIA F FREQ. RELATIVA FR (%) 1º grau 2º grau superior I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 12 18 6 33,33 50,00 16,67 TOTAL 36 100 GRAU DE INSTRUÇÃO FRQÜÊNCIA F FREQ. RELATIVA FR % CENSO FREQ. RELATIVA FR % PROVÁVEL 1º grau 2º grau superior 650 1020 330 32,50 51,00 16,50 33,33 50,00 16,67 TOTAL 2000 100 100 Noções de Probabilidade e Estatística 16 Profª Berenice C. Damasceno TABELA 4: Freqüência e porcentagens dos 36 empregados (Amostra) da empresa Milsa CLASSES DE SALÁRIOS FREQÜÊNCIA F FREQ. RELATIVA FR (%) 4 |----- 8 8 |----- 12 12 |----- 16 16 |----- 20 20 |----- 24 10 12 8 5 1 27,78 33,33 22,22 13,89 2,78 TOTAL 36 100 TABELA 5: Freqüências e porcentagem dos empregados da empresa Milsa, segundo Nº de filhos Nº DE FILHOS FREQÜÊNCIA F FREQ. RELATIVA FR (%) 0 1 2 3 5 4 5 7 3 1 20 25 35 15 5 TOTAL 20 100 Noções de Probabilidade e Estatística 17 Profª Berenice C. Damasceno 5.0 APRESENTAÇÃO GRÁFICA A apresentação gráfica dos dados e respectivos resultados de sua análise pode também ser feita sob forma de figuras, em geral gráficos ou diagramas. Gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem comentários inseridos. Os gráficos devem ser simples, atrair a atenção do leitor e inspirar confiança. 5.1 DIAGRAMA DE ORDENADAS Para sua construção é traçada uma reta horizontal (ou vertical) de sustentação; a partir de pontos eqüidistantes na reta, traçam-se perpendiculares cujos comprimentos sejam proporcionais às freqüências. freqüências 12 10 8 6 4 2 0 4 I-------8 8 I-------12 12 I-------16 16 I-------20 20 I-------24 Salários Noções de Probabilidade e Estatística 18 Profª Berenice C. Damasceno 5.2 DIAGRAMA DE BARRAS A mesma distribuição acima poderia ser representada por meio de diagrama que levasse em conta a magnitude da área da figura geométrica, já que a vista repousa melhor sobre uma superfície do que sobre uma linha. freqüências 12 10 8 6 4 2 0 salários 4 |---- 8 8 |---- 12 12 |----16 16 |----20 20 |----24 Noções de Probabilidade e Estatística 19 Profª Berenice C. Damasceno 5.3 DIAGRAMA DE CÍRCULOS Além do retângulo, outra figura geométrica utilizada é o círculo ou conjunto de círculos. Lembrando que a área do círculo é o produto do número irracional pipipipi = (3,1416) pelo quadrado do raio (r), isto é, 2r.C pipipipi==== , e desde que as áreas dos diversos círculos devem ser proporcionais às magnitudes das freqüências, isto é, f.C αααα==== onde αααα é o fator de proporcionalidade, segue-se que: f.αααα = 2r.pipipipi , ou seja, fr pipipipi αααα = . Se chamar pipipipi αααα de α’, tem-se: f'r αααα= . Portanto, os raios dos círculos devem ser proporcionais à raiz quadrada das freqüências das modalidades da variável. Assim se quisermos representar graficamente a distribuição da tabela 4, os raios do círculo deverão ser: r1 = 27,78 . α’= 5,27 . α’→ 5,27. 3 = 15.8 mm r2 = 33,33 . α’= 5.77 . α’→ 5,77. 3 = 17,3 mm r3 = 22,22 . α’= 4,71. α’→ 4,71. 3 = 14,1 mm r4 = 13,89 . α’= 3.72. α’→ 3,72. 3 = 11,1 mm r5 = 2,78 . α’ = 1,66 α’→ 1,66. 3 = 5,00 mm A figura abaixo representa esta distribuição, com um α’ adotado de 3 mm. 2,7 % 22,22 % 27,78 % 33,33 % 13,89 % Noções de Probabilidade e Estatística 20 Profª Berenice C. Damasceno 5.4 DIAGRAMA DE SETORES CIRCULARES Outra opção seria através de setores circulares, na qual se divide a área total de um círculo em subáreas (setores) proporcionais as freqüências. Lembrando que o círculo compreende setores cujas áreas (S) são produto do raio (r) pelo tamanho do arco (a), isto é, S = r.a, e como S deve ser proporcional à freqüência f, tem-se S= α.f , onde α é o fator de proporcionalidade; então: α .f = r. a a = α . f r Se chamarmos r αααα de α’, tem-se S = α’.f , isto é, os arcos e os respectivos ângulos centrais de um círculo é igual a 360°, e sendo F a freqüênci a total, tem-se 360° = α’. F ou seja: F º360 '====αααα . Portanto f.F º360 a ==== . Assim, a distribuição de freqüência da tabela 4 representando faixas de salários será: a1 = 360° x 27,78 = 100° 100 a2 = 360° x 33,33 = 120° 100 a3 = 360° x 22,22 = 80° 100 a4 = 360° x 13,89 = 50° 100 S5 = 360° x 2,78 = 10° 100 Noções de Probabilidade e Estatística 21 Profª Berenice C. Damasceno Diagrama de Setor Circular: . Diagrama de Setor Circular feito automaticamente pelo Excel: 28% 33% 22% 14% 3% 120° 50° 100° 80° 10° Noções de Probabilidade e Estatística 22 Profª Berenice C. Damasceno 5.5 DIAGRAMA LINEAR No diagrama linear deve-se plotar os pontos nos eixos como foi feito no diagrama de barras e em seguida unir esses pontos por semi-retas constituindo-se desta forma o diagrama linear. 4 8 8 12 12 16 16 20 20 24 12 10 8 6 4 2 0 salários freq. Noções de Probabilidade e Estatística 23 Profª Berenice C. Damasceno 6.0 MONTAGEM DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS A análise estatística de dados relativos a uma amostra de uma população, requer uma aglutinação organizada de informações, conforme regras cuja prática demonstrou serem eficientes. Consideremos uma relação de pesos de pacotes de manteiga, em gramas, de uma amostra de 100 pacotes extraídos parcialmente de um processo automático de empacotamento. ±15 A especificação de fabricação é 215 gramas (200 a 230 gramas) TABELA 6 AMOSTR A PESO AMOSTR A PESO AMOSTR A PESO AMOSTR A PESO AMOSTR A PESO 1 207 21 220 41 210 61 210 81 217 2 213 22 204 42 214 62 220 82 211 3 210 23 213 43 219 63 213 83 213 4 215 24 211 44 215 64 217 84 218 5 201 25 214 45 217 65 214 85 213 6 210 26 217 46 213 66 219 86 216 7 212 27 224 47 218 67 214 87 218 8 204 28 211 48 214 68 215 88 216 9 209 29 220 49 215 69 223 89 206 10 212 30 209 50 212 70 217 90 212 11 215 31 214 51 221 71 213 91 207 12 216 32 208 52 211 72 218 92 213 13 221 33 217 53 218 73 207 93 215 14 219 34 214 54 205 74 210 94 212 15 222 35 209 55 220 75 208 95 223 16 225 36 212 56 203 76 214 96 210 17 215 37 208 57 216 77 211 97 226 18 218 38 215 58 222 78 205 98 224 19 213 39 211 59 206 79 215 99 214 20 216 40 216 60 221 80 207 100 215 O agrupamento destes dados em sub-grupos é feito com base nos seguintes conceitos: Amplitude total (RT ou ΩΩΩΩ): é a diferença entre a medida máxima e a medida mínima. No caso da amostra de pacotes de manteiga acima, temos: Noções de Probabilidade e Estatística 24 Profª Berenice C. Damasceno RT = 226 – 201 = 25 gramas Número de classes (d) : é o número de divisões que estipulamos para a Amplitude Total. Normalmente pode-se usar d ≈ n onde n é o número de itens na amostra. Para o exercício temos d ≈ 10100 = classes, porém deve-se utilizar sempre que possível número ímpar de classes, no caso podemos usar 9 classes. (Classe: é o intervalo de variação das medidas.) Amplitude do intervalo de classe (RI): é a diferença entre os valores máximos e mínimos de cada classe. Amplitude do intervalo de cada classe d RTRI ==== No exercício temos: amplitude do intervalo de cada classe 78,2 9 25RI ======== (aprox. 3) RI adotado = 3 e RT adotado = 27 (começa um antes do menor e termina um depois do maior valor) OBS.: Normalmente usa-se um número mínimo de 5 e no máximo 20 classes, de preferência de mesma amplitude. As classes devem ser mutuamente exclusivas, para que não haja dúvida na localização dos valores das variáveis, podemos daí utilizar as seguintes simbologias para os intervalos: 0 ----I 10 intervalo aberto & fechado, para significar que o intervalo compreende os valores da variável maiores do que 0 (exclusive) e até 10 (inclusive); 0 I---- 10 intervalo fechado & aberto, para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (exclusive); 0 ----- 10 Intervalo aberto & aberto, para significar que compreende valores maiores do que 0 e menores do que 10. 0 I----I 10 intervalo fechado & fechado, para significar que compreende os valores da variável a partir de 0 (inclusive) e até 10 (inclusive). Noções de Probabilidade e Estatística 25 Profª Berenice C. Damasceno TABELA DE DISTRIBUIÇÃO DAS FREQÜÊNCIAS Para a facilidade e metodização do processo de análise estatística, monta-se uma tabela que agrupe as informações obtidas, da forma de Tabela de Freqüências. Para os pacotes em pauta, teremos a seguinte tabela de freqüências: TABELA 7 VALOR COMPRIMENTO FREQ. FREQ. RELATIVA (%) FREQU. ACUM. FREQ. ACUM. REL (%) CLASSE CLASSE TABULAÇÃO f fR F FR 1 200 I--- 203 I 1 1 1 1 2 203 I--- 206 I I I I 4 4 5 5 3 206 I--- 209 I I I I I I I I I I 10 10 15 15 4 209 I--- 212 I I I I I I I I I I I I I I I 15 15 30 30 5 212 I--- 215 I I I I I I I I I I I I I I I I I I I I I I I I I 25 25 55 55 6 215 I--- 218 I I I I I I I I I I I I I I I I I I I I I 21 21 76 76 7 218 I--- 221 I I I I I I I I I I I I I 13 13 89 89 8 221 I--- 224 I I I I I I I 7 7 96 96 9 224 I--- 227 I I I I 4 4 100 100 ∑ 100 100% Onde: Freqüência (f) = número de vezes que as medidas ocorrem no intervalo de classes Freqüência Relativa (fR) = porcentagem da freqüência de cada classe em relação ao total de elementos. 100. n ffR ==== Freqüência acumulada (F) = soma das freqüências até o intervalo de classe considerado. Ex. F5 = f1+ f2 + f3 + f4 + f5 → 1 + 4 + 10 + 15 + 25 = 55 Freqüência acumulada relativa (FR) = soma das freqüências relativas até o intervalo considerado. Por ex.: FR3 = fR1 + fR2 + fR3 → 1 + 4 + 10 = 15 Noções de Probabilidade e Estatística 26 Profª Berenice C. Damasceno 7.0 REPRESENTAÇÃO GRÁFICA DAS VARIÁVEIS QUANTITATIVAS A representação gráfica da distribuição de freqüências de uma variável tem a vantagem de, rápida e concisamente, informar sobre a variabilidade da mesma. Podemos optar por vários tipos de gráficos, porém qualquer que seja ele, devemos especificar os elementos essenciais para a sua interpretação, que são: i. o título; ii. o corpo; iii. o cabeçalho; iv. as colunas indicadoras. TÍTULO é a indicação que, precedendo à tabela, é colocado na parte superior da mesma. Deve ser preciso, claro e conciso, indicando a natureza dos fatos estudados (o quê), e a época (quando) em que o mesmo foi observado. CORPO da tabela é o conjunto de linhas e colunas que contem respectivamente, as séries horizontais e verticais de informações. Casa, cela ou célula é o cruzamento de uma linha com uma coluna, onde se tem a freqüência com que a categoria (ou categorias) aparece. CABEÇALHO é a parte da tabela em que é designada a natureza (as categorias, as modalidades da variável) do conteúdo de cada coluna. COLUNA INDICADORA é a parte da tabela em que é designada a natureza (as categorias, as modalidades da variável) do conteúdo de cada linha. Os elementos complementares de uma tabela são: i. Fontes; ii. Notas. FONTE é o indicativo, no rodapé da tabela, da entidade responsável pela sua organização ou fornecedora dos dados primários. A razão da presença da fonte não é somente honestidade científica, mas também permitir ao leitor a possibilidade de consultar o trabalho original de onde procedem as informações. NOTAS são colocadas no rodapé da tabela para esclarecimentos de ordem geral. E são numeradas, podendo-se também usar símbolos gráficos, sendo comum o asterisco. Noções de Probabilidade e Estatística 27 Profª Berenice C. Damasceno 7.1 HISTOGRAMA E POLIGONO DAS FREQÜÊNCIAS 1 2 3 4 5 6 7 8 9 CLASSES FREQÜÊNCIAS 10 15 25 5 POLÍGONO DE FREQÜÊNCIAS HISTOGRAMA Polígono de freqüências é a representação gráfica de uma distribuição de freqüências através de um polígono, onde tomamos sobre a abscissa os pontos médios das classes e sobre as ordenadas as freqüências correspondentes. Depois para fechar o polígono unimos os extremos da figura com o eixo das abscissas nos pontos médios de uma classe imediatamente anterior à primeira e imediatamente posterior à última, ambas as freqüências nulas, para manter a área sob o polígono igual a área do histograma. Noções de Probabilidade e Estatística 28 Profª Berenice C. Damasceno 7.2 HISTOGRAMA E POLIGONO DE FREQÜÊNCIA RELATIVA 1 2 3 4 5 6 7 8 9 CLASSES FREQÜÊNCIAS RELATIVAS (%) 10 15 25 5 POLÍGONO DE FREQÜÊNCIA RELATIVA HISTOGRAMA Noções de Probabilidade e Estatística 29 Profª Berenice C. Damasceno 7.3 POLIGONO DE FREQÜÊNCIA ACUMULADA OU OGIVA 1 2 3 4 5 6 7 8 9 CLASSES FREQÜÊNCIAS ACUMULADAS 55 100 15 POLÍGONO DE FREQÜÊNCIA ACUMULADA HISTOGRAMA Noções de Probabilidade e Estatística 30 Profª Berenice C. Damasceno 7.4 POLIGONO DE FREQÜÊNCIA ACUMULADA RELATIVA 1 2 3 4 5 6 7 8 9 CLASSES FREQÜÊNCIAS ACUMULADAS RELATIVAS (%) 55 100 15 POLÍGONO DE FREQÜÊNCIA ACUMULADA RELATIVA HISTOGRAMA Noções de Probabilidade e Estatística 31 Profª Berenice C. Damasceno 8.0 TIPOS DE DISTRIBUIÇÃO As distribuições de freqüência podem se apresentar de diversas formas conforme as figuras a seguir: 8.1 DISTRIBUIÇÃO SIMÉTRICA OU EM FORMA DE SINO A distribuição é simétrica quando os valores se distribuem igualmente em torno da média ( __ X ou M) A) Normal B) Alongada Noções de Probabilidade e Estatística 32 Profª Berenice C. Damasceno C) Achatada 8.2 DISTRIBUIÇÃO ASSIMÉTRICA É aquela em que as freqüências dos valores medidos se distribuem de forma desigual em torno da média. A) Assimétrica Positiva Noções de Probabilidade e Estatística 33 Profª Berenice C. Damasceno B) Assimétrica Negativa 8.3 DISTRIBUIÇÃO MODAL, AMODAL, BIMODAL E MULTIMODAL Chamamos de moda (mo) numa distribuição, ao valor da medida ou classe que corresponde à freqüência máxima. Sob o critério da moda as distribuições classificam-se em: A) DISTRIBUIÇÃO MODAL – Quando a distribuição tem freqüência máxima ela é denominada modal. mo Noções de Probabilidade e Estatística 34 Profª Berenice C. Damasceno B) DISTRIBUIÇÃO AMODAL – Quando a distribuição não tem moda C) DISTRIBUIÇÃO BIMODAL – Quando a distribuição tem duas modas. mo mo D) DISTRIBUIÇÃO MULTIMODAL – Quando a distribuição tem mais de duas modas mo mo mo Noções de Probabilidade e Estatística 35 Profª Berenice C. Damasceno 8.4 APRESENTAÇÃO TIPO RAMO-E-FOLHAS Uma alternativa para o uso da tabela de distribuição de freqüências é usar o gráfico do tipo ramo-e-folhas. Podemos estudar a partir de um exemplo prático: Observamos os seguintes números de passageiros em 50 viagens de um avião que faz a ponte aérea Rio - São Paulo: 61 52 64 84 35 57 58 95 82 64 50 53 103 40 62 77 78 66 60 41 58 92 51 64 71 75 89 37 54 67 59 79 80 73 49 71 97 62 68 53 43 80 75 70 45 91 50 64 56 86 SOLUÇÃO: F FA 3 5 7 2 2 4 0 1 3 5 9 5 7 5 0 0 1 2 3 3 4 6 7 8 8 9 12 19 6 0 1 2 2 4 4 4 4 6 7 8 11 30 7 0 1 1 3 5 5 7 8 9 9 39 8 0 0 2 4 6 9 6 45 9 1 2 5 7 4 49 10 3 1 50 A MEDIANA NESTE CASO SERÁ md = 64 Noções de Probabilidade e Estatística 36 Profª Berenice C. Damasceno 8.5 O PICTOGRAMA A figura abaixo mostra um exemplo de apresentação pictográfica de dados temporais (comumente encontrada em jornais, revistas e relatórios de vários tipos); no caso abaixo representa a população dos Estados Unidos da América do Norte. 1920 1930 1940 1950 1960 1970 1980 1990 Cada símbolo = 10 milhões de pessoas (Pictograma da população dos Estados Unidos da América do Norte) EXERCÍCIO Construa uma distribuição de freqüências e faça as possíveis representações gráficas para os dados da tabela abaixo. Tabela - Pressão arterial em milímetros de mercúrio, para cães adultos anestesiados depois de determinado procedimento cirúrgico. Fonte: ARAÚJO e HOSSNE (1977) 130,0 105,0 120,0 111,5 99,0 116,0 92,5 107,5 1250 100,0 107,5 120,0 143,0 115,0 135,0 130,0 135,0 127,5 905 104,5 136,5 100,0 145,0 125,0 104,5 101,5 102,5 101,5 134,5 138,5 110,0 102,5 90,5 107,5 1244,0 121,5 135,0 102,0 119,5 115,5 125,5 117,5 107,5 140,0 121,5 107,5 113,0 93,0 103,5 Noções de Probabilidade e Estatística 37 Profª Berenice C. Damasceno 9.0 MEDIDAS DE POSIÇÃO OU DE TENDÊNCIA CENTRAL Como o próprio nome indica, a medida de tendência central visa a determinar o centro da distribuição. Esta determinação, porém, não é bem definida daí parece razoável chamarmos de “tendência central”. São medidas de tendência central: • MÉDIA ARITMÉTICA SIMPLES/PONDERADA ( __ X ou M); • MEDIANA (md); • MODA (mo). 9.1 MÉDIA ARITMÉTICA SIMPLES Dada uma distribuição de freqüências, chama-se média aritmética desta distribuição, e representa-se por _ X a soma de todos os valores da variável, dividida pelo número de variáveis “n”. n x X n 1i i _ ∑∑∑∑ ==== ==== ou simplificadamente, n x X _ ∑∑∑∑ ==== Sendo: n21 n 1i i x...xxx ++++++++++++====∑∑∑∑ ==== Exemplo: Calcular a média aritmética simples de 8, 3, 5, 12, 10. 6,7 5 38 5 1012538X _ ======== ++++++++++++++++ ==== Noções de Probabilidade e Estatística 38 Profª Berenice C. Damasceno 9.2 MÉDIA ARITMÉTICA PONDERADA ∑∑∑∑ ∑∑∑∑ ==== ==== ==== n 1i i n 1i ii __ f f.x X onde: fi = freqüência dos dados xi Exemplo: Calcular a média ponderada dos números 5, 8, 6, 2 ; os quais ocorrem com as freqüências 3, 2, 4 e 1, respectivamente. Números x = 5, 8, 6, 2 Freqüências f = 3, 2, 4, 1 7,5 10 57 1423 )1.2()4.6()2.8()3.5( f f.x X n 1i i n 1i ii __ ======== ++++++++++++ ++++++++++++ ======== ∑∑∑∑ ∑∑∑∑ ==== ==== 9.3 MEDIANA (md) Se ordenarmos uma seqüência de números do menor para o maior e se a quantidade desses números for impar, então a mediana será o valor do meio, ou a média dos dois valores do meio, caso a quantidade de números seja par. O símbolo que usamos para representar a mediana será md No caso de cálculo da mediana quando estamos trabalhando com distribuição de freqüência determinamos o valor mais provável dessa distribuição a partir de: Posição da md = Freqüência acumulada total = FA 2 2 Noções de Probabilidade e Estatística 39 Profª Berenice C. Damasceno Ou seja, a posição da MEDIANA é definida por ++++ 2 1n -ésimo elemento quando ”n” é ímpar e temos um nú�mero inteiro que dá a posição da mediana. Quando temos o meio do caminho entre dois números inteiros, isto é, ”n” é par, a mediana será a média deles. Exemplo: Determine a posição da mediana para: (a) n=15, (b) n=45 e (c)n=88. (a) 8 2 115 2 1n ==== ++++ ==== ++++ , e a mediana é o valor do 8° elemento; (b) 23 2 145 2 1n ==== ++++ ==== ++++ , e a mediana é o valor do 23° elemento; (c) 5,44 2 188 2 1n ==== ++++ ==== ++++ , e a mediana é a média do valor do 44° e o 45°elem ento. Ou seja, quando n é par procuramos duas posições: 2 n e ++++1 2 n No caso do exercício da distribuição dos 100 valores de peso de pacotes de manteiga temos: md = FA = 100 = 50, e a mediana é o valor do 50° elemento 2 2 F 0 1 5 15 30 55 76 89 96 100 X 200 203 206 209 212 215 218 221 224 227 50° (55 – 30) (215 – 212) ou (55 – 30) (215 – 212) (55 – 50) ∆ (50 – 30) ∆ ∆ = 5 x 3 = 0,6 ∆ = 20 x 3 = 2,4 25 25 portanto a mediana será 215 - ∆ portanto a mediana será 212 + ∆ logo, md = 215 - 0,6 = 214,4. logo, md = 212 + 2,4 = 214,4. 30 55 212 215 50° valor Noções de Probabilidade e Estatística 40 Profª Berenice C. Damasceno Assim, para encontrarmos a mediana para dados tabulados agrupados em classes podemos formalizar os passos anteriores na seguinte equação: −−−− ++++==== med ant infd f F 2 n hlm , onde: 2 n ≡ metade da quantidade de dados h ≡ amplitude da classe mediana linf ≡ limite inferior da classe da mediana fmed ≡ freqüência absoluta da classe da mediana Fant ≡ freqüência acumulada da classe anterior a da mediana Voltando ao exemplo, temos: 1º Passo: da tabela 7 - página 25, temos as freqüências acumuladas já calculadas; 2º Passo: n = 100 => 50 2 100 2 n ======== => localização da classe mediana: 5ª classe, isto é, classe 212 --- 215; 3º Passo: encontrar na tabela: linf , fmed e Fant : linf = 212 fmed = 25 Fant = 30 4º Passo: substituir os dados na equação: 4,2144,22128,0.3212 25 30503212 f F 2 n hlm med ant infd ====++++====++++==== −−−− ++++==== −−−− ++++==== md = 214,4 Noções de Probabilidade e Estatística 41 Profª Berenice C. Damasceno 9.3.1 SEPARATRIZES (QUARTIS, DECIS E CENTIS) Como extensão do conceito de mediana, podemos dividir os valores em quatro, dez e cem partes iguais. Essas divisões são chamadas de quartis, decis e centis, respectivamente. O cálculo dessas divisões é semelhante ao da mediana, isto é: Quartis: −−−− ++++==== −−−− i i Q 1Q infi f F 4 n.i hlQ , onde i = 1, 2, 3 Decis: −−−− ++++==== −−−− i i D 1D infi f F 10 n.i hlD , onde i = 1, 2, 3, 4, 5, .., 9 Centis: −−−− ++++==== −−−− i i C 1C infi f F 100 n.i hlC , onde i = 1, 2, 3, 4, 5, ..., 99 Onde: h ≡ amplitude da classe linf ≡ limite inferior da classe da quartílica, decílica ou percentílica fQi , fDi , fCi ≡ freqüências das classes quartílica, decílica e percentílica, respectivamente FQi-1 , FDi-1 , FCi-1 ≡ freqüências acumuladas da classe anterior à classe quartílica, decílica ou percentílica Voltando ao exemplo anterior, temos: i) Se quisermos calcular o 1º Quartil, ou seja, 25% dos dados: 01,21167,0.3209 15 15 4 100 3209 f F 4 n.1 hlQ i i Q 1Q inf1 ====++++==== −−−− ++++==== −−−− ++++==== −−−− Noções de Probabilidade e Estatística 42 Profª Berenice C. Damasceno ii) Para o 3º Quartil: 85,21795,0.3215 21 55 4 100.3 3215 f F 4 n.3 hlQ i i Q 1Q inf3 ====++++==== −−−− ++++==== −−−− ++++==== −−−− iii) Para o 8º Decil: 93,21831,0.3218 13 76 10 100.8 3218 f F 10 n.8 hlD i i D 1D inf8 ====++++==== −−−− ++++==== −−−− ++++==== −−−− iv) Para o 15º Centil: 209 10 5 100 100.15 3206 f F 100 n.15 hlC i i C 1C inf15 ==== −−−− ++++==== −−−− ++++==== −−−− OBS.: Caso tenhamos dados não agrupados em classes, como por exemplo a seqüência 2,3,3,4,5,7,7,8,10,11,12,12, 13; o cálculo do 3º Quartil será: Posição: 75,9 4 13.3 4 n.3 ======== . A posição 9,75ª será aproximada pela inteira imediatamente posterior a ela, ou seja, a 10ª posição, logo Q3 = 11. E assim, analogamente, para encontrar os decis e centis de uma série de dados não agrupados em classes. 9.4 MODA ( mo ) Em um conjunto de números a moda é o valor que ocorre com maior freqüência, isto é, o valor mais comum. Exemplos: 1) 2, 2, 3, 7, 8, 8, 8, 9, 10 moda=8 2) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 moda = Ф (não existe moda) 3) 2, 2, 4, 4, 4, 5, 6, 7, 8, 8, 8, 9 moda = 4 e 8 Noções de Probabilidade e Estatística 43 Profª Berenice C. Damasceno Para o exemplo do exercício das distribuições de freqüências dos pacotes de manteiga (onde os dados são tabulados agrupados em classes) uma forma de estimar o valor da moda é pela Estimativa de Pearson (para dados tabulados agrupados em classes): mo = 3.md – 2. _ X Voltando ao exemplo, temos: mo = 3.214,4 – 2. 214,49 => mo = 214,22 onde a média foi calculada da forma: 47132125151041 4.5,2257.5,22213.5,21921.5,21625.5,21315.5,21010.5,2074.5,2041.5,201X _ ++++++++++++++++++++++++++++++++ ++++++++++++++++++++++++++++++++ ==== => 49,214X _ ==== O cálculo da moda pelo Método de Pearson é mais utilizado quando temos uma indicação de que os três parâmetros de tendência central (média, mediana e moda) estejam muito próximos. Um outro método, de origem gráfica, é o Método de Czuber, que utilizamos na maioria dos casos: h pa ainflmo ⋅ + += ∆∆ ∆ onde: linf = limite inferior da classe modal. ∆a = diferença entre a fi da classe modal e a fi da classe anterior. Entenderemos como classe anterior aquela que precede à classe modal. ∆p = diferença entre a fi da classe modal e a fi da classe posterior (aquela que vem logo após a classe modal). h = amplitude da classe modal. A equação da moda pode ser deduzida facilmente do processo gráfico para determinar a moda em um histograma. Noções de Probabilidade e Estatística 44 Profª Berenice C. Damasceno Da figura acima temos mo = linf + x e chamando ∆1 de ∆a e ∆2 de ∆p , e, pela semelhança dos triângulos ABE e CDE temos: pa a p a h x xh x ∆∆ ∆ ∆ ∆ + =⇒ − = Portanto: hpa ainflmo ⋅ + += ∆∆ ∆ Noções de Probabilidade e Estatística 45 Profª Berenice C. Damasceno 10.0 MEDIDAS DE VARIABILIDADE (OU DE DISPERSÃO) As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros, ou separados. Podemos dizer que dispersão é o grau com o qual os valores numéricos de uma distribuição tendem a se distanciar em torno de um valor médio. Em todos os casos, o valor zero indica ausência de dispersão; a dispersão aumenta à proporção que aumenta o valor da medida (amplitude, desvio-padrão, variância). xx x x x x xxx xxx xx x x a) pequena dispersão xx x x xxx x x x x x x x x xx x x xxx x x x xx x x x x xx b) grande dispersão 10.1 AMPLITUDE TOTAL (RT ou ΩΩΩΩ) É a medida mais simples de dispersão. É a diferença entre o maior e o menor valor das observações. RT = Xmax – Xmin Embora exista simplicidade de cálculo, existem duas restrições ao seu uso generalizado: 1- Utiliza apenas uma parcela das informações contidas nas observações. O seu valor não se modifica mesmo que os valores das observações variem, desde que conservem os seus valores máximo e mínimo. Ou seja, depende apenas dos valores externos (max e min), não sendo afetada pelos valores internos. 2- Depende do número de observações na amostra. Em geral o valor da amplitude Noções de Probabilidade e Estatística 46 Profª Berenice C. Damasceno cresce quando cresce o tamanho da amostra. X min X max. RT = pequeno X min X max. RT = Grande Noções de Probabilidade e Estatística 47 Profª Berenice C. Damasceno 10.2 DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA (di) O desvio di em relação à média de um conjunto de dados é a diferença do valor xi e a média aritmética _ X do conjunto, isto é: di = (xi - _X ) Exemplos : (1) Calcular os desvios di para o seguinte conjunto : 3, 4, 5, 6, 7 xi di 3 -2 4 -1 5 0 6 1 7 2 Onde 5 5 76543X _ ==== ++++++++++++++++ ==== ΣΣΣΣdi = 0 (2) Calcular os desvios di para a seguinte distribuição : xi fi di 82 5 -4,60 85 10 -1,60 87 15 0,40 89 8 2,40 90 4 3,40 Onde _ X = 86,60. ΣΣΣΣfi = 42 ΣΣΣΣdi ≈≈≈≈ 0 (3) Calcular os desvios di para a seguinte distribuição : Classes xi fi di di.fi [35, 45) 40 2 -22,91 -45,82 [45, 55) 50 13 -12,91 -167,83 [55, 65) 60 20 -2,91 -58,20 [65, 75) 70 10 7,09 70,90 [75, 85) 80 7 17,09 119,63 [85, 95) 90 3 27,09 81,27 Onde : _ X = 62,91 ΣΣΣΣfi = 55 ΣΣΣΣdi ≈≈≈≈ 12,55 ΣΣΣΣdi.fi≈≈≈≈ 0 Noções de Probabilidade e Estatística 48 Profª Berenice C. Damasceno 10.3 DESVIO MÉDIO ( __d ) O desvio médio __ d é a média aritmética dos módulos dos desvios, isto é: n xx n d d __ i i __ ∑∑∑∑∑∑∑∑ −−−− ======== Para uma distribuição de freqüências (simples ou por classes), teremos: n f.xx n f.d d i __ i ii __ ∑∑∑∑∑∑∑∑ −−−− ======== Exercício: calcular o desvio médio para os exemplos (1), (2) e (3) da página anterior. 10.4 VARIÂNCIA (σσσσ2 ou s2) Variância da população é a soma dos quadrados dos desvios de cada observação em relação à média de “x” e divide-se por N. Indica-se a Variância da População por σ² . Podemos fazer a mesma analogia com a Variância da Amostra dada por S². Variância para uma população: N f.)x( i2i2 ∑∑∑∑ µµµµ−−−− ====σσσσ , onde µµµµ é a média populacional e N é o tamanho da população. Variância para uma amostra: 1n f.)Xx( s i 2 __ i2 −−−− −−−− ==== ∑∑∑∑ , onde _ X é a média amostral e n é o tamanho da amostra. As equações anteriores para σσσσ2 e s2 representam uma maneira de cálculo dessas medidas. Podemos também utilizar as seguintes equações: Noções de Probabilidade e Estatística 49 Profª Berenice C. Damasceno N µN.)(xf σ 22 ii2 ∑ − = ou 1n xn.)(xf s 2 __ 2 ii2 − − = ∑ Como medida de dispersão, a Variância tem a desvantagem de apresentar como unidade de medida o quadrado da unidade de medida dos dados. Se os dados estão em metros, a Variância fica em metros quadrados. O desvio padrão por sua vez, fica com valor na mesma da unidade da variável. Obs: A variância sendo uma média de uma soma de quadrados é sempre maior ou igual a 0. Ela será nula se os valores dos dados são constantes. 10.5 DESVIO PADRÃO (σσσσ ou s) É a medida que determina a variação dos valores observados em torno da média da distribuição, e representa a distância do ponto de inflexão da curva até a linha da média. A partir da variância podemos calcular o desvio padrão como segue: Desvio padrão da população: 2σσσσ====σσσσ Desvio padrão da amostra: 2ss ==== 10.6 COEFICIENTE DE VARIAÇÃO (cv) O coeficiente de variação cv é a razão entre o desvio padrão e a média aritmética. Esta medida é admensional e geralmente é expressa em porcentagens. A equação para o seu cálculo é: 100.cv µµµµ σσσσ ==== (para população) ou 100. x s cv __ ==== (para amostra) Noções de Probabilidade e Estatística 50 Profª Berenice C. Damasceno EXERCÍCIOS (1) Calcular a média aritmética para os dados da tabela: Pesos (kg) Freqüência (f) 35 45 3 45 55 7 55 65 11 65 75 20 75 85 13 85 95 6 (2) Calcular a mediana para a tabela: Pesos (kg) Freqüência (f) 40 50 2 50 60 5 60 70 9 70 80 20 80 90 15 90 100 9 (3) Encontre a mediana para os seguintes dados: Estaturas (cm) Freqüência (f) 140 149 3 149 158 9 158 167 12 167 176 15 176 185 32 185 194 19 194 203 14 (4) Vinte e cinco residências de um certo bairro foram sorteadas e visitadas por um entrevistador que, entre outras questões, perguntou sobre o número de televisores. Os dados foram os seguintes: 2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0 e 2. Organize os dados numa tabela de feqüência e determine as diversas medidas de posição. Noções de Probabilidade e Estatística 51 Profª Berenice C. Damasceno (5) Num experimento, 15 coelhos foram alimentados com uma nova ração e seu peso avaliado no fim do mês. Os dados referentes ao ganho de peso (em quilogramas) foram os seguintes: 1,5 ; 1,6 ; 2,3 ; 1,7 ; 1,5 ; 2,0 ; 1,5 ; 1,8 ; 2,1 ; 2,1 ; 1,9 ; 1,8 ; 1,7 ; 2,5 ; e 2,2. a) Utilizando os dados brutos acima, determine a média, moda e mediana desse conjunto. b) Organize uma tabela de freqüência com faixas de amplitude 0,2 a partir de 1,5. c) Calcule a partir dessa tabela de freqüência e com o ponto médio como representante de cada classe, a média e a mediana. (6) Dada a seguinte tabela: Classes Freqüência (f) 20 30 5 30 40 9 40 50 17 50 60 28 60 70 37 70 80 15 80 90 10 Determinar: a) a mediana; b) o 1º Quartil; c) o 3º Quartil; d) o 8º Decil; e) o 15º Centil. (7) Calcular a moda pela estimativa de Pearson, para a tabela: Classes Freqüência (f) 35 46 8 46 57 21 57 68 46 68 79 57 79 90 39 90 101 28 101 112 12 Noções de Probabilidade e Estatística 52 Profª Berenice C. Damasceno (8) Determinar o desvio padrão para as medidas: 16, 11, 20, 26 e 10. (9) Você está indeciso em comprar um aparelho de televisão e decide avaliar algumas informações estatísticas, fornecidas pelo fabricante, sobre a duração (em horas) do tubo de imagem. Marca do aparelho GA FB HW Média 8000 8200 8000 Mediana 8000 9000 7000 Desvio Padrão 600 1500 2500 Com que marca você ficaria? Justifique. (10) A pulsação de dez estudantes, no início de uma avaliação de Estatística, foram as seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule a média e a variância desse conjunto de dados. (11) Num estudo sobre consumo de combustível, 200 automóveis do mesmo ano e modelo tiveram seu consumo observado durante 1000 quilômetros. A informação obtida é apresentada na tabela abaixo em km/litro. Calcular __ X , S2 e S. Faixas Freqüência (f) 7 8 27 8 9 29 9 10 46 10 11 43 11 12 55 Calcular a média, mediana, moda, variância e desvio-padrão dos dados da tabela acima. (12) 15 alunos participaram de um teste e obtiveram os seguintes resultados 60, 45, 70, 30, 85, 60, 30, 70, 60, 60, 85, 70, 70, 85 e 70. Pede-se: a) Construir uma tabela de dados ponderados; b) Calcular a média aritmética (ponderada); c) Calcular o desvio padrão; d) Determinar a variância. Noções de Probabilidade e Estatística 53 Profª Berenice C. Damasceno (13) Calcular a variância e o desvio padrão para os seguintes dados: xi f 30 2 45 1 60 4 70 15 85 3 . (14) Calcular a variância da série de dados dada pela tabela abaixo: Classes fi [2 ; 4) 2 [4 ; 6) 5 [6 ; 8) 7 [8 ; 10) 4 [10 ; 12) 3 [12 ; 14] 3 Noções de Probabilidade e Estatística 54 Profª Berenice C. Damasceno 11.0 PROBABILIDADE O problema fundamental da estatística consiste em trabalhar com o acaso e a incerteza. Chama-se probabilidade de um acontecimento a razão entre o número de casos favoráveis ao mesmo e o número total de acontecimentos possíveis. As leis da hereditariedade foram a primeira grande aplicação das probabilidades na área de biociências. Hoje conhecemos muitas aplicações: ocorrência de mutações, risco de doenças, chance de sobrevivência, distribuição e interação de espécies, etc. A aplicação mais importante, entretanto, é feita na estatística. Nenhuma observação e nenhuma experiência podem ser precisamente planejadas e analisadas sem algum método estatístico. Mesmo se mantivermos as condições experimentais mais constantes possíveis, a repetição de uma observação ou uma experiência dificilmente resulta sempre exatamente igual. Sempre existem flutuações. Portanto, todas as conclusões baseadas em dados empíricos são necessariamente encaradas com incerteza. Tentamos expressar o grau de incerteza em termos de probabilidades. Então, um pesquisador afirma “significância ao nível de cinco por cento”, ele admite a possibilidade de uma afirmativa errônea. Antes da compreensão de alguns métodos estatísticos é necessário um conhecimento básico sobre probabilidades. Quando se considera uma população limitada de P indivíduos, a probabilidade de cada um ser escolhido, ao acaso, é de 1/P. Laplace definiu probabilidade como: “O quociente do número de casos favoráveis sobre o número de casos igualmente possíveis”. Por exemplo, se jogarmos uma moeda “não viciada” para o ar, de modo geral não podemos afirmar se vai dar cara ou coroa. Porém existem apenas dois eventos possíveis: sair “cara” (K) ou “coroa” (C). Nesse exemplo existe um caso favorável a esse evento em dois casos possíveis. A P (K) = ½ ou 50%. Considerando-se “cara” como sucesso e “coroa” como fracasso e representando-se o acontecimento favorável como “P” e o não favorável como “Q”, temos as razões: P= ½ e Q = ½ Sendo P+Q = 1 então P= (1 - Q) e Q = (1 - P) Noções de Probabilidade e Estatística 55 Profª Berenice C. Damasceno A probabilidade de um evento A, denotada por P (A), é um número de 0 a 1, que indica a chance de ocorrência do evento A. Quanto mais próxima de 1 é P(A), maior é a chance de ocorrência do evento A, e quanto mais próxima de Zero, menor é a chance de ocorrência do evento A. A um evento impossível atribui-se a probabilidade Zero. Um evento certo tem probabilidade 1. As probabilidades podem ser expressas, inclusive por valores decimais, frações e porcentagem como: 20%; 2 em 10; 0,2; ou ainda, 1/5. Além do uso na interpretação de jogos de azar, usa-se ainda a probabilidade mediante determinada combinação de julgamento, experiência ou dados históricos, para predizer Quão Provável é a ocorrência de determinado evento futuro. Há numerosos exemplos de tais situações no campo dos Negócios e do Governo. A previsão da aceitação de um novo produto, o cálculo dos custos de produção, a contratação de um novo empregado, o preparo do orçamento, a avaliação do impacto de uma redução de impostos sobre a inflação – tudo isso contém algum elemento de acaso. Noções de Probabilidade e Estatística 56 Profª Berenice C. Damasceno 11.1 ESPAÇO AMOSTRAL E EVENTOS Consideremos o experimento que consiste em “extrair uma carta de um baralho de 52 cartas”. Há 52 eventos elementares no espaço amostral. Quanto aos eventos podemos classificá-los em: ESPAÇO AMOSTRAL COMPLEMENTO Cartas vermelhas e cartas pretas Não se interceptam cartas de MUTUAMENTE EXCLUSIVOS copas e cartas de paus NAO SÃO MUTUAMENTE Cartas de copas e figuras, tem EXCLUSIVOS elementos em comum. Cartas de paus, ouro, copas e COLETIVAMENTE EXAUSTIVOS A B C D espadas 11.2 TRÊS ORIGENS DA PROBABILIDADE Há três maneiras diferentes de calcular ou estimar probabilidades, O método Clássico, quando o espaço amostral tem resultados igualmente prováveis. O método Empírico, que se baseia na freqüência relativa de ocorrência de um evento num grande número de provas repetidas; e o método Subjetivo, que utiliza estimativas pessoais baseadas num certo grau de crença. OBJETIVO SUBJETIVO CLÁSSICO EMPÍRICO Opinião Pessoal (resultados igualmente prováveis) (dados históricos) A A B A B Noções de Probabilidade e Estatística 57 Profª Berenice C. Damasceno O Método Clássico Os jogos de azar (lançamento de moedas, jogo de dados, extração de cartas) usualmente apresentam resultados igualmente prováveis. Nestes casos temos: possíveisresultadosdeN 1)resultadocada(P °°°° ==== Se cada carta de um baralho de 52 tem a mesma chance de ser escolhida, então a probabilidade de extrair cada uma delas é de 1/52 : P (A) = 1/52 ou 1,92%. Da mesma forma a probabilidade de termos uma cara no lançamento de uma moeda é ½ ou 50%. O mesmo ocorre com uma coroa, ou seja, ½ ou 50%. No caso de um dado temos a probabilidade de dar qualquer número: 1, 2, 3, 4, 5 ou 6 de 1/6 ou de 16,66%. De forma geral vale também a expressão: P(A) = Número de resultados associados ao evento A Número total de resultados possíveis Por exemplo, a probabilidade de extração de uma dama, de acordo com esta definição, é P (dama) = 4 damas = 4 = 1 = 7,69% 52 cartas 52 13 Analogamente, a probabilidade de obter número ímpar no lance de um dado é P(ímpar) = 3 faces = 3 ou 50% 6 faces possíveis 6 Noções de Probabilidade e Estatística 58 Profª Berenice C. Damasceno A MATEMÁTICA DA PROBABILIDADE Muitas aplicações de estatística exigem a determinação da probabilidade de combinações de eventos. Há duas categorias de eventos de interesse, A e B, no espaço amostral. Pode ser necessário determinar P(A e B), isto é; a probabilidade de ocorrência de ambos os eventos. Em outras situações, podemos querer a probabilidade de ocorrência de A ou B, P(A ou B). Cálculo da Probabilidade da ocorrência de dois eventos “independentes” P(A e B) Se dois eventos são independentes, então a probabilidade da ocorrência de ambos é igual ao produto de suas probabilidades individuais: P(A e B) = P(A) . P(B) Exemplo: Jogam-se duas moedas equilibradas. Qual a probabilidade de ambas as faces serem cara? É razoável admitir que os resultados das duas moedas sejam independentes um do outro. Além disso, para moedas equilibradas, P(cara)= ½ . Logo P(cara e cara) será: 1ª moeda 2ªmoeda ½ x ½ = ¼ ou 25% Cálculo da Probabilidade da ocorrência de dois eventos “mutuamente exclusivos” P(A ou B ocorrerá) Se dois eventos são mutuamente exclusivos, a probabilidade de ocorrência de qualquer um deles é a soma de suas probabilidades individuais. Para dois eventos A e B temos: P(A ou B) = P(A) + P(B) Exemplo: qual é a probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado? P(cinco) ou P(seis) = P (5) + P(6) = 1 + 1 = 2 = 33,33% 6 6 6 Cálculo da Probabilidade da ocorrência de dois eventos “não mutuamente exclusivos” P(A ou B ou ambos ocorrerão) Suponhamos a probabilidade de extração de uma carta de paus ou um dez de um baralho Noções de Probabilidade e Estatística 59 Profª Berenice C. Damasceno Carta de paus de 52 cartas. Como é possível que uma carta seja simultaneamente de “paus” e um “dez”, os eventos não são mutuamente exclusivos. Assim devemos excluir a probabilidade de intersecção. Então temos: P(paus) = 13 , P(dez)= 4 , P( dez de paus) = 1 , 52 52 52 P(paus ou dez,ou ambos) = P(paus) + P(dez) - P(dez de paus) = 13 + 4 - 1 = 16 52 52 52 52 Os eventos “paus” e “dez” se interceptam. NAIPE PAUS OUROS COPAS ESPADA PRETA VERMELHA VERMELHA PRETA ♣ K ♦ K ♥ K ♠ K ♣ Q ♦ Q ♥ Q ♠ Q ♣ J ♦ J ♥ J ♠ J ♣ 10 ♦ 10 ♥ 10 ♠ 10 ♣ 9 ♦ 9 ♥ 9 ♠ 9 ♣ 8 ♦ 8 ♥ 8 ♠ 8 ♣ 7 ♦ 7 ♥ 7 ♠ 7 ♣ 6 ♦ 6 ♥ 6 ♠ 6 ♣ 5 ♦ 5 ♥ 5 ♠ 5 ♣ 4 ♦ 4 ♥ 4 ♠ 4 ♣ 3 ♦ 3 ♥ 3 ♠ 3 ♣ 2 ♦ 2 ♥ 2 ♠ 2 ♣ A ♦ A ♥ A ♠ A a carta é um dez Noções de Probabilidade e Estatística 60 Profª Berenice C. Damasceno Resumindo: P (A e B), para eventos independentes (Multiplicação) P(A) x P(B) P (A ou B), para eventos mutuamente exclusivos (Soma) P(A) + P(B) P (A ou B ou ambos ocorrerão), para eventos não mutuamente exclusivos P(A) + P(B) - P(A interceção B) 11.4 ALGUMAS PROPRIEDADES Como foi visto no final do item anterior, existem algumas regras de probabilidade. Neste item detalharemos tais regras, conhecidas como propriedades da probabilidade. Revendo, a probabilidade de um evento A ocorrer é um número entre 0 e 1, ou seja: 0 ≤ P(A) ≤ 1 Se considerarmos o espaço amostral, S, e o conjunto vazio, ∅, como eventos, temos: P(S) = 1 (evento certo) P(∅) = 0 (evento impossível) Exemplo: Suponha que o seguinte quadro represente uma possível divisão dos alunos matriculados num Instituto de Matemática: Noções de Probabilidade e Estatística 61 Profª Berenice C. Damasceno SEXO CURSO Homens (H) Mulheres(F) TOTAIS Matemática Pura (M) 70 40 110 Matemática Aplicada (A) 15 15 30 Estatística (E) 10 20 30 Computação (C) 20 10 30 TOTAIS 115 85 200 Sendo M o evento que ocorre quando, escolhendo-se ao acaso um aluno do Instituto, ele é um estudante de Matemática Pura. A, E, C, H e F são os demais eventos com significados análogos. Desta maneira, temos como exemplos: 200 30)E(P = e 200 115)H(P = Dados os eventos A e H, podemos considerar dois novos eventos: - A ∪ H, chamado a união de A e H, que ocorre quando pelo menos um dos eventos ocorre; - A ∩ H, chamado a intersecção de A e H, que ocorre quando A e H ocorrem simultaneamente. É fácil verificar na tabela anterior que 200 15)HA(P =∩ , pois o aluno escolhido terá que ser ao mesmo tempo, matriculado no curso de Matemática Aplicada e homem. Vemos que 200 30)A(P = e 200 115)H(P = ; suponha que o nosso cálculo para P(A ∪ H) fosse: 200 145 200 115 200 30)H(P)A(P)HA(P =+=+=∪ Se assim o fizéssemos, estaríamos contando duas vezes os alunos que são homens e que estão matriculados no curso de Matemática Aplicada, como está em destaque na tabela anterior. Portanto a resposta correta é: 200 130 200 15 200 115 200 30)HA(P)H(P)A(P)HA(P =−+=∩−+=∪ No entanto, considerando-se os eventos A e C, vemos que 200 30)A(P = , 200 30)C(P = e )C(P)A(P 200 60)CA(P +==∪ . Neste caso, os eventos A e C são disjuntos ou Noções de Probabilidade e Estatística 62 Profª Berenice C. Damasceno mutuamente exclusivos, pois se A ocorre, então C não ocorre e vice-versa. Aqui, φφφφ=∩ CA e 0)CA(P =∩ . Portanto, se M e N são dois eventos quaisquer, teremos a chamada regra da adição de probabilidades: )NM(P)N(P)M(P)NM(P ∩−+=∪ , que se reduz a )N(P)M(P)NM(P +=∪ , se M e N são eventos mutuamente exclusivos. Suponha agora que estejamos somente interessados em saber se um estudante escolhido ao acaso está matriculado como de Matemática Pura, Aplicada, Estatística ou Computação, não interessando saber se é homem ou mulher. Um espaço amostral é CEAMS ∪∪∪= . Os eventos A e CEMB ∪∪= são chamados complementares e são tais que SBA =∪ e φφφφ=∩ BA . Vemos que 200 30)A(P = , enquanto 200 170 200 30 200 30 200 110)B(P =++= , isto é: 1)B(P)A(P =+ Em geral, vamos indicar por AC o complementar de um evento A, e teremos, então: )A(P1)A(P C −= As operações de união, intersecção e complementação entre eventos possuem propriedades análogas àquelas válidas para operações entre conjuntos. Por exemplo: (i) (A ∩ B)C = AC ∪ BC (A ∪ B)C = AC ∩ BC (ii) A ∩ AC = ∅ A ∪ AC = S (iii) A ∩ ∅ = ∅ A ∩ S = A A ∪ ∅ = A A ∪ S = S (iv) ∅C = S SC = ∅ Noções de Probabilidade e Estatística 63 Profª Berenice C. Damasceno Vejamos, agora, um exemplo de aplicação das propriedades das probabilidades. Exemplo: Consideremos um experimento e os eventos A e B associados, tais que 2 1)A(P = , 3 1)B(P = e 4 1)BA(P =∩ . Então temos: (a) 2 1 2 11)A(P1)A(P C =−=−= ; 3 2 3 11)B(P1)B(P C =−=−= (b) 12 7 4 1 3 1 2 1)BA(P)B(P)A(P)BA(P ====−−−−++++====∩∩∩∩−−−−++++====∪∪∪∪ (c) [ ] 12 5 12 71)BA(P1)BA(P)BA(P CCC =−=∪−=∪=∩ (d) [ ] 4 3 4 11)BA(P1)BA(P)BA(P CCC =−=∪−=∩=∪ (e) Calculemos )BA(P C ∩ , ou seja, a probabilidade que ocorra B e não ocorra A Podemos escrever: )BA()BA(B C ∩∪∩= , ou seja, B pode ocorrer com A ou (exclusivo) com AC. Logo, )BA(P)BA(P)B(P C ∩∪∩= , do que decorre 12 1 4 1 3 1)BA(P)B(P)BA(P C =−=∩−=∩ Noções de Probabilidade e Estatística 64 Profª Berenice C. Damasceno EXERCÍCIOS 1- Extrai-se uma só carta de um baralho de 52. Determine a probabilidade de obter: a- Um valete b- Uma figura c- Uma carta vermelha d- Uma carta de ouros e- Um dez de paus f- Um nove vermelho ou um oito preto 2- Joga-se uma vez um dado equilibrado; determine a probabilidade de obter: a- Um seis; b- Cinco, seis ou sete; c- Um número par; d- Um número menor que quatro. 3- Doze fichas são numeradas de 1 a 12 e colocadas numa urna. Escolhida uma aleatoriamente, determine a probabilidade de sair: a- O número 3 b- Um número impar c- Um número menor que quatro d- O número dez 4- Joga-se um par de dados equilibrados: a- Qual a probabilidade de ambas as faces serem seis? b- Qual a probabilidade de ambas as faces serem dois? c- Qual a probabilidade de ambas as faces serem pares? 5- Sejam P(A) = 0,30, P(B) = 0,80 e P(A e B) = 0,15. a- A e B são mutuamente exclusivos? Explique. b- Determine P(A ou B). 6- Sejam A e B mutuamente exclusivos, P(A) = 0,31 e P(B) = 0,29. a- A e B são coletivamente exaustivos? Explique. b- Determine P(A ou B). c- Determine P (A e B) 7- Joga-se uma moeda três vezes. Qual a probabilidade de aparecer coroa três vezes? Qual a probabilidade de não aparecer coroa nas três vezes? Noções de Probabilidade e Estatística 65 Profª Berenice C. Damasceno 11.5 PROBABILIDADE CONDICIONAL E INDEPENDÊNCIA Voltemos à tabela da página 59. Dado que um estudante, escolhido ao acaso, esteja matriculado no curso de Estatística, a probabilidade de ele ser mulher é de 3 2 30 20 = . Isto porque do total de 30 alunos que estudam Estatística, 20 são mulheres. Escrevemos: 3 2)aEstatístic|mulher(P = Para dois eventos quaisquer A e B, sendo P(B) > 0, definimos a probabilidade condicional de A, dado B, P(A|B), como sendo: )B(P )BA(P)B|A(P ∩= Para o exemplo mencionado, se A e B indicam, respectivamente, os eventos “aluno matriculado em Estatística” e “aluno é mulher”, então P(A∩B) = 20/200, P(B) = 30/200 e, portanto: 3 2 200/30 200/20 )B(P )BA(P)B|A(P ==∩= , como havíamos obtido. Da relação anterior, isto é: )B(P )BPA)B|A(P ∩= obtemos a chamada regra do produto de probabilidades, ou seja: )B|A(P.)B(P)BA(P =∩ Exemplo: Uma urna contem duas bolas brancas (B) e três vermelhas (V). Suponha que sorteemos duas bolas ao acaso, sem reposição. Isto significa que escolhemos a primeira bola, verificamos a sua cor e não a devolvemos à urna; misturamos as bolas restantes e retiramos a segunda bola. O diagrama em árvore ilustra as possibilidades. Em cada “galho” da árvore estão indicadas as probabilidades de ocorrência, sendo que para algumas bolas temos probabilidades condicionais. A probabilidade dos resultados conjuntos é, então, dada pela regra do produto acima. Noções de Probabilidade e Estatística 66 Profª Berenice C. Damasceno Resultados Probabilidades BB 10 1 20 2 4 1 . 5 2 == BV 10 3 20 6 4 3 . 5 2 == VB 10 3 20 6 4 2 . 5 3 == VV 10 3 20 6 4 2 . 5 3 == Total 1 Exemplo: Imagine agora que as duas extrações são feitas da urna, mas a primeira bola é reposta na urna antes da extração da segunda bola. Nestas condições, as extrações são independentes, no sentido de que o resultado de cada extração não tem influência no resultado da outra. Obtemos a seguinte situação: Resultados Probabilidades BB 25 4 5 2 . 5 2 = BV 25 6 5 3 . 5 2 = VB 25 6 5 2 . 5 3 = VV 25 9 5 3 . 5 3 = Total 1 Observe que aqui )ª2nabranca(P 5 2)ª1nabranca|ª2nabranca(P == , ou seja, se o evento A é independente de B, então P(A|B) = P(A). Usando a regra do produto, temos: )A(P.)B(P)B|A(P.)B(P)BA(P ==∩ , ou seja, )B(P.)A(P)BA(P =∩ , se A é independente de B. É fácil ver que, se A é independente de B, então B é independente de A. A equação anterior pode ser tomada como definição de independência, ou seja, A e B são independentes se, e somente se, tal equação for válida. 2/4 2/4 3/4 3/5 1/4 2/5 V V B V B B 3/5 2/5 3/5 3/5 2/5 2/5 V V B V B B Noções de Probabilidade e Estatística 67 Profª Berenice C. Damasceno Exemplo: Considere ainda a mesma urna dos exemplos anteriores, mas vamos fazer três extrações sem repetição. Obtemos o esquema: Resultados Probabilidades BBV 60 6 20 21. 4 1 . 5 2 == BVB 60 6 3 1 . 4 3 . 5 2 = BVV 60 12 3 2 . 4 3 . 5 2 = VBB 60 6 3 1 . 4 2 . 5 3 = VBV 60 12 3 2 . 4 2 . 5 3 = VVB 60 12 3 2 . 4 2 . 5 3 = VVV 60 6 3 1 . 4 2 . 5 3 = Total 60/60 = 1 Observe que P(B|B) = ¼, ao passo que P(V|B∩B) = 1; daí, 10 11. 4 1 . 5 2)BB|V(P.)B|B(P.)B(P)VBB(P ==∩=∩∩ De modo geral, dados 3 eventos M, N e R, temos que: )NM|R(P.)M|N(P.)M(P)RNM(P ∩=∩∩ 1/3 2 /3 2 /3 1 /3 2 /3 1 /3 1 V V B B B V V 2/4 2 /4 3 /4 3 /5 1 /4 2 /5 V V B V B B Noções de Probabilidade e Estatística 68 Profª Berenice C. Damasceno Exemplo: A Teoria da Confiabilidade estuda sistemas e seus componentes, como, por exemplo, sistemas mecânicos ou eletrônicos (um automóvel ou um computador) e sistemas biológicos (como o corpo humano). O objetivo da teoria é estudar relações entre o funcionamento dos componentes e do sistema. A figura abaixo ilustra um sistema composto de dois componentes, ligados em série. O sistema funciona se os componentes 1 e 2 funcionam simultaneamente. Se um dos componentes não funciona, o sistema também não funciona. Supondo que os componentes funcionem independentemente, e se pi é a probabilidade do componente i (i=1,2) funcionar, então a probabilidade do sistema funcionar é p1.p2. Chamando: E: o sistema funciona Ai: o componente i funciona, i = 1,2 então, 212121 p.p)A(P.)A(P)AA(P)E(P ==∩= Cada pi é chamada a confiabilidade do componente i e P(E) = h(p1, p2) = p1. p2 é chamada a confiabilidade do sistema. Se os elementos 1 e 2 estiverem ligados em paralelo, como na figura abaixo, então o sistema funciona se pelo menos um dos dois componentes funciona. Ou seja, 2121212121 p.ppp)AA(P)A(P)A(P)AA(P)E(P −+=∩−+=∪= e a confiabilidade do sistema é h(p1, p2) = p1 + p2 – p1. p2. 2 1 2 1 Noções de Probabilidade e Estatística 69 Profª Berenice C. Damasceno Vejamos agora o conceito de independência para três eventos. Dizemos que os eventos A, B e C são independentes se, e somente se, )B(P.)A(P)BA(P ====∩∩∩∩ )C(P.)A(P)CA(P =∩ )C(P.)B(P)CB(P =∩ )C(P.)B(P.)A(P)CBA(P =∩∩ Esta definição pode ser estendida para um número finito qualquer de eventos independentes. Noções de Probabilidade e Estatística 70 Profª Berenice C. Damasceno 11.6 TEOREMA DE BAYES Uma das relações mais importantes envolvendo probabilidades condicionais é dada pelo teorema de Bayes, que expressa uma probabilidade condicional em termos de outras probabilidades condicionais e marginais. Vamos introduzi-lo através de um exemplo. Exemplo: Temos 5 urnas exatamente iguais, cada uma com 6 bolas. Duas dessas urnas (tipo C1) têm 3 bolas brancas, duas outras (tipo C2) têm 2 bolas brancas, e a última urna (tipo C3) tem 6 bolas brancas. Escolhemos uma urna ao acaso e dela retiramos uma bola. Qual a probabilidade da urna escolhida ser do tipo C3, sabendo-se que a bola sorteada é branca? Na figura abaixo estão esquematizados o espaço amostral e os eventos de interesse. BC 5 4 3 2 1 S C1 C2 C3 C O R B Queremos encontrar P(C3|B), sabendo que 2 1 6 3)C|B(P 5 2)C(P 11 === 3 1 6 2)C|B(P 5 2)C(P 22 === 1 6 6)C|B(P 5 1)C(P 33 ============ Da definição de probabilidade condicional, temos: P(B) )C|P(B.)P(C P(B) B)P(CB)|P(C 3333 =∩= Precisamos agora encontrar o valor de P(B), já que o numerador é conhecido. Como C1, C2 e C3 são eventos mutuamente exclusivos, e reunidos formam o espaço amostral completo, podemos decompor o evento B, na união de três outros, mutuamente exclusivos, ou seja: )BC()BC()BC(B 321 ∩∪∩∪∩= e então Noções de Probabilidade e Estatística 71 Profª Berenice C. Damasceno 15 81. 5 1 3 1 . 5 2 2 1 . 5 2 )C|B(P.)C(P)C|B(P.)C(P)C|B(P.)C(P )BC(P)BC(P)BC(P)B(P 332211 321 =++= =++= =∩+∩+∩= Substituindo este resultado na equação de P(C3|B), obtemos: 8 3 15 8 1 5 1 33 3 ============ . )B(P )C|B(P.)C(P )B|C(P Podemos agora generalizar os resultados acima do seguinte modo: seja C1, C2, ..., Cn uma partição do espaço amostral S, isto é, Ci ∩ Cj = ∅, i ≠j, e C1 ∪ C2 ∪ ... ∪ Cn = S; E consideremos A um evento qualquer. Também são conhecidos P(Ci) e P(A|Ci) para i = 1, 2,...., n. Então, temos o seguinte resultado, ilustrado pela figura a seguir. Teorema de Bayes – A probabilidade de ocorrência de um dos eventos Ci, dado que ocorreu o evento A, é dado por: ∑ = = n 1j jj ii i )C|A(P.)C(P )C|A(P.)C(P)A|C(P onde , i = 1, 2, ..., n. Exemplo: Para selecionar seus funcionários, uma empresa oferece aos candidatos um curso de treinamento durante uma semana. Ao final, eles são submetidos a uma prova e 25% são classificados como bons (B), 50% como médios (M) e os restantes 25% como fracos (F). Noções de Probabilidade e Estatística 72 Profª Berenice C. Damasceno Como medida de economia, o departamento de seleção pretende substituir o treinamento por um teste contendo perguntas envolvendo conhecimentos gerais e específicos. Mas, para isso, gostaria de conhecer qual a probabilidade de que um indivíduo aprovado no teste fosse considerado fraco, caso fizesse o curso. Assim, nesse ano antes do início do curso, os candidatos foram submetidos ao teste e, de acordo com os resultados, receberam o conceito aprovado (A) ou reprovado (R). Ao final do curso, obtiveram as seguintes probabilidades condicionais: P(A|B) = 0,80 P(A|M) = 0,50 P(A|F) = 0,20 Queremos encontrar P(F|A), e pelo teorema de Bayes esta é dada por 10,0)20,0(.)25,0()50,0(.)50,0()80,0(.)25,0( )20,0(.)25,0( )F|A(P.)F(P)M|A(P.)M(P)B|A(P.)B(P )F|A(P.)F(P)A|F(P = ++ = = ++ = Então, apenas 10% dos aprovados é que seriam classificados como fracos durante o curso. De modo análogo, podemos encontrar: P(B|A) = 0,40 e P(M|A) = 0,50 que seriam subsídios valiosos para ajudar a decisão de substituir o treinamento pelo teste. 11.7 ABORDAGEM TABULAR DO TEOREMA DE BAYES O cálculo de uma probabilidade condicional pelo Teorema de Bayes, muitas vezes é facilitado utilizando-se uma abordagem tabular. Nessa abordagem uma tabela com cinco colunas será montada. Os passos para a sua montagem são os seguintes: (1º) Na 1ª coluna são colocados os eventos mutuamente exclusivos para os quais as probabilidades posteriores são desejadas (Ai). (2º) Na 2ª coluna são colocadas as probabilidades prévias para esses eventos (P(Ai)). (3º) Na 3ª coluna são colocadas as probabilidades condicionais da nova informação dada para cada evento (P(B|Ai)). Noções de Probabilidade e Estatística 73 Profª Berenice C. Damasceno (4º) Na 4ª coluna são calculadas as probabilidades associadas para cada um dos eventos e a nova informação B, usando-se a lei da multiplicação. Essas probabilidades associadas são encontradas multiplicando-se as probabilidades prévias na coluna 2 pelas probabilidades condicionais na coluna 3, isto é, P(Ai ∩ B) = P(Ai) . P(B|Ai) (5º) É feita, então, a soma das probabilidades associadas na coluna 4. A soma é a probabilidade da nova informação P(B). (6º) Na 5ª coluna, calcular as probabilidades posteriores usando a relação básica de probabilidade condicional: )( )()|( BP BAPBAP ii ∩ = No exemplo anterior, aplicando-se essa abordagem, teremos a seguinte a tabela: Eventos Probabilidades Prévias Probabilidades Condicionais Probabilidades Associadas Probabilidades Posteriores B P(B) = 0,25 P(A|B) = 0,80 P(B). P(A|B) = 0,25.0,80 = 0,20 40,0 50,0 20,0)|( ==ABP M P(M) = 0,50 P(A|M) = 0,50 P(M). P(A|M) = 0,50.0,50 = 0,25 50,0 50,0 25,0)|( ==AMP F P(F) = 0,25 P(A|F) = 0,20 P(F). P(A|F) = 0,25.0,20 = 0,05 10,0 50,0 05,0)|( ==AFP _______ 1,00 _______ P(A) = 0,50 _______ 1,00 OBSERVAÇÕES: - O teorema de Bayes é usado extensivamente nas análises de decisões. As probabilidades prévias são freqüentemente estimativas subjetivas fornecidas por um tomador de decisão. A informação amostral é obtida e as probabilidades posteriores são calculadas para uso no desenvolvimento de uma estratégia de decisão. - Um evento e seu complemento são mutuamente exclusivos e suas uniões formam uma partição. Assim, o teorema de Bayes é sempre aplicável para o cálculo das probabilidades posteriores de um evento e seu complemento. Noções de Probabilidade e Estatística 74 Profª Berenice C. Damasceno EXERCÍCIOS 1- No exemplo da página 68, que trata das urnas, elabore a tabela segundo a abordagem tabular para chegar aos valores das probabilidades posteriores. 2- A probabilidade do time de futebol São Paulo ganhar uma partida quando chove é de 0,7 e quando não chove é de 0,8. No mês de setembro passado, a probabilidade de chuva foi de 0,6. Sabendo-se que o São Paulo jogou uma partida em setembro e ganhou, qual a probabilidade de ter chovido no dia desse jogo? 3- M. D. Computing (maio de 1991) descreve o uso do teorema de Bayes e o uso da probabilidade condicional no diagnóstico médico. As probabilidades prévias de doenças são baseadas na avaliação dos médicos de variáveis tais como localização geográfica, influência sazonal, ocorrência de epidemias e assim por diante. Suponha que se acredite que um paciente tenha uma de duas doenças, denotadas como D1 e D2 com P(D1) = 0,60 e P(D2) = 0,40 , e que a pesquisa médica tenha determinado a probabilidade associada com cada sintoma que pode acompanhar as doenças. Suponha que, dadas as doenças D1 e D2, as probabilidades de que o paciente terá os sintomas S1, S2 ou S3 são como segue: S1 S2 S3 D1 P(S1|D1) = 0,15 P(S2|D1) = 0,10 P(S3|D1) = 0,15 D2 P(S1|D2) = 0,80 P(S2|D2) = 0,15 P(S3|D2) = 0,03 Depois que constatar que um certo sintoma esteja presente, o diagnóstico médico pode ser auxiliado encontrando-se as probabilidades revisadas de cada doença em particular. Calcule as probabilidades posteriores de cada doença dadas as seguintes constatações médicas: a) O paciente tem o sintoma S1. b) O paciente tem o sintoma S2. c) O paciente tem o sintoma S3. 4- Uma companhia produz circuitos integrados em três fábricas, I, II e III. A fábrica I produz 40% dos circuitos, enquanto a II e a III produzem 30% cada uma. As probabilidades de que um circuito integrado produzido por estas fábricas não funcione são 0,01, 0,04 e 0,03, respectivamente. Escolhido um circuito da produção conjunta das três fábricas, qual a probabilidade do mesmo não funcionar? Noções de Probabilidade e Estatística 75 Profª Berenice C. Damasceno 12.0 TÉCNICAS DE CONTAGEM Para utilizar o método clássico da probabilidade, é preciso conhecer o número total de resultados possíveis de um experimento. Uma das possibilidades é o uso das árvores de decisão, mas quando o número de resultados é grande, essa lista se torna muito trabalhosa; é necessário então recorrer a fórmulas matemáticas para determinar o número total de resultados possíveis. Suponhamos que um estudante esteja fazendo um teste de 20 questões do tipo “verdadeiro-ou-falso”. Suponhamos ainda que ele, não tenha estudado nada, esteja dando todas as respostas na base do palpite. Qual a probabilidade de ele responder corretamente todo o teste? A primeira coisa a fazer é determinar o número total de resultados possíveis. Em segundo lugar devemos explorar suas diversas versões. Imaginemos que o teste consista de apenas: Uma questão temos V ou F Duas questões temos VV, VF, FV, FF Três questões temos VVV, VVF, VFF, VFV, FVF, FVV, FFV, FFF Conclui-se: Número de questões : 1 2 3 4 Número de resultados : 2 4 8 16 Nota-se que, se o número de itens for grande, a listagem se tornará praticamente impossível. Em seguida, podemos ver um diagrama de árvore para determinar todos os arranjos possíveis. Noções de Probabilidade e Estatística 76 Profª Berenice C. Damasceno QUESTÃO N°1 QUESTÃO N°2 QUESTÃO N°3 RESULTADOS Além disso, o que realmente é necessário é determinar o número total de resultados; nada se tem a ganhar identificando cada resultado. 12.1 O PRINCÍPIO DA MULTIPLICAÇÃO O diagrama mostra que cada questão dobra o número total de resultados possíveis (com duas alternativas V ou F) temos: NÚMERO DE QUESTÕES TOTAL DE RESULTADOS 1 2=2 2 2 x 2 =4 3 2 x 2 x 2 = 8 4 2 x 2 x 2 x 2 = 16 F F V V V F F F F V F V V V V V V V V F V FV V FF FV V FV F FFV FFF Noções de Probabilidade e Estatística 77 Profª Berenice C. Damasceno Se fossem quatro escolhas para cada questão: NÚMERO DE QUESTÕES TOTAL DE RESULTADOS 1 4=4 2 4 x 4 =16 3 4 x 4 x 4 = 64 4 4 x 4 x 4 x 4 = 256 Para solucionar o exercício do teste, teremos: 2 x 2 x 2 x 2 x 2 x . . . . . . . x 2 = 220 = 1.048.576 1 2 3 4 5 . . . . . . 20 De um modo geral, se há “n” decisões seqüenciais, cada uma com “m” escolhas, o número total de resultados é mn. 12.2 PERMUTAÇÃO, ARRANJO E COMBINAÇÃO Quando a ordem em que os elementos se dispõem é importante, o número total de resultados possíveis é conhecido como Arranjo ou Permutação. Quando a ordem não interessa, o número total de resultados possíveis é designado como Combinação. Para o uso na análise combinatória usaremos o número fatorial representado pelo símbolo ! como por exemplo 4! lê-se “quatro fatorial” e significa 4 x 3 x 2 x 1 = 24. Outros exemplos: 5! = 5 x 4 x 3 x 2 x 1 = 120 12! = 12 x 11 x 10 x 9 x 8 x 7 x ..............x 1 = 479.001.600 Os fatoriais crescem de modo extremamente rápido, à medida que aumenta o número- base. Felizmente, quase nunca é necessário utilizar-se completamente os fatoriais, pois eles aparecem em grupos, permitindo cancelamentos: Noções de Probabilidade e Estatística 78 Profª Berenice C. Damasceno 5! = 1 7! 42 4! = 12 2! 5! = 10 2! 3! Às vezes os fatoriais podem envolver soma e subtração. Exemplos: ( 5 - 3 )! = 2! e não ( 5! - 3! ) ( 9 - 2 )! = 7! ( 3 + 1)! = 4! 8! = 8! = 8 x 7 x 6 x 5! = 8 x 7 x 6 = 56 3! ( 8 – 3 )! 3! . 5! 3 x 2 x 5! 3 x 2 O fatorial de zero é igual a um 0! = 1. O fatorial de 1 é igual a um 1! = 1. ARRANJOS São agrupamentos que podem variar pela ordem ou natureza dos elementos. Quando se consideram n elementos distintos tomados x a x chamamos arranjo ou agrupamentos “eneários” que se podem formar com esses n elementos, dispomos de todas as formas possíveis de modo que dois arranjos quaisquer difiram ao menos pela ordem dos elementos. Assim, os arranjos possíveis com as letras A, B e C são A 3,2 (3 elementos dois a dois) A 3,2 = AB; BA; AC; CA, BC; CB. E com os números: 2, 6 e 8 podem ser feitos os seguintes arranjos A 3,2 A 3,2 = 26; 28; 62; 68; 82; 86. Noções de Probabilidade e Estatística 79 Profª Berenice C. Damasceno Portanto: )!xn( !nA x,n − = Outro exemplo: Se há sete cavalos num páreo, quantos arranjos há considerando 1°,2° e 3° lugares? Ou seja, 7 elementos tomados 3 a 3 A 7,3 = 7! = 7! = 7 x 6 x 5 x 4! = 7 x 6 x 5 = 210 ( 7 – 3 )! 4! 4! PERMUTAÇÃO Denomina-se permutação aos arranjos de objetos tomados n a n. Neste caso cada objeto entra só uma vez em todos os grupos. Em geral o número de permutações distintas com n itens, dos quais n1 são indistinguíveis de um tipo, n2 de outro tipo, etc, é: )!n(...)!n()!n()!n( !nP k321 n...,,n,n n K21 = (permutação com repetições) Exemplo: Quantas permutações distintas de 3 letras podemos formar com as letras: R R R R U U U N 4 3 1 Solução Há 8 letras : 4Rs 3Us 1N dai: 280)!1()!3()!4( !8P 1348 ======== Noções de Probabilidade e Estatística 80 Profª Berenice C. Damasceno COMBINAÇÃO Chama-se combinação quando não interessa a ordem para denotar o número de agrupamentos distintos possíveis. Exemplo: é a escolha de 2 tipos de vegetal de um cardápio com 5 tipos. A escolha de batata e cenoura é a mesma que cenoura e batata. De um modo geral, para agrupamentos de tamanho x extraídos de uma lista de n itens, o Número de combinações possíveis é: ( )nxx,n )!xn(!x !nC =−= Quantos comitês distintos, de 3 pessoas cada um, podemos formar com um grupo de 10 pessoas? 120 !7.2.3 !7.8.9.10 !7!3 !10 )!310(!3 !10C 3,10 ============ −−−− ==== De quantas maneiras podemos formar um comitê de 1 mulher e 2 homens, de um total de 4 mulheres e 6 homens. Mulheres e Homens => 6015.4 !4!2 !6 . !3!1 !4C.C 2,61,4 ============ Noções de Probabilidade e Estatística 81 Profª Berenice C. Damasceno REGRAS DE CONTAGEM REGRA DA MULTIPLICAÇÃO: o produto do número de escolhas para uma seqüência de decisões mn, onde m = número de escolhas e n = decisões seqüenciais. ARRANJOS: Número de agrupamentos em que interfere a ordem )!xn( !nA x,n − = PERMUTAÇÃO COM REPETIÇÕES (OU DISTINGÜÍVEIS): alguns itens são idênticos, e a ordem é importante. )!n(...)!n()!n()!n( !nP k321 n...,,n,n n K21 = OBS: Permutação simples: Pn = n! COMBINAÇÕES: a ordem não importa. ( )nxx,n )!xn(!x !nC =−= Noções de Probabilidade e Estatística 82 Profª Berenice C. Damasceno EXERCÍCIOS 1- Calcule: a- 2! b- 3! c- 10! d- 1! e- 0! 2- Calcule: a- 2 3 b- 4 4 c- 1 5 d- 6 9 3- Determine o número de arranjos: a- A 3,2 b- A 4,4 c- A 5,1 d- A 9,6 e- A 1,0 4- Um vendedor de automóveis deseja impressionar os possíveis compradores com o maior Número de combinações diferentes possíveis. Um modelo pode ser dotado de três tipos de motor, dois tipos de transmissão, cinco cores externas e duas internas. Quantas são a escolhas possíveis? 5- Em um determinado Estado, as placas de licença constam de três letras e quatro algarismos. Quantas placas diferentes podemos formar admitindo-se o uso de todas as (26 letras) e os (10 algarismos)? 6- Quantas permutações distintas podem ser feitas com as letras da palavra ESTATÍSTICA? 7- Se um torneio de basquetebol consiste de 36 times, de quantas maneiras podem ser conquistados os três primeiros lugares? 8- De quantas maneiras diferentes podemos escolher um comitê de cinco pessoas dentre oito? 9- A Pizzaria ISA oferece as seguintes escolhas de pizza: presunto, cogumelos, pimentão, enchovas e muzzarella. De quantas maneiras podemos escolher dois tipos diferente de pizza? Noções de Probabilidade e Estatística 83 Profª Berenice C. Damasceno =>0,50 13.0 VARIÁVEL ALEATÓRIA E DISTRIBUIÇÃO DE PROBABILIDADE 13.1 DEFINIÇÃO DE VARIÁVEL ALEATÓRIA Introduzidas às noções fundamentais sobre a teoria das probabilidades, podemos passar às chamadas Distribuições de Probabilidades. Uma distribuição de probabilidades é uma distribuição de freqüência relativa para os resultados de um espaço amostral (isto é, para os resultados de uma variável aleatória); que mostra a proporção das vezes em que a variável aleatória tende a assumir cada um dos diversos valores. Consideremos a variável aleatória “número de caras em duas jogadas de uma moeda”, eis a lista dos pontos do espaço amostral e os valores correspondentes à v.a.: (Sendo K = cara e C = coroa) Resultados Valor de v.a. CC 0 CK 1 KC 1 KK 2 Se a moeda é equilibrada, P(K) = P(C) = ½. As probabilidades dos diversos resultados são: Resultados Pobabilidade do Resultado P(x) Número de Caras CC 25,0 4 1 2 1 . 2 1 ======== 0 CK 25,0 4 1 2 1 . 2 1 ======== 1 KC 25,0 4 1 2 1 . 2 1 ======== 1 KK 25,0 4 1 2 1 . 2 1 ======== 2 Noções de Probabilidade e Estatística 84 Profª Berenice C. Damasceno Assim, pois, a distribuição de probabilidades para o número de caras em duas jogadas de uma moeda é: Número de Caras P(x) 0 0,25 1 0,50 2 0,25 1,00 Nota-se que a soma de todas as probabilidades é 1,00, como é de se esperar, pois os resultados apresentados são mutuamente exclusivos e coletivamente exaustivos. A mesma distribuição pode ser apresentada em forma acumulada. Número de Caras P(x ou menos) 0 0,25 1 0,75 2 1,00 Graficamente, as distribuições de probabilidade e acumulada se apresentam: P 1,00 R 1,00 O 1,OO B A P B R 0,75 I 0,75 O L 0,75 B I A D B A I 0,5 D 0,5 L 0,5 E I D A A C D 0,25 U 0,25 E 0,25 0,25 M 0,25 U L A 0 D 0 0 1 2 A 0 1 2 NÚMERO DE CARAS NÚMERO DE CARAS Noções de Probabilidade e Estatística 85 Profª Berenice C. Damasceno Portanto concluímos que uma variável aleatória (v.a.) fornece um meio para se descrever por valores numéricos os resultados experimentais. Uma v.a. é uma descrição numérica do resultado de um experimento. Uma v.a. pode ser classificada como discreta ou contínua, dependendo dos valores numéricos que ela assume. VARIÁVEIS ALEATÓRIAS DISCRETAS Uma v.a. que pode assumir tanto um número finito de valores como infinita seqüência de valores tais como 0, 1, 2, 3, ... é denominada variável aleatória discreta. Por exemplo, considere o experimento de um contador que faz um exame público. O exame tem quatro partes. Podemos definir a v.a. discreta como x ≡ o número de partes em que foi aprovado no exame. Essa v.a. discreta pode assumir o número finito de valores 0, 1, 2, 3 ou 4. Como outro exemplo, considere o experimento de carros que chegam a um posto de pedágio. A v.a. de interesse é x ≡ o número de carros que chega durante o período de um dia. Os possíveis valores de x vêm da seqüência de inteiros 0, 1, 2 e assim por diante. Portanto x é uma v.a. discreta que assume um dos valores nessa seqüência infinita. Embora muitos experimentos tenham resultados que são naturalmente descritos por valores numéricos, outros não o são. Por exemplo, uma questão de um levantamento pode solicitar a um indivíduo que relembre a mensagem de um recente comercial de televisão. Esse experimento poderia ter dois resultados possíveis: o indivíduo não pode lembrar a mensagem e o indivíduo pode lembrar a mensagem. Podemos ainda descrever esses resultados experimentais numericamente, definindo-se a v.a. discreta x como segue: seja x = 0 se o indivíduo não pode lembrar a mensagem e x = 1 se o indivíduo pode lembrar a mensagem. Os valores numéricos para essa v.a. são arbitrários (poderíamos usar 5 e 10), mas eles são aceitáveis em termos da definição de uma v.a.. Outros exemplos de v.a. discretas são dados a seguir: Noções de Probabilidade e Estatística 86 Profª Berenice C. Damasceno Exemplos de v.a. discretas Experimento v.a. (x) Possíveis valores para v.a. Contatar cinco clientes Número de clientes que colocam um pedido de compra 0, 1, 2, 3, 4, 5 Inspecionar um embarque de 50 rádios Número de rádios defeituosos 0, 1, 2, ..., 49, 50 Operar um restaurante por um dia Número de clientes 0, 1, 2, 3, 4, ... Vender um automóvel Gênero do cliente 0 se masculino, 1 se feminino VARIÁVEIS ALEATÓRIAS CONTÍNUAS Uma v.a. que pode assumir qualquer valor numérico em um intervalo ou numa coleção de intervalos é chamada v.a. contínua. Resultados experimentais que são baseados em escalas de medidas tais como peso, tempo, distância e temperatura podem ser descritos por v.a. contínuas. Por exemplo considere, o experimento de monitorar as chamadas telefônicas que chegam a um escritório de reclamações de uma grande empresa de seguros. Suponha que a v.a. de interesse seja x ≡ o tempo em minutos entre chamadas consecutivas recebidas. Essa v.a. pode assumir qualquer valor no intervalo x ≥ 0. Realmente, um número infinito de valores são possíveis para x, incluindo valores tais como 1,27 minutos, 2,471 minutos, 4,5555 minutos e assim por diante. Como um outro exemplo, considere um trecho de 144 Km de uma auto-estrada interestadual ao norte de Atlanta, Geórgia, nos USA. Para um serviço de emergência localizado em Atlanta, podemos definir a v.a. como x ≡ a localização do próximo acidente de trânsito ao longo desse trecho da auto-estrada. Neste caso, x seria uma v.a. contínua que assume qualquer valor no intervalo 0 ≤ x ≤ 144. Outros exemplos são apresentados na tabela abaixo. Noções de Probabilidade e Estatística 87 Profª Berenice C. Damasceno Exemplos de v.a. contínuas Experimento v.a. (x) Possíveis valores para v.a. Operar um banco Tempo entre as chegadas dos clientes em minutos x ≥ 0 (min) Encher um recipiente de refrigerante (máx = 343 ml) Número de ml 0 ≤ x ≤ 343 (ml) Trabalhar num projeto para a construção de uma nova biblioteca Porcentagem de término do projeto após 6 meses 0 ≤ x ≤ 100 (%) Testar um novo processo químico Temperatura quando a reação desejada ocorre (mín 65º C e máx 100º C) 65 ≤ x ≤ 100 (ºC) Observação: Um modo de determinar se uma v.a. é discreta ou contínua é pensar nos valores da v.a. como pontos sobre um segmento de reta. Escolha 2 pontos que representam valores da v.a.. Se todo o segmento de reta entre os 2 pontos também representa possíveis valores para a v.a., então a v.a. é contínua. Noções de Probabilidade e Estatística 88 Profª Berenice C. Damasceno EXERCÍCIO: Uma série de experimentos e v.a. ‘s associadas são listados a seguir. Em cada caso, identifique os valores que a v.a. pode assumir e estabeleça se a v.a. é discreta ou contínua. Experimento v.a. (x) a. Fazer um exame com 20 questões Número de questões respondidas corretamente b. Observar carros que chegam a um posto de pedágio, no espaço de uma hora Número de carros que chegam ao posto de pedágio c. Auditar 50 declarações de imposto Número de declarações que contêm erros d. Observar o trabalho de um operário Número de horas não produtivas em um dia de trabalho de 8 horas e. Pesar um carregamento de produtos Número de quilos DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE A distribuição de probabilidade para uma v.a. descreve como as probabilidades estão distribuídas sobre os valores da v.a.. Para uma v.a. discreta x, a distribuição de probabilidade é definida por uma função de probabilidade, denotada por f(x). A função de probabilidade fornece a probabilidade para cada um dos valores da v.a.. Como exemplo de v.a. discreta e sua distribuição de probabilidade, considere as vendas de automóveis de uma revendedora chamada X-Motors. Nos últimos 300 dias de operação, os dados de vendas mostram 54 dias sem vendas de automóveis, 117 dias com um automóvel vendido, 72 dias com dois automóveis vendidos, 42 dias com três automóveis vendidos, 12 dias com quatro automóveis vendidos e 3 dias com cinco automóveis vendidos. Suponha que consideremos o experimento de selecionar um dia de operação na X-Motors. Definimos a v.a. de interesse como x ≡ o número de automóveis vendidos durante um dia. A partir dos dados históricos conhecidos, sabemos que x é uma v.a. discreta que pode assumir os valores 0, 1, 2, 3, 4 ou 5. Na notação da função de probabilidade, f(0) fornece a probabilidade de 0 automóveis vendidos, f(1) fornece a probabilidade de 1 automóvel vendido e assim por diante. Uma vez que os dados mostram 54 dos 300 dias com 0, atribuímos o valor 54/300 = 0,18 para f(0), indicando que a probabilidade de 0 automóvel ter sido vendido durante um dia é de 0,18. Analogamente, Noções de Probabilidade e Estatística 89 Profª Berenice C. Damasceno podemos calcular as demais funções, mostradas na tabela a seguir. Distribuição de probabilidade para o número de automóveis vendidos durante um dia na X-Motors x f(x) 0 0,18 1 0,39 2 0,24 3 0,14 4 0,04 5 0,01 Total 1,00 No desenvolvimento de uma função de probabilidade para qualquer v.a. discreta, as duas condições seguintes precisam ser satisfeitas: 1. f(x) ≥ 0 2. ∑ f(x) = 1 O exemplo mais simples de uma distribuição discreta de probabilidade é a distribuição uniforme de probabilidade. Sua função de probabilidade é dada a seguir: f(x) = 1/n onde: n ≡ o número de valores que a v.a. pode assumir por exemplo considere o experimento de lançamento de um dado e defina a v.a. x como sendo o número da face voltada para cima. Existem n = 6 valores possíveis para a v.a.; x = 1, 2, 3, 4 , 5, 6. Assim a função de probabilidade para esta v.a. é f(x) = 1/6 x = 1,2,3,4,5,6 Noções de Probabilidade e Estatística 90 Profª Berenice C. Damasceno Os valores possíveis da v.a. e as probabilidades associadas são mostrados a seguir: x f(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 VALOR ESPERADO E VARIÂNCIA DE UMA V.A. DISCRETA VALOR ESPERADO O valor esperado, ou média, de uma v.a. discreta é a medida de posição central para a v.a.. A expressão matemática para o valor esperado da v.a. x é dada por: E(x) = µ = ∑ x.f(x) Voltando ao exemplo anterior da X-Motors, temos: Cálculo do valor esperado para o nº de automóveis vendidos durante um dia na X-Motors x f(x) x.f(x) 0 0,18 0,00 1 0,39 0,39 2 0,24 0,48 3 0,14 0,42 4 0,04 0,16 5 0,01 0,05 Total 1,00 1,50 Noções de Probabilidade e Estatística 91 Profª Berenice C. Damasceno Portanto E(x) = µ = ∑ x.f(x) = 1,50. VARIÂNCIA Enquanto o valor esperado fornece o valor médio para a v.a., freqüentemente necessitamos de uma medida de variabilidade ou de dispersão. A expressão matemática para a variância é: Var(x) = σ2 = ∑ (x - µ)2 . f(x) E o desvio padrão será: σ = 2σ No exemplo anterior temos: Cálculo da variância para o nº de automóveis vendidos durante um dia na X-Motors x f(x) (x - µµµµ)2 . f(x) 0 0,18 0,4050 1 0,39 0,0975 2 0,24 0,0600 3 0,14 0,3150 4 0,04 0,2500 5 0,01 0,1225 Total 1,00 1,2500 Portanto Var(x) = σ2 = ∑ (x - µ)2 . f(x) = 1,25. Noções de Probabilidade e Estatística 92 Profª Berenice C. Damasceno EXERCÍCIOS: 1 - A seguinte tabela é uma distribuição de probabilidade para v.a. x: x f(x) 3 0,25 6 0,50 9 0,25 Total 1,00 a) Calcule E(x), o valor esperado de x. b) Calcule σ2, a variância de x. c) Calcule σ, o desvio padrão de x. 2 - A seguinte tabela é uma distribuição de probabilidade para v.a. y: y f(y) 2 0,20 4 0,30 7 0,40 8 0,10 Total 1,00 a) Calcule E(y). b) Calcule Var(y) e σ. 3 - Um serviço voluntário de ambulâncias atende de 0 a 5 chamadas de serviço em qualquer dia. A distribuição de probabilidade para o número de chamadas de serviço é: Noções de Probabilidade e Estatística 93 Profª Berenice C. Damasceno Número de chamadas de serviço Probabilidade 0 0,10 1 0,15 2 0,30 3 0,20 4 0,15 5 0,10 a) Qual o número esperado de chamadas de serviço? b) Qual é a variância no número de chamadas de serviço? Qual é o desvio padrão? 4 - O Statistical Abstract of the United States, 1997, mostra que o número médio de aparelhos de televisão por família é de 2,3. Considere que a distribuição de probabilidade para o número de aparelhos de televisão por família é mostrado a seguir: x f(x) 0 0,01 1 0,23 2 0,41 3 0,20 4 0,10 5 0,05 a) Calcule o valor esperado do número de aparelhos de televisão por família e compare-o com a média relatada no Statistical Abstract. b) Qual a variância e o desvio padrão do número de aparelhos por família? Noções de Probabilidade e Estatística 94 Profª Berenice C. Damasceno 13.2 DISTRIBUIÇÃO BINOMIAL A distribuição binomial de probabilidade é uma distribuição discreta de probabilidade que tem muitas aplicações. Ela está associada a um experimento de múltipla etapa que chamamos de experimento binomial. Um experimento binomial Um experimento binomial tem as quatro seguintes propriedades: (1ª) O experimento consiste de uma seqüência de n ensaios idênticos. (2ª) Dois resultados são possíveis em cada ensaio. Referimo-nos a um como um sucesso e ao outro como um fracasso. (3ª) A probabilidade de um sucesso, denotado por p, não se modifica de ensaio para ensaio. Conseqüentemente, a probabilidade de um fracasso, denotado por q (onde q = 1 – p), não se modifica de ensaio para ensaio. (4ª) Os ensaios são independentes. Se as propriedades 2, 3 e 4 estão presentes, dizemos que os ensaios são gerados por um processo de Bernoulli. Se além disso, a propriedade 1 está presente, dizemos que temos um experimento binomial. Suponhamos agora o experimento E4= “Lançamento de 4 moedas”. A tabela abaixo mostra todas as possibilidades de combinações cara/coroa, os eventos que estas combinações originam e os valores correspondentes da variável aleatória X : Número de vezes que sai “Cara”. Noções de Probabilidade e Estatística 95 Profª Berenice C. Damasceno POSSIBILIDADE MOEDA N° EVENTO VALOR DE X N° 1, 2, 3, 4 ( N° DE VEZES QUE SAI CARA) 1 C C C C 0K e 4C 0 2a C C C K 1K e 3C 1 2b C C K C 2c C K C C 2d K C C C 3a C C K K 2K e 2C 2 3b C K K C 3c K K C C 3d C K C K 3e K C K C 3f K C C K 4a K K K C 3K e 1C 3 4b K K C K 4c K C K K 4d C K K K 5 K K K K 4K e 0C 4 Utilizando as regras do produto para eventos independentes (e) e da adição para eventos mutuamente exclusivos (ou) é possível calcular as probabilidades associadas aos valores de X. A probabilidade de X=0 é obtida pelo conhecimento de termos 4 coroas, sabe-se que a probabilidade de sair coroa é ½ , a probabilidade final será: 0,5x0,5x0,5x0,5 = 0,0625. Para o cálculo da probabilidade X=1 deve-se trabalhar com o evento “1K e 3C” como temos as opções a,b,c,d, que são mutuamente exclusivas, a regra da soma manda efetuar a adição 0,0625 +0,0625 +0,0625 +0,0625 ou, o que é o mesmo de se efetuar o produto 4x 0,0625 = 0,25. Noções de Probabilidade e Estatística 96 Profª Berenice C. Damasceno Desta forma analogamente temos: x EVENTO f( x ) 0 4 0 4 0 0K e 4C O,0625 = 1 X 0,5 X 0,5 = 1 p q 1 3 1 3 1 1K e 3C O,2500 = 4 X 0,5 X 0,5 = 4 p q 2 2 2 2 2 2K e 2C O,3750 = 6 X 0,5 X 0,5 = 6 p q 3 1 3 1 3 3K e 1C O,2500 = 4 X 0,5 X 0,5 = 4 p q 4 0 4 0 4 4K e 0C O,0625 = 1 X 0,5 X 0,5 = 1 p q TOTAL 1,00 n = número de moedas p = probabilidade de K : P(K) = 0,5 q = 1 – p = probabilidade de C : P(C) = 0,5 Podemos usar a equação: = − n xxnx n )!(.! ! combinações de n indivíduos tomados x a x. Generalizando temos a função binomial f(x): ( ) xnx qp xnx n xf − − = .. !.! !)( Noções de Probabilidade e Estatística 97 Profª Berenice C. Damasceno Exemplo: Distribuição binomial de x (número de coroas) para n = 10 X Número de Distribuição f(x) “Coroas” em 10 jogadas Amostral 10 000976,0 1024 1 .1)!1010(!10 !10 ======== −−−− 9 009760,0 1024 1 .10)!910(!9 !10 ======== −−−− 8 043940,0 1024 1 .45)!810(!8 !10 ======== −−−− 7 117180,0 1024 1 .120)!710(!7 !10 ======== −−−− 6 205070,0 1024 1 .210)!610(!6 !10 ======== −−−− 5 246090,0 1024 1 .252)!510(!5 !10 ======== −−−− 4 205070,0 1024 1 .210)!410(!4 !10 ======== −−−− 3 117180,0 1024 1 .120)!310(!3 !10 ======== −−−− 2 043940,0 1024 1 .45)!210(!2 !10 ======== −−−− 1 009760,0 1024 1 .10)!110(!1 !10 ======== −−−− 0 000976,0 1024 1 .1)!010(!0 !10 ======== −−−− Total de resultados = 210 = 1024 )!xn(!x !n −−−− Noções de Probabilidade e Estatística 98 Profª Berenice C. Damasceno EXERCÍCIOS: Use a equação binomial para responder às questões abaixo: 1- Um fabricante de mesas de bilhar suspeita que 2% de seu produto apresenta algum defeito. Se tal suspeita é correta, determine a probabilidade de que, numa amostra de nove mesas: a- Haja ao menos uma defeituosa b- Não haja nenhuma defeituosa 2- Dos estudantes de um colégio, 41% FUMAM CIGARROS. Escolhem-se seis ao acaso para darem sua opinião sobre o fumo. a- Determine a probabilidade de nenhum dos seis estudantes ser fumante. b- Determine a probabilidade de todos os seis serem fumantes. c- Qual a probabilidade de ao menos a metade dos seis serem fumantes. 3- Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao embarque. O avião comporta 15 passageiros. Determine a probabilidade de que todos os 15 que reservaram lugar compareçam ao embarque 4- Um revendedor de automóveis novos constatou que 80% dos carros vendidos são devolvidos ao departamento mecânico para corrigir defeitos de fabricação, nos primeiros 25 dias apos a venda. De 11 carros vendidos num período de 5 dias, qual é a probabilidade de que: a. Todos voltem dentro de 25 dias para reparo. b. Só um não volte 5- Suponha que 8% dos cachorros-quentes vendidos num estádio de futebol sejam pedidos sem mostarda. Se sete pessoas pedem cachorrão, determine a probabilidade de que: a. Todos queiram mostarda b. Apenas um não a queira. Noções de Probabilidade e Estatística 99 Profª Berenice C. Damasceno 13.3 DISTRIBUIÇÃO DE POISSON A chamada Distribuição de Poisson ou de Eventos Raros pode ser considerada um caso limite da distribuição binomial. Quando “n” é grande e “p” é pequeno podemos usar a aproximação de Poisson para a distribuição Binomial. É difícil dar condições precisas para que se possa usar a aproximação de Poisson, ou seja, o que significa quando “n” é grande e “p” pequeno. Como regra geral (de referência empírica) podemos usar: n ≥ 100 e n.p ≤ 10 n = elementos da população p = probabilidade Exemplo: n = 150 p = 0,05 Temos a distribuição de Poisson com: n.p = 150 . (0,05) = 7,5 A equação a ser usada é: ! .).()( . x epn xf pnx − = sendo e= 2,718 e µ = n.p Exemplo: Sabe-se que 2% dos livros encadernados em uma certa livraria apresentam defeitos de encadernação. Utilize a aproximação de Poisson da distribuição Binomial para achar a probabilidade de que 5 entre 400 livros encadernados nessa livraria apresentam algum defeito de encadernação. Temos: n = 400 p = 2% = 0,02 x = 5 n.p = 400 . 0,02 = 8 - 8 e = 0,000335; temos então: 0915,0 120 )000335,0()32768( !5 .)8()5( 85 === −ef Obs.: A distribuição de Poisson é semelhante à Binomial, diferenciando-se apenas no fato de que na Binomial os eventos ocorrem por tentativas ou observações fixas, enquanto que na de Poisson os eventos ocorrem simultaneamente. Ex.; nº de acidentes por dia, clientes por hora, chamadas telefônicas por minuto, defeitos por cm2, etc. Noções de Probabilidade e Estatística 100 Profª Berenice C. Damasceno Contra-exemplo: Suponhamos que os defeitos em fios para tear possam ser aproximados por um processo de Poisson com média de 0,2 defeitos por metro (p = 0,2). Inspecionando-se pedaços de fio de 6 metros de comprimento, determine a probabilidade de menos de 2 (isto é 0 ,1) defeitos. Dados: n = 6 p = 0,2 n . p = 6 . 0,2 = 1,2 Para utilizarmos a aproximação de Poisson para a distribuição Binomial devemos ter: 1ª) n ≥ 100. (neste caso n = 6); 2ª) n.p ≤ 10 (neste caso n.p = 6 . 0,2 = 1,2). Logo a 1ª condição não é verificada, isto implica que não poderemos utilizar Poisson. Uma solução possível é a utilização da distribuição Binomial, ou seja: P(x<2) = P(0) + P(1) , onde: 2621,08,0.1.18,0.2,0 !6!0 !6)0(P 660 ============ e 3932,08,0.2,0.68,0.2,0 !5!1 !6)1(P 551 ============ Logo, P(x<2) = 0,6553 ou 65,53% de haver 0 ou 1 defeito. EXERCICIOS: 1- O departamento de manutenção de computadores de uma Universidade recebe uma média 5 computadores por dia. Qual a probabilidade que, em determinado dia, selecionado aleatoriamente, sejam recebidos: a- Exatamente 3 computaores; b- Menos de 3 computadores. 2- Se 0,6% dos detonadores fornecidos a um arsenal são defeituosos, utilize a aproximação de Poisson para a distribuição binomial para determinar a probabilidade de que, em uma amostra aleatória de 500 detonadores, quatro sejam defeituosos. 3- Em uma certa cidade 3,2% dos habitantes se envolve em, ao menos, um acidente de carro em um ano. Com o auxilio da aproximação de Poisson para a distribuição Binomial, determine a probabilidade de que, dentre 200 motoristas escolhidos aleatoriamente nessa cidade: a- Exatamente seis se envolvam em ao menos um acidente em um ano; b- No máximo oito se envolvam em ao menos um acidente em um ano; c- Cinco ou mais se envolvam em ao menos um acidente em um ano; 4- Suponha que, em média 2% das pessoas sejam canhotas. Encontre a probabilidade de 3 ou mais canhotos em 100 pessoas. Noções de Probabilidade e Estatística 101 Profª Berenice C. Damasceno 13.4 DISTRIBUIÇÃO NORMAL (ou de GAUSS ou de LAPLACE) É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino. A distribuição normal é o resultado da atuação conjunta de causas aleatórias. Parâmetros da Distribuição Normal µ → Média da População Determinam o formato da curva σ → Desvio padrão da população Equação da Função de Probabilidade – A equação da função de probabilidade é dada pela expressão: 2 2 2 )( 2 1)( σ µ piσ −− = x exf Do estudo da estatística conclui-se que: - a variável x pode assumir qualquer valor real no intervalo - ∞ ≤ x ≤ + ∞ - a variável x obedecerá à uma Distribuição Normal, se a probabilidade de que um valor x seja menor ou igual a outro x0 for: F (x) σ µ - 3σ µ - 2σ µ - 1σ µ µ + 1σ µ + 2σ µ + 3σ Noções de Probabilidade e Estatística 102 Profª Berenice C. Damasceno dxexfxxP x x ∫ ∞− −− ==< 0 2 2 2 )( 00 2 1)()( σ µ piσ - a integral desta expressão representa a área compreendida entre - ∞ e x0. - ∞ + ∞ Portanto: “ A probabilidade de ocorrência de um valor menor ou igual à área abaixo da curva, entre os valores - ∞ e x0 é dada pela equação anterior”. Os valores pi = 3,1416 e e ( número neperiano) = 2,718 são constantes numéricas. F (x) σ X0 Noções de Probabilidade e Estatística 103 Profª Berenice C. Damasceno CARACTERÍSTICAS DA CURVA DE DISTRIBUIÇÃO NORMAL A curva normal obedece necessariamente às seguintes características: a- A média µ é o valor da variável x para o qual a f(x) é máxima. b- O desvio padrão σ, é a distância entre a média e o ponto de inflexão da curva. c- A área total sob a curva normal é igual a 1, pela própria equação da probabilidade. d- Em virtude da simetria as áreas à direita e à esquerda do valor µ são iguais DISTRIBUIÇÃO NORMAL PADRONIZADA Se tomarmos a equação auxiliar: σ µ− = x z o que significa adotar como origem do eixo z o ponto em que x = µ e como unidade de escalados z e o desvio padrão σ, teremos transformado a expressão da função das probabilidades na distribuição normal reduzida: 2 2 2 1)( z ezf − = piσ Considerando, a partir da equação auxiliar: dzdx dx dz σ σ =⇒= 1 Portanto a função da probabilidade, em função de Z, será dada pela expressão: Noções de Probabilidade e Estatística 104 Profª Berenice C. Damasceno dzezf z z ∫ ∞− − = 0 2 2 2 1)( pi As áreas sob a curva permanecem as mesmas, mas agora podem ser tabuladas em função dos valores de Z (Ver figura abaixo, eixo dos Z). Basta construir a tábua das áreas para os valores I(z), mostrados na tabela da página 56. Por exemplo, a área desde Z=0 até Z= 1,0 é I(1,0) = 0,3413 ou 34,13% da área total da curva; conseqüentemente, dentro do intervalo ± 1 σ temos 68,26% da área total da curva. Se procurarmos a probabilidade de encontrarmos um valor de “x” dentro do intervalo µ ± 0,95 onde µ é a média, σ é o desvio padrão da população, teremos: )95,095,0()( 00 σµσµ +<<−=+<<− zPzzzP IZ1= 0,3289 It= 0,6578 ou 65,78%. Apresentamos na tabela abaixo alguns dos mais importantes intervalos de distribuição normal para aplicações em exercícios de probabilidade na curva normal. Noções de Probabilidade e Estatística 105 Profª Berenice C. Damasceno TÁBUAS DE ÁREAS DA CURVA NORMAL A partir da equação auxiliar σ µ− = x z podemos transformar valores de x em valores de z e em seguida construir uma tabela com resultados das integrais, que corresponde à área sob a curva x0 intervalo de 0 a Z0 identificada por IZ0. -3 -2 -1 0 1 2 3 Z F (x) σ µ - 3( ( - 2( ( - 1( ( ( + 1( ( + 2( ( + 3( Noções de Probabilidade e Estatística 106 Profª Berenice C. Damasceno Transformação de X em Z x0 σ µ− = x z z0 µ σ µµ − 0 µ + 1σ σ µσµ −+1 1 µ + 2σ σ µσµ −+ 2 2 µ + 3σ σ µσµ −+ 3 3 µ - 1σ σ µσµ −−1 -1 µ - 2σ σ µσµ −− 2 -2 µ - 3σ σ µσµ −− 3 -3 Noções de Probabilidade e Estatística 107 Profª Berenice C. Damasceno IZ0 0 Z0 AREAS IZ0 = P (0 ≤ z ≤ Z0) para Z0= (x - µ)/ σ Z0 IZ0 Z0 IZ0 Z0 IZ0 Z0 IZ0 Z0 IZ0 Z0 IZ0 0,00 0,0000 0,60 0,2257 1,20 0,3849 1,80 0,4641 2,40 0,4918 3,00 0,4987 0,05 0,0199 0,65 0,2422 1,25 0,3944 1,85 0,4678 2,45 0,4929 3,05 0,4989 0,10 0,0398 0,70 0,2580 1,30 0,4032 1,90 0,4713 2,50 0,4938 3,10 0,4990 0,15 0,0596 0,75 0,2734 1,35 0,4115 1,95 0,4744 2,55 0,4946 3,15 0,4992 0,20 0,0793 0,80 0,2881 1,40 0,4192 2,00 0,4772 2,60 0,4953 3,20 0,4993 0,25 0,0987 0,85 0,3051 1,45 0,4279 2,05 0,4798 2,65 0,4960 3,25 0,4994 0,30 0,1179 0,90 0,3159 1,50 0,4332 2,10 0,4821 2,70 0,4965 3,30 0,4995 0,35 0,1369 0,95 0,3289 1,55 0,4394 2,15 0,4842 2,75 0,4970 3,35 0,4996 0,40 0,1554 1,00 0,3413 1,60 0,4452 2,20 0,4861 2,80 0,4974 3,40 0,4997 0,45 0,1736 1,05 0,3531 1,65 0,4505 2,25 0,4878 2,85 0,4978 3,50 0,4998 0,50 0,1915 1,10 0,3643 1,70 0,4554 2,30 0,4893 2,90 0,4981 3,70 0,4999 0,55 0,2088 1,15 0,3749 1,75 0,4599 2,35 0,4906 2,95 0,4984 3,90 0,5000 Noções de Probabilidade e Estatística 108 Profª Berenice C. Damasceno EXERCÍCIOS 1- Trace uma curva normal e sombreie a área desejada a partir das informações: a- área à direita de z=1,0 b- área da esquerda de z= 1,0 c- área entre z=0 e z=1,5 d- área entre z=0 e z= - 2,9 e- área entre z=1,0 e z= 2,0 f- área entre z= -2,0 e z= 2,0 g- área entre z= 2,5 e z=3,0 2- Ache os valores de z correspondentes às seguintes áreas: a- área à esquerda de µ para Iz = 0,0596 b- área à esquerda de µ para Iz = 0,2257 c- área à esquerda de µ para Iz= 0,4505 e área à direita de µ para Iz = 0,4861 3- Uma distribuição normal tem média 50 e desvio padrão 5. Que porcentagem da população estaria provavelmente dentro dos intervalos: a- P(x ≤ 60) b- P(35 ≤ x ≤ 62) c- P(55 ≤ x ≤ 65) d- P(x ≥ 55) e- P(35 ≤ x ≤ 45) Noções de Probabilidade e Estatística 109 Profª Berenice C. Damasceno 4- Suponha uma renda média de uma grande comunidade possa ser razoavelmente aproximada por uma distribuição normal com media anual de R$ 10.000,00 e desvio padrão de R$ 2.000,00. a- Que porcentagem da população terá renda superior a R$ 15.000,00? b- Numa amostra de 50 assalariados, quantos podemos esperar que tenham menos de R$ 8.000,00 de renda? 5- Considere um problema semelhante ao anterior, sendo a renda média de um grupo de trabalhadores igual a R$ 7000,00 e o desvio R$ 800,00 e a distribuição sendo normal, pede-se: a- A probabilidade dos trabalhadores ganharem acima de R$ 8000, 00; b- O limite inferior da renda dos 10 % mais ricos. 6- O adulto americano médio tem 1,75 m de altura. Assuma que o desvio seja 8 cm. Responda: a- qual é a probabilidade de que um homem adulto tenha mais de 1,83 m ? b- qual é a probabilidade de que um homem adulto tenha menos de 1,522 m ? c- qual é a probabilidade de que um homem adulto tenha entre 1,682 e 1,778 m ? d- qual é a probabilidade de que um homem adulto não tenha mais de 1,83 m ? 7- O volume de comercialização na Bolsa de Valores de Nova York tem crescido nos últimos anos. Para as duas primeiras semanas de janeiro de 1998, o volume médio diário foi de 646 milhões de ações. A distribuição de probabilidade é aproximadamente normal com desvio de 100 milhões de ações. a- Qual a probabilidade de que o volume de comercialização será menor de 400 milhões? b- Qual a probabilidade de que o volume de comercialização excedeu 801 milhões?