Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com Descrição, Exploração e Comparação de Dados UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL 2. Descrição, Exploração e Comparação de Dados Serão apresentados, nesta seção, tabelas, gráficos e medidas importantes que podem ser utilizadas para descrever ou explorar um conjunto de dados, ou comparar dois ou mais conjuntos. 2.1. Aspectos Gerais Muitas vezes dados são coletados para resolver a problemas específicos, noutras, dados são coletados para se verificar o que deles pode ser revelado, ou seja, desejamos explorá-los. Nas duas situações, são necessários diversos recursos que contribuam para o entendimento do conjunto de dados. Isso é o que se verá a partir de agora. 2.2. Resumo de Dados com Tabelas de Freqüências Ao se estudar grande conjunto de dados é conveniente organizá- los e resumi-los, construindo um tabela de freqüências. Uma Tabela de Freqüências relaciona categorias (ou classes) de valores, juntamente com contagens (ou freqüências) do número de valores que se enquadram em cada categoria. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL 2.2. Resumo de Dados com Tabelas de Freqüências Vejamos por meio de um exemplo: A tabela 3 relaciona as cargas axiais (em libras) da amostra de 175 latas de alumínio de 0,0109 in. (0,0278 cm) de espessura. A carga axial de uma lata é o peso máximo suportado por seus lados e é medida utilizando-se uma placa para aplicar uma pressão crescente ao topo da lata, até que ela ceda. É importante ter-se uma carga axial suficientemente grande a fim de a lata não ceder quando se coloca a tampa sob pressão. Nesse processo de fabricação os topos das latas são colocados no lugar com uma pressão que varia de 158 a 165 libras. As latas menos espessas têm a vantagem de utilizar menos material, o que reduz o custo, mas não são provavelmente tão resistentes quanto as mais espessas. A empresa que fabrica essas latas costuma utilizar uma espessura de 0,0111 in. (0,0282 cm) de espessura. Afinal, essas latas menos espessas podem realmente ser usadas? Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Tabela 3 - Cargas Axiais de Latas de Alumínio de 0,0109 in. (0,0278 cm) 270 273 258 204 254 228 282 278 201 264 265 223 274 280 250 275 281 271 263 277 275 278 260 262 273 274 286 236 290 286 278 283 262 277 295 274 272 265 275 263 251 289 242 284 241 276 200 278 283 269 282 267 282 272 277 261 257 278 295 270 268 286 262 272 268 283 256 206 277 252 265 263 281 268 280 289 283 263 273 209 259 287 269 277 234 282 276 272 257 267 204 270 285 273 269 284 276 286 273 239 263 270 279 206 270 270 268 218 251 252 284 278 277 208 271 208 280 269 270 294 292 289 290 215 284 283 279 275 223 220 281 268 272 268 279 217 259 291 291 281 230 276 225 282 276 289 288 268 242 283 277 285 293 248 278 285 292 282 287 277 266 268 273 270 256 297 280 256 262 268 262 293 290 274 292 Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL A Tabela 3 foi refeita, com os dados ordenados em ordem crescente: Tabela 3 – Cargas Axiais de Latas de Alumínio de 0,0109 in. (0,0278 cm) 200 250 263 270 276 280 286 201 251 264 270 276 280 286 204 251 265 270 276 281 286 204 252 265 270 276 281 286 206 252 265 271 276 281 287 206 254 266 271 277 281 287 208 256 267 272 277 282 288 208 256 267 272 277 282 289 209 256 268 272 277 282 289 215 257 268 272 277 282 289 217 257 268 272 277 282 289 218 258 268 273 277 282 290 220 259 268 273 277 283 290 223 259 268 273 278 283 290 223 260 268 273 278 283 291 225 261 268 273 278 283 291 228 262 268 273 278 283 292 230 262 269 274 278 283 292 234 262 269 274 278 284 292 236 262 269 274 278 284 293 239 262 269 274 279 284 293 241 263 270 275 279 284 294 242 263 270 275 279 285 295 242 263 270 275 280 285 295 248 263 270 275 280 285 297 Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Tabela 4 – Cargas Axiais por Intervalos de Classe Carga Axial Freqüência 200 - 209 9 210 - 219 3 220 - 229 5 230 - 239 4 240 - 249 4 250 - 259 14 260 - 269 32 270 - 279 52 280 - 289 38 290 - 299 14 Distribuição de Freqüências – Tabela 4 Limites Inferiores de Classes são os menores números que podem efetivamente pertencer às diferentes classes. Na tabela 4 são os números 200, 210, 220, 230, 240, 250, 260, 270, 280 e 290. Limites Superiores de Classes são os maiores números que podem efetivamente pertencer às diferentes classes. Na tabela 4 são os números 209, 219, 229, 239, 249, 259, 269, 279, 289 e 299. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Fronteiras de Classes são os números usados para separar classes, mas sem as lacunas criadas pelos limites de classe. São obtidos assim: determinamos o tamanho da lacuna entre o limite superior de uma classe e o limite inferior da classe seguinte (Ex.: 240-239 = 1), adicionamos metade desse valor a cada limite superior de classe (ex.: 209+0,50 = 209,50), obtendo as fronteiras superiores de classe. De outra forma, subtraímos metade daquele valor de cada limite inferior de classe, obtendo as fronteiras inferiores de classe (ex.: 200-0,50 = 199,50). Marcas de classe são os pontos médios das classes. Na tabela 4 os pontos médios são 204,5; 214,5; 224,5; 234,5; 244,5; 254,5; 264,5; 274,5; 284,5; 294,5. Amplitude de classe é a diferença entre dois limites de classe inferiores consecutivos ou entre duas fronteiras inferiores de classe consecutivas. Na tabela 4 a amplitude de classe é 10. Número de elementos de uma amostra é o número total de dados (valores/observações) apresentados numa amostra, geralmente simbolizados por n. Já a letra N representa o número total de valores ou observações de uma população. Amplitude Total é a diferença entre o maior e o menor valor de um conjunto de dados. Na tabela 3: Amplitude Total = 297-200 = 97. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL 2.2.1. Construção de uma tabela de freqüências O Processo de construção de uma tabela de freqüências envolve os seguintes passos: 1. Decidir o número de classes da tabela de freqüência. O número de classes deve ficar entre 5 e 20. O número efetivo de classes pode depender da conveniência de utilizar números arredondados ou de outros fatores subjetivos. Sugere-se a aplicação do seguinte cálculo para aproximação do número adequado de classes para a tabela de freqüências: k = 1 + 3,3 x log n. 2. Determinar a amplitude de classe, dividindo a amplitude total pelo número de classes. O resultado deve ser arredondado para mais, até um número conveniente. Esse arredondamento garante que todos os números sejam incluídos na tabela de freqüências. Se o número de classes divide exatamente a amplitude, é preciso acrescentar mais uma classe para que todos os dados sejam incluídos. Amplitude de classe = amplitude total / número de classes Amplitude de classe = 97 / 10 = 9,7 => 10 (arredondamento) Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL 2.2.1. Construção de uma tabela de freqüências 3. Escolher como limite inferior da primeira classe o menor valor observado ou um valor ligeiramente inferior a ele. Esse valor será o ponto de partida. 4. Some a amplitude de classe ao ponto de partida, obtendo o segundo limite inferior de classe. Adicione a amplitude de classe para obter o terceiro limite inferior de classe; e assim por diante. 5. Relacione os limites inferiores de classe em uma coluna e introduza os limites superiores, que podem ser facilmente determinados a essa altura. 6. Represente cada observação por um pequeno traço na classe apropriada e, com auxílio desses traços, determine a freqüência total de cada classe. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL A determinação do número de classes, nesse momento, não é uma imposição, assim, se tomarmos um número diferente de classes que resulte em uma tabela de freqüências diferente, estará igualmente correto. A prioridade deve ser a obtenção de uma tabela com valores convenientes e compreensíveis. A tabela 4 apresenta informações úteis tornando a lista de cargas axiais mais inteligível, mas perdemos a precisão dos dados originais. Por exemplo, a primeira classe 200-209 indica 9 observações, mas não há maneira de sabermos, por essa tabela, quais são precisamente esses valores. Não podemos reconstruir os 175 valores iniciais das cargas axiais com base na tabela de freqüências; sacrificamos a exatidão dos dados originais para termos dados mais compreensíveis. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Na construção de tabelas de freqüência, observam-se as seguintes diretrizes: 1. As classes devem ser mutuamente excludentes. Ou seja, cada valor original deve pertencer exatamente a uma, e uma só classe; 2. Todas as classes devem ser incluídas, mesmo as de freqüência zero; 3. Procurar utilizar a mesma amplitude para todas as classes, embora eventualmente seja impossível evitar intervalos com extremidade aberta, como “70 anos ou mais”. 4. Escolher números convenientes para limites de classe. Arredondar para cima a fim de ter menos casa decimais, ou utilizar números adequados à situação. 5. Utilizar entre 5 e 20 classes; 6. A somas das freqüências das diversas classes deve ser igual ao número de observações originais. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL Frequência Relativa e Acumulada Carga Axial Freqüência Freqüência Relativa Freqüência Acumulada 200-209 9 0,0514 9 210-219 3 0,0171 12 220-229 5 0,0286 17 230-239 4 0,0229 21 240-249 4 0,0229 25 250-259 14 0,0800 39 260-269 32 0,1829 71 270-279 52 0,2971 123 280-289 38 0,2171 161 290-299 14 0,0800 175 Σ 175 1,0000 Com as tabelas de freqüência, é possível identificar a natureza geral da distribuição dos dados, bem como construir gráficos que facilitem a visualização dessa distribuição. Curso: Administração Disciplina: Estatística Prof. Dalton de Sousa – dalton.sousa@gmail.com UNIVERSIDADE FEDERAL DE MATO GROSSO DO SUL TRIOLA, Mário F. Introdução à Estatística. 10 ed. Rio de Janeiro: LTC, 2008. ANDERSON, D.R.; SWEWNEY, D.J.; WILLIAMS, T.A. Estatística Aplicada à Administração e Economia. 2 ed. São Paulo: Cengaje Learning, 2009. STEVENSON, W.J. Estatística aplicada à Administração. São Paulo: Harper & Row do Brasil, 1981.