Notas de aula completo

Livre

0
0
172
1 year ago
Preview
Full text
(1)Estatística Estatística Descritiva Importância da Estatística 1.1 Introdução Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos e de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que, hoje, chamaríamos de “estatísticas”. Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. A partir do século X V I começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No século X V I I I o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser simples tabulação de dados numéricos coletivos para se tornar o estudo de como se chegar a conclusões sobre o todo (população), partindo da observação de partes desse todo (amostras)”. Na atualidade os recursos estatísticos têm avançado rapidamente e, com seus processos e técnicas, têm contribuído para a organização dos negócios e recursos do mundo moderno. O desafio da necessidade de mudança tem forçado muitas empresas e indústrias a colocar-se sob minucioso exame. Muitas companhias têm identificado qualidade como o principal tópico na busca pela sobrevivência e pela lucratividade e crescimento. Qualidade é um conceito mas, possui interpretação muito extensa. A filosofia de controle de qualidade implica que existe um leque aceitável de características de produtos e serviços em termos de material, dimensão e performance. Muitos cientistas e usuários têm contribuído para o desenvolvimento da gerência da qualidade. A gerência e controle do processo de qualidade requerem que a economia e satisfação pessoal do cliente sejam o alvo do fornecedor, contudo temos de reconhecer que existe variabilidade em todos os produtos e serviços. Isso leva a uma visão de especificação de produto e serviço a qual difere daquela em controle de qualidade. Os controles principais são idealizados para manter serviço e processos em foco, dentro da tolerância. Empresas podem utilizar controles para prevenir a insatisfação do cliente e melhorar continuamente tanto produto/serviço quanto o processo, através da redução da variabilidade que 1

(2) 1.2. POR QUE PRECISAMOS APRENDER ESTATÍSTICA? representa desperdício. 1.2 Por Que Precisamos Aprender Estatística? Qualquer que seja o controle ou a filosofia gerencial de qualidade de uma organização, a Estatística tem um papel crucial. Os métodos estatísticos são consciente ou inconscientemente usados em várias situações, especialmente na apresentação de informações oriundas de dados numéricos. Diversas vezes, apresentações são baseadas, principalmente, em algum tipo de técnica utilizando teorias matemáticas; porém durante a preparação e apresentação dos dados, métodos estatísticos são utilizados para definir a técnica de coleta de dados e chegar a uma conclusão através das informações coletadas. Os métodos estatísticos têm aplicações em controle de processo, controle de produto, solução de problema, melhora na fabricação e manutenção econômica além de satisfação do cliente. Por este motivo o conhecimento destes métodos está se tornando cada vez mais importante para engenheiros e demais profissionais engajados em programas de promoção da qualidade e produtividade. Qualquer um que derive informações a partir de dados está agindo como um estatístico. Métodos estatísticos representam as ferramentas básicas para remediar e controlar variações, porque a análise estatística é a única base para tentar entender variabilidade. Indústrias ocidentais estão acordando para o uso de métodos estatísticos e técnicas relacionadas para fazer frente ao crescimento constante da competição. Estas empresas também sabem que a implantação de um programa para melhoria da qualidade pode eliminar desperdícios, reduzir os índices de produtos defeituosos fabricados, diminuir a necessidade da realização de inspeção e aumentar a satisfação dos clientes, fatores que implicam em um aumento da produtividade e da competitividade das empresas. É óbvio que empregados de uma empresa devem tornar-se mais familiarizados com estatística. Eles devem entender e conhecer as técnicas estatísticas disponíveis, e adaptação de dados de experimentos para a análise estatística. Um profissional treinado em Estatística terá maior facilidade em identificar um problema em sua área de atuação, determinar os tipos de dados que irão contribuir para a sua análise, coletar estes dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do problema detectado. Quase toda atividade e experiência humana envolvem coleta e análise de algum tipo de informação (dados). Na coleta de dados relativos ao comportamento ou outras características de um grupo de indivíduos, amostras aleatórias de um processo ou resultados de repetitivas medições, sempre envolvem variação e incerteza. Para utilizar os dados para análise, na maioria dos casos, os mesmos devem ser resumidos e organizados numa forma ou combinação especial facilitando o estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja sendo estudado, ou seja, assunto da estatística descritiva. A Estatística Descritiva abrange métodos gráficos e numéricos utilizados para resumir dados de maneira que características importantes da amostra possam ser expostas. 2

(3) Estatística 1.3 As Ferramentas Estatísticas Contribuem para a Redução da Variabilidade A variabilidade também é denominada variação ou dispersão e está presente em todos os processos de produção de bens e de fornecimento de serviços. Considere, por exemplo, uma situação em que serão selecionadas algumas peças provenientes de uma linha de produção e a seguir será medido o diâmetro de cada uma destas peças. Se o instrumento de medida utilizado tiver resolução suficiente, os resultados obtidos serão diferentes, ou seja, existirá variabilidade entre as medidas do diâmetro. Podemos dizer que a variabilidade é o resultado de alterações nas condições sob as quais as observações são tomadas. Estas alterações podem refletir diferenças entre as matérias-primas, as condições dos equipamentos, os métodos de trabalho, as condições ambientais e os operadores envolvidos no processo considerado. A variabilidade também é decorrente do sistema de medição empregado. Na fabricação de um produto atuam diversos fatores que afetam suas características da qualidade, o que poderá dar origem aos produtos defeituosos. Um produto será considerado defeituoso se as suas características da qualidade não satisfazem a uma determinada especificação e será considerado perfeito ou não-defeituoso em caso contrário. Já que os produtos defeituosos são provocados por variações nas condições de operação do processo, uma redução da variabilidade do processo permite a produção de ítens cuja característica da qualidade de interesse esteja próxima a um valor alvo desejado e dentro dos limites de especificação estabelecidos. A redução da variabilidade do processo envolve a coleta, o processamento e a disposição de dados, para que as causas fundamentais de variação possam ser identificadas, analisadas e bloqueadas. Portanto, o emprego de ferramentas estatísticas contribui para que a redução da variabilidade possa ser alcançada de forma eficaz. É importante destacar que existem dois tipos de causas para a variação na qualidade dos produtos provenientes de um processo: 1. Causas Comuns ou Aleatórias: é inerente ao processo considerado e estará presente mesmo que todas as operações sejam executadas empregando métodos padronizados; 2. Causas Especiais ou Assinaláveis: surgem esporadicamente, devido a uma situação particular que faz com que o processo se comporte de um modo diferente do usual (ocorrência de defeito nos equipamentos, mudança de operador, etc.) Para que a redução da variabilidade de um processo possa ser alcançada é fundamental diferenciar, na prática, os dois tipos de causas de variação, já que para cada um deles deverá ser adotada uma forma particular de ação gerencial. Por meio do emprego da Estatística é possível distinguir, de forma objetiva e econômica, as causas comuns das causas especiais de variação. Algumas das ferramentas utilizadas são: - Estratificação; - Folha de verificação; 3

(4) 2.1. MÉTODO ESTATÍSTICO - Gráfico de Pareto; - Diagrama de Causa e Efeito; - Histograma; - Diagrama de Dispersão; - Gráfico de Controle. Apresentação dos Dados 2.1 Método Estatístico Para muitos a Estatística não passa de conjuntos de tabelas de dados numéricos. Mas será que a estatística é só isso? A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística. Hoje em dia podemos adotar a seguinte definição para a Estatística: Ciência que se baseia na Teoria das Probabilidades e cujo objetivo principal é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas. Método é um conjunto de meios dispostos convenientemente para se chegar a um determinado objetivo. Dos métodos científicos podemos destacar os métodos experimental e estatístico. o método experimental consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física e da Química, por exemplo. Já o método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Como exemplo, podemos citar a determinação das causas que definem o preço de uma mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu preço. Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos preços das outras necessidades e etc. Mas, isso tudo é impossível. Daí a necessidade de utilização do método estatístico. 2.1.1 Fases do Método Estatístico 1. DEFINIÇÃO DO PROBLEMA: Consiste em uma apreciação ou formulação correta do problema a ser estudado, e levando em consideração os valores: o que, onde, como e quando. 2. PLANEJAMENTO: Nesta fase temos a considerar o procedimento necessário para o desenvolvimento dos trabalhos ou seja: como levantar informações, que dados deverão seus obtidos, qual será a maneira mais correta para formular as perguntas, construir o cronograma das atividades, determinar os custos operacionais e determinar o tamanho da pesquisa. 4

(5) Estatística 3. COLETA DE DADOS: É a fase que consiste em adquirir as informações necessárias e é feita através de um questionário ou boletim. A coleta pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação) elementos pertinentes aos prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários, a exemplo de notas de verificação e de exames, do censo demográfico, etc. A coleta direta pode ser classificada relativamente ao fator tempo em — permanente: aquelas onde as informações são sempre atualizadas e são comunicadas por terceiros, por exemplo o registro civil; — contínua: feita continuamente, por exemplo, a freqüência dos alunos às aulas; — periódica: feita em intervalos constantes de tempo, é realizada em época certa e em tempo determinado, por exemplo, censo (a cada ano); — ocasional: aquela que é feita em dado momento com a finalidade de atingir um objetivo imediato, por exemplo, uma pesquisa do IBOPE. A coleta é indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Ex.: Pesquisa sobre a mortalidade infantil, feita a partir de dados colhidos por uma coleta direta. A coleta pode ser adquirida de duas maneiras: — Por vias internas: são aquelas obtidas dentro da organização; — Por vias externas: são aquelas que podem ser obtidas por via primária (informação obtida diretamente pela pessoa), ou por via secundária(obtida através de publicações). 4. CRÍTICA DOS DADOS - Pode ser externa, quando visa às causas dos erros por parte do informante; ou interna quando visa observar os elementos originais dos dados da coleta. 5. APURAÇÃO DOS DADOS: É a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica e os cálculos. 6. EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS: É a maneira de mostrar as informações a terceiros, podendo ser: a) Expositiva (descrição ou narração); b) Aritmética (apresentada através de tabelas); c) Geométrica (através de gráficos); d) Pictórica (o fenômeno é ilustrado através de figuras representativas). 7. ANÁLISE DOS RESULTADOS: Concluídas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, e tiramos desses resultados conclusões e previsões. É a etapa mais delicada e importante, pois ai temos que tirar as conclusões que servirão para auxiliar o pesquisador a resolver o seu problema. Atualmente a empresa é uma das vigas mestras da Economia dos povos. A direção de qualquer tipo de empresa, exige de seu administrador a importante tarefa de tomar decisões, e o conhecimento e uso da Estatística facilitará seu tríplice trabalho de organizar, dirigir e controlar a empresa. 2.2 Divisões da Estatística A Teoria Estatística moderna se divide em dois grandes campos: 5

(6) 2.3. POPULAÇÃO E AMOSTRA Estatística Descritiva ou Dedutiva - consiste num conjunto de métodos que ensinam a reduzir uma quantidade de dados bastante númerosa por um número pequeno de medidas (dados numéricos, tabelas, gráficos ou curvas), substitutas e representantes daquela massa de dados. Estatística Inferencial ou Indutiva - consiste em deduzir ou tirar conclusões (inferir) a respeito das propriedades de um universo a partir de uma amostra. O processo de generalização, que é característico do método indutivo, está associado a uma margem de incerteza. A medida da incerteza é tratada mediante técnicas e métodos que se fundamentam na Teoria das Probabilidades. A disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes revigorou a área da Estatística denominada “Estatística Descritiva”. 2.3 População e Amostra 2.1 Definição. [População, Censo ou Universo Estatístico] Conjunto de indivíduos, objetos ou informações que apresentam pelo menos uma característica comum, cujo comportamento interessa analisar. Ou, em outras palavras, conjunto de todas as medidas, observações relativas ao estudo de determinado fenômeno. Seja χ = {xi } uma população, onde i representa a ordem do elemento populacional e ‫{ = ג‬Yk } um conjunto de características da população χ as quais no interessa estudar. Então, a cada elemento de χ podemos associar a uma característica Yk ∈ ‫ג‬. ER 2.1. i) O Ministério da Saúde pretende estudar o nível da glucose no sangue das crianças brasileiras com 7 anos de idade em 2001. População: χ = {o conjunto formado por todas as crianças portuguesas com 7 anos}. Característica: ‫{ = ג‬nível de glucose no sangue}. ii) Deseja-se saber se nas indústrias situadas no Estado da Bahia, em 1997, existia algum tipo de controle ambiental. População: χ = {indústrias situadas no Estado da Bahia em 1997}. Característica: ‫{ = ג‬existência ou não de algum tipo de controle ambiental na indústria}. iii) Estudo sobre a precipitação pluviométrica na Região Nordeste no ano 1997. População ou universo: χ = {área referente à Região Nordeste}. Característica: ‫{ = ג‬precipitação pluviométrica}. iv) Deseja-se conhecer o patrimônio líquido, faturamento, número de empregados, tempo de existência, das empresas situadas no Pólo Petroquímico de Camaçari neste ano. População ou universo: χ = {empresas existentes no Pólo Petroquímico de Camaçari no ano em estudo}. Características: ‫{ = ג‬patrimônio líquido, faturamento, número de empregados, tempo de existência}. v) Deseja-se conhecer a idade, o peso, a estatura, a classe social e o tipo de dieta alimentar das crianças até dois anos de idade residentes no bairro Cabula, Salvador, em 2000. 6

(7) Estatística População ou universo: χ = {crianças até dois anos de idade residentes no Cabula em 2000}. Característica: ‫{ = ג‬idade, peso, estatura, classe social, tipo de dieta alimentar}. vi) O Serviço de Meteorologia pretende estudar a temperatura ambiente na cidade de Salvador às 8h de hoje. População ou universo: χ = {Salvador}. Característica: ‫{ = ג‬a temperatura ambiente às 8h de hoje}. Devemos considerar ainda que as populações podem ser homogêneas (cujas partes todas são da mesma natureza) ou heterogêneas (pelo menos uma das partes possui natureza distinta). Em geral, como os universos são grandes, investigar todos os elementos populacionais para determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de investigação leva a destruição do elemento observado, ou, como no caso de populações infinitas, é impossível observar a totalidade da população. Assim, para minimizar a influência dessas dificuldades, estudar parte da população constitui-se um aspecto fundamental da Estatística. 2.2 Definição. [Amostra] Chamamos de amostra um subconjunto próprio e finito da população. A seleção da amostra é baseada em características da população. População característica Técnicas de amostragem −−−−−−−−−−−−−−−−−−−−→   Conclusões sobre as características da população Amostra Análise descritiva Inferência Estatística ←−−−−−−−−−−−−−−−−−−    Informações contidas nos dados Figura 2.1: Notas de Aula da Disciplina MAT116 - USP A estatística, portanto, muito se baseia em fatos deduzidos pela teoria da amostragem. Por exemplo: Seja µ a razão que expressa a intenção de voto a cada 10 eleitores indagados que o candidato a Prefeito Alberto Magalhães receberia se fosse analisada toda a população de uma cidade que está para realizar eleições brevemente. Como é um resultado difícil de se obter, vamos trabalhar com amostras. Seja ¯x1 , ¯x2 , . . . , ¯xk , as razões que expressam a intenção de voto a cada 10 eleitores indagados, obtidas das amostras de tamanho n de determinadas regiões da cidade. Sabemos que estas medidas só terão algum significado se um número razoável destas estiverem suficientemente próximas da medida µ. Cada erro absoluto é calculado por |¯xi − µ| = εi . Se torna interessante para a Estatística analisar o comportamento dos erros nas diversas amostras referidas. Como o tamanho da amostra influencia na magnitude do erro, quanto maior for a amostra, mais provável será que se tenha uma melhor estimativa. Desta forma, analisaremos quais εi são menores que um valor fixo “aceitável” ε para o erro. Claro que, quanto maior a quantidade de valores εi menores ou iguais que ε, mais confiável será a estimativa, ou seja, 7

(8) 2.4. VARIÁVEIS ESTATÍSTICAS quando trabalhamos com amostras, visando conhecer a população, é necessário conhecer a probabilidade α de que o erro obtido não seja maior do que ε: P(|¯xi − µ| ≤ ε) = 1 − α. Assim, dizemos que cada amostra é representativa da população e que a medida ¯xi , de uma amostra previamente selecionada, pode ser utilizada como estimativa para a medida µ. Uma medida, obtida com cálculos baseados em informações de uma amostra, é chamada de estatística enquanto que a medida, obtida com cálculos baseados em informações de uma população, é chamada de parâmetro. A parte da Estatística responsável pela determinação do tamanho da amostra e da forma de seleção dos seus elementos é chamada Amostragem. 2.4 Variáveis Estatísticas A Estatística ocupa-se fundamentalmente das propriedades das populações cujas características são passíveis de representação numérica como resultado de medições e contagens. Essas características da população são comumente chamadas de variáveis. As variáveis podem ser divididas em dois grupos: qualitativas e quantitativas.  QUALITATIVA ORDINAL  QUANTITATIVA NOMINAL (sexo, estado civil, cor dos olhos, etc.) (classe social, grau de instrução, etc.) CONTÍNUA (peso, altura, salário mensal, etc.) DISCRETA (número de filhos, número de carros, idade, etc.) Variáveis qualitativas - quando o resultado da observação é apresentado na forma de qualidade ou atributo. Exemplos: setor de atividade econômica; estado civil; porte da empresa; etc. - Variável qualitativa nominal - quando não existe qualquer ordenação para os resultados obtidos do processo de observação. Como exemplo, temos, entre as variáveis acima citadas: setor de atividade econômica (industrial, comercial, serviços, etc.); estado civil (solteiro, casado, viúvo, etc.). - Variável qualitativa ordinal - quando existe uma certa ordenação nos possíveis resultados das observações efetuadas. Exemplo: porte de uma empresa (micro, pequena, média e grande). Outro exemplo seria a classe social (alta, média e baixa); ou, ainda, o grau de escolaridade do empregado (1 grau; 2 grau; e 3 grau). Variáveis quantitativas - quando o resultado da observação é um número, decorrente de um processo de mensuração ou contagem. Exemplos: número de empregados; salário mensal; faturamento anual; idade; tamanho da família; etc. - Variável quantitativa discreta - quando os resultados possíveis da observação formam um conjunto finito ou enumerável de números e que resultam, freqüentemente, de uma contagem. Exemplos: número de empregados; tamanho da família. - Variável quantitativa contínua - quando os possíveis valores formam um intervalo ou uma união de intervalos de números reais e que resultam, normalmente, de uma mensuração. Exemplos: salário mensal; faturamento anual, altura; peso. 8

(9) Estatística Para resumir as informações levantadas durante uma pesquisa usaremos a técnica e a representação mais apropriada, a depender do tipo de variável que estamos analisando. 2.5 2.5.1 Apresentação dos dados Séries Estatísticas Uma série estatística é toda e qualquer coleção de dados estatísticos referidos a uma mesma ordem de classificação quantitativa. Genericamente podemos dizer que é uma sucessão de números que se relacionam com qualquer variável do fenômeno em estudo. A palavra série é usada normalmente para designar um conjunto de dados dispostos de acordo com um caráter variável. Assim, ao realizarmos um levantamento de dados sobre um fenômeno ou variável, o que obtemos é uma série estatística. Dados Brutos e Rol Quando fazemos um levantamento de dados, se faz necessário o registro das informações coletadas (questionários, formulários, etc.). Estas informações, apresentadas de forma desorganizada são chamados de dados brutos. Por exemplo, 4, 3, 4, 5, 7, 4, 6, 6, 7, 7, 4, 6, 5, 6, 6, 7, 5, 8, 5, 6, 2, 3, 6. Quando os valores para cada variável investigada estão dispostos em uma determinada ordem, crescente ou decrescente, chamamos cada listagem de rol. Por exemplo, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8. Podemos também caracterizar os dados estatísticos à sua espécie ou tipo característico: discretos (podemos contar os ítens); contínuos (não podemos contar); nominais ou categóricos; por postos. Classificação das Séries Estatísticas As séries estatísticas são diferenciadas umas das outras pelos seguintes fatores dos elementos que a compõe: - A época (fator temporal ou cronológico) a que se refere o fenômeno observado; - O local (fator espacial ou geográfico) onde o fenômeno acontece; - O fenômeno (espécie do fato ou fator especificativo) que é descrito. O fator de diferenciação das séries estatísticas podem ser divididos em dois grandes grupos: 9

(10) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA Série Homógrada: a variável apresenta variação descontínua: 1a . Série temporal, cronológica, histórica ou marchas- quando os resultados da observação do fenômeno são registrados ao longo do tempo. 2a . Série geográfica ou espacial - o local varia, permanecendo fixos o tempo e o fenômeno. 3a . Série especificativa, específica ou categórica - quando o fenômeno é observado segundo algumas categorias, permanecendo fixos o tempo e o local. Série Heterógrada: o fenômeno apresenta subdivisões. Embora fixo, o fenômeno varia em intensidade. 4a . Distribuição de freqüências - neste tipo de série estatística o tempo, o local e o fenômeno permanecem fixos. O fenômeno considerado é uma variável quantitativa (discreta ou contínua) e seus valores observados são descritos considerando o número de vezes que ocorreram na série (freqüência). 2.6 Apresentação de uma Série Estatística O modo de condensação ou apresentação das informações são dadas por tabelas ou gráficos que facilitam a visualização do fenômeno, permitem a comparação com outros elementos ou, ainda, fazer previsões. Os principais tipos de gráficos serão apresentados, porém, antecedendo-os, serão apresentadas as normas de apresentação tabular e as tabelas das séries estatísticas que deram origem aos gráficos. 2.6.1 Apresentação Tabular A representação tabular (tabela) é uma das modalidades mais utilizadas para a apresentação dos dados estatísticos coleta dos na amostragem. N ORMAS DE APRESENTAÇÃO TABULAR DE DADOS As normas a seguir foram retiradas do documento: Normas de apresentação tabular do Centro de Documentação e Disseminação de Informação 3a edição IBGE, Rio de Janeiro, 1993. Têm como objetivo fixar conceitos e procedimentos aplicáveis a elaboração de tabelas de dados numéricos, de modo a garantir a clareza das informações apresentadas. Apresentemos o esboço de uma tabela onde a seguir conceituaremos os elementos que a compõe. Topo : Espaço superior de uma tabela destinado ao seu título; Título: Conjunto de termos indicadores do conteúdo de uma tabela. Toda tabela deve ter título, inscrito no topo, para indicar a natureza e as abrangências geográfica e temporal dos dados numéricos. As indicações da natureza e da abrangência geográfica dos dados numéricos devem ser feitas sem abreviações, por extenso, de forma clara e concisa; 10

(11) Estatística TOPO Cabeçalho das colunas Coluna ↓ Linha → Célula RODAPÉ Centro : Espaço central de uma tabela destinado a moldura, aos dados numéricos e aos termos necessários a sua compressão. No centro identificam-se quatro espaços menores: o espaço do cabeçalho, a coluna, a linha e a célula. Espaço do cabeçalho: espaço superior do centro de uma tabela destinado a indicação do conteúdo das colunas. Toda tabela deve ter cabeçalho, escrito no espaço do cabeçalho, para indicar, complementarmente ao título, o conteúdo das colunas. O conteúdo das colunas deve ser feito com palavras ou com notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações; Coluna: Espaço vertical do centro de uma tabela destinado aos dados numéricos (coluna de dados numéricos) ou aos indicadores de linha (colunas indicadoras); Linha: Espaço horizontal do centro de uma tabela destinado aos dados numéricos. Toda tabela deve ter indicadores de linha, inscritos nas colunas indicadoras, para indicar, complementarmente ao título, o conteúdo as linhas. O conteúdo das linhas deve ser feito com palavras ou com notações, de forma clara e concisa. Recomenda-se que a indicação com palavras seja feita por extenso, sem abreviações; Dado numérico : Quantificador de um fato especifico observado. A estrutura dos dados numéricos e dos termos necessários a compreensão de uma tabela deve ser feita com, no mínimo, três traços horizontais paralelos. O primeiro para separar o topo, o segundo para separar o espaço do cabeçalho. O terceiro para separar o rodapé; Célula : espaço mínimo do centro de uma tabela, resultante do cruzamento de uma linha com uma coluna, destinado ao dado numérico ou ao sinal convencional. Sinal convencional: Representação gráfica que substitui um dado numérico. A substituição de um dado numérico deve ser feita por um dos sinais abaixo, conforme o caso: − zero não resultante de arredondamento; ··· Dado numérico não disponível; ··  0   0, 0  0, 00   etc.   −0   −0, 0  −0, 00   x Não se aplica a um dado numérico; Dado omitido ; zero aproximado de um dado numérico originalmente positivo. Quando uma tabela zero aproximado de um dado numérico originalmente negativo. etc. 11

(12) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA contiver sinais convencionais, estes deverão ser apresentados em nota geral com seus respectivos significados. No caso de publicação que contenha tabelas com sinais convencionais, na qual a apresentação dos sinais e de seus significados figure em destaque, e dispensável a nota geral em cada tabela. Rodapé : Espaço inferior de uma tabela destinado a fonte, a nota geral e a nota especifica. Fonte: Identificador do responsável (pessoa física ou jurídica) ou responsáveis pelos dados numéricos. Toda tabela deve ter fonte, inscrita a partir da primeira linha de seu rodapé. A identificação do responsável ou responsáveis pelos dados numéricos deve ser feita com palavras, por extenso, e precedida da palavra Fonte ou Fontes. Quando os dados sao extraídos de algum documento, recomenda-se a indicação da referencia bibliográfica do documento e quando a tabela contiver dados numéricos resultantes de transformação dos dados numéricos obtidos na fonte, o responsável pela operação deve ser identificado em nota geral ou nota especifica. Nota geral: Texto esclarecedor do conteúdo geral de uma tabela, quando necessário. Deve ser inscrito logo após o rodapé da tabela e ser precedido do termo Nota ou Notas. Nota específica: Texto esclarecedor de algum elemento especifico de uma tabela, quando necessário. Deve ser inscrito no rodapé, logo após a nota geral (quando esta existir). Quando uma tabela contiver mais de uma nota especifica, estas devem ser distribuídas obedecendo a ordem de numeração das chamadas, separando-se uma das outras por um ponto. Chamada : Símbolo remissivo atribuído a algum elemento de uma tabela que necessita uma nota específica. A remissiva atribuída a algum elemento deve ser feita em algarismos arábicos em destaque: entre parênteses, entre colchetes, exponencial. Quando uma tabela contiver mais de uma chamada, estas devem ser distribuídas sucessivamente, de cima para baixo e da esquerda para a direita, em ordem crescente de numeração. Unidade de medida : Termo indicador da expressão quantitativa ou metrológica dos dados numéricos. Uma tabela deve ter unidade de medida, inscrita no espaço do cabeçalho ou nas colunas indicadoras, sempre que houver necessidade de se indicar, complementarmente ao título, a expressão quantitativa ou metrológica dos dados numéricos. A unidade de medida deve ser feita com símbolos ou palavras entre parênteses. Apresentação do tempo 1o . Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final, ligados por hífen (-). ER 2.2. 2001-2004: apresenta dados numéricos para os anos de 2001, 2002, 2003 e 2004. SET 2000-FEV 2001: apresenta dados numéricos para os meses de Setembro, Outubro, Novembro, Dezembro de 20001 e Janeiro, Fevereiro e Março de 2001. 30.05.2001-06.06.2001: dados referentes aos dias 30 e 31 de Maio de 2001 e 1, 2, 3, 4, 5, e 6 de Junho de 2001. 2o . Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final, ligados por barra (/). 12

(13) Estatística ER 2.3. 2001/2004: apresenta dados numéricos para os anos de 2001 e 2004, não sendo apresentados dados numéricos de pelo menos um dos anos desta serie temporal. OUT 2001/MAR 2002: dados referentes aos meses de Outubro de 2001 e Março de 2002, não sendo apresentados dados numéricos de pelo menos um dos meses desta serie temporal. 30.05.2001/06.06.2001: dados referentes aos dias 30 de Maio de 2001 e 6 de junho de 2001, não sendo apresentados dados numéricos de pelo menos um dos dias desta serie temporal. 3o . No caso de uma serie temporal não consecutiva que contenha um número reduzido de pontos, a serie temporal pode ser apresentada por todos os seus pontos, separados por vírgula, dispensandose proceder conforme o item (ii). 4o . Quando uma tabela contiver dados numéricos de uma safra, abrangendo dois anos, a apresentação do ponto no tempo deve ser feita com os dois últimos algarismos de cada um dos anos ligados por barra (/) e precedida da palavra Safra. ER 2.4. Safra 01/02: apresenta dados numéricos de uma safra iniciada em 2001 e terminada em 2002. 5o . Quando uma tabela contiver dados numéricos de um período anual diferente do ano civil, isto deve ser indicado no título, em nota geral ou nota específica 2.6.2 Arredondamento de dados numéricos Os dados numéricos em uma tabela devem ser arredondados sempre que houver necessidade de apresentá-los com um número menor de algarismos. Isto deve ser indicado em nota geral ou nota específica. 1o . O arredondamento dos dados numéricos deve respeitar as diferenças significativas (absolutas e relativas) existentes entre eles. 2o . No arredondamento do dado numérico, quando o primeiro algarismo a ser abandonado for 0, 1, 2, 3 ou 4, deve ficar inalterado o ultimo algarismo a permanecer. ER 2.5. Arredondar o número 9, 2317 para um número com duas casas decimais. O valor arredondado será 9, 23. 3o . No arredondamento de dado numérico, quando o primeiro algarismo a ser abandonado for 5, 6, 7, 8 ou 9, deve-se aumentar de uma unidade o último algarismo a permanecer. ER 2.6. Arredondar o número 9, 2317 para um número com três casas decimais. O valor arredondado será 9, 232. EP 2.1. Arredondar cada um dos seguintes valores para a aproximação pedida: 13

(14) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA 48, 6 para o inteiro mais próximo (a) 2, 484 p/ centésimos (b) 5, 781 p/ décimos (g) 23, 350 p/ uma casa decimal (h) (c) 0, 0045 p/ milésimos (i) 4, 99 p/ décimos (d) 22, 250 p/ décimos (j) 25, 351 p/ décimos 1001, 39 p/ o inteiro mais próximo (e) 6498 p/ a centena mais próxima (f) 324 para a dezena mais próxima (k) 5872 para o milhar mais próximo (l) A seguir exemplificaremos, através de tabelas, algumas séries estatísticas. ER 2.8. Série geográfica ER 2.7. Série temporal Índice de Produto Industrial População residente segundo os municípios Brasil - 1979 da região metropolitana de salvador − 1991 Meses IPI População Municípios (em 1.000 habitantes) Janeiro 18.633 Fevereiro 17.497 Camaçari 114 Março 19.470 Candeias 68 Abril 18.884 Dias D’Avila 31 Maio 20.308 Itaparica 15 Junho 20.146 Lauro de Freitas 69 Julho 20.258 Madre de Deus 9 Agosto 21.614 Salvador Setembro 19.717 São Francisco do Conde 20 Outubro 22.133 Simões Filho 73 Novembro 20.503 Vera Cruz 22 Dezempbro 12.721 Total Tabela 2.1: FONTE: IBGE ER 2.9. Série específica Rebanhos brasileiros − 1992 Rebanho Quantidade Bovinos 154.441 Eqüinos 550 Ovinos 2.075 2.496 Tabela 2.2: FONTE: IBGE, Censo Demográfico, Bahia. 1991. ER 2.10. Série conjugada Terminais telefônicos em serviço1991 − 1993 Região 1991 1993 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 19.956 Nordeste 1.287.813 1.379.101 1.486.649 Suínos 34.532 Centro-Oeste 713.357 778.925 884.822 Caprinos 12.160 Norte 342.938 375.658 403.494 Tabela 2.3: FONTE: Revista Isto É. 2.6.3 Tabela 2.4: FONTE: Revista Isto É. Atividades EP 2.2. Assinale a alternativa correta. População ou universo é um: (a) conjunto de pessoas; (b) conjunto de indivíduos apresentando uma característica especial; 14 1992

(15) Estatística (c) conjunto de todos os indivíduos apresentando uma característica comum objeto de estudo. (d) conjunto de objetos; (e) n.d.a. EP 2.3. Estabelecer quais dados são discretos e quais são contínuos: (a) número de ações vendidas diariamente na Bolsa de Valores; (b) temperaturas registradas em um posto de meteorologia; (c) vida média das válvulas de televisão produzidas por uma determinada companhia; (d) salários anuais de professores do colégio; (e) comprimentos de 1000 parafusos produzidos por uma fábrica. EP 2.4. Entre as alternativas seguintes, assinale aquela que contiver uma afirmação verdadeira. (a) Dados Brutos são aqueles que estiverem numericamente organizados; (b) Rol é um arranjo de dados numéricos brutos; (c) O conjunto das alturas de 100 estudantes, do sexo masculino, de uma universidade, arranjados em ordem crescente ou decrescente de grandeza, é um exemplo de rol de dados. EP 2.5. Entre as alternativas seguintes, assinale aquela que corresponder a uma afirmação falsa. (a) Faz-se um levantamento por censo quando todos os elementos da população são pesquisados. (b) Faz-se levantamento por amostragem quando se pesquisa parte dessa população e, com base no subconjunto pesquisado, pode-se tirar conclusão acerca da população. (c) A decisão entre os tipos de levantamento a serem realizados, censo e amostragem, depende de prazo para a realização da pesquisa e recursos financeiros disponíveis, entre outras variáveis que possam implicar em vantagens ou desvantagens do censo e da amostragem. (d) As afirmações contidas nas alternativas “a” e “c” são falsas. (e) n.d.a. EP 2.6. As fases principais do método estatístico são: (a) coleta de dados, amostragem, apresentação tabular, apresentação gráfica e definição do problema; (b) coleta de dados, amostragem, apresentação tabular, apresentação gráfica e definição do problema; (c) amostragem, apresentação tabular, apuração dos dados, interpretação dos dados e planejamento; (d) definição do problema, planejamento, coleta dos dados, apuração, apresentação dos dados, análise e interpretação dos dados; (e) coleta de dados; apuração dos dados, análise e interpretação dos dados, apresentação dos dados. 15

(16) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA EP 2.7. [TCU-94] Assinale a opção correta. (a) Estatística Inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos. (b) O processo utilizado para se medir as características de todos os membros de uma dada população recebe o nome de censo. (c) A Estatística Descritiva compreende as técnicas por meio das quais são tomadas decisões sobre uma população com base na observação de uma amostra. (d) Uma população pode ser caracterizada se forem observados todos os seus componentes. (e) Parâmetros são medidas características de grupos, determinadas por meio de uma amostra aleatória. EP 2.8. [TTN-94] Marque a opção correta. (a) Um evento tem, no mínimo, dois elementos do espaço-amostra de um experimento aleatório. (b) Em um experimento aleatório uniforme todos os elementos do espaço-amostra são iguais. (c) Dois experimentos aleatórios distintos têm, necessariamente, espaços-amostra distintos. (d) Uma parte não-nula do espaço-amostra de um experimento aleatório define um evento. (e) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais. EP 2.9. [AFC-94] A tabela abaixo apresenta a distribuição de um grupo de 200 estudantes segundo o curso que fazem (Estatística ou Matemática) e o sexo (homem ou mulher). A única afirmação errada é: (a) 40% dos homens estudam Matemática. (b) 75% das mulheres fazem o curso de Matemática. (c) Dois em cada três estudantes de Estatística são homens. Homem Mulher Estatística 40 20 Matemática 80 60 (d) Um em cada três homens faz o curso de Estatística. (e) 60% dos estudantes são homens. EP 2.10. [AFC-94] A tabela abaixo apresenta a esperança de vida ao nascer para o Brasil (média nacional) e a Região Nordeste (média regional) no período de 1940 a 1980. Esperança de vida ao nascer (em anos) Anos Brasil Região Nordeste 1940 41, 5 38, 7 1950 45, 5 38, 9 1960 51, 6 41, 0 1970 53, 5 45, 5 1980 60, 0 51, 0 Tabela 2.5: Fonte: IBGE, Perfil estatístico de crianças e mães no Brasil, 1984. Da análise da tabela podemos concluir que a única afirmação errada é: 16

(17) Estatística (a) a esperança de vida do cidadão brasileiro cresceu no período 1940/1980. (b) a esperança de vida de um cidadão do nordeste brasileiro cresceu no período 1940/1980. (c) a tabela aponta uma diminuição na diferença entre a esperança de vida na Região Nordeste e a média nacional; (d) a tabela indica uma defasagem de 20 anos entre os valores observados na Região Nordeste e a média nacional; (e) no período 1940/1980, a esperança de vida de um cidadão do Nordeste brasileiro cresceu a uma taxa inferior à taxa média no Brasil. EP 2.11. [TCDF-95] Assinale a opção correta. (a) Em Estatística, entende-se por população um conjunto de pessoas. (b) A variável é discreta quando pode assumir qualquer valor dentro de determinado intervalo. (c) Freqüência relativa de uma variável aleatória é o número de repetições dessa variável. (d) A série estatística é cronológica quando o elemento variável é o tempo. (e) Amplitude total é a diferença entre dois valores quaisquer do atributo. EP 2.12. [TTN] Assinale a opção correta: (a) Uma amostra aleatória extraída de uma população deve ser superior, no tamanho, a 5% do número de elementos populacionais. (b) Em um experimento aleatório, cada elemento do espaço amostral tem a mesma probabilidade de ser selecionado, em uma realização do experimento. (c) Em um experimento aleatório é impossível garantir a ocorrência de um evento em uma particular realização do experimento, se ele não for um evento certo. (d) Um plano de amostragem corretamente elaborado garante a fidelidade dos dados da população. (e) A opção pela amostragem em relação ao censo, garante a redução de tempo, mas conduz sempre ao incremento de custo e à perda de precisão. EP 2.13. [TTN] Marque a opção correta: (a) Dois experimentos aleatórios distintos têm, necessariamente, espaço-amostra distintos. (b) Uma parte não nula de um experimento aleatório define um evento. (c) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais. (d) Um evento, tem, no mínimo, dois elementos do espaço-amostra de um experimento aleatório. (e) Em um experimento aleatório uniforme, todos os elementos do espaço-amostra são iguais. 17

(18) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA Respostas 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 c discretos : a c d d b e a c d c c contínuos : b, c, d, e 2.6.4 Distribuição de Freqüências Após a coleta de informações relativamente a uma variável dispomos dos dados de uma forma desarrumada e, naturalmente, devemos organizá-los. Essa organização facilita a interpretação dos dados e condensa o número de informações. Não é rara as situações onde existem vários valores repetidos. Denominamos freqüência absoluta, ou simplesmente freqüência, o número de vezes que um determinado valor da variável aparece. Somos capazes de observar muito mais facilmente estes valores ordenados se os dispusermos em uma coluna e, ao lado de cada valor, a sua respectiva freqüência. Esta tabela, portanto, é denominada distribuição de freqüência ou dados agrupados. Tipos de Freqüências Os tipos de freqüências: as simples, que se dividem em absolutas e relativas e as acumuladas que se dividem em crescente ou decrecente, absolutas ou relativas. Veja ao quadro a seguir.         Freqüência          Simples Absoluta Relativa    Acumulada     crescente decrescente Absoluta Relativa Absoluta Relativa A freqüência simples se divide em — freqüência simples absoluta (fi ): número de ocorrências ou repetições de um valor individual ou um intervalo de valores. — freqüência simples relativa (f ri ): razão entre a freqüência simples absoluta e o número total de dados (soma de todas as freqüências simples absolutas). f ri =

(19) fi i Claro que

(20) i 18 f ri = 1. fi .

(21) Estatística As freqüências simples absoluta e relativa são simplesmente chamadas de freqüência absoluta e freqüência relativa. A freqüência relativa pode também ser apresentada na forma de percentagem, bastando para isso multiplicá-la por 100 - freqüência simples relativa percentual. As freqüências relativas e relativas percentuais são úteis quando necessitamos comparar dois conjuntos de dados com o total de observação diferentes. A freqüência acumulada, absoluta ou relativa, se divide em — freqüência acumulada crescente ou “abaixo de”: corresponde à soma das freqüências simples (absolutas ou relativas) das classes ou dos valores anteriores. Notação: F ci freqüência absoluta crescente e F r ci freqüência relativa crescente. A expressão “abaixo de” refere-se ao fato de que as freqüências a serem acumuladas correspondem aos valores menores ou anteriores ao valor ou à classe cuja freqüência acumulada se deseja obter, ou seja, as observações existentes até uma determinada classe ou valor individual. — freqüência acumulada decrescente ou “acima de”: corresponde à soma das freqüências a partir de uma determinada classe ou valor individual. Notação: F di freqüência absoluta decrescente e F r di freqüência relativa decrescente. Agora exemplificaremos as distribuições de freqüência e suas respectivas tabelas para cada tipo de variável. 1a - Variáveis qualitativas As variáveis qualitativas obtidas em uma pesquisa podem ser organizadas em formas de tabelas para facilitar a visualização e análise dos dados. Por exemplo, considere as respostas de 30 pessoas que foram entrevistadas sobre as bebidas preferidas durante a refeição. Os resultados foram os seguintes: · Água · Suco · Água · Refrigerante · Outras · Suco · Suco · Refrigerante · Suco · Refrigerante · Suco · Outras · Refrigerante · Suco · Água · Suco · Refrigerante · Suco · Suco · Cerveja · Suco · Suco · Refrigerante · Água · Refrigerante · Outras · Refrigerante · Cerveja · Refrigerante · Suco 2a - Variáveis quantitativas discretas No exemplo a seguir, as informações foram obtidas através de um processo de contagem. Portanto, trata-se de uma variável discreta. Um outro exemplo envolve o número de defeitos apresentados por uma máquina industrial durante o período de 30 dias. Os resultados foram os seguintes: 2.3 Observação. A tabela de freqüências para uma variável qualitativa ou uma variável quantitativa discreta é também chamada de distribuição de freqüências para dados não-agrupados em classes. 19

(22) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA TABELA DE FREQÜÊNCIAS Bebida Freqüência Freqüência Freqüência Freqüência preferida simples acumulada simples acumulada absoluta absoluta relativa relativa Água Cerveja Refrigerante Suco Outras Total Tabela 2.6: Fonte: Dados fictícios ·1 ·1 ·1 ·1 ·1 ·1 ·0 ·1 ·2 ·0 ·1 ·0 ·1 ·1 ·2 ·1 ·1 ·3 ·4 ·1 ·1 ·0 ·0 ·3 ·2 ·1 ·2 ·1 ·0 ·1 TABELA DE FREQÜÊNCIAS Número Freqüência Freqüência Freqüência Freqüência de simples acumulada simples acumulada defeitos absoluta absoluta relativa relativa 0 1 2 3 4 Total Tabela 2.7: Fonte: Dados fictícios EP 2.14. Preencher a tabela com os valores de freqüências correspondentes a cada uma das colunas. Imaginemos que a pesquisa indica o número de salários mínimos dos alunos da turma de estatística. Valor fi 3 1 4 3 5 4 6 7 7 4 8 1 f ri F ci F di F cri F dri Soma (a) Qual a probabilidade de sortearmos, nesta turma, uma pessoa que possui vencimentos igual a 7 salários mínimos? (b) Qual a probabilidade de sortearmos, nesta sala, uma pessoa que recebe no máximo 7 salários mínimos? 20

(23) Estatística (c) Qual a probabilidade de sortearmos, nesta turma, uma pessoa que recebe no mínimo 5 salários mínimos? 3a - Variáveis quantitativas contínuas No caso em que a série estatística apresenta variáveis quantitativas contínuas, existe a necessidade de organizar os dados originais em uma distribuição de freqüências onde os valores observados são agrupados em classes de valores. Portanto, adotemos a seguinte nomenclatura: 1. Máximo (max): maior valor pertencente ao conjunto. 2. Mínimo (min): menor valor pertencente ao conjunto. 3. Amplitude total (AT): é a diferença entre o valor máximo e mínimo AT = max − min . 4. Classe: é cada um dos intervalos em que se subdivide a amplitude total. 5. O número de classes (k): Quantidade de classes existentes. 6. Limite superior (ls ): é a cota superior para os valores da classe. 7. Limite inferior (li ): é a cota inferior para os valores da classe. 8. Tipos de intervalos: li − ls : Aberto à esquerda e à direita; li ⊢ ls : Fechado à esquerda e aberto à direita; li ⊣ ls : Aberto à esquerda e fechado à direita; ⊣ ls : Fechado à esquerda e à direita; li ⊢ 9. Amplitude do intervalo de classe (h): é o comprimento da classe, definida como a diferença entre o limite superior e inferior. Determinação do número de classes e amplitude do intervalo de classes Não existem regras gerais para a determinação do número de classes em uma distribuição. No entanto, algumas regras são propostas por autores que nos dão uma idéia aproximada do número de classes em função do número de dados. A determinação do tamanho e da quantidade de classes deve observar as seguintes normas: 1. As classes devem abranger todos os dados; 2. Não deve existir classe com freqüência nula; 3. Cada dado deve enquadrar-se em apenas uma classe; 21

(24) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA 4. Para variáveis contínuas, o limite superior de uma classe é o limite inferior da classe subseqüente. Em geral, na definição das classes, o limite inferior é incluído e o superior excluído. 5. A quantidade de classes, de um modo geral, não deve inferior a 5 ou superior a 25. 6. Quando não for um sério inconveniente, a amplitude dos intervalos de classe deve ser constante. A Regra de Sturges Um dos métodos mais utilizados é o chamado de regra de Sturges ou regra do logaritmo. Ele estabelece que o número de classes k será o inteiro imediatamente superior ou igual a log2 2n, em que n é o número de dados, isto é, log2 2n ≤ k < (log2 2n) + 1, k ∈ Z. Podemos encontrar o valor de k sem, necessariamente, ter que utilizar uma calculadora ou uma tábua de logaritmos. Para isso, considere as seguintes potências de base dois 21 22 23 24 25 26 27 28 29 210 211 212             2 4 8 16 32 64 128 256 512 1024 2048 4096. Seja n um valor que representa a quantidade de dados. Como k é o inteiro imediatamente superior ou igual a log2 2n, podemos escrever que k − 1 < log2 2n ≤ k. Logo, 2k−1 < 2n ≤ 2k e, em seqüência, 2k−2 < n ≤ 2k−1 . A Regra do Quadrado Outra maneira para se obter o número de classes é k≈ √ n, k ∈ Z. A prática recomenda 5 ≤ k ≤ 16. Mesmo conhecendo alguns métodos para a determinação do k, deve-se saber que a escolha dependerá antes da natureza dos dados, da unidade de medida e da experiência e do bom senso de quem fará a organização dos dados da pesquisa. Comparação entre as regras Apesar da liberdade quanto a escolha da regra de determinação da escolha de classes, faremos uma comparação gráfica para chegar a algumas conclusões. 22

(25) Estatística y 10 5 x 100 Observe que a partir de um determinado valor, o gráfico da função log2 (2x) assume valores menores √ que os da função x. Sendo assim, se o intuito for de se ter uma distribuição de freqüências com dados agrupados em uma quantidade menor de classes, devemos utilizar a regra de Sturges. Amplitude do Intervalo de Classes Sendo k o número de classes, determina-se a amplitude do intervalo de classes h, como sendo um AT , pois, desta forma, haverá uma pequena folga na última classe. Com este valor ligeiramente superior a k procedimento aumentamos a amplitude total que os dados nos permitiram obter, mas, é claro que quanto menor for este aumento, mais expressivos serão os resultados obtidos. Para montar a tabela (distribuição de freqüências) devemos definir as classes: a partir do valor mínimo da amostra e a amplitude de classe h temos a primeira classe. O primeiro elemento das classes seguintes sempre serão formadas pelo último elemento da classe anterior. ER 2.11. Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção da empresa produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho através de uma medida específica, obtendo os seguintes resultados: · 154 · 165 · 175 · 180 · 190 · 195 · 202 · 211 · 155 · 170 · 176 · 180 · 190 · 198 · 205 · 212 · 156 · 172 · 178 · 180 · 190 · 200 · 205 · 215 · 164 · 175 · 178 · 184 · 192 · 200 · 210 · 218 Construir uma tabela de distribuição de freqüências com intervalos de classes. Solução: Neste caso, n = 32 e pela regra de Sturges log2 2n ≤ k. Como log2 64 = 6, temos que k = 6. A amplitude total é dada por AT = 218 − 154 = 64. Segue que de cada intervalo de classe é h = 11. 64 AT = ≈ 10, 67. Portanto, a amplitude k 6 Dessa forma, a tabela de distribuição de freqüências para dados agrupados em classes fica da seguinte 23

(26) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA maneira: TABELA DE FREQÜÊNCIAS Freqüência Freqüência Freqüência simples simples simples absoluta acumulada relativa 154 ⊢ 165 4 4 0, 13 165 ⊢ 176 5 9 0, 16 176 ⊢ 187 7 16 0, 22 187 ⊢ 198 5 21 0, 16 198 ⊢ 209 6 27 0, 19 209 ⊢ 220 5 32 0, 16 Total 32 − 1, 00 Medida Ponto Médio da Classe Informações relativas aos verdadeiros valores das séries estatísticas são perdidas ao efetuarmos uma distribuição de freqüências por classes já que uma uma simplificação da realidade ocorre. Além disso, esse processo de classificação dos dados não nos permite um tratamento estatístico adequado para a descrição dos dados. Contornarmos esse problema se adotarmos a hipótese de que todos os valores de uma classe são iguais ao valor que se encontra no centro da classe. chamamos esse valor representativo de uma classe de ponto médio ou ponto central. No caso da variável contínua, o ponto médio da classe i, que representaremos por mi , é definido por: 1 mi = li + hi ; i = 1, 2, . . . , k 2 onde mi = ponto médio da classe i li = limite inferior da classe i; hi = amplitude do intervalo da classe i; k = número de classes da distribuição de freqüências. ER 2.12. A tabela abaixo apresenta a distribuição da espessura de 100 folhas de tabaco: 2.01 2.08 1.96 3.04 2.01 3.18 1.94 2.19 2.24 2.18 2.59 1.96 2.29 3.18 2.09 1.96 2.06 2.18 2.05 2.04 2.43 1.56 1.94 3.15 2.35 2.08 2.56 2.17 1.96 1.59 2.22 2.34 2.24 1.95 2.01 3.12 3.03 3.12 2.04 1.66 1.87 2.49 3.12 2.24 1.76 3.20 2.38 1.58 1.89 1.98 1.89 1.71 2.42 1.62 1.97 2.18 1.69 3.14 2.18 3.06 2.40 1.96 3.01 2.19 2.25 1.45 1.93 2.06 1.83 1.84 1.91 2.11 1.78 2.36 2.33 3.17 2.03 1.87 3.11 2.17 1.72 1.62 1.99 1.64 1.54 2.26 1.86 2.09 1.74 1.92 2.36 1.82 2.02 2.25 1.75 3.15 3.18 1.99 1.76 2.51 Construir a distribuição de freqüências e determinar os pontos médios das classes. 24

(27) Estatística 2.6.5 Atividades EP 2.15. A tabela abaixo mostra a distribuição de freqüência dos salários anuais, em reais, de 65 empregados de uma firma. Determine: Salários (a) o limite inferior da sexta classe; (b) o limite superior da quarta classe; (c) o ponto médio da terceira classe; (d) a amplitude do quinto intervalo de classe; (e) a freqüência da terceira classe; 5.000 ⊢ 6.000 8 6.000 ⊢ 7.000 10 7.000 ⊢ 8.000 16 8.000 ⊢ 9.000 14 9.000 ⊢ 10.000 10 10.000 ⊢ 11.000 5 12.000 2 11.000 ⊢ (f) a freqüência relativa da terceira classe; Empregados TOTAL (g) o intervalo de classe que tem maior freqüência; 65 (h) a porcentagem de empregados que ganham menos de R$8.000, 00 por ano; (i) a porcentagem de empregados que ganham menos que R$10.000, 00 e pelo menos R$6.000, 00 por ano. EP 2.16. Obtenha a distribuição de freqüências dos dados abaixo, que representam a quantidade vendida de automóveis no decorrer de um mês: 14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14 EP 2.17. Considerando as notas de 60 alunos da faculdade, listadas abaixo, apresente a distribuição de freqüências, sendo 30 o limite inferior da primeira classe e 10 para o intervalo de classe. 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 85 73 60 67 41 78 56 94 35 45 EP 2.18. Os números abaixo foram obtidos com o lançamento de um dado 60 vezes. Obtenha a distribuição de freqüências sem intervalos de classe: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 1 3 5 4 4 2 6 2 2 5 EP 2.19. Forme a distribuição de freqüências em intervalo de classes, a partir das notas de um teste de inteligência, listadas abaixo, aplicado em 100 pessoas. 64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 101 85 98 75 73 90 86 86 84 86 76 76 83 103 86 84 85 76 80 92 102 73 87 70 85 79 93 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 105 74 98 78 78 83 96 95 94 88 62 91 83 98 93 83 76 94 75 67 95 108 98 71 92 72 73 25

(28) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA EP 2.20. [TTN] Considere a distribuição de freqüências abaixo e identifique a afirmativa correta: (a) 65% das observações têm peso não inferior a 4kg e inferior a 10kg . (b) Mais de 65% das observações têm peso maior ou igual a 4kg . (c) Menos de 20 observações têm peso igual ou superior a 4kg . (d) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população. (e) 8% das observações têm peso no intervalo de classe 8 ⊢ 10. Peso(kg) Freqüências ⊢ 4 9 6 12 ⊢ 8 6 10 2 12 1 2 ⊢ 4 6 ⊢ 8 10 ⊢ TOTAL EP 2.21. A tabela abaixo representa os salários pagos a 100 operários de uma empresa. Pede-se: (a) no de operários que ganham até dois salários mínimos; (b) no de operários que ganham até seis salários mínimos; (c) porcentagem de operários com salário entre 6 e 8 salários mínimos; (d) porcentagem de operários com salário igual ou inferior a 4 salários mínimos. Salários Operários mínimos 0 2 4 6 8 ⊣ 2 40 ⊣ 4 30 ⊣ 6 10 ⊣ 8 15 ⊣ 10 5 TOTAL EP 2.22. Assinale, entre as alternativas, aquela que contiver uma afirmação verdadeira. (a) Reunindo-se dados brutos em classes pode-se obter o número de indivíduos pertencentes a cada uma das classes, que é denominado “freqüência da classe”. (b) Os intervalos de classe precisam ser necessariamente iguais, na elaboração de uma tabela que apresente uma distribuição de freqüência. (c) O limite superior real da classe 150 − 155 é 155. (d) O limite inferior real da classe 150 − 155 é 150. (e) n.d.a. EP 2.23. Assinale, entre as alternativas, aquela que contiver uma afirmação verdadeira. (a) A amplitude do intervalo de classe é calculada pela soma entre os limites reais inferior e superior de uma classe. (b) Obtém-se o ponto médio de uma classe pela média aritmética dos limites inferior e superior reais de uma classe. (c) Um intervalo de classe aberto em seus dois limites inclui ambos os números extremos. (d) Intervalos de classe fechados têm seus limites superior e inferior reais excluídos dos números que os compõem. (e) n.d.a. 26

(29) Estatística EP 2.24. [TTN] Os intervalos de classe podem ser apresentados de várias maneiras. Dentre as situações abaixo a correta é: (a) 2 − 6 compreende todos os valores entre 2 e 6, inclusive os extremos; (b) 2 ⊢ ⊣ 6 compreende todos os valores entre 2 e 6, exclusive os extremos; (c) 2 ⊢ 6 compreende todos os valores entre 2 e 6, exclusive 2 e inclusive 6; (d) 2 ⊣ 6 compreende todos os valores entre 2 e 6, inclusive 2 e exclusive 6; (e) 2 − 6 compreende todos os valores entre 2 e 6, exclusive os extremos. EP 2.25. Considere a seguinte distribuição de freqüências, da duração de 400 válvulas de rádio, ensaiadas pela Companhia Ótima S/A. Os limites superiores reais da quinta e oitava classes, a amplitude do intervalo de DURAÇÃO NÚMERO (HORAS) VÁLVULAS classe e a porcentagem das válvulas, cuja duração é de 500 horas, no 300 − 399 14 mínimo, mas inferior a 1000 horas são, respectivamente: 400 − 499 46 500 − 599 58 600 − 699 76 700 − 799 68 800 − 899 62 (a) 799, 5; 1.199, 5 e 100 horas e 79%; (b) 799; 1.099 e 99 horas e 77%; (c) 799, 5; 1.099, 5, 100 horas e 78%; (d) 799; 1.199, 99 horas e 80%; 900 − 999 48 1.000 − 1.099 22 1.100 − 1.199 6 TOTAL (e) 799; 1.099, 5, 100 horas e 85%. 400 EP 2.26. Ouvindo-se 300 pessoas sobre o tema “reforma da previdência, contra ou a favor?”, foram obtidas 123 respostas a favor, 72 contra, 51 pessoas não quiseram opinar, e o restante não tinha opinião formada sobre o assunto. Distribuindo-se esses dados numa tabela, obtém-se: OPINIÃO fi f ri Favorável 123 x Contra 72 y Omissos 51 0, 17 Sem Opinião 54 0, 18 TOTAL 400 1, 00 Na coluna freqüência relativa, os valores de x e y são, respectivamente: (a) 0, 41 e 0, 24; (b) 0, 38 e 0, 27; (c) 0, 37 e 0, 28; (d) 0, 35 e 0, 30; (e) 0, 30 e 0, 35; (FT/MG) Responda às questões 2.27 e 2.28 com base na seguinte situação: a distribuição a seguir indica o número de acidentes ocorridos com 40 motoristas de uma empresa de ônibus. Acidentes 0 1 2 3 4 5 6 Motoristas 13 7 10 4 3 2 1 EP 2.27. O número de motoristas que sofreram pelo menos 4 acidentes é: (a) 3 (b) 6 (c) 10 (d) 27 (e) 30 27

(30) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA EP 2.28. A porcentagem de motoristas que sofreram no máximo 2 acidentes é: (a) 25% (b) 32, 5% (c) 42, 5% (d) 57, 5% (e) 75% EP 2.29. [TTN] de acordo com a seguinte distribuição de freqüências, assinale a alternativa correta: (a) Mais de 85% das observações têm diâmetro não inferior a 6cm. (b) 75% das observações estão no intervalo de 2 ⊢ 12. (c) A soma dos pontos médios dos intervalos de classe é inferior à soma Diâmetro(cm) 4 ⊢ 6 6 8 8 8 ⊢ 10 12 12 10 12 ⊢ 14 4 6 ⊢ 10 ⊢ das freqüências absolutas simples. (d) 28% das observações estão no quarto intervalo de classe. fi (e) Menos de 25 das observações têm diâmetro abaixo de 10cm. Resposta 2.15 2.21 a) 40 a) 10.000 (Aparente) b) 80 b) 8.999 (Aparente) c) 15%, excluindo o 6 c) 7.499, 5 d) 70% d) 8.999, 5e9.999, 5 2.6.6 a e) 1.000 2.23 b f) 16 2.24 e g ) 24, 61% 2.25 c h) 2.20 2.22 7.000 − 7.999 i) 52, 3% 2.26 a j) 76, 9% 2.27 b b 2.28 e Apresentação Gráfica A representação gráfica de séries estatísticas constitui-se num fator importante em apresentações de trabalhos. Esta representação pode ser dividida em três grandes grupos: os diagramas; os cartogramas; e os estereogramas. ◦ Diagramas - são figuras geométricas dispostas em duas dimensões. São os mais usados na representação de séries estatísticas. ◦ Cartogramas - as séries estatísticas são representadas em cartas geográficas. ◦ Estereogramas - representam volumes e são apresentados em três dimensões sendo, portanto, necessário algum conhecimento de perspectiva. 28

(31) Estatística Apresentaremos, aqui, apenas os principais diagramas, que podem ser utilizados para qualquer representação de uma série estatística. São eles: ◦ Gráfico em barras; ◦ Gráfico em colunas; ◦ Gráfico em curvas; ◦ Gráfico em setores; ◦ Histogramas; ◦ Boxplots; ◦ Ramo-e-folhas. Recomenda-se a seguinte utilização de correspondência entre as séries estatísticas e a sua representação gráfica. TIPO DE SÉRIE FATOR VARIANTE GRÁFICO MAIS INDICADO Temporal Época Curvas, excepcionalmente Colunas Especificativas Fenômeno Barras, Colunas ou Setores Geográficas Local Cartogramas, Colunas, Barras ou Setores Distribuição Intensidade de freqüências do fenômeno ESTATÍSTICA Histograma (contínua), Bastão (discreta), Barras, Colunas ou Setores (qualitativa) 1o . Gráfico em Colunas ER 2.13. Série Geográfica É o gráfico que corresponde ao Histograma, porém, é utilizado na representação de dados nominais (ou categorias) ou em séries temporais. Pode-se, também, usar barras horizontais. 29

(32) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA NÚMERO DE CRIANÇAS DE BAIXA RENDA, SEGUNDO O BAIRRO DE RESIDÊNCIA, QUE PARTICIPARAM DO ENSINO DE MÚSICA NA ESCOLA XYZ, SALVADOR - 1998 Bairro Número de crianças Paripe 11 Periperi 39 Plataforma 45 Praia Grande 25 120 Total Tabela 2.8: Fonte: Escola de Música XYZ, Salvador. Número de crianças de baixa renda, segundo o bairro de residência, que participaram do ensino de música na escola XYZ, Salvador - 1998 50 40 30 20 10 0 Paripe Periperi Plataforma Praia Grande ER 2.14. Série Especificativa-Temporal INGRESSANTES DA UNIVERSIDADE XYZ SEGUNDO ÁREA DE ESTUDO E ANO Área / Ano 1998 1999 2000 Exatas 120 156 68 Humanas 72 85 112 Biológicas 169 145 73 Tabela 2.9: Fonte: Dados Fictícios Ingressantes da Universidade XYZ segundo área de estudo e ano 200 Exatas 150 Humanas Biológicas 100 50 0 30 1998 1999 2000

(33) Estatística 2o . Gráfico em Barras ER 2.15. Série Especificativa TIPO DE FRAUDE NOS CARTÕES DE CRÉDITO DA MASTERCARD INTERNACIONAL NO BRASIL - 2000 Tipo de fraude Quantidade Cartão roubado Cartão falsificado Pedido por correio/telefone Outros 243 85 52 46 Tipo de fraude nos cartões de crédito da Mastercard Internacional do Brasil - 2000 Outros Pedido por correio/telefone Cartão Falsificado Cartão Roubado 0 Tabela 2.10: Fonte: Triola, Mario F. 50 100 150 200 250 300 Quantidade 3o . Gráfico de Pareto O gráfico de Pareto é composto por barras verticais e por uma curva representado a percentagem acumulada. As barras estão disponíveis em ordem decrescente, tornando evidente a priorização de temas. Este gráfico é muito utilizado na área de Controle de Qualidade. ER 2.16. [Werkema, volume 2] Uma indústria fabricante de lentes tem como objetivo resolver o seguinte problema: aumento do número de lentes defeituosas produzidas pela empresa a partir de fevereiro de 1995. A empresa classificou uma amostra de lentes fabricadas durante uma semana de produção de acordo com os tipos de defeitos detectados. O resultado está na tabela abaixo: DEFEITOS ENCONTRADOS EM UMA AMOSTRA DE LENTES FABRICADAS DURANTE UMA SEMANA DE PRODUÇÃO DE UMA INDÚSTRIA Tipo de defeito Quantidade Arranhão 12 Trinca 41 Revestimento inadequado 55 Muito fina ou muito grossa 11 Não acabada 05 Outros 03 Total 127 Número total de lentes inspecionadas: 1.200 Uma maneira de representarmos graficamente estes dados é através do gráfico de Pareto. Para con31

(34) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA struirmos o gráfico de Pareto é necessário obtermos a planilha de dados mostrada na tabela a seguir. PLANILHA DE DADOS PARA CONSTRUÇÃO DO GRÁFICO DE PARETOS Tipo Quantidade Total Percentagem do Percentagem de defeito de defeito Acumulado Total Geral(%) Acumulada Revest. Inadeq. 55 55 43, 3 43, 3 Trinca 41 96 32, 3 75, 6 Arranhão 12 108 9, 4 85, 0 Fina ou Grossa 11 119 8, 7 93, 7 Não-Acabada 5 124 3, 9 97, 6 Outros 3 127 2, 4 100, 0 127 − 100, 0 − Total Nesta tabela, os tipos de defeitos foram listados em ordem decrescente de quantidade na coluna 1, a quantidade de defeitos aparece na coluna 2 e o total acumulado está na coluna 3. Nas colunas 4 e 5 estão as percentagens totais e as percentagens acumuladas respectivamente. As barras do gráfico de Pareto foram construídas a partir dos dados da coluna 2 e a curva acumulada conhecida como curva de Pareto, foi traçada a partir dos números da coluna 5. Gráfico de Pareto para defeito das lentes 100 80 100 60 40 50 20 0 0 Revestimento Inadequado Trinca Arranhão Fina ou Grossa Não acabada Outros Defeitos Observando o gráfico acima, foi imediato para indústria perceber que os dois tipos de defeitos mais freqüentes, “Revestimento inadequado” e “trinca ”, representavam 75, 6% dos defeitos detectados nas lentes produzidas pela empresa. Portanto, “Revestimento inadequado” e “Trinca” foram considerados os defeitos mais importantes, que devem ser eliminados em primeira lugar esse tipo de defeito é chamado de poucos defeitos vitais, enquanto que os outros representam apenas os muitos defeitos triviais, pois, representam a minoria das observações. 4o . Gráfico em Linhas ou Curvas É muito utilizado na representação gráfica de dados não agrupados em classes, ao lado do gráfico de hastes ou bastões e também para a representação de séries temporais (cotação de ações, vendas, etc). ER 2.17. Série Temporal 32

(35) Estatística IPI, BRASIL-1979 Meses IPI JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV 18.633 17.497 19.470 18.884 20.308 20.146 20.258 21.614 19.717 22.133 20.503 ÍNDICE DE PRODUTO INDUSTRIAL - BRASIL - 1.979 25.000 20.000 15.000 10.000 5.000 0            JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV Fonte: IBGE 5o . Gráfico em Setores ER 2.18. Série Geográfica Percentual de funcionários dos coletivos de Salvador segundo área de residência Área de residência 39, 1% 17, 2% Percentual Centro 17, 2 Subúrbio 39, 1 Periferia 43, 7  Centro  Subúrbio  Periferia 43, 7% Fonte: Dados Fictícios 6o . Gráficos de Hastes, Bastões ou Diagrama de Traços É muito utilizado na representação gráfica de dados não agrupados em classes, o que ocorre normalmente com dados discretos. Nestes casos não há perda de informação, pois, os valores da variável aparecem individualmente, como constam da amostra. ER 2.19. fi xi fi 0 10 1 20 30 2 30 20 3 25 10 4 10 5 5 40 0 1 2 3 4 5 xi 7o . Histograma É muito utilizado na representação gráfica de dados agrupados em intervalos de classes, o que ocorre normalmente com dados contínuos e, conseqüentemente, há perda de informação. O seu uso é recomendado quando 33

(36) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA - existem valores não inteiros para a variável; - a quantidade de valores da variável é grande, no caso de valores inteiros (discretos); - não é importante a perda de informação ocasionada pelos dados apresentados. No caso de classes com a mesma amplitude, é construído um retângulo para cada classe com base igual à amplitude do intervalo de classe e altura proporcional a freqüência da classe. Quando temos classes com amplitudes diferentes, devemos construir um retângulo para cada classe, com base igual à amplitude do intervalo de classe e altura dada por: h= freqüência amplitude ( 2.1) Note que a área do retângulo é igual a freqüência da classe. A altura h em ( 2.1) é chamada de densidade de freqüência. ER 2.20. Histograma para a distribuição de freqüência do exemplo 2.11. Medida específica de um aparelho elétrico TABELA DE FREQÜÊNCIAS Medida fi F ci f ri 154 165 176 187 198 209 4 5 7 5 6 5 4 9 16 21 27 32 0, 13 0, 16 0, 22 0, 16 0, 19 0, 16 ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ 165 176 187 198 209 220 Total 32 8 6 fi 4 2 1, 00 0 154⊢165 165⊢176 176⊢187 187⊢198 198⊢209 209⊢220 Medida ER 2.21. Histograma para a distribuição de freqüências com amplitudes diferentes. TABELA DE FREQÜÊNCIAS Medida fi F ci f ri 150 155 161 173 177 184 198 206 3 4 5 3 10 1 3 3 3 7 12 15 25 26 29 32 0, 09375 0, 125 0, 15625 0, 09375 0, 3125 0, 03125 0, 09375 0, 09375 ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ ⊢ Total 155 161 173 177 184 198 206 220 32 1, 00000 15 1 5 16 15 0 ⊢ 55 ⊢ 1 16 17 1⊢ 3 17 4 7 18 17 3 ⊢ 77 ⊢ 1 18 19 4⊢ 8 19 20 8⊢ 6 20 22 6⊢ 0 8o . Polígono de Freqüências É a representação gráfica de uma distribuição por meio de um polígono e é obtido ao se unir por um segmento de reta dois pontos médios consecutivos das bases superiores dos retângulos de um histograma. 34

(37) Estatística Idade 2 4 6 8 fi ⊢ 4 4 ⊢ 6 6 ⊢ 8 10 ⊢ 10 7 12 3 10 ⊢ fi 10 F ci 7 6 4 3 Total 0 2 4 6 8 10 12 Limites das classes 9o . Polígono de Freqüências Acumuladas É construído a partir das freqüências acumuladas. Os segmentos possuem extremidades de abscissas nos limites inferior e superior referente a cada classe. A abscissa que representa o limite inferior da classe se relaciona com a freqüência acumulada da classe anterior. Já a abscissa que representa o limite superior da classe se relaciona com a freqüência acumulada da mesma. ER 2.22. A representação através de um gráfico de polígono de freqüências da distribuição Notas fi fi 16 2 2 14 2 ⊢ 4 7 12 4 ⊢ 6 3 6 ⊢ 8 1 8 ⊢ 10 3 0 ⊢ é 10 Total 2.6.7 8 6 4 2 0 2 4 6 8 10 Notas Cuidados na Representação Gráfica Há vários problemas com este gráfico. Ele impressiona mais pela tecnologia utilizada do que pela informação que passa para o leitor. Os dados não são tridimensionais. As grades do fundo mais o efeito tridimensional distraem a visão e dificultam comparações entre trimestre e regiões. Uma forma de melhorar o gráfico é dar-lhe a dimensão correta. Pode-se eliminar as linhas de grade. Não utilize faixas horizontais, verticais ou similares, que só atrapalham a visão do leitor. Faça mais de um gráfico até encontrar um que seja informativo, claro, e que não possua objetos desnecessários. Não apresente gráficos supérfluos. Se retirarmos a figura abaixo, toda a informação poderá ser transmitida textualmente, com uma simples frase: “80% das respostas foram positivas e 20% negativas”. O gráfico abaixo tem alguns problemas. Primeiro, o efeito 3-D dificulta o julgamento das porcentagens relativas de cada categoria da variável. A retirada do efeito 3-D ajudará o leitor a julgar melhor as proporções relativas observadas em cada amostra. 2.6.8 Atividades EP 2.30. [TCU] Gráficos são instrumentos úteis na análise estatística. Assinale a afirmação incorreta. 35

(38) 2.6. APRESENTAÇÃO DE UMA SÉRIE ESTATÍSTICA (a) Um histograma representa uma distribuição de freqüências para variáveis do tipo contínuo. (b) O gráfico de barras representa, por meio de uma série de barras, quantidades ou freqüências para variáveis categóricas. (c) O gráfico de setores é apropriado, quando se quer representar as divisões de um montante total. (d) Um histograma pode ser construído utilizando-se, indistintamente, as freqüências absolutas ou relativas de um intervalo de classe. (e) Uma ogiva pode ser obtida ligando-se os pontos médios dos topos dos retângulos de um histograma. EP 2.31. [AFTN] Analise a opção correta. (a) A utilização de gráficos da barra ou de colunas exige amplitude de classe constante na distribuição de freqüência. (b) O histograma é um gráfico construído com freqüências de uma distribuição de freqüências ou de uma série temporal. (c) O polígono de freqüência é um indicador gráfico da distribuição de probabilidade que se ajusta à distribuição empírica a que ele se refere. (d) O histograma pode ser construído para a distribuição de uma variável discreta ou contínua. (e) O polígono de freqüência é construído unido-se os pontos correspondentes aos limites inferiores dos intervalos de classe da distribuição de freqüência. EP 2.32. [TCDF] Em relação aos tipos de gráficos, assinale a opção correta. (a) Uma série categórica é representada por um gráfico de linha. (b) Uma série cronológica é melhor representada por um gráfico de setores. (c) Se uma distribuição de freqüências apresenta intervalos de tamanhos desiguais, o melhor gráfico para representá-la é um polígono de freqüências. (d) O gráfico de barras é usado somente para séries geográficas. (e) O gráfico de setores é usado para comparar proporções. EP 2.33. O gráfico formado por um conjunto de retângulos justapostos, de forma que a área de cada retângulo seja proporcional à freqüência da classe que ele representa é chamado de: (a) Polígono de Freqüências (d) Histograma (b) Gráfico de Barras (e) Ogivograma (c) Gráfico de Colunas EP 2.34. [AFE] Indique a alternativa correta: (a) A freqüência relativa nos fornece o número de observações dentro de cada intervalo de classe. (b) Ao falarmos em distribuição de freqüências estamos nos referindo a uma população. Quando tratamos com amostra, nos referimos a distribuição de probabilidade. 36

(39) Estatística (c) Curvas de freqüências simétricas são aquelas em que as observações eqüidistantes do ponto central têm a mesma freqüência. (d) Um polígono de freqüências é um conjunto de retângulos, cujas áreas são proporcionais às freqüências das classes. (e) A amplitude de um intervalo de classe é a diferença entre o limite superior e o ponto médio do intervalo. Respostas 2.30 2.31 2.32 2.33 2.34 e c e d c Medidas Descritivas Como foi visto, a Estatística Descritiva consiste em um conjunto de métodos que ensinam a reduzir uma quantidade de dados, bastante numerosa, em um número pequeno de medidas que substituem e representam aquela massa de dados (uma outra maneira de se resumir os dados de uma variável quantitativa, além de tabelas e gráficos). Quatro tipos fundamentais de medidas descritivas são estudadas: - medidas de posição (ou de locação ou de localização); - medidas de dispersão (ou de variabilidade); - medidas de assimetria ; - medidas de curtose . Entre as medidas de posição, aquelas que tendem a estar no centro da distribuição são chamadas de medidas de tendência central. Veremos, também, algumas idéias gerais sobre assimetria e análise exploratória de dados. As medidas descritivas auxiliam a análise do comportamento dos dados. Medidas que são provenientes da análise de uma população é denominada parâmetro. As provenientes de uma amostra são denominadas estimadores ou estatísticas. Faremos, então, para cada caso, uma notação específica conforme o quadro a seguir. Medidas Parâmetros Estimadores Número de elementos N n Média µ ¯x Variância σ 2 S2 37

(40) 3.1. MÉDIAS Medidas de Posição As medidas de posição estudadas são: • Médias: A média é um valor que substitui todos os valores dos elementos de X = {xi ; i = 1, 2, . . . , n} e que não altera uma determinada característica. Se a característica a ser mantida é: – a soma dos elementos de X temos a Média Aritmética; – o produto dos elementos de X temos a Média Geométrica; – a soma dos inversos dos elementos de X temos a Média Harmônica; – a soma dos quadrados dos elementos de X temos a Média Quadrática. • Separatrizes: Valores que dividem ou repartem a distribuição em partes iguais. Cada divisão é chamada de quantil. 3.4 Observação. As medidas de posição, que tendem a estar no centro da distribuição são chamadas de medidas de tendência central. As médias são exemplos de medidas de tendência central. Se quisermos dividir a distribuição em: – duas partes iguais temos a mediana, que também é uma medida de tendência central; – quatro partes iguais temos os quartis; – dez partes iguais temos os decis; – cem partes iguais temos os percentis ou centis. 3.1 3.1.1 Médias Média Aritmética Considere um conjunto de dados numéricos X = {xi ; i = 1, 2, . . . , n}. Se a característica a ser mantida é a soma dos elementos de X , obtemos a média aritmética simples ou média aritmética. A média aritmética ¯x é um valor tal que x1 + x2 + . . . + xn = ¯x + ¯x + . . . + ¯x ¯x + ¯x + . . . + ¯x  n x1 + x2 + . . . + xn ⇓ = n · ¯x Logo, a média aritmética para o conjunto X é: 38 parcelas 

(41) Estatística

(42) n x1 + x2 + . . . + xn = ¯x = n xi i =1 n ( 3.2) A média aritmética é a principal medida de tendência central. Algumas das razões que fazem com que seja a medida de posição mais recomendada são: — É definida rigorosamente e pode ser interpretada sem ambigüidades; — Leva em consideração todas as observações efetuadas; — Calcula-se com facilidade. ER 3.23. Um estudante obteve, durante o ano letivo, as seguintes médias para os quatro bimestres: 4.5, 6.5, 7, 6. Sabendo que a média final nessa instituição de ensino é 6, determine se ele foi aprovado. Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensível a valores extremos, isto é, a valores excessivamente pequenos ou excessivamente grandes, em relação às demais observações do conjunto de dados. ER 3.24. Se estivermos interessados em conhecer o salário médio de certa empresa com cinco funcionários e obtivermos o seguinte conjunto de dados, em reais: 123 − 145 − 210 − 225 − 2.500; podemos observar que quatro dos cinco salários apresentam valores entre 123 e 225 reais, porém a média salarial de 640, 6 reais é bastante distinta desse conjunto pela influência do salário de 2.500 que puxou o valor médio para cima. Outras Propriedades da Média Aritmética 1. Somando-se um valor constante e arbitrário a cada um dos elementos de um conjunto de dados, a média aritmética fica adicionada dessa constante. 2. Multiplicando-se um valor constante e arbitrário a cada um dos elementos de um conjunto de dados, a média aritmética fica multiplicada por essa constante.

(43) n 3. A soma dos desvios é zero, ou seja, i =0 (xi − ¯x ) = 0. Média Aritmética Ponderada Em certas situações, os dados numéricos que queremos sintetizar possuem diferentes graus de importância. Utiliza-se, portanto, a média chamada média aritmética ponderada que é calculada ao atribuirmos “pesos” (ou ponderações) aos valores possíveis da variável. Quando os dados aparecem na forma de uma distribuição de freqüências, os ponderadores são as freqüências absolutas. 39

(44) 3.1. MÉDIAS Seja fi o peso atribuído ao respectivo valor que a variável xi ∈ X assume. A média aritmética ¯x é um valor tal que x1 + . . . + x1 + x2 + . . . + x2 + . . . + xn + . . . + xn = ¯x + . . . + ¯x x1 + . . . + x1 + x2 + . . . + x2 + . . . + xn + . . . + xn =     ×f1   ×f2   ¯x + . . . + ¯x , ×(f1 +f2 +...+fn ) ×fn ou seja, f1 · x1 + f2 · x2 + . . . + fn · xn = (f1 + f2 + . . . + fn ) · ¯x . Segue que

(45)

(46) n f1 · x1 + f2 · x2 + . . . + fn · xn = ¯x = f1 + f2 + . . . + fn xi · fi i =1 n . ( 3.3) fi i =1 3.5 Observação. Esta média aritmética é também chamada aritmética ponderada. As freqüências com que aparecem determinados elementos de um conjunto (pesos ou ponderações) assumem um grau de “importância” para cada valor. Podemos observar que a relação da equação ( 3.3) é válida para dados tabulados não agrupados em classes. ER 3.25. Um estudante obteve médias 8, 0, 7, 0 e 6, 0 nos três primeiros bimestres do ano letivo. Sabendose que em seu colégio é adotado o sistema de pesos 1, 2, 3 e 4 para os quatro bimestres, respectivamente, calcule a média que ele deve obter no quarto bimestre para que ele consiga a média anual 7, 0, necessária para passar direto na disciplina. EP 3.35. Calcule a média aritmética para a seguinte tabela da dados tabulados. xi fi 4 1 5 5 6 6 7 5 8 3 xi · fi Total Tabela 3.11: Fonte: Dados Fictícios EP 3.36. Um aluno da turma de estatística da Faculdade XY obteve notas 5, 0 e 7, 0 em duas provas realizadas. Se adicionarmos a cada nota o valor 10 a média aritmética fica adicionada do mesmo valor. Se multiplicamos cada nota pelo valor 10 a média aritmética fica multiplicada do mesmo valor. EP 3.37. Compare os pesos médios das crianças ao nascer para os dois grupos de dieta e, a seguir, com os pesos após dez dias do uso da dieta alimentar. Pode-se afirmar que uma dieta foi mais eficiente que a outra? EP 3.38. Apenas a média aritmética é suficiente para chegarmos a uma conclusão quanto à eficiência das dietas? Justifique sua resposta. 40

(47) Estatística 3.1.2 Atividade EP 3.39. Dados os conjuntos de números: A = {100, 101, 102, 103, 104, 105} e B = {0, 1, 2, 3, 4, 5}, podemos afirmar que: (a) a média de A é igual à de B multiplicada por 100; (b) a média de A é igual à média de B; (c) a média de A é igual à média de B dividida por 100; (d) a média de A é igual à média de B mais a constante 100; (e) n.r.a. EP 3.40. [TCDF] Em uma empresa, o salário médio dos empregados é de R$500, 00. Os salários médios pagos aos empregados dos sexos masculino e feminino são de R$520, 00 e R$420, 00, respectivamente. Então, nessa empresa, (a) o número de homens é o dobro do número de mulheres; (b) o número de homens é o triplo do número de mulheres; (c) o número de homens é o quádruplo do número de mulheres; (d) o número de mulheres é o triplo do número de homens; (e) o número de mulheres é o quádruplo do número de homens. EP 3.41. [Fiscal de Tributos de Minas de Gerais] A estatura média dos sócios de um clube é 165cm, sendo a dos homens 172cm e a das mulheres 162cm. A porcentagem de mulheres no clube é de: a) 62% b) 65% c) 68% d) 70% e) 72% EP 3.42. Um aluno recebeu as seguintes notas finais: 82 em Matemática, 90 em Estatística, 65 em História e 70 em Geografia. Atribuindo-se a essas matérias, respectivamente, os pesos 3, 3, 2, 1, calcular a média aritmética das notas recebidas pelo aluno. EP 3.43. Se tornar-mos x0 = 10 como a média arbitrária de um conjunto de números, chegaremos aos seguintes desvios, calculados em relação a x0 = {−4, −1, 2, 0, 3, −3, 5, 1}. Calcular a média verdadeira do conjunto. EP 3.44. Os desvios tomados em relação à média arbitrária x0 = 9 de um conjunto de números são: {−5, −2, 3, 0, 4, −3, 5, 2}. A média aritmética do conjunto será: a) 9, 0 b) 9, 5 c) 9, 3 d) 9, 8 e) 10, 2 EP 3.45. Calcular a média aritmética para as seguintes tabelas de dados: Respostas 3.39 - d; 3.40 - c ; 3.41 - d ; 3.42 - 79,6; 3.43 - 10,375; 3.44 - b; 3.45: a - 5,65; b - 5,27. . . ; c - 8,9; d - 79,5. 41

(48) 3.1. MÉDIAS Valor fi 3 1 4 3 5 4 6 7 7 4 8 1 (a) Peso (kg) fi ⊢ 4 9 6 12 ⊢ 8 6 10 2 12 1 2 ⊢ 4 (b) 6 ⊢ 8 10 ⊢ Total Total Tabela 3.13: Fonte: Dados Fictícios Tabela 3.12: Fonte: Dados Fictícios Diâmetro (cm) fi 4 ⊢ 6 6 6 ⊢ 8 8 8 ⊢ 10 12 10 ⊢ 12 10 14 4 (c) 12 ⊢ Classes fi 5 ⊢ 25 4 25 ⊢ 45 6 65 14 65 ⊢ 85 26 105 14 105 ⊢ 125 8 145 6 145 ⊢ 165 2 45 ⊢ (d) 85 ⊢ 125 ⊢ Total Tabela 3.14: Fonte: Dados Fictícios Total Tabela 3.15: Fonte: Dados Fictícios 3.1.3 Média Geométrica Se o produto dos elementos de X é a característica a ser mantida, obtemos a média geométrica. A média geométrica pode ser calculada de duas formas: a média geométrica simples e a média geométrica ponderada. Média geométrica simples A média geométrica simples dos n números positivos do conjunto X é um valor positivo ¯g tal que x1 · x2 · . . . · xn = g¯ · ¯g · . . . · g¯ = g¯ n . Logo, √ g¯ = n x1 · x2 · . . . · xn =  n x n i ( 3.4) i =1 ER 3.26. A média geométrica dos números 3, 36 e 54 é g¯ = √ 3 3 · 36 · 54 = 18. Média geométrica ponderada Se quisermos sintetizar a média geométrica e cada elemento da série possuem diferentes graus de importância, utilizaremos a média geométrica ponderada que é calculada ao atribuirmos pesos (ou ponderações) aos valores 42

(49) Estatística possíveis da variável. Quando os dados aparecem na forma de uma distribuição de freqüências, os ponderadores serão as freqüências absolutas. Seja fi o peso atribuído ao respectivo valor que a variável xi ∈ X assume. A média geométrica ponderada dos n números positivos do conjunto X é um valor positivo g¯p tal que

(50) k x1f1 · x2f2 · . . . · xkfk = g¯p · ¯gp · . . . · g¯p = g¯pn , onde n = Logo, g¯p =  n  fi . i k x1f1 · x2f2 · . . . · xkfk = n xifi ( 3.5) i =1 ER 3.27. Considere a tabela xi fi 1 2 3 4 5 3 7 1 Total 10 Tabela 3.16: FONTE: Dados fictícios Determine a média geométrica ponderada. Solução: g¯p = √ 10 12 · 34 · 53 · 71 ≈ 3, 0553. Propriedades da Média Geométrica 1. O produto dos quocientes de cada valor de um conjunto de números pela média geométrica do conjunto é igual a 1. Por exemplo, √ 4 9 X = {4, 9}, g¯ = 4 · 9 = 6 e · = 1. 6 6 2. Séries que possuem o mesmo número de elementos com a mesma soma apresentam a mesma média aritmética e as séries que possuem o mesmo número de elementos com o mesmo produto têm a mesma média geométrica. Por exemplo, X = {2, 5, 8}, ¯x = 5; X ′ = {2, 4, 9}, ¯x = 5; Y = {2, 4, 7}, g¯ =; Y ′ = {1, 2, 28}, g¯ = 3, 8259. 3. Se houver, pelo menos, um zero entre os valores da distribuição, a média geométrica será nula. 4. A média geométrica é também influenciada pelos valores extremos da distribuição. 43

(51) 3.1. MÉDIAS 3.1.4 Média Harmônica Se a soma dos inversos dos elementos de X é a característica a ser observada, obteremos a média harmônica. A média harmônica pode ser calculada de duas formas: a média harmônica simples e a média harmônica ponderada. Média Harmônica Simples A média harmônica simples dos n números positivos é um valor positivo ¯h tal que 1 1 1 1 1 1 n + + ...+ = + + ...+ = . ¯h ¯h ¯h ¯h x1 x2 xn Logo, ¯h = n = 1 1 1 + + ...+ x1 x2 xn

(52) n n i =1 ( 3.6) 1 xi Podemos facilmente concluir que a média harmônica é o inverso da média aritmética dos inversos dos números. ER 3.28. A média harmônica dos números 3, 36 e 54 é ¯h = 3 ≈ 7, 9. 1 1 1 + + 3 36 54 3.6 Observação. Evitamos a possibilidade de não existirem as médias geométrica e harmônica uma vez que estas só foram definidas para números positivos. Média Harmônica Ponderada Utilizaremos a média harmônica ponderada quando os valores da variável em conjunto X possuírem determinada importância (peso). Quando os dados aparecem na forma de uma distribuição de freqüências, os ponderadores serão as freqüências absolutas. Seja fi o peso atribuído ao respectivo valor que a variável xi ∈ X assume. A média harmônica ponderada dos k números positivos do conjunto X é um valor positivo ¯hp tal que f2 fk 1 1 1 k f1 + + ...+ = + + ...+ = . ¯hp ¯hp ¯hp ¯hp x1 x2 xk Logo, ¯hp = n = f1 f2 fk + + ...+ x1 x2 xk

(53) k k i =1 44 . fi xi ( 3.7)

(54) Estatística ER 3.29. Considere a tabela fi xi xi fi 1 2 3 4 5 3 7 1 Total 10 Determine a média harmônica ponderada. Solução: ¯hp ≈ 2, 457 Propriedades da Média Harmônica 1. Valores próximos possuem médias próximas e valores afastados, médias afastadas. 2. Quando os valores das variáveis não forem muito afastados, verifica-se que g¯ ≈ ¯x + ¯h . 2 3. A presença de pelo menos um valor igual a zero inviabiliza o cálculo da média harmônica. 4. Valores extremos também influenciam a média harmônica. 3.1.5 Média Quadrática Seja ¯q a média quadrática do conjunto X . Sendo assim, ¯q é um valor tal que   x12 + x22 + . . . + xn2 = ¯q 2 + ¯q 2 + . . . + ¯q 2 = ¯q 2 + ¯q 2 + . . . + ¯q 2 = n¯q 2 . Segue que ¯q =  ×n 

(55) n x12 + x22 + ...+ n xn2 = i =1 n xi2 ( 3.8) O valor de ¯q é denominado a média quadrática simples ou média quadrática de X . Observe que a média quadrática é a raiz quadrada da média aritmética dos quadrados dos números. Este tipo de média é bastante usado em Estatística. ER 3.30. Calcule a média quadrática dos números 2, 3 e 5.  Solução: A média quadrática dos números 2, 3 e 5 é ¯q = 22 + 32 + 52 ≈ 3, 56. 3 45

(56) 3.1. MÉDIAS Média Quadrática Ponderada Considere o conjunto X = {x1 , x2 , . . . , xn }, em que cada xi

(57) = 0 aparece fi vezes. Seja ¯q o valor tal que   x12 · f1 + x22 · f2 + . . . + xn2 · fn = q 2 + q 2 + . . . + q 2 = q 2 · (f1 + f2 + . . . + fn ). ×(f1 +f2 +...+fn ) Logo,

(58)

(59) n x 2 · f1 + x22 · f2 + . . . + xn2 · fn = q¯2 = 1 f1 + f2 + . . . + fn Segue que, 

(60)

(61) i =1 xi2 · fi n . fi i =1 n ¯q = i =1 xi2 · fi n . ( 3.9) fi i =1 ER 3.31. Calcule a média quadrática dos números 2, 3 e 5, com freqüências 5, 3 e 2. Solução: Vejamos agora alguns exemplos para ilustrar a utilização dos diferentes tipos de médias. ER 3.32. Uma empresa produziu durante o 1◦ trimestre do ano passado 500, 200 e 200 unidades em janeiro, fevereiro e março, respectivamente. Qual foi a produção média mensal? Solução: Que média devemos usar? Queremos a produção média M, tal que se a produção mensal fosse sempre igual a M, a produção trimestral seria a mesma. Uma vez que a produção trimestral é 500 + 200 + 200 = 900 = M + M + M. Então, 3M = 900 e M = 300 (média aritmética). ER 3.33. Uma empresa aumentou sua produção durante o primeiro bimestre do ano passado. Em janeiro e em fevereiro as taxas de aumento foram de 21% e 8%, respectivamente. Qual a taxa média de aumento mensal neste bimestre? Solução: Cuidado! Não devemos fazer (21% + 8%) = 14, 5%. Vamos pensar na solução correta. 2 Que tipo de média devemos usar? Queremos uma taxa média i, tal que se em cada mês a taxa de aumento fosse igual a i, o aumento bimestral seria o mesmo. E qual foi o aumento bimestral? Sem perda de generalidade suponha que a produção em dezembro tenha sido de 100 unidades. Então, a produção em janeiro e em fevereiro são, respectivamente, 100 + (0, 21)100 = 100 · (1 + 0, 21) = 100 · 1, 21 = 121 46 121 · 0, 08121 = 121 · 1, 08 = 100 · 1, 21 · 1, 08 = 130, 68

(62) Estatística Portanto, a taxa de aumento bimestral foi de 30, 68%. Se em todos os meses tivéssemos a mesma taxa de aumento i, qual seria o valor de i para obtermos o mesmo aumento bimestral? Produção em janeiro: 100 · (1 + i); Produção em fevereiro: 100 · (1 + i)2 . Então, (1 + i)2 = (1 + i) = 1, 21 · 1, 08 √ 1, 21 · 1, 08 = 1, 1432 (média geométrica) Logo, a taxa média de aumento mensal i = 14, 32%. Observe que a taxa média aumentada de uma unidade é a média geométrica das taxas mensais aumentadas de uma unidade. ER 3.34. Um carro percorre metade de um percurso retilíneo AB de extensão d com velocidade v1 e a outra metade com velocidade v2 . Qual a sua velocidade média? Solução: Lembrando que velocidade é a razão entre distância e tempo, então o primeiro trecho foi d d percorrido em t1 = e o segundo trecho em t2 = sendo o tempo total dado por t = t1 + t2 . 2v1 2v2 A velocidade média (constante) v que nos faria percorrer a distância d no tempo t é v= d d = = d d d t + 2v1 2v2 2 ou seja, v=  1d 1 + v1 v2  = 2 , 1 1 + v1 v2 2 . 1 1 + v1 v2 Observe, portanto, que a velocidade média é a média harmônica das velocidades em cada trecho. 3.1.6 Relação entre as médias Se x1 , x2 , . . . , xn são n números positivos e ¯h, g¯ , ¯x e ¯q são suas médias harmônica, geométrica, aritmética e quadrática, respectivamente, então ¯h ≤ g¯ ≤ ¯x ≤ ¯q . Além disso, duas quaisquer dessas médias serão iguais se, e somente se, x1 = x2 = . . . = xn . 3.1.7 Atividades EP 3.47. Considere a amostra {6, 2, 7, 5, 4}. A soma dos desvios em relação à média é igual a: a) −4 b) 8 c) 0 d) 25 e) 4 47

(63) 3.1. MÉDIAS EP 3.46. Calcular a média harmônica dos dados constantes na tabela. Classes fi ⊢ 3 2 ⊢ 7 12 ⊢ 11 2 1 3 5 7 9 ⊢ 5 fi xi 4 ⊢ 9 4 Total EP 3.48. A relação ¯x = ¯xh = ¯xg ocorre quando: (a) todos os xi forem negativos. (d) a variável for contínua. (b) a distribuição for simétrica. (e) n. d. a. (c) todos os xi forem iguais. EP 3.49. Indique a relação correta quanto às médias aritmética, geométrica e harmônica: a) ¯xh ≤ ¯x ≤ ¯xg b) ¯xg ≤ ¯x ≤ ¯xh c) ¯xg ≤ ¯xh ≤ ¯x d) ¯xh ≤ ¯xg ≤ ¯x e) n.d.a. EP 3.50. É propriedade comum entre média aritmética e média geométrica: (a) ser influenciada pelos valores extremos da série. (b) a soma dos desvios é iguala zero. (c) seu uso é vantajoso na análise dos números índices. (d) a soma dos quadrados dos desvios é um mínimo. (e) n. d. a. Respostas 3.46 5, 1; 3.1.8 3.47 c; 3.48 c; 3.49 d; 3.50 a Média para Valores Agrupados em Classes Para dados tabulados agrupados em classes devemos inicialmente obter os pontos médios de cada classe que serão os valores de xi . Em seguida, calculamos a média utilizando a equação respectiva utilizando a freqüência absoluta fi de cada classe. Observe que estamos calculando a média aritmética ponderada para valores agrupados discretamente, pois, as classes são substituídas pelo seus respectivos pontos médios. 48

(64) Estatística ER 3.35. Calcule a média aritmética para os dados agrupados em classes. Classes fi 2 ⊢ 4 3 6 ⊢ 10 ⊢ 4 ⊢ 6 5 8 10 8 ⊢ 10 5 12 3 xi xi · fi Total 3.2 Separatrizes As separatrizes são medidas de posição que nos permite calcular valores da variável que dividem ou separam a distribuição em partes iguais. Temos quatro tipos de separatrizes, também chamadas de quantis: • a mediana, que também é uma medida de tendência central; • os quartis; • os decis; • percentis. 3.2.1 Mediana Chamamos de Mediana (Md) o elemento que ocupa a posição central na distribuição ordenada (crescente ou decrescente), isto é, divide um rol em duas partes iguais de modo que 50% dos valores observados são inferiores ao valor mediano e 50% superiores a esse valor. Devemos considerar dois casos para calcular o elemento Mediana: o cálculo da mediana para um conjunto com valores não tabuláveis e o outro conjunto com valores tabuláveis. Devemos ainda considerar se os dados deste conjunto são discretos ou agrupados em classes. Mediana em um conjunto com valores não-tabuláveis A Mediana em um conjunto com valores discretos é determinada por Md = x n2 + x n2 +1 , 2 n é par, ( 3.10) Md = x n+1 , 2 n é ímpar. ( 3.11) ER 3.36. Determine a mediana para os conjuntos: (a) X = {1, 3, 5, 7, 9, 11}. (b) Y = {1, 3, 5, 7, 9, 11, 12, 13, 14} 49

(65) 3.2. SEPARATRIZES Solução: Como nX = 6, MdX = 5+7 = 6. Já nY = 9, e MdY = 9. 2 Mediana em um conjunto com valores tabuláveis Para o cálculo da mediana de um conjunto com valores tabuláveis devemos considerar ainda o tipo de variável. 1 - Mediana em conjuntos com valores discretos agrupados Neste caso temos que trabalhar com a freqüência acumulada a fim de identificarmos a posição central. ER 3.37. Determine o elemento mediano para a tabela 3.17 xi fi 2 5 4 10 6 15 8 12 10 5 12 3 F ci Total Tabela 3.17: Fonte: Dados Fictícios Solução: Md = x25 + x26 6+6 = = 6. 2 2 2 - Mediana em um conjunto com valores agrupados em classes Neste caso a mediana é obtida respeitando a seguinte relação   P − F ci −1 , Md = li + hi · fi ( 3.12) onde P= n é a posição do elemento mediano; 2 li é o limite inferior da classe mediana; hi é amplitude de classe mediana; F ci −1 é freqüência acumulada anterior à classe mediana; fi é a freqüência absoluta da classe mediana. As seguintes etapas para o cálculo da mediana em dados agrupados em classes devem ser consideradas: 50

(66) Estatística 1. Cálculo da posição do elemento mediano; 2. Identificação da classe mediana; 3. Calcular a mediana. ER 3.38. Determine a mediana do conjunto representado pela tabela Classes 2 4 6 8 10 ⊢ ⊢ ⊢ ⊢ ⊢ fi 4 6 8 10 12 F ci 3 5 7 4 1 Total Tabela 3.18: Fonte: Dados Fictícios A mediana é uma medida de posição resistente, pois é pouco afetada por mudanças de pequena porção dos dados, ao contrário da média aritmética que é sensível a valores atípicos. Por exemplo, se X = Y = {200, 250, 250, 300, 450, 460, 510}, ¯xX = 345, 7 e MdX = 300. {200, 250, 250, 300, 450, 460, 2.300}, ¯xY = 601, 0 e MdY = 300. Podemos observar que, no caso do conjunto Y , a média não sintetiza adequadamente o conjunto de dados, pois, apenas um valor é superior a ela. Devemos empregar a mediana se: desejamos obter o ponto que divide a distribuição em duas partes iguais (“abaixo de” ou “acima de”); existem valores extremos que afetam de uma maneira acentuada a média ou; a variável em estudo é o salário. ER 3.39. Considere os seguintes dados que representam o número de mortes depois das erupções vulcânicas que ficaram célebres: Data Nome vulcão N mortes Data Nome vulcão N mortes 79a.c. Mt. Vesuvius, Italy 16000 1902 Santa Maria, Guatemala 1000 1169 Mt. Etna, Sicily 15000 1902 Mt. Pelée, Martinique 30000 1631 Mt. Vesuvius, Italy 4000 1911 Mt. Taal, Philippines 1400 1669 Mt. Etna, Sicily 20000 1919 Mt. Kelud, Java 5000 1772 Mt. Papandayan, Java 3000 1951 Mt. Lamington, New Guinea 3000 1792 Mt. Unzen-Dake,Japan 10400 1966 Mt. Kelud, Java 1000 1815 Tamboro, Java 12000 1980 Mt. St. Helens, U.S. 60 1883 Krakatau, Indonesia 35000 1985 Nevado del Ruiz, Colombia 22940 Tabela 3.19: Fonte: World Almanac, 1993 (a) Calcule a média e mediana do número de mortes. O que pode concluir quanto à simetria da distribuição dos dados? 51

(67) 3.2. SEPARATRIZES (b) Suponha que ao digitar os valores anteriores o valor que diz respeito à erupção vulcânica de 1883 apareceu 335000, em vez de 35000. Calcule novamente a média e a mediana; (c) Admita agora que o engano se deu ao digitar o 60, que apareceu substituído por 600. Calcule novamente a média e a mediana; (d) Apresente os valores obtidos nas alíneas anteriores no seguinte quadro e comente-o: Dados originais Dados com o valor 335000 Dados com o valor 600 Média Mediana (e) Suponha que um professor pediu aos seus alunos que calculassem a mediana dos dados que dizem respeito ao número de mortes, e que alguns apresentaram o valor 18000. O que é que poderá ter acontecido? 3.2.2 Quartis, Decis e Centis As medidas de posição denominadas quartis, decis e centis (ou percentis) têm construção análoga a da mediana. Enquanto a mediana separa a distribuição em duas partes iguais, esses, dividem a distribuição em quatro partes, em dez partes e, em cem partes, respectivamente. Variáveis Discretas O quartil Qi , o Decil Di e o Centil Ci de ordem i numa distribuição com variáveis discretas é determinado   por: x[P]+1 , P

(68) ∈ Z ( 3.13) xP + xP+1 , P ∈ Z, 2 onde n é a freqüência total da distribuição, [P] representa a parte inteira de P ∈ R e P pode assumir os valores i ·n i ·n 4 , 10 ou i ·n 100 a depender de qual das separatrizes desejamos calcular. Variáveis Contínuas O Quartil Qi , o Decil Di e o Centil Ci de ordem i numa distribuição com variáveis contínuas agrupadas em classes é determinado por: l i + hi · P − Fc  i −1 fi , ( 3.14) onde P é a posição do quantil de ordem i o qual desejamos calcular e é determinado por i ·n i ·n i ·n , ou , 4 10 100 respectivamente, posição do Quartil, do Decil ou do Centil, sendo n a freqüência total da distribuição; 52

(69) Estatística li é o limite inferior da classe quantílica; hi é amplitude de classe quantílica; F ci −1 é freqüência acumulada absoluta anterior à classe quantílica; f ri é a freqüência absoluta da classe quantílica. Observe que C50 = D5 = Q2 = Md. Podemos reformular a equação (3.14) utilizando freqüências relativas, ou seja  l i + hi ·  P − F r ci −1 , f ri ( 3.15) onde P = 4i , P = i 10 ou P = i 100 é a posição do quantil de ordem i o qual desejamos calcular, sendo n a freqüência total da distribuição; li é o limite inferior da classe quantílica; hi é amplitude de classe quantílica; F r ci −1 é freqüência relativa acumulada anterior à classe quantílica; f ri é a freqüência relativa da classe quantílica. Intervalo interquartil Definimos o intervalo interquartil ou interquartílico o intervalo (Q1 ; Q3 ) que contém 50% do total de observações localizadas mais ao centro da distribuição. EP 3.51. Dada a distribuição de freqüências abaixo, calcule: (a) Q1 ; (b) D8 ; (c) C70 . Classes fi 5 ⊢ 25 4 25 ⊢ 45 6 45 ⊢ 65 14 65 ⊢ 85 26 85 ⊢ 105 14 105 ⊢ 125 8 145 6 145 ⊢ 165 2 125 ⊢ F ci Total 53

(70) 3.2. SEPARATRIZES EP 3.52. Ao aplicar uma prova de Estatística a uma turma de 120 alunos, encontrou-se o resultado expresso na tabela a seguir: Notas fi 30 ⊢ 40 50 ⊢ F ci 1 40 ⊢ 50 3 60 11 60 ⊢ 70 21 70 ⊢ 80 43 80 ⊢ 90 32 90 ⊢ 100 9 Total Calcule: (a) o grau mais alto que poderia ser obtido pelos 50% piores alunos da turma; (b) o grau mais baixo que poderia ser obtido pelos 25% melhores alunos da turma; (c) o grau mais alto que é possível ser obtido pelos 20% piores alunos da turma. 3.2.3 Moda A moda é outra importante medida de locação, mas, diferentemente das médias, não se utiliza todos os valores do conjunto analisado em seu cálculo. A Moda Mo é o valor que ocorre com maior freqüência no conjunto e em distribuições simples (sem agrupamento em classes) sua determinação é facilitada pela observação do elemento que apresenta maior freqüência. Por exemplo: (a) X = {2, 3, 3, 5, 5, 5, 6, 7}, Mo = 5; (b) Y = {10, 12, 17, 21, 32}, não existe moda, a distribuição é amodal; (c) Z = {2, 2, 5, 5, 7, 7}, distribuição é amodal; (d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21}, distribuição apresentando dois valores modais, Mo1 = 12 e Mo2 = 18 (distribuição bimodal). (e) Na tabela abaixo observe que a determinação da moda (Mo = 3) é imediata xi fi 1 2 2 2 3 5 4 4 5 1 Total Tabela 3.20: Fonte: Dados Fictícios Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuição plurimodal . 54

(71) Estatística A moda é uma medida mais adequada ao caso de dados agrupados. No caso de dados não agrupados, a moda nem sempre tem utilidade com elemento representativo ou sintetizador do conjunto. Quando a distribuição de freqüências está organizada por classes de valores, devemos identificar a classe modal (classe em que observamos a maior freqüência). O ponto médio da classe modal será o valor estimado para a moda que é denominada Moda Bruta . Consideremos, por exemplo, o seguinte conjunto de dados: Valores fi 7 2 11 3 15 1 17 4 19 5 21 2 25 7 Total Tabela 3.21: Fonte: Dados Fictícios De acordo com a definição a Moda é 25, entretanto, este valor não é representativo do conjunto de dados e, portanto, a moda não é uma boa medida de locação neste caso. Podemos obter a moda por outro métodos Método de King A moda pelo Método de King baseia-se na influência das freqüências das classes adjacentes sobre a classe modal.  Mo = li + hi · fi +1 fi −1 + fi +1  , onde li é o limite inferior da classe modal; hi é a amplitude do intervalo da classe modal; fi −1 é a freqüência absoluta da classe anterior à classe modal. fi +1 é a freqüência absoluta da classe posterior à classe modal; Método de Czuber A moda pelo Método de Czuber considera não apenas as freqüências das classes adjacentes à classes modal, mas também a freqüência da classe modal.  Mo = li + hi ·  fi − fi −1 . 2fi − (fi −1 + fi +1 ) 55

(72) 3.2. SEPARATRIZES Se fizermos ∆1 = fi − fi −1 e ∆2 = fi − fi +1 , então  Mo = li + hi · ∆1 ∆1 + ∆2  . Importante: Quando a questão não informar que moda obter, então o que se pede é a moda pelo Método de Czuber, por ser o valor mais preciso. Fórmula de Pearson A moda é dada, aproximadamente, pela diferença entre o triplo da mediana e o dobro da média, ou seja, ( 3.16) Mo ≈ 3 · Md − 2 · ¯x . Esta fórmula apresenta uma boa aproximação quando existe uma razoável simetria. ER 3.40. Calcular as modas para os seguintes casos: fi Estaturas(cm) fi 2 5 154 4 4 8 150 ⊢ 158 9 6 14 154 ⊢ 162 11 8 10 158 ⊢ 166 8 10 7 162 ⊢ 170 5 174 3 Notas 0 ⊢ a) 2 ⊢ 4 ⊢ 6 ⊢ 8 ⊢ b) 166 ⊢ Total 170 ⊢ Consumo(kW h) ⊢ 25 4 45 10 45 ⊢ 65 24 65 ⊢ 85 50 85 ⊢ 105 64 105 ⊢ 125 72 125 ⊢ 145 78 145 ⊢ 165 80 5 25 ⊢ c) Total fi Total Respostas a) Moda Bruta Moda de King = 5, 0 b) Moda Bruta = 5, 1 Moda de Czuber = 5, 2 = 160 Moda de King = 159, 9 Moda de Czuber = 159, 6 c) Moda Bruta Moda de King = 75 = 75 Moda de Czuber = 75 3.7 Observação. 1. Quando as freqüências das classes adjacentes (anterior e posterior) à classes modal forem iguais, teremos: Notas 0 ⊢ 2 5 2 ⊢ 4 8 4 ⊢ 6 14 6 ⊢ 8 8 8 ⊢ 10 7 Total 56 fi

(73) Estatística 2. Quando a distribuição for Simétrica, teremos: Notas 0 ⊢ fi 2 3 2 ⊢ 4 8 4 ⊢ 6 14 6 ⊢ 8 8 8 ⊢ 10 3 Total 3. Quando o somatório das freqüências simples acima da classe mediana for igual ao somatório das freqüências simples abaixo, a mediana será obtida através do ponto médio da classe mediana. Notas 0 ⊢ fi 2 3 2 ⊢ 4 12 4 ⊢ 6 14 6 ⊢ 8 8 8 ⊢ 10 7 Total Relação entre a média aritmética, a moda e a mediana Três tipos de relações podem ser efetuadas entre as três principais medidas de tendência central em uma distribuição. Distribuição simétrica : Quando a média aritmética, a mediana e a moda são iguais. ¯x = Md = Mo. Distribuição assimétrica : Quando existe diferença entre a média aritmética, a mediana e a moda. - positiva (à direita): A média aritmética é o maior dos valores e a mediana está entre a média aritmética e a moda. ¯x > Md > Mo. - negativa (à esquerda): A média aritmética é o menor dos valores e a mediana está entre a média aritmética e a moda. ¯x < Md < Mo. 3.8 Observação. Para observamos o aspecto da assimetria através das medidas de tendência central bastaríamos comparar a média aritmética e a moda, visto que a mediana, em geral, situa-se entre estas duas medidas, porém, devemos ter cuidado, pois, em alguns casos isto pode não ocorrer. ER 3.41. Comparar a mediana com a média aritmética e a moda bruta para as variáveis peso ao nascer e peso após dez dias para todas as cem crianças observadas. O que você pode concluir? 57

(74) 3.2. SEPARATRIZES Solução: Peso ao nascer: Mo = 1650, 0 < Md = 1705, 0 < ¯x = 1727, 5; Peso ao 10◦ dia: Mo = 1750, 0 < Md = 1750, 0 < ¯x = 1763, 0. 3.9 Observação. Quando usamos qualquer programa estatístico, os dados não são agrupados em classes. Desta forma a mediana é calculada como se os dados estivessem organizados de acordo com um rol. R ESUMO COMPARATIVO ENTRE AS MÉDIAS Definição

(75) Aritmética ¯x = Limitações Reflete cada valor n Média Vantagens xi i =1 n Sempre calculada Possui boas propriedades Influenciada por matemáticas valores extremos. Única Uso de calculadora Menos sensível a Metade dos valores Mediana são maiores, metade menores valores extremos do que a média. Difícil de determinar Necessita de ordenação para grandes quantidades de dados. Não se presta a Moda Valor “típico” análise matemática Valor de Maior quantidade de Pode não haver moda maior ocorrência valores concentrados para certos conjuntos neste ponto de dados, como pode haver uma infinidade. 3.2.4 Atividades EP 3.53. Calcule a mediana nos seguintes casos: a) X = {2, 3, 5, 6, 9, 10, 13, 15} b) X = {1, 3, 4, 6, 8, 9, 11, 13, 14} c) X = {4, 6, 2, 7, 3, 8} 58 d) X = {5, 6, 2, 8, 4, 9, 14, 12, 10}

(76) Estatística e) xi fi 3 F ci xi fi 2 12 4 6 5 10 xi fi 2 2 2 13 6 3 8 14 12 4 12 6 8 15 10 5 10 7 5 16 6 6 5 8 4 17 4 7 3 f) Total h) 2 ⊢ 4 ⊢ 6 ⊢ 8 ⊢ g) Total Notas 0 ⊢ F ci fi 2 5 4 8 6 10 8 14 10 7 F ci i) Total F ci Total Estaturas (cm) fi 150 ⊢ 154 4 154 ⊢ 158 9 162 11 162 ⊢ 166 8 170 5 170 ⊢ 174 3 158 ⊢ 166 ⊢ Consumo (kwh) F ci Total ⊢ 25 45 ⊢ 85 ⊢ 5 j) fi 4 25 ⊢ 45 6 65 14 65 ⊢ 85 26 105 14 105 ⊢ 125 8 145 6 145 ⊢ 165 2 125 ⊢ F ci Total EP 3.54. Das afirmações abaixo: I - Quando se ordenam valores não agrupados segundo sua grandeza, a mediana é o ponto médio desta série. II - Quando os valores de uma série contínua estão agrupados em uma distribuição de freqüência, a mediana é, por definição, o ponto que corresponde a 50% da distribuição. III - Quando desejamos o ponto médio exato de uma distribuição de freqüência, basta calcular a mediana. IV - Quando existem valores extremos que afetam muito o cálculo da média, para representá-la devemos dar preferência à mediana. (a) todas estão erradas. (b) todas estão corretas. (c) apenas a I está errada. (d) apenas a IV está errada. (e) apenas a II está correta. EP 3.55. Os salários mensais de quatro pessoas são: 15.000, 00, 18.000, 00, 19.000, 00 e 90.000, 00. (a) Determinar a média aritmética de seus salários; (b) Podemos dizer que a média obtida é típica dos salários? 59

(77) 3.2. SEPARATRIZES EP 3.56. A tabela abaixo representa os salários pagos a 100 operários de uma firma. Salários Mínimos 0 2 4 6 8 Operários ⊢ 2 40 ⊢ 4 30 ⊢ 6 10 ⊢ 8 15 ⊢ 10 5 Total Determinar: (a) o salário médio; (b) o salário modal (Czuber); (c) o salário mediano. EP 3.57. Considere a distribuição das estaturas de 100 alunos de uma turma. Estaturas (cm) Operários 140 ⊢ 150 5 150 ⊢ 160 10 160 ⊢ 170 30 170 ⊢ 180 40 180 ⊢ 190 10 190 ⊢ 200 5 Total Determinar: (a) a estatura média; (b) a estatura modal (Czuber); (c) a estatura modal (King); (d) a estatura mediana; (e) os limites onde estão compreendidos 50% das estaturas (1o e 3o quartis). Respostas 3.53 a) Md = 7, 5 b) Md = 8 f ) Md = 14, 5 g ) Md = 4 3.54 B 3.55 $35.625, 00 3.56 3.57 60 c) Md = 5 d) Md = 8 h) Md = 5, 23 i) e) Md = 5 Md = 160, 55 j) Md = 77, 31

(78) Estatística Medidas de Dispersão A análise de um conjunto de observações com base numa medida de tendência central não nos fornece informações suficientes para o conjunto de valores. Em outras palavras, as medidas de tendência central (médias, moda, mediana) são úteis para identificar um valor típico numa distribuição de freqüência, porém, estes não apresentam as disparidades existentes numa distribuição. Portanto, as medidas de dispersão são utilizadas para avaliar o grau de variabilidade ou dispersão dos valores de uma distribuição em torno da média. Estas medidas permitem estabelecer comparações entre fenômenos de mesma natureza ou de naturezas distintas e, em geral, essa variabilidade é observada em torno de uma medida de tendência central. Entre duas amostras com a mesma média, será mais representativa aquela que apresentar menor dispersão. Dentre as medidas de dispersão destacamos a Amplitude Total, o Desvio Médio e o Quartil, a Variância, o Desvio Padrão e os coeficientes de Variação e de Pearson. Medidas de Dispersão Absolutas Relativas Amplitude Total Desvio Quartil ou Coeficiente de Variação de Pearson Amplitude Semi-interqualítica Variável reduzida Desvio Médio Variância Desvio padrão As absolutas vêm expressas na mesma unidade de medida da variável em estudo. As relativas são as medidas que independem da unidade de medida de variável observada. Servem para estudar comparativamente duas ou mais distribuições com natureza distinta ou com unidades de medida diferentes. 3.2.5 Amplitude Total A Amplitude Total (AT ) é a diferença entre os valores extremos do conjunto. AT = xmax − xmin ( 3.17) A amplitude total é a mais simples das medidas de dispersão. Apresenta uma desvantagem em relação as outras medidas de dispersão por levar em conta apenas os valores mínimo e máximo do conjunto, ou seja, se ocorre qualquer variação no interior do conjunto de dados esta medida não se modifica. Além disso, geralmente sofre a influência de um valor “atípico” (valores elevados o pequenos em relação ao conjunto) na distribuição. ER 3.42. 61

(79) 3.2. SEPARATRIZES 1. Para os valores 30, 35, 38, 45, 48, 50, 56, 60, 65 temos AT = 65 − 30 = 35. 2. Para a tabela abaixo, temos AT = 174 − 150 = 24 altura fi 150 ⊢ 154 4 154 ⊢ 158 9 158 ⊢ 162 11 162 ⊢ 166 8 170 5 170 ⊢ 174 3 166 ⊢ Total 3.2.6 40 Desvio A diferença entre um determinado valor xi de uma amostra e a sua média é chamada de desvio di . ER 3.43. Determine os desvios das seguintes amostras a) X = {1, 3, 5, 7, 9}; b) Y = {1, 1, 3, 3, 3, 3, 5, 5, 5, 5, 5, 5, 5, 7, 7, 7, 7, 9, 9}. Propriedades do desvio 1. A soma algébrica dos desvios tomados em relação à média aritmética é igual a zero, ou seja,

(80)

(81) n n di = i =1 i =1 (xi − ¯x ) = 0. 2. A soma dos quadrados dos desvios tomados em relação à média aritmética é mínima. Em outras palavras, a soma dos quadrados dos desvios, tomados em relação à média aritmética é menor que a soma dos quadrados dos desvios, tomados em relação a qualquer outro elemento diferente da média aritmética. Esta propriedade também é válida para dados tabulados agrupados em classes. ER 3.44. Considere X = {1, 3, 5, 7, 9}. xi 1 3 5 di = xi − ¯x di2 −4 −2 0 7 2 9 4 Soma Tabela 3.22: Fonte: Dados Fictícios 62

(82) Estatística 3.2.7 Desvio Quartil O Desvio Quartil (DQ) é metade da amplitude interqualítica, onde a amplitude interqualítica é a diferença entre dois quartis. DQ = 3.2.8 Q3 − Q1 2 ( 3.18) Desvio Médio O Desvio Médio (DM) é definido como a média aritmética dos valores absolutos dos desvios em relação

(83) à média aritmética de distribuição. n DM = |xi − ¯x | · fi

(84) i =1 n . ( 3.19) fi i =1

(85) Se f1 = f2 = f3 = . . . = fk = 1, então n i =1 DM = |xi − ¯x | n ( 3.20) . O desvio médio apresenta facilidades no cálculo, mas, é pouco empregado devido ao uso de módulos. O seu estudo serve como introdução à construção do desvio padrão. ER 3.45. Calcule o desvio médio para a amostra {1, 3, 4, 5, 7}. 3.2.9 Variância A Variância populacional σ2 é a média aritmética dos quadrados dos valores dos desvios em relação à média aritmética da distribuição. Sendo x1 , x2 , . . . , xn , n valores que a variável x assume e f1 , f2 , . . . , fn , as respectivas freqüências abso-

(86) lutas temos: n σ2 = i =1 (xi − ¯x )2 · fi

(87) n . ( 3.21) fi i =1

(88) Se f1 = f2 = f3 = . . . = fn = 1 então n σ2 = i =1 (xi − ¯x )2 n

(89) ( 3.22) . No caso da Variância amostral se torna conveniente o uso da fórmula n S2 = i =1 (xi − ¯x )2 · fi n−1 . ( 3.23) 63

(90) 3.2. SEPARATRIZES Propriedades da Variância 1. Somando-se ou subtraindo-se um valor constante a cada elemento de um conjunto de dados, a variância não se altera. 2. Multiplicando-se ou dividindo-se por um valor constante cada elemento de um conjunto de dados, a variância fica multiplicada ou dividida pelo quadrado dessa constante. 3.2.10 Desvio Padrão O Desvio Padrão populacional σ é a raiz quadrada da variância populacional, ou seja, sendo x1 , x2 , . . . , xn , 

(91) n valores que a variável x assume e f1 , f2 , . . . , fn , as respectivas freqüências absolutas temos: n i =1 σ= (xi − ¯x )2 · fi

(92) n ( 3.24) . fi i =1 

(93) Se f1 = f2 = f3 = . . . = fn = 1, então n σ= No caso do Desvio Padrão amostral temos i =1 (xi − ¯x )2 n 

(94) ( 3.25) . n S= i =1 (xi − ¯x )2 · fi n−1 ( 3.26) . ER 3.46. Determine o Desvio Padrão populacional para os conjuntos X = {1, 3, 4, 5, 7} e Y = {1, 2, 3, 6, 9, 10, 11}. Solução: Já sabemos que ¯x = 1 + 2 + 3 + 6 + 9 + 10 + 11 1+3+5+7 = 4 e ¯y = = 6 , logo temos: 5 7 (xi − ¯x )2 xi xi 1 3 4 5 7 Total σ= 64 (xi − ¯x )2 1 (3 − 4)2 = 1 3 (1 − 4)2 = 9 2 (4 − 4)2 = 0 6 (7 − 4)2 = 9 10 (5 − 4)2 = 1  20 20 =2 5 9 11 Total σ= (1 − 6)2 = 25 (2 − 6)2 = 16 (3 − 6)2 = 9 (6 − 6)2 = 0 (9 − 6)2 = 9 (10 − 6)2 = 16 (11 − 6)2 = 25  100 100 = 3, 78 7

(95) Estatística ER 3.47. Calcular o desvio padrão considerando as notas de Matemática de 10 alunos de uma determinada classe como sendo {2, 2, 3, 4, 4, 4, 5, 5, 6, 7}. Solução: xi fi 2 2 3 1 4 3 5 2 6 1 7 1 Total 10 xi · fi (xi − ¯x )2 · fi xi − ¯x Se os dados so agrupados em intervalos de classe, basta representar cada classe, por seu ponto médio. ER 3.48. Calcule o desvio padrão populacional considerando a tabela Notas fi 0 ⊢ 2 4 2 ⊢ 4 10 4 ⊢ 6 16 6 ⊢ 8 6 8 ⊢ 10 4 xi fi · xi di di2 di2 · fi Total Q. 1. As amostras abaixo, apresentadas por um gráfico de freqüência acumulada e por uma distribuição de freqüências agrupadas em classes, representam as notas tiradas por alunos de duas turmas de Geometria Analítica da Faculdade SIMAT no ano de 2.006. Com base na média aritmética analise qual turma se saiu melhor. Caso necessário, utilize o coeficiente de variação de Pearson (C V ) como fator de determinação. Turma A F ci Turma B 10 0 8 2 6 4 4 6 2 8 Notas fi ⊢ 2 1 ⊢ 6 3 ⊢ 10 4 ⊢ 4 7 ⊢ 8 1 Total 0 2 4 6 8 10 Notas Fonte: Faculdade SIMAT Propriedades do Desvio Padrão 1. Somando-se ou subtraindo-se um valor constante a cada elemento de um conjunto de dados, o desvio padrão no se altera. Por exemplo, se numa turma de 40 alunos a idade média é de 16 anos 65

(96) 3.2. SEPARATRIZES com desvio padrão de 1, 5 ano, qual será o desvio padrão de idade para esse mesmo grupo 10 anos depois? 2. Multiplicando se ou dividindo se por um valor constante a cada elemento de um conjunto de dados, o desvio padrão fica multiplicado ou dividido pela constante. Por exemplo, se o custo médio da cesta básica é de R$56, 00, com desvio padrão de R$6, 10 e se o governo aumentar em 5% o preço de todos os produtos, em quanto ficará a dispersão no custo da cesta básica após o aumento? Resposta: 56 · 1, 05 = 58, 80 e o desvio padrão: 6, 10 · 1, 05 = 6, 41. 3. O Desvio Padrão possui a mesma unidade de medida original da variável original, enquanto que a Variância apresenta a unidade de medida elevado ao quadrado. 3.2.11 Relações Importantes para o Desvio Padrão  A relação entre as fórmulas de Desvio Padrão populacional e amostral é dada pela equação σ=S n−1 . n ( 3.27) O esforço computacional que a fórmula na equação ( 3.24) pode ser diminuída se fizermos a seguinte simplificação:

(97)

(98)

(99) n σ2 = i =1 (xi − ¯x ) n =

(100)

(101) n xi2 i =1

(102) − 2¯x xi + n¯x 2 i =1 n

(103) n xi + n xi + i =1 ¯x 2 i =1 

(104) 

(105) xi n n = i =1 2 n xi2 i =1 − n n 2 n n − 2¯x 2

(106) 

(107)  i =1 n n i =1 i =1 xi2 xi − i =1 . n 

(108) 

(109)  Conseqüentemente, n 2 n xi2 σ= i =1 n xi i =1 − n

(110) Na 5◦ igualdade utilizamos n ¯x = 66 i =1 xi n

(111)

(112) n xi2 n n = = 

(113)  i =1 xi −2 2 n n i =1 − 2xi ¯x + ¯x i =1 = n xi2 n xi2 n n =

(114) n 2 i =1 n xi . . ( 3.28)

(115) Estatística 

(116) 

(117)  Para uma distribuição de freqüências podemos utilizar n σ= n xi2 fi i =1 n 2 xi fi i =1 − . n ( 3.29) EP 3.58. Calcule o desvio médio, o desvio padrão, a variância (use os dois processos) e os coeficientes nas alternativas abaixo. O que se pode dizer sobre a Curva de Freqüência? Classes fi F ci 240 ⊢ 260 7 260 ⊢ 280 20 280 ⊢ 300 33 300 ⊢ 320 25 420 ⊢ 440 11 440 ⊢ 460 4 Total Tabela 3.23: Fonte: Dados Fictícios. 3.2.12 Coeficiente de Variação de Pearson O Coeficiente de Variação de Pearson C V é um valor relativo para um conjunto de n observações e é definido como o quociente entre o desvio padrão e a média aritmética da distribuição, ou seja CV = σ ¯x ou CV = S . ¯x ( 3.30) É uma medida relativa de dispersão utilizada para comparar o grau de concentração em torno da média de séries distintas. Uma distribuição pode ser classificada quanto a sua variabilidade. Dizemos que ela possui pequena variabilidade quando o coeficiente de variabilidade for, no máximo, 10%. A variabilidade é média quando o coeficiente de variabilidade estiver entre 10% e 20%. Acima de 20% dizemos que a distribuição possui grande variabilidade. ER 3.49. Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: ¯x σ Estaturas 175cm 5, 0cm Pesos 68kg 2, 0kg Qual das medidas (Estatura ou Peso) possui maior homogeneidade? Para responder a esta questão devemos calcular o C V da Estatura e o do Peso. Aquele que apresentar menor valor será o de maior homogeneidade (menor dispersão ou variabilidade). 5 2 = 2, 85% C Vpeso = = 2, 94%. 175 68 Logo, nesse grupo de indivíduos, as estaturas são mais homogêneas que o peso. C Vestatur a = 67

(118) 3.3. ASSIMETRIA Atividade EP 3.59. Considere a tabela Estaturas (cm) 171 175 182 186 188 Pesos (Kg) 64 72 81 80 80 Determine, para cada uma das medidas: (a) a média aritmética; (b) o desvio padrão; (c) o coeficiente de variação de Pearson. 3.3 Assimetria Uma distribuição pode ser classificada quanto a assimetria onde é observado o grau de afastamento que uma distribuição possui relativamente a uma unidade de simetria. Uma distribuição simétrica possui os mesmos valores para a média, a moda e a mediana. Já as assimetrias podem ser positiva ou à direita (Mo < Md < ¯x ), ou negativa ou à esquerda (¯x < Md < Mo). A assimetria da distribuição pode, também, ser constatada se: - se (Md − Q1 ) < (Q3 − Md), então a assimetria é à direita ou positiva; - se (Md − Q1 ) > (Q3 − Md), então a assimetria é à esquerda ou negativa; - se (Md − Q1 ) = (Q3 − Md), então a distribuição é simétrica. Podemos, também, classificar uma distribuição através de coeficientes. Vejamos algumas relações que determinam importantes coeficientes de assimetria. 3.3.1 Coeficientes de Assimetria de Pearson A razão entre a diferença entre a média e a moda e o desvio padrão. CAS = ¯x − Mo ¯x − Mo . ou AS = σ S ( 3.31) Uma outra relação atribuída também a Pearson e que também mede o grau de simetria de uma distribuição é dada por CAS = Q1 + Q3 − 2Md . Q3 − Q1 ( 3.32) Em ambos os casos temos que: se CAS = 0, então dizemos que a distribuição é simétrica; se CAS > 0, a distribuição é assimétrica positiva, caso contrário a distribuição é assimétrica negativa. Nas distribuições assimétricas, os valores Normais são aqueles que pertencem ao intervalo definido por (¯x − σ, ¯x + σ) denominado Zona de Normalidade. 68

(119) Estatística EP 3.60. Calcule os coeficientes de Pearson para a distribuição amostral: Salário dos funcionários da ACB-2004 Salário fi 240 ⊢ 260 7 260 ⊢ 280 20 300 ⊢ 320 25 340 ⊢ 360 4 280 ⊢ 300 33 320 ⊢ 340 11 F ci Total Tabela 3.24: Fonte: Dados Fictícios. 3.4 Curtose Curtose é o grau de achatamento de uma distribuição em relação a uma distribuição padrão, também denominada curva normal ou Mesocúrtica . Quando a distribuição apresenta: uma curva de freqüência mais fechada que a normal (mais delgada, mais aguda ou afilada em sua parte superior), ela recebe o nome de Leptocúrtica ; uma curva de freqüência mais aberta que a normal (ou mais achatada em sua parte superior), ela recebe o nome de Platicúrtica. O coeficiente de Curtose ou percentílico K= Q3 − Q1 2(C90 − C10 ) é utilizado para determinarmos se a curva de freqüência é Mesocúrtica (K ( 3.33) = 0, 263), Platicúrtica (K > 0, 263) ou Leptocúrtica (K < 0, 263). ER 3.50. O que dizer sobre a curva de distribuição do exemplo 3.48? 3.4.1 Atividade EP 3.61. Dada a amostra 2, 3, 5, 6, 7, 8, 10, 11, 12 calcule: a) a amplitude total; b) o desvio médio; c) a variância; d) o coeficiente de variação de Pearson; e) o tipo de assimetria. 69

(120) 3.5. REPRESENTAÇÃO GRÁFICA USANDO SEPARATRIZES 3.5 Representação gráfica usando separatrizes 3.5.1 Box-plot O Box-plot é uma representação gráfica alternativa ao histograma que fornece informações sobre as seguintes características de um conjunto de dados: - locação; - dispersão; - assimetria; - comprimento da cauda; e - outliers (observações discrepantes). Pontos discrepantes podem afetar as decisões a serem tomadas a partir da análise dos dados se não forem devidamente considerados. O box-plot é uma ferramenta gráfica que ajuda a identificar a existência de possíveis valores discrepantes (outliers) no conjunto de dados. Nesta etapa do Curso não estaremos preocupados com o tratamento a ser dado a observações discrepantes, vamos apenas detectá-las. Características principais do Box-plot (a) Retângulo alinhado verticalmente (mais comumente) com dois segmentos de reta, um em cada um dos lados opostos do retângulo. (b) A altura do retângulo é definida pela distância entre os quartis Q1 e Q3 . (c) Uma linha secciona o retângulo no valor correspondente à mediana (Md). (d) Se não existem valores considerados discrepantes no conjunto de dados, dois segmentos de reta ligam, respectivamente, os quartis Q1 e Q3 ao valor mínimo e máximo do conjunto de dados. (e) Caso existam valores discrepantes, o comprimento dos segmentos de reta informam sobre a cauda da distribuição. As observações do conjunto de dados que se encontram fora de Q1 − 1, 5 · (Q3 − Q1 ) e de Q3 + 1, 5 · (Q3 − Q1 ), chamados de outside, devem ser investigados como possíveis outliers. Valores outside não são necessariamente outliers, mas um outlier usualmente aparece no gráfico como um outside. Não existe uma única forma de apresentar um box-plot. Diferentes livros (e softwares) adotam variações na apresentação dos pontos extremos. EP 3.63. Verificar, utilizando o Box-plot, se há alguma indicação de que uma dieta foi mais eficiente do que a outra, utilizando as variáveis peso ao nascer e diferença no peso após dez dias segundo a dieta utilizada nas crianças prematuras. 70

(121) Estatística Teoria das Probabilidades Probabilidade A Teoria das Probabilidades, de modo geral, visa definir um modelo matemático não determinístico (probabilístico ou estocástico) que seja conveniente a descrição e interpretação de fenômenos aleatórios. 4.1 4.1.1 Introdução Considerações Iniciais 4.10 Definição. [Experimento Aleatório] Um experimento E é aleatório quando está sujeito a influências de fatores casuais e, como conseqüência destes, não podemos precisar o seu resultado. Os experimentos aleatórios são caracterizados por: - Repetições sob as mesmas condições; - O conjunto de todos os resultados possíveis do experimento pode ser descrito, porém, não podemos afirmar que resultado em particular ocorrerá; - Quando o experimento for repetido um grande número de vezes, ocorrerá uma regularidade nos resultados. ER 4.51. São exemplos de experimentos aleatórios: 1. Lançar uma moeda e observar a face de cima; 2. Lançar um dado e observar a face de cima; 3. Lançar um dado várias vezes e observar as seqüências obtidas; 4. De uma urna contendo bolas brancas e bolas pretas, retirar uma e observar a sua cor; 5. De um baralho contendo 52 cartas, selecionar uma carta e observar o seu naipe. 4.11 Definição. [Espaço Amostral] O conjunto S de todos os resultados possíveis de um experimento aleatório é chamado de Espaço Amostral. ER 4.52. 1. E1 : Jogar uma moeda e observar a face superior. S1 = {Cara, Coroa}. 71

(122) 4.1. INTRODUÇÃO 2. E2 : Jogar um dado e observar o número da face de cima. S2 = {1, 2, 3, 4, 5, 6}. 3. E3 : Consumo de energia elétrica de uma residência em um dia (em K w h). S3 = {x ∈ R : x > 0}. 4. E4 : Número de ligações novas de energia elétrica no mês Y . S4 = {0, 1, 2, 3, . . .}. Diremos que um espaço amostral S é finito se #S = n ∈ N. Caso contrário diremos que S é infinito. EP 4.64. Dar o espaço amostral para cada experimento abaixo. (a) Uma letra é escolhida entre as letras da palavra matemática; (b) Uma bola é extraída de uma urna contendo bolas azuis (A), brancas (B) e vermelhas (V), e é observada sua cor; (c) Uma carta é extraída de um baralho contendo 52 cartas e é observado seu naipe; (d) Um casal deseja ter 3 filhos; (e) Dois dados lançados; (f) Escolher, entre 5 pessoas, 2 para formar uma comissão. 4.12 Definição. [Evento] Dado um experimento aleatório cujo espaço amostral é S, chamaremos de Evento qualquer subconjunto do espaço amostral S. Denotamos um evento através de uma letra maiúscula qualquer do alfabeto. Se um espaço amostral S possui n elementos, então S possuirá 2n subconjuntos e, portanto, 2n eventos. Em particular, o evento S é chamado de evento certo, o conjunto vazio de evento impossível e o evento que possui um único elemento de evento elementar. ER 4.53. No lançamento de um dado S = {1, 2, 3, 4, 5, 6} consideremos os eventos - A: ocorrer um número par, A = {2, 4, 6}. - B: ocorrer um número primo, B = {2, 3, 5}. - C : ocorrer um número maior que 6, C = ∅. ER 4.54. Uma moeda é lançada duas vezes S = {(K , K ); (K , C ); (C , K ); (C , C )} e observa-se a seqüência de caras K e coroas C . Consideremos os seguintes eventos: - A: ocorrer coroa no primeiro lançamento, A = {(C , K ); (C , C )}. - B: ocorrer, no máximo, uma cara, B = {(K , C ); (C , K ); (C , C )}. 72 - C : ocorrer exatamente duas coroas, C = {(C , C )}.

(123) Estatística Atividade EP 4.65. Descrever o espaço amostral para cada um dos seguintes experimentos: (a) Observar o sexo de uma criança ao nascer. (b) Lançar uma moeda três vezes sucessivamente e observar a face voltada para cima. Anotar a seqüencia de caras e coroas. (c) Lançar uma moeda três vezes sucessivamente e observar a face voltada para cima. Registrar o número de caras ocorrido. (d) Registrar o número de pessoas atendidas num ambulatório no período de vinte e quatro horas. (e) Lançar uma moeda e um dado, simultaneamente, e registrar os resultados ocorridos nas faces voltadas para cima. (f) Um lote de dez pecas contem três defeituosas. As pecas sao retiradas uma a uma, sem reposição, ate que a ultima peca defeituosa e encontrada. O número total de pecas retiradas e registrado. (g) Pecas sao fabricadas ate que dez pecas perfeitas sejam produzidas. O número total de pecas fabricadas e anotado. (h) Registrar o tempo de vida de uma lampâda. (i) De uma baralho completo de 52 cartas retira-se, ao acaso, uma carta e observa-se o resultado. EP 4.66. Determine o número de elementos do espaço amostral do experimento: observar os lados voltados para cima ao lançarmos uma moeda, um dado e depois uma moeda. EP 4.67. Cite, dentro da sua area de estudo, dois exemplos sobre experimentos aleatórios e para cada um descreva o espaço amostral. 4.1.2 Operações com Eventos A união e a interseção de conjuntos servem como operadores que, combinados a eventos, são capazes de produzir outro evento distinto dos originais. 4.13 Definição. [União de eventos] Consideremos dois eventos A e B. O evento união A ∪ B é um novo evento e ocorre quando o evento A, o evento B ou ambos os eventos ocorrem. 4.14 Definição. [Interseção de eventos] Consideremos dois eventos A e B de um espaço amostral S. O evento interseção A ∩ B é um novo evento e ocorre quando os eventos A e B ocorrerem simultaneamente. ¯ de um evento A de um espaço amostral S é 4.15 Definição. [Evento complementar] O complementar A um novo evento que ocorre quando A não ocorre. ER 4.55. Ao lançar um dado e observar a face superior, considere os seguintes eventos: A: ocorrência de número par; (A = {2, 4, 6}); B: ocorrência de número ímpar; (B = {1, 3, 5}); C : ocorrência de número menor que quatro C = {1, 2, 3}. Obtenha: 73

(124) 4.1. INTRODUÇÃO (a) A ∪ B; (c) A ∪ C . (b) A ∩ B; ¯ ∩C ¯. (d) A 4.16 Definição. [Eventos mutuamente exclusivos] Dois eventos A e B de um espaço amostral finito S são mutuamente exclusivos se eles não ocorrem simultaneamente, isto é, quando A ∩ B = ∅. ER 4.56. No lançamento de um dado considerarmos A o evento ocorrer número par e B o evento ocorrer número ímpar. Verificamos, portanto, que se trata de eventos mutuamente exclusivos. Atividade EP 4.68. Sejam A, B e C três eventos quaisquer. Estabeleça uma expressão para os eventos abaixo utilizando a Teoria dos Conjuntos e construa o Diagrama de Venn correspondente: (a) A e B ocorrem; (e) não ocorre A e não ocorre B; (b) A ou B ocorrem; (f) A e B ocorrem, mas C não ocorre; (c) B ocorre, mas A não ocorre; (g) A e C ocorrem, mas B não ocorre; (d) A não ocorre; (h) somente A ocorre. EP 4.69. Sendo S = {10, 20, 30, 40, 50, 60, 70, 80, 90, 100}, listar cada um dos subconjuntos de S: (a) A = {a|a é exatamente divisível por 3}; ¯ ∩ A; ¯ (e) B (b) B = {b|b é exatamente divisível por 4}; ¯ ∪ B; ¯ (e) A (c) C = A ∪ B; (f) B − A; (d) A ∩ B; (g) A − B. EP 4.70. Considere o lançamento de uma moeda e um dado, simultaneamente, e registrar os resultados ocorridos nas faces voltadas para cima. Com base no experimento relacione os elementos dos seguintes eventos: (a) A: aparece coroa e número ímpar; (d) D: aparece número ímpar; (b) B: aparece coroa e número par; (e) A ∪ B; (c) C : aparece coroa; (f) A ∪ B ∪ D. EP 4.71. Uma urna contém 30 bolas numeradas de 1 a 30. Uma bola é escolhida e observada o seu número. Descreva os seguintes eventos quando o número obtido é: A: par; E : múltiplo de 2 e 5; B: ímpar; F : múltiplo de 3 ou 8; C : primo; G : múltiplo de 2 ou 6; D: maior que 20; H: não múltiplo de 6. EP 4.72. Dois dados, um azul e outro vermelho, são lançados nesta ordem. Descrever os eventos: A: ocorre 3 no dado azul; B: ocorrem mesmos números em ambos os dados; C : ocorre número 5 em ao menos um dado; 74 D: ocorrem números cuja soma é oito; E : ocorrem números cuja soma é maior que oito; F : ocorrem números cujo produto é seis.

(125) Estatística EP 4.73. São lançados um dado e uma moeda. Descreva os eventos: A: ocorre cara; A ∪ B; ¯ A; B: ocorre número par; B ∩ C; ¯; C C : ocorre o número 3; A ∩ C; ¯ ∩ C. B EP 4.74. Considere os conjuntos A = {1, 2, 3, 4}, B = {1, 2, 3, 4, 5} e A × B. Descreva os eventos: E1 = {(a, b); a = b}; E5 = {(a, b); b = a2 + 1}; E2 = {(a, b); a > b}; E6 = {(a, b); a2 + b 2 = 2a}; E3 = {(a, b); a + b = 3}; E7 = {(a, b); a2 + b 2 = b}; E4 = {(a, b); b = 2}; E8 = {(a, b); a = 3}. EP 4.75. Uma urna 1 contendo duas bolas cinzas e três bolas pretas e uma urna 2 contendo cinco bolas cinzas e seis bolas pretas. Uma urna é escolhida e dela extraída uma bola e observada sua cor. Descreva os eventos: E1 : a urna escolhida é 1; E5 = E1 ∪ E2 ; E2 : a urna escolhida é 2; E6 = E1 ∩ E3 ; E3 : a bola escolhida é cinza; E7 = E¯4 ; E4 : a bola escolhida é preta; E8 = E¯1 ∩ E¯3 . EP 4.76. Lança-se um dado e uma moeda. Enumere os seguintes eventos: A = {número ímpar; cara} C = { número primo; cara} B = {número par; coroa} D = { múltiplos de 4} 4.2 Cálculos Probabilísticos 4.2.1 Definindo a Probabilidade de um Evento Consideremos um experimento aleatório com espaço amostral S = {s1 , s2 , . . . , sk } e suponhamos que o ex- perimento tenha sido repetido N vezes, nas mesmas condições. A razão entre a quantidade de vezes (ni ) que um determinado evento elementar {si } ocorre e a quantidade de repetições do experimento é chamada de freqüência ni relativa (f ri ), isto é, f ri = , ∀ i. Pode-se observar que N 1. 0 ≤ f ri ≤ 1, ∀ i;

(126) k 2. i =1 f ri = n2 nk n1 + n2 + . . . + nk N n1 + + ...+ = = = 1. N N N N N

(127) 3. se A

(128) = ∅ é um evento qualquer de S, a freqüência relativa f rA deste evento é dada por: f rA = f ri ; ai ∈A 4. a freqüência relativa de um evento A ⊂ S tende a se estabilizar na vizinhança de um determinado valor quando o número de repetições do experimento aleatório é suficientemente grande. 75

(129) 4.2. CÁLCULOS PROBABILÍSTICOS Ao repetirmos um experimento aleatório um grande número de vezes, nas mesmas condições, sabemos que determinados eventos ocorrem com maior freqüência relativa que outros. Esta informação quantitativa dada pela freqüência relativa e suas propriedades, nos ajudará a definir um número chamado de probabilidade de um evento. Dados um experimento aleatório E e um espaço amostral S = {si , 1 ≤ i ≤ n}, a cada evento elementar Si = {si } associamos um número real P(Si ) = pi , chamado a probabilidade do evento elementar Si , satisfazendo as seguintes propriedades (1) 0 ≤ pi ≤ 1, ∀ i ∈ {1, 2, . . . , n};

(130) n (2) pi = 1. i =1 Os números pi associados à probabilidade de um evento elementar definem uma distribuição de probabilidade sobre o espaço amostral S. Podemos estender o conceito de probabilidade para um evento arbitrário A de um espaço amostral S se considerarmos a aplicação: P:S

(131) 0 P(A) = p → [0, 1] A → i se A = ∅ , se A

(132) = ∅ , si ∈A ou seja, a probabilidade P(A) de um evento qualquer A de um espaço amostral finito S é a soma das probabilidades dos eventos elementares que o constituem. A priori, quaisquer valores pi satisfazendo as propriedades (1) e (2) constituem uma distribuição de probabilidades sobre o espaço amostral S, porém, devemos entender o número pi como sendo um valor próximo da freqüência relativa f ri , quando o experimento aleatório é repetido um grande número de vezes. Em particular, dizemos que uma distribuição de probabilidades sobre S = {s1 , s2 , . . . , sk } é equiprovável se p1 = p2 = . . . = pk , isto é, se todos os ventos elementares de S possuem a mesma probabilidade. Seja S = {s1 , s2 , . . . , sk } um espaço amostral equiprovável cuja distribuição de probabilidades é dada por r 1 pi = . A probabilidade P(A) de um evento A = {s1 , s2 , . . . , sr } é . De fato, N N

(133) P(A) =

(134) 1

(135) i =1 i =1 r r pi = i =1 1 = N N r 1= r . N Um evento qualquer pode ser obtido de outros através de operações conhecidas em teoria de conjuntos. A partir da definição de probabilidade de um evento vamos estender o cálculo de probabilidades para a resolução de uma série de problemas que envolvem estes eventos. 4.17 Teorema. Se A e B são eventos mutuamente exclusivos, então P(A ∪ B) = P(A) + P(B). Prova. Seja o evento A = {a1 , a2 , . . . , ar }, onde ai

(136) = aj , ∀ i, j, e o evento B = {ar +1 , ar +2 , . . . , ar +q }, então 76

(137) r +q P(A ∪ B) = i =1

(138) i =1

(139) q r pi = pi + k=r +1 pk = P(A) + P(B). ✷

(140) Estatística 4.18 Teorema. Considere ∅, A e B eventos de um espaço amostral S. 1. A probabilidade de ∅ é zero; 2. A probabilidade de um evento certo é um, isto é, P(S) = 1; ¯ é o complemento do evento A, então P(A) ¯ = 1 − P(A); 3. Se A 4. Se A ⊂ B, então P(A) ≤ P(B); 5. P(A ∪ B) = P(A) + P(B) − P(A ∩ B). Prova. 1. Temos que, para todo A ⊂ S, A ∩ ∅ = ∅, e, pelo teorema 4.17 P(A) = P(A ∪ ∅) = P(A) + P(∅). Logo, P(∅) = 0 ✷.  2. P(S) = P({s1 , s2 , . . . , sk }) = P ∪ki=1 {si } = k

(141) pi = 1 ✷ i =1 ¯ ∪A=S e A ¯ ∩A=∅ 3. Sabemos que A ¯ ∪ A) = P(A) ¯ + P(A). 1 = P(S) = P(A ¯ = 1 − P(A). ✷ Logo, P(A) ¯ ∩ B) teremos que 4. Se escrevermos B = A ∪ (A ¯ ∩ B)) = P(A) + P(A ¯ ∩ B). P(B) = P(A ∪ (A ¯ ∩ B) ≥ 0. Logo, P(B) ≥ P(A). ✷ Portanto, P(B) − P(A) = P(A 5. Sejam A e B dois eventos distintos tais que A ∩ B

(142) = ∅. Observe que:  ¯ ∩ B) = ∅ A ∩ (A ¯ B = (B ∩ A) ∪ (B ∩ A) Logo, P(A ∪ B) = P(B) = ¯ ¯ = P(A) + P(B ∩ A) ¯ P(A ∪ ((B ∩ A) ∪ (B ∩ A))) = P(A ∪ (B ∩ A)) ¯ = P(B ∩ A) + P(B ∩ A). ¯ P((B ∩ A) ∪ (B ∩ A)) Logo, P(A ∪ B) − P(B) = P(A) − P(A ∩ B). Segue que P(A ∪ B) = P(A) + P(B) − P(A ∩ B). ✷ ER 4.57. No lançamento de um dado qual a probabilidade de (a) obtermos um número maior que 2 e primo? (b) obtermos um número menor que 4 ou primo? (c) não obtermos um número menor que 5? 77

(143) 4.2. CÁLCULOS PROBABILÍSTICOS Atividade EP 4.77. Determinar a probabilidade de cada um dos seguintes eventos: (a) Aparecer exatamente duas caras em três lances de uma moeda honesta; (b) Aparecer pelo menos uma cara em três lances de uma moeda honesta; (c) Retirar um “dez de paus” ao extrairmos uma carta de um baralho completo de 52 cartas; (d) Aparecer a soma “oito” no lançamento de dois dados; (e) Retirar uma carta de “paus” ou uma “figura”, numa única extração, de um baralho completo de 52 cartas; (f) Aparecer coroa no próximo lance de uma moeda se de um total de 100 lances 56 foram caras. EP 4.78. Uma urna contém quatro bolas azuis, três vermelhas e duas brancas. Calcule a probabilidade de, se retirarmos uma bola ao acaso: (a) ser vermelha; (c) ser vermelha ou branca; (b) não ser vermelha; (d) ser azul. EP 4.79. Dados P(A) = 1/2; P(B) = 3/8; e P(A ∩ B) = 1/8, calcule: (a) P(A ∪ B); ¯ ∩ B); ¯ (b) P(A ¯ ∪ B); ¯ (c) P(A ¯ ∩ B); (d) P(A ¯ (e) P(A ∩ B); ¯ (f) P(A ∪ B). EP 4.80. Um espaço amostral e dividido em três regiões mutuamente exclusivas A1 , A2 e A3 . Se P(A1 ) = 1/2, P(A2 ) = 1/3 e P(A3 ) = 1/6, calcule: (a) P(A1 ∪ A2 ); (c) P(A¯1 ); (b) P(A1 ∪ A2 ∪ A3 ); (d) P(A1 ∪ A2 ). ¯ e P(B), ¯ achar P(A ∪ B). EP 4.81. Se P(A ∪ B) EP 4.82. Uma companhia de seguros analisou a freqüência com que 2.000 segurados usaram o hospital, distribuídos segundo a tabela abaixo. Escolhe-se um segurado ao acaso. Sendo definidos os eventos A: o segurado usou o hospital e B: o segurado é homem, determine: ¯ ∪ B); ¯ (a) P(A ¯ ∩ B); (b) P(A (c) P(A ∩ B). Homens Mulheres Usaram o hospital 100 150 Não usaram o hospital 900 850 EP 4.83. Uma associação de indústrias transformadoras de resinas plásticas e composta de 20 empresas que produzem sacos plásticos (S), 10 que produzem garrafas (G), 8 que produzem utensílios domésticos (U) e duas que se encarregam de brinquedos (B). Ao escolhermos uma empresa ao acaso, achar a probabilidade de que: (a) seja uma industria que produza sacos plásticos ou utensílios domésticos; 78

(144) Estatística (b) seja uma industria produtora de sacos plásticos ou brinquedos; (c) não seja uma industria que produza garrafas. 4.2.2 Probabilidade Condicional 4.19 Definição. Sejam A e B dois eventos de um espaço amostral finito S. A probabilidade do evento A, condicionada ao evento B, denotado por P(A|B), isto é, a probabilidade do evento A visto que B ocorreu, é a probabilidade do evento A adotando-se B como sendo o novo espaço amostral ao invés de S. ER 4.58. No lançamento de um dado é observado o número da face superior.Considere os eventos: A: a face é um número ímpar; B: a face é um número maior que um. Qual a probabilidade de ter sido ímpar uma vez que o número era maior que um? Solução: P(A|B) = 2 . 5 ER 4.59. A tabela a seguir retrata a distribuição do número de formandos por curso em uma universidade U distinguindo-se o sexo. Engenharia E Direito D Biologia B Masculino 20 50 30 100 Feminino 10 30 40 80 30 80 70 Uma pessoa é escolhida ao acaso. Qual a probabilidade de (a) a pessoa fazer biologia, ser do sexo feminino? (b) a pessoa ser do sexo feminino, fazer biologia? (c) a pessoa fazer engenharia, ser do sexo masculino? (d) a pessoa ser do sexo masculino, fazer direito? Dados dois eventos A e B associados a um mesmo espaço amostral S, se P(B) > 0, então podemos ainda definir a probabilidade de ocorrência do evento A condicionado a ocorrência do evento B ou probabilidade de A dado B, por: P(A|B) = P(A ∩ B) , P(B) P(B) > 0, ( 4.34) em que P(A ∩ B) e P(B) são calculados em relação ao espaço amostral S. EP 4.84. Com os dados do exemplo anterior, calcular a probabilidade da (a) pessoa fazer biologia e ser do sexo masculino? 79

(145) 4.2. CÁLCULOS PROBABILÍSTICOS (b) pessoa fazer engenharia e ser do sexo feminino? (c) pessoa ser do sexo feminino e fazer direito? EP 4.85. Imagine que um dado foi jogado. Já entendemos que a probabilidade de ocorrer o número 3 é igual a 1/6. Agora imagine que o dado foi jogado e sem que vejamos o resultado alguém nos informa que ocorreu um número ímpar. Qual a probabilidade de que seja o número 3? EP 4.86. No lançamento de dois dados considere os eventos: A: O primeiro dado apresenta o número 2; B: A soma dos dois números é 6. Calcule P(A|B) e P(B|A). 4.2.3 Probabilidade da ocorrência simultânea de eventos 4.20 Teorema. [do Produto] A probabilidade da ocorrência simultânea de dois eventos A e B de um espaço amostral finito S é o produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro. Prova. Da definição de probabilidade condicional, temos P(A|B) = P(A ∩ B) . P(B) Portanto, P(A ∩ B) = P(B) · P(A|B). ✷ ER 4.60. Uma urna I contém 2 bolas vermelhas e 3 brancas e uma urna I I contém 4 bolas vermelhas e 5 brancas. Uma urna é escolhida ao acaso e dela uma bola é extraída ao acaso. Qual a probabilidade de observamos: Urna I e bola vermelha? Solução: P(UI ∩ V ) = P(UI ) · P(V |UI ) = 1 1 2 · = . 2 5 5 ER 4.61. Em um lote de 12 peças, 4 são defeituosas, 2 peças são retiradas uma após a outra sem reposição. Qual a probabilidade de que ambas sejam boas? Solução: P(B1 ∩ B2 ) = P(B1 ) · P(B2 |B1 ) = 14 8 7 · = . 12 11 33 Podemos generalizar o teorema do produto para mais de dois eventos. 4.21 Teorema. Sejam A1 , A2 , . . . , An , n eventos de um espaço amostral finito S. A probabilidade de ocorrência simultânea destes eventos é dado por: P(A1 ∩ A2 ∩ · · · ∩ An ) = P(A1 ) · P(A2 |A1 ) · P(A3 |A1 ∩ A2 ) · . . . · P(An |A1 ∩ A2 ∩ . . . ∩ An−1 ). ER 4.62. Uma urna contém duas bolas brancas, três vermelhas e cinco azuis. Qual a probabilidade de se retirar, sem reposição, uma bola azul, uma branca e uma vermelha, exatamente nessa ordem? 80

(146) Estatística Solução: P(A ∩ B ∩ V ) = P(A) · P(B|A) · P(V |A ∩ B) = 1 5 2 3 · · = . 10 9 8 24 ER 4.63. Duas cartas são retiradas ao acaso de um baralho completo de 52 cartas. Determine a probabilidade de ambas serem valete, se a primeira carta: (a) foi recolocada antes de extrair a segunda; (b) não foi recolocada antes de extrair a segunda. 4.2.4 Independência de eventos 4.22 Definição. Um evento A é considerado independente de outro B, ambos do mesmo espaço amostral S, se a ocorrência de B não afeta a probabilidade do evento A, ou seja, A independe de B se P(A|B) = P(A). 4.23 Proposição. Considere os eventos A e B de um espaço amostral finito. Se A independe de B, então B independe de A. Desta forma, diremos que A e B são independentes. Prova. Suponha que A independe de B, ou seja, P(A) = P(A|B). Utilizando-se do teorema do produto, temos que: P(B|A) = P(B) · P(A|B) P(B) · P(A) P(A ∩ B) = = = P(B). ✷ P(A) P(A) P(A) 4.24 Definição. Dois eventos são ditos dependentes quando não são independentes. 4.25 Proposição. Se dois eventos A e B de um mesmo espaço amostral finito são independentes, então P(A ∩ B) = P(A) · P(B).  Prova. P(A ∩ B) = P(A) · P(B|A) P(B) · P(A|B) = P(A) · P(B) = P(B) · P(A) ✷ ER 4.64. Uma moeda é lançada 3 vezes. Sejam os eventos A: Ocorrer pelo menos duas caras; B: Ocorrer resultados iguais nos 3 lançamentos. Os eventos são independentes? Solução: P(A ∩ B) = 4 2 1 1 , P(A) = e P(B) = . P(A) · P(B) = . Logo, os eventos são independentes. 8 8 8 8 Podemos generalizar a definição independência para mais de dois eventos. Os n eventos A1 , A2 , . . . , An são independentes se P(Ai ∩ Aj ) P(Ai ∩ Aj ∩ Ak ) P(A1 ∩ A2 ∩ · · · ∩ An ) = P(Ai ) · P(Aj ); ∀ i, j, i

(147) = j; = P(Ai ) · P(Aj ) · P(Ak ); ∀ i, j, k i

(148) = j

(149) = k; .. . = P(A1 ) · P(A2 ) · . . . · P(An ). ER 4.65. Um dado é lançado 8 vezes. Qual a probabilidade de observarmos a face 2 em todos os lançamentos? 81

(150) 4.2. CÁLCULOS PROBABILÍSTICOS Solução: Considere os eventos A1 : ocorrer 2 no primeiro lançamento; A2 : ocorrer 2 no segundo lançamento; .. . A8 : ocorrer 2 no oitavo lançamento. Como o resultado de um lançamento não influencia os de outros, os eventos Ai , i = {1, 2, . . . , 8}, são independentes. Logo: 1 1 1 P(A1 ∩ A2 ∩ · · · ∩ A8 ) = P(A1 ) · P(A2 ) · . . . · P(A8 ) = · · . . . · = 6 6 6   8 1 6 . ×8 ER 4.66. Qual a probabilidade de que a face 5 seja observada pelo menos uma vez em 8 lançamentos de uma dado? Solução: Considere os eventos A1 : ocorre um número diferente de 5 no primeiro lançamento; A2 : ocorre um número diferente de 5 no segundo lançamento; .. . A8 : ocorre um número diferente de 5 no oitavo lançamento. Como o resultado de um lançamento não influencia os de outros, os eventos Ai , i = {1, 2, . . . , 8} são independentes, então a probabilidade de não observamos a face 5 nestes lançamentos é dado por: P(A1 ∩ A2 ∩ · · · ∩ A8 ) = P(A1 ) · P(A2 ) · . . . · P(A8 ) = 5 5 5 · ·...· = 6 6 6   8 5 6 . ×8 Como o evento A: observar a face 5 pelo menos uma vez em 8 lançamentos é o evento complementar do evento B: não observar a face 5 em 8 lançamentos, temos: ¯ = 1 − P(B) = 1 − P(A) = P(B)  8 5 6 . ¯ A ¯ e B, A ¯ eB ¯ são também 4.26 Proposição. Se A e B são dois eventos independentes, então A e B, independentes. ¯ independentes, pois a prova dos demais casos é análoga. Prova. Mostremos o caso A e B Por hipótese P(A|B) = P(A) e P(B|A) = P(B). ¯ = P(A|B) ¯ ¯ ¯ P(A ∩ B) P(A) · P(B|A) P(A) · P(B|A) = = = P(A). ✷ ¯ ¯ 1 − P(B|A) P(B) P(B|A) 4.27 Proposição. Se A e B são dois eventos não vazios e mutuamente exclusivos, então A e B são dependentes. Prova. Suponha A e B dois eventos independentes. Logo, pela definição, P(A) = P(B|A). Pela proposição 4.25, P(A ∩ B) = P(A) · P(B). Por hipótese, P(A ∪ B) = P(A) + P(B). Segue que P(A) + P(B) − P(A ∩ B) = P(A) + P(B) e, portanto, P(A ∩ B) = 0, o que significa que A ou B é vazio, contrariando a hipótese. Logo, A e B são dependentes. 82 ✷

(151) Estatística Atividade EP 4.87. Numa sala existem 5 homens e 12 mulheres. Um aluno é sorteado ao acaso para ir a lousa. (a) Qual a probabilidade que seja homem? (b) Qual a probabilidade que seja mulher? (c) Estes eventos são independentes? EP 4.88. De um baralho de 52 cartas, uma é extraída ao acaso. Considere os eventos: A: a carta é de espadas; B: a carta é um valete; C : a carta é um valete ou uma dama. Qual par de eventos é independente? EP 4.89. A probabilidade de que um aluno A resolva uma questão de Física é 0, 6 e de que um aluno B resolva esta mesma questão é 0, 2. Qual a probabilidade de que: (a) ambos a resolvam? (b) ao menos um a resolva? (c) nenhum deles a resolva? (d) A a resolva, mas B não a resolva? (e) B a resolva, mas A não a resolva? EP 4.90. A probabilidade de que um homem sobreviva mais 10 anos, a partir de uma determinada data, é 0, 5 e de que sua esposa sobreviva a este mesmo tempo, a partir da mesma data, é 0, 6. Qual a probabilidade de: (a) ambos sobrevivam mais 10 anos, a partir daquela data? (b) ao menos um sobreviver mais 10 anos, a partir daquela data? EP 4.91. A probabilidade de que um aluno A resolva uma questão de Matemática é 0, 4, de que um aluno B a resolva é 0, 3 e a de que o aluno C a resolva é de 0, 2. Qual a probabilidade de que: (a) os três a resolvam? (b) ao menos um a resolva? (c) nenhum deles a resolva? EP 4.92. A probabilidade de que os pais de Anita, de 15 anos de idade, a deixem sair acompanhada é inversamente proporcional à idade do garoto, com mesma idade ou superior à dela. Sabendo que as idades de Alberto, Gabriel e Matheus são, respectivamente, 16, 18 e 20 anos, determine qual a probabilidade de que: (a) os três saiam com Anita; 83

(152) 4.2. CÁLCULOS PROBABILÍSTICOS (b) ao menos um saia com Anita; (c) nenhum deles saia com Anita? EP 4.93. Em um circuito elétrico, 4 componentes são ligados em série e trabalham independentemente um do outro. As probabilidades de falharem são, respectivamente, 0.1, 0.2, 0.3 e 0.4. Qual a probabilidade de que não passe corrente elétrica pelo circuito. EP 4.94. Uma moeda é lançada 10 vezes. Qual a probabilidade de observarmos: (a) 10 coroas? (b) 10 caras? (c) 4 coroas e 6 caras? EP 4.95. Com os dados do exercício 4.82, calcular as seguintes probabilidades: (a) o segurado escolhido ser homem, sabendo-se que utilizou o hospital; (b) o segurado escolhido ter utilizado o hospital, dado que era do sexo masculino; c) o segurado ser mulher, dado que não utilizou o hospital. EP 4.96. Sejam A e B dois eventos associados a um experimento tais que P(A) = 0, 4, P(A ∪ B) = 0, 7 e P(B) = p. (a) Para que valor de p, os eventos A e B são mutuamente exclusivos? (b) Para que valor de p, os eventos A e B são independentes? EP 4.97. Certo aparelho eletrônico tem duas lâmpadas que podem estar acesas ou apagadas, tendo sido observadas as probabilidades de acordo com a tabela que mostra, por exemplo, ambas as lâmpadas estavam simultaneamente apagadas 30% do tempo. Pergunta-se: Lâmpada 2 (a) O fato “lâmpada 1 acesa” é independente de “lâmpada 2 acesa”? (b) O fato “lâmpada 1 apagada” é independente de “lâmpada 2 acesa”? Lâmpada 1 Acesa Apagada Acesa 0, 15 0, 45 Apagada 0, 10 0, 30 EP 4.98. Em certa indústria a manutenção de um equipamento utilizado no processo produtivo é feita por dois técnicos diariamente. Caso haja qualquer falha no equipamento, o produto apresenta defeito e é descartado, mas o custo do descarte do produto é elevado. Se num dia a probabilidade do técnico 1 não perceber um problema no equipamento é de 1/5 e a probabilidade de que o técnico 2 não detecte problema no equipamento é de 1/8 e se os técnicos fazem a verificação diária no equipamento de forma independente, qual a probabilidade da indústria não descartar produto em certo dia se o equipamento apresentou defeito. EP 4.99. Uma partida de certo produto consiste de 10 artigos perfeitos, 4 com pequenos defeitos e 2 com graves defeitos. Retirando-se ao acaso dois artigos, sem reposição, qual a probabilidade de que: (a) ambos estejam perfeitos; (b) pelos menos um seja perfeito. 84

(153) Estatística EP 4.100. Um empreiteiro apresentou orçamentos separados para a execução da parte elétrica e da parte de encanamento de um edifício. Ele acha que a probabilidade de ganhar a concorrência da parte elétrica é de 1/2. Caso ele ganhe a parte elétrica, a chance de ganhar a parte de encanamento é de 3/4; caso contrário, essa probabilidade é de 1/3. Qual a probabilidade dele: (a) ganhar os dois contratos? (b) ganhar apenas um contrato? EP 4.101. Suponha que numa escola 60% dos alunos sejam homens e 40% sejam mulheres. Sabe-se que dentre os alunos do sexo masculino 3% são canhotos, enquanto que dentre as mulheres apenas 2% são canhotas. Escolhe-se um aluno ao acaso. Achar a probabilidade de que seja canhoto. EP 4.102. A probabilidade de que um time de futebol vença seu oponente é estimada em 0, 7, se não chover; mas só 0, 5, se chover. Se os registros meteorológicos mostrarem que choveu 40% das vezes na data do jogo, nos anos passados, qual a probabilidade de que o time vença seu próximo oponente? EP 4.103. Um processo industrial produz 4% de ítens defeituosos. A experiência mostra que 25% dos ítens defeituosos produzidos não são percebidos pelo inspetor de qualidade. Os ítens bons sempre passam satisfatoriamente pela inspeção. Qual a probabilidade de que, se você comprar um desses ítens, seja um item defeituoso? EP 4.104. Um artigo manufaturado, que não pode ser usado se for defeituoso, deve passar por duas inspeções antes de receber embalagem. A experiência mostra que um dos inspetores deixará passar 5% dos artigos defeituosos, ao passo que o segundo inspetor deixará passar 4% de tais artigos. Se os artigos sem defeito sempre passam pela inspeção e se 10% dos artigos processados são defeituosos, que percentagem dos artigos produzidos que passam pela duas inspeções são defeituosos? EP 4.105. Marque verdadeiro ou falso. Justifique suas respostas. (a) O espaço amostral de um experimento é o conjunto de resultados possíveis deste experimento; (b) O evento é um resultado possível do experimento; (c) Se A e B são eventos independentes, então P(A|B) = P(A); (d) Se A e B são eventos mutuamente exclusivos, então eles são independentes. 4.2.5 O Teorema da Probabilidade Total 4.28 Definição. [Partição de um Espaço Amostral] Um conjunto {A1 , A2 , . . . , An } de eventos forma uma partição para espaço amostral S se os seus elementos são não vazios, mutuamente exclusivos e exaustivos (a união é S), ou seja: 1. Ai

(154) = ∅, ∀ i; 2. Ai ∩ Aj = ∅, para i

(155) = j; 3. ∪ni=1 Ai = S. 85

(156) 4.2. CÁLCULOS PROBABILÍSTICOS 4.29 Teorema. [da Probabilidade Total] Sejam A um evento e {A1 , A2 , . . . , An } uma partição de um espaço amostral S. Então

(157) n P(A) = i =1 P(Ai ) · P(A|Ai ). Prova. Podemos escrever A = (A1 ∩ A) ∪ (A2 ∩ A) ∪ · · · ∪ (An ∩ A) = ∪ni=1 (Ai ∩ A). Sendo {A1 , A2 , . . . , An } uma partição para S, os n eventos (Ai ∩ A) são mutuamente exclusivos. Portanto, P(A) = = = P((A1 ∩ A) ∪ (A2 ∩ A) ∪ · · · ∪ (An ∩ A)) P(A1 ∩ A) + P(A2 ∩ A) + . . . + P(An ∩ A) P(A1 ) · P(A|A1 ) + P(A2 ) · P(A|A2 ) + . . . + P(An ) · P(A|An ). ✷ Uma probabilidade total é sempre calculada como uma soma de probabilidades parciais correspondentes à intersecção do acontecimento de interesse com outros mutuamente exclusivos e exaustivos. Este resultado é utilizado quando é difícil de se obter diretamente a probabilidade de um evento P(A). ER 4.67. Em três urnas numeradas são distribuídas uma determinada quantidade de bolas coloridas conforme tabela abaixo: Brancas Pretas U1 3 4 U2 5 2 U3 4 5 Uma urna é selecionada ao acaso e dela é retirada uma bola também ao acaso. Qual a probabilidade dela ser (a) preta? (b) branca? Atividade EP 4.106. Em duas urnas numeradas são distribuídas uma determinada quantidade de bolas coloridas conforme tabela abaixo: Brancas Pretas U1 3 9 U2 7 8 Uma urna é selecionada ao acaso e dela é retirada ao acaso um bola. Qual a probabilidade dela (a) ser de U1 e branca? (c) ser de U2 e branca? (b) ser de U1 e preta? (d) ser de U2 e preta? EP 4.107. Uma urna tem 10 bolas brancas 6 azuis e 8 pretas. Uma bola é selecionada ao acaso e sem reposição desta é retirada ao acaso outra bola. Qual a probabilidade de (a) a primeira ser branca e a segunda azul? (b) a primeira ser azul e a segunda preta? 86

(158) Estatística (c) a primeira a segunda serem brancas? EP 4.108. Em Salvador, no mês de Outubro, costuma chover 5 dias. Qual a probabilidade de não chover nos três primeiros dias de Outubro? EP 4.109. Em três urnas numeradas são distribuídas uma determinada quantidade de bolas coloridas conforme tabela abaixo: Brancas Azuis Pretas U1 3 4 5 U2 5 2 6 U3 2 4 3 Uma urna é selecionada ao acaso e dela é retirada ao acaso um bola. Qual a probabilidade dela ser: (a) azul? (b) preta? (c) branca? EP 4.110. Numa fábrica de automóveis, em um lote A existem 295 peças boas e 5 peças defeituosas. Em outro lote B desta fábrica, existem 224 peças boas e 16 peças defeituosas e, em outro lote C , existem 471 peças boas e 9 peças defeituosas. Um dos lotes é sorteado ao acaso e dele é extraída uma peça ao acaso. Qual a probabilidade da peça ser: (a) boa? (b) defeituosa? ¯ = 0.2. Calcule P(A). EP 4.111. Seja A e B dois eventos tais que: P(A ∩ B) = 0.6 e P(A ∩ B) EP 4.112. Em três urnas numeradas são distribuídas uma determinada quantidade de bolas coloridas conforme tabela abaixo: Brancas Azuis Pretas U1 2 5 3 U2 4 7 9 U3 5 3 2 Uma urna é selecionada ao acaso e dela é retirada ao acaso um bola. (a) Qual a probabilidade dela ser de U1 e ser azul? (b) Qual a probabilidade dela ser branca? (c) Se a bola observada foi branca, qual a probabilidade que tenha vindo de U2 ? EP 4.113. Suponha que temos duas urnas (1 e 2), cada uma com duas gavetas. A urna 1 contém uma moeda de ouro em uma gaveta e uma moeda de prata na outra gaveta; enquanto que a urna 2 contém uma moeda de ouro em cada gaveta. Uma urna é escolhida ao acaso; a seguir, uma de suas gavetas é aberta ao acaso e verifica-se que a moeda encontrada nessa gaveta é de ouro. Qual a probabilidade de que a moeda provenha da urna 2? EP 4.114. Suponhamos um teste de aptidão colegial destinado a separar estudantes colegiais em grupos que “prometem” e grupos que “não prometem”, ao entrarem para a faculdade. Entre os estudantes que tiveram notas satisfatórias em seu primeiro ano, 80% passou no teste de aptidão. Entre os estudantes que tiveram um trabalho insatisfatório, 40% passou no teste. Supõe-se que não se use o teste de admissão nessa faculdade. Sabe-se que somente 70% dos alunos do primeiro ano obtiveram notas satisfatórias, qual a probabilidade de que um estudante que tenha passado no teste seja um estudante satisfatório? 87

(159) 4.2. CÁLCULOS PROBABILÍSTICOS Respostas 3 7 4 1 , (b) , (c) , (d) . 8 8 30 15 2 15 5 , (b) , (c) . 4.107. (a) 46 23 92 520 . 4.108. 899 109 21 4.109. (a) , (b) 351 52 Questão 4.106. (a) Questão Questão Questão 4.2.6 49 1391 , (b) Questão 4.110. (a) 1440 1440 Questão 4.111. 0, 8 1 3 2 Questão 4.112. (a) , (b) , (c) 6 10 9 Questão 4.113. 2/3 Questão 4.114. 14/17 O Teorema de Bayes 4.30 Teorema. [Bayes] Sejam B um evento e {A1 , A2 , . . . , An } uma partição de um espaço amostral S. Então P(Ai |B) =

(160) P(Ai ) · P(B|Ai ) n i =1 . P(Ai ) · P(B|Ai ) Prova. Como P(B) · P(Ai |B) = P(Ai ) · P(B|Ai ), ∀ i, podemos escrever: P(Ai |B) =

(161) P(Ai ) · P(B|Ai ) , ∀ i. P(B) Como B é um evento qualquer de S e {A1 , A2 , . . . , An } é uma partição de S, pelo teorema da probabilin dade total, temos que P(B) = i =1 P(Ai ) · P(B|Ai ). Conseqüentemente, P(Ai |B) = P(Ai ) · P(B|Ai ) , ∀ i. ✷ P(A) Observe que a regra de Bayes é obtida de uma expressão que caracteriza a probabilidade condicional e é muito utilizada pois relaciona as probabilidades a priori P(Ai ), com a posteriori P(Ai |B). ER 4.68. Em três urnas numeradas são distribuídas uma determinada quantidade de bolas coloridas conforme tabela abaixo: Brancas Azuis Pretas U1 3 1 5 U2 4 3 2 U3 5 2 3 Uma urna é selecionada ao acaso e dela é retirada ao acaso uma bola e verificada que ela é branca. Qual a probabilidade dela ter vindo: (a) da urna U1 ? (b) da urna U2 ? (c) da urna U1 ou U3 ? Atividade EP 4.115. Uma urna I possui 4 bolas vermelhas e 5 brancas, a urna I I possui 6 bolas vermelhas e 2 brancas. Uma urna é escolhida ao acaso e dela é extraída ao acaso uma bola. 88

(162) Estatística (a) Qual a probabilidade de observarmos urna I e bola branca? (b) Qual a probabilidade de observarmos urna bola branca? (c) Se a bola observada foi branca, qual a probabilidade de que tenha vindo da urna I ? EP 4.116. Uma caixa contém 3 moedas M1 , M2 e M3 . A primeira moeda é honesta, a segunda tem duas caras e a terceira é viciada de tal modo que caras são quatro vezes mais prováveis que coroas. uma moeda é escolhida ao acaso e lançada. (a) Qual a probabilidade de observarmos moeda M2 e coroa? (b) Qual a probabilidade de observarmos coroa? (c) Se o resultado final foi cara, qual a probabilidade de que a moeda lançada tenha sido M1 ? EP 4.117. Duas máquinas A e B produzem peças idênticas, sendo que a produção da máquina A é o triplo da produção da máquina B. A máquina A produz 80% de peças boas e a máquina B produz 90%. Uma peça do estoque é selecionada ao acaso e verifica-se que é boa. Qual a probabilidade de que tenha sido fabricada pela máquina A? EP 4.118. Uma clínica especializada trata de três tipos de doenças: X , Y e Z . 50% dos que procuram a clínica são portadores de X e 30% de Y . As probabilidades de cura, nessa clínica, são: P(X ) = 0, 8, P(Y ) = 0, 9 e P(Z ) = 0, 95. Um enfermo saiu curado dessa clínica. Qual a probabilidade de que ele sofria da doença X ? E das doenças Y e Z ? EP 4.119. Em uma população 55% são de mulheres. 5% dos homens são cegos e 2% das mulheres são cegas. Uma pessoa é selecionada ao acaso e verifica-se que ela é cega. Qual a probabilidade de que seja homem? Modelos Probabilísticos Modelos Probabilísticos A descrição matemática de um fenômeno empírico é sempre uma representação idealizada do mundo real. Este tipo de representação é chamado de modelo probabilístico ou estatístico. 5.1 Variável Aleatória Em geral os métodos estatísticos são necessários quando estudamos fenômenos aleatórios, ou seja, não completamente previsíveis. Muitos experimentos produzem resultados não numéricos. Podemos, entretanto, transformar seus resultados em números, utilizando alguma regra de associação. 89

(163) 5.1. VARIÁVEL ALEATÓRIA 5.31 Definição. Seja E um experimento aleatório e S o espaço amostral associado a esse experimento. Uma variável aleatória X é uma função que associa a cada elemento s ∈ S um número real X (s), isto é → R X :S → X (s) s ER 5.69. No lançamento de duas moedas o espaço amostral é S = {(C , C ); (C , K ); (K , C ); (K , K )}. Uma variável aleatória X para o evento número ocorrido de caras nos dois lançamentos da moeda pode ser definida por: (C , C ) 2 (C , K ) ou (K , C ) 1 (K , K ) 0 ER 5.70. Seja o evento E : lançar dois dados e observar o soma dos pontos das faces voltadas para cima. Uma variável aleatória (X , Y ) pode ser obtida ao associarmos os números obtidos na face superior em cada face com a sua soma, isto é: 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 ER 5.71. Velocidade média do vento em um certa estação meteorológica. Vamos associar a letra Y a velocidade do vento, logo Y é uma variável aleatória. 5.1.1 Tipos de Variáveis Aleatórias Um conjunto X é enumerável quando é possível estabelecer uma relação unívoca entre seus elementos e o conjunto dos números naturais. Se X for finito, podemos dizer quantos elementos o conjunto X (S) possui. Podemos classificar uma variável aleatória X em: — discreta: quando seu conjunto imagem X (S) é enumerável, finito ou infinito. ER 5.72. Considerando o evento: lançamento de um dado e observar a face superior, seja  X (x) = 0 , se x é par 1 , se x é ímpar ER 5.73. A escolha ao acaso de n indivíduos para formar uma comissão. S = {conjunto de indivíduos} 90 X (S) = {0, 1, 2, . . . , n}

(164) Estatística — contínua: quando ela assume valores em um conjunto não-enumerável (em nosso estudo, intervalos reais ou união de intervalos de números reais). ER 5.74. Tempo de vida de um determinado ser vivo. 5.2 Funções de Probabilidades Seja X uma variável aleatória. Uma caracterização completa de X é dada por uma função de probabilidade. Sejam E um experimento aleatório associado a um espaço amostral S e X : S → R uma variável aleatória. A função de probabilidades f é uma função que associa X à probabilidade de que X assuma um determinado valor y ∈ X (S) (caso a variável aleatória seja discreta) ou associa X à probabilidade de que X pertença a um intervalo I ⊂ X (S) (caso a variável aleatória seja contínua). Algumas características são inerentes a esta definição. Estudaremos estas conforme a variável aleatória seja discreta ou contínua. 5.2.1 Distribuição de Probabilidades 5.32 Definição. Considere E um experimento aleatório associado a um espaço amostral S = {si , i ∈ N} e X é uma variável aleatória discreta que assume valores X (si ) = xi , i ∈ N. Uma distribuição de probabilidades de X é uma função que associa a probabilidade de que uma variável aleatória discreta X assuma um determinado valor xi ∈ X (S) e é representada por P(X = xi ), ou simplesmente P(xi ), i ∈ N. Em outras palavras, a distribuição de probabilidades é o conjunto de pares (xi , P(xi )), i ∈ N. Como característica a distribuição de probabilidades de X deve satisfazer aos seguintes axiomas: 1.

(165) P(X = xi ) ≥ 0, ∀ i ∞ 2. P(X = xi ) = 1. i =1 Por se tratar de pares (xi , P(xi )), a distribuição de probabilidades pode também ser representada através de fórmulas, tabelas, gráficos e diagramas. ER 5.75. Consideremos novamente o lançamento de duas moedas ( 5.69) e, uma vez que já sabemos calcular as probabilidades de todos os pontos do espaço amostral, a distribuição de probabilidades é 5.2.2 xi 0 1 2 P(X = xi ) 1 4 1 2 1 4 Densidade de Probabilidade Por se tratar de uma função que assume valores em um conjunto não-enumerável, uma variável aleatória contínua não pode ter cada um de seus valores x ∈ X (S) associado a uma determinada proba91

(166) 5.2. FUNÇÕES DE PROBABILIDADES bilidade P(X = x), como no caso da distribuição de probabilidades. Portanto, é necessário a construção de uma outra função com as mesmas características da distribuição de probabilidades. 5.33 Definição. Considere E um experimento aleatório associado a um espaço amostral S e X uma variável aleatória contínua. A densidade de probabilidade é uma função f (x) satisfazendo aos seguintes axiomas: 1. f (x) ≥ 0, ∀ x ∈ R; ! 2. +∞ f (x) dx = 1. −∞ Além disso, a probabilidade de que uma variável aleatória contínua X assuma valor em um determinado intervalo [a, b] ⊂ R é dado por: P(a < X < b) = ! b ( 5.35) f (x) dx. a Por se tratar de uma função que assume valores em um conjunto não-enumerável, uma densidade de probabilidade é representada através de fórmulas e gráficos e, claramente, 1. P(X = x0 ) = P(x0 ) = ! x0 f (x) dx = 0; x0 e, como conseqüência da definição, 2. P(a < X < b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b); 3. a densidade de probabilidade f (x) não representa a probabilidade; 4. a probabilidade P(a < X < b) é a área da figura limitada por a < x < b, y = 0 e o gráfico de f (x). ER 5.76. Seja X uma variável aleatória contínua. Verifique se 8x f (x) = 0 1 2 1 , x < 0 ou x > 2 , 0≤x ≤ é uma densidade de probabilidade. Caso afirmativo, calcule P(0, 1 < X < 0, 2), P(X < 0, 4) e represente graficamente. y Solução: Para que f (x) seja uma densidade de probabilidade, os axiomas relativos a este tipo de função devem ser satisfeitos. Clara- 4 mente, pela definição, 1. f (x) ≥ 0, ∀ x ∈ R; 2. ! +∞ −∞ f (x) dx = ! 0 0 dx + −∞ ! 1 2 0 8x dx = 1, e, portanto, o segundo axioma também é satisfeito. 92 1 2 x

(167) Estatística 5.3 Função de Repartição A função de repartição F (x) de uma variável aleatória X , no ponto x, é a probabilidade de que X assume um valor menor ou igual a x, isto é ( 5.36) F (x) = P(X ≤ x) Desta forma 1. F (x) =

(168) P(xi ), no caso em que X é uma variável aleatória discreta; xi ≤x 2. F (x) = !x f (s) ds, no caso em que X é uma variável aleatória contínua. Claramente, −∞ F (−∞) = 0 e F (+∞) = 1; podemos utilizar a função de repartição para calcular a probabilidade P(a < X < b), da seguinte maneira: P(a < X < b) = P(X < b) − P(X ≤ a) = F (b) − F (a). ( 5.37) ER 5.77. Determine o valor de k para que a função  f (x) = 0 , kx 2 , x < 0 ou x ≥ 1 0≤x <1 Seja uma densidade de probabilidade. Em seguida, determine sua função de repartição. Solução: A primeira característica é que k > 0. Além disso, ! +∞ 1= !0 !1 f (x) dx = −∞ 0 dx + k 3 x 3 ""1 "" 0 ! +∞ 0 dx, 0 −∞ ou seja, kx 2 dx + 1 ! +∞ dx + 0 dx. 1 Logo, k = 3. Quanto à função de repartição temos, para: x <0 , F (x) = 0≤x <1 , F (x) = x ≥1 , 5.3.1 !x !−∞ 0 0 ds = 0 !−∞ 0 0 ds + !x !0 1 0 ds + F (x) = 3s 2 ds = x 3 3s 2 !x ds + 0 −∞ 0 ds = 1 1 Atividade EP 5.120. Uma variável aleatória X tem a seguinte função densidade de probabilidade:  f (x) =  kx , 0≤x <5 k(10 − x) , 5 ≤ x < 10 0 , x < 0oux ≥ 10. 93

(169) 5.4. VARIÁVEIS ALEATÓRIAS BIDIMENSIONAIS (a) Determine o valor de k; (b) P(2, 5 ≤ X ≤ 7, 5). EP 5.121. Dada a função de repartição:  F (X ) =  0 x +1 2 1 , x < −1 , −1 ≤ x < 1 , x ≥ 1. Calcule:  (a) P −  1 1 ≤X ≤ ; 2 2 (b) P(X = 0). 5.4 Variáveis Aleatórias Bidimensionais Existem experimentos em que o interesse está voltado para duas ou mais características (variáveis), simultaneamente. Sejam E um experimento aleatório e S um espaço amostral associado a E . Para um mesmo ponto amostral s podemos obter os valores X (s) e Y (s) de duas variáveis aleatórias X e Y . Uma variável aleatória bidimensional é uma função (X , Y ) que associa s ∈ S ao par (X (s), Y (s)). Assim como a variável aleatória unidimensional, a bidimensional pode ser discreta ou contínua. 5.4.1 Distribuição de probabilidade conjunta A distribuição de probabilidade conjunta é uma função que associa uma variável aleatória bidimensional discreta (X , Y ) ao número P(X = xi , Y = yj ), i ∈ N, ou seja, P : (X , Y ) → [0, 1] (xi , yj ) → P(X = xi , Y = yj ) Esta função satisfaz aos seguintes axiomas: 1. P(X = xi , Y = yj ) ≥ 0, ∀ i, j;

(170)

(171) ∞ 2. ∞ P(xi , yj ) = 1. i =1 j=1 Sua representação pode ser efetuada através de uma fórmula, tabela ou gráfico. ER 5.78. Representar tabularmente a distribuição de probabilidades correspondente ao lançamento de dois dados. 94

(172) Estatística Solução: X \Y 1 2 3 4 5 6 5.4.2 1 2 3 4 5 6 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 1 36 Densidade de Probabilidade Conjunta A densidade de probabilidade conjunta de uma variável aleatória bidimensional contínua (X , Y ) é uma função f (x, y ) que satisfaz aos seguintes axiomas: 1. 2. f (x, y ) ≥ 0, ∀(x, y ) ∈ R2 ; !∞!∞ f (x, y ) dx dy = 1. −∞ −∞ Sua representação pode ser efetuada através de equações e gráficos. Assim, como no caso unidimensional, a probabilidade é definida por P(a < X < b, c < Y < d) = ! d! b c ( 5.38) f (x, y ) dx dy . a ER 5.79. Seja S = {(x, y ) ∈ R2 ; 0 < x < 1 e 0 < y < 1}. Verifique se a função  f (x, y ) = x +y , (x, y ) ∈ S 0 , (x, y )

(173) ∈ S é uma densidade de probabilidade. Caso afirmativo, calcule a probabilidade de que a variável aleatória X esteja em [0, 50; 0, 75]2. Solução: Para que f (x, y ) seja uma densidade de probabilidade conjunta ela deve satisfazer aos respectivos axiomas: 1. Como x e y variam no intervalo aberto (0, 1), a função (x, y ) → x + y é sempre positiva. Portanto, o primeiro axioma está satisfeito. 2. O segundo axioma também se verifica, pois, ! 1 #! 1 ! +∞ ! +∞ f (x, y ) dx dy −∞ = −∞ = = !0 1 % x02 !0 1  12 2 y + y2 2 0 = $ (x + y ) dx dy ""1 & + xy ""  0 +y ""1 "" = 1 0 dy dy 95

(174) 5.5. FUNÇÃO DE REPARTIÇÃO CONJUNTA 5.5 Função de Repartição Conjunta A função de repartição conjunta de uma variável aleatória bidimensional é definida por F (x, y ) = P(X ≤ x, Y ≤ y ). ( 5.39) Caso (X , Y ) seja uma variável aleatória bidimensional discreta, F (x, y ) =

(175)

(176) P(xi , yj ). ( 5.40) xi ≤x yj ≤y Caso (X , Y ) seja uma variável aleatória bidimensional contínua, !y !x F (x, y ) = −∞ −∞ f (u, v ) du dv , ∀ (x; y ) ∈ R2 ( 5.41) Observe que f (x, y ) =  ER 5.80. Seja ∂2F (x, y ) ∂x∂y x +y f (x, y ) = 0 , (x, y ) ∈ S , (x, y )

(177) ∈ S a função densidade de probabilidade de uma variável aleatória bidimensional, onde S = {(x, y ) ∈ R2 ; 0 < x < 1 e 0 < y < 1}. Determine sua função de repartição conjunta. 5.6 Funções de Probabilidade Marginais Seja (X , Y ) uma variável aleatória bidimensional. Pode-se, a partir da função distribuição ou densidade de probabilidade conjunta, achar a distribuição ou densidade de probabilidade de X (distribuição ou densidade marginal de X ) e de Y (distribuição ou densidade marginal de Y ). 5.6.1 Distribuição de Probabilidade Marginal Seja (X , Y ) uma variável aleatória bidimensional discreta. A distribuição de probabilidade marginal de X , respectivamente, Y , são: P(X = xi ) ∞

(178) = P(X = xi , Y = yj ) ( 5.42) P(X = xi , Y = yj ) ( 5.43) j=1 ∞ P(Y = yj )

(179) = i =1 ER 5.81. Considere a seguinte distribuição de probabilidade: xi \yj 96 0 1 2 0 0, 10 0, 04 0, 06 1 0, 20 0, 08 0, 12 2 0, 12 0, 20 0, 08

(180) Estatística Determine as distribuições de probabilidade marginais. Solução: xi \yj 5.6.2 0 1 2 P(xi ) 0 0, 10 0, 04 0, 06 0, 20 1 0, 20 0, 08 0, 12 0, 40 2 0, 12 0, 20 0, 08 0, 40 P(yi ) 0, 42 0, 32 0, 26 1 Densidade de Probabilidade Marginal Seja (X , Y ) uma variável aleatória bidimensional contínua. A densidade de probabilidade marginal de X , respectivamente, Y , são: ! +∞ FX (x) = ! f (x, y ) dy ( 5.44) f (x, y ) dx ( 5.45) −∞ +∞ FY (y ) = −∞ ER 5.82. Considere a densidade de probabilidade:  f (x, y ) = x +y 0 , (x, y ) ∈ S , (x, y )

(181) ∈ S, onde S = {(x, y ) ∈ R2 ; 0 < x < 1 e 0 < y < 1}. Determine as distribuições de probabilidade marginais de X e de Y . Solução: 1. 2. ""1 & "" = x + 1 . FX (x) = f (x, y )dy = (x + y )dy = 2 −∞ 0 0 % "1 & ! +∞ !1 2xy + x 2 "" 1 FY (y ) = =y+ . f (x, y )dx = (x + y )dx = " 2 2 −∞ 0 0 ! +∞ % !1 2xy + y 2 2 EP 5.122. Suponha que (X , Y ) tenha a seguinte função de densidade de probabilidade conjunta: f (x, y ) = 3 2 (x + y 2 ) , (x, y ) ∈ [0, 1]2 2 0 , (x, y ) ∈ ℜ2 \ [0, 1]2 Calcule as distribuições marginais de X e Y . 5.7 Variáveis Aleatórias Independentes Duas variáveis aleatórias X e Y são independentes se, e somente se, a função de probabilidade conjunta é igual ao produto de suas funções de probabilidade marginais. 97

(182) 5.7. VARIÁVEIS ALEATÓRIAS INDEPENDENTES 5.7.1 Variáveis aleatórias discretas independentes Sejam X e Y duas variáveis aleatórias discretas independentes, então P(X = xi , Y = yj ) = P(X = xi ) · P(Y = yj ), ∀ i, j. ( 5.46) ER 5.83. Considere a seguinte distribuição de probabilidade: xi \yj 0 1 2 0 0, 10 0, 20 0, 20 1 0, 04 0, 08 0, 08 2 0, 06 0, 12 0, 12 e verifique se as variáveis aleatórias X e Y são independentes. Solução: De acordo com a tabela xi \yj 0 1 2 P(xi ) 0 0, 10 0, 20 0, 20 0, 50 1 0, 04 0, 08 0, 08 0, 20 2 0, 06 0, 12 0, 12 0, 30 P(yi ) 0, 20 0, 40 0, 40 1 podemos escrever P(xi ) · P(yj ) (xi , yj ) P(xi , yj ) P(xi ) P(yj ) (0, 0) 0, 10 0, 50 0, 20 (0, 1) 0, 20 0, 50 0, 40 0, 20 (0, 2) 0, 20 0, 50 0, 40 0, 20 (1, 0) 0, 04 0, 20 0, 20 0, 04 (1, 1) 0, 08 0, 20 0, 40 0, 08 (1, 2) 0, 08 0, 20 0, 40 0, 08 (2, 0) 0, 06 0, 30 0, 20 0, 06 (2, 1) 0, 12 0, 30 0, 40 0, 12 (2, 2) 0, 12 0, 30 0, 40 0, 12 0, 10 e constatamos que P(X = xi , Y = yj ) = P(X = xi ) · P(Y = yj ), ∀ i, j. Logo, X e Y são duas variáveis aleatórias independentes. ER 5.84. Considere a seguinte distribuição de probabilidade: xi \yj 0 1 2 0 0, 10 0, 04 0, 06 1 0, 20 0, 08 0, 12 2 0, 12 0, 20 0, 08 e verifique se as variáveis aleatórias X e Y são independentes. EP 5.123. Considere a seguinte distribuição conjunta das variáveis aleatórias X e Y : xi \yj 98 −2 −1 4 5 1 0, 1 0, 2 0, 0 0, 3 2 0, 2 0, 1 0, 1 0, 0

(183) Estatística (a) Achar as probabilidades marginais de X e Y ; (b) As variáveis X e Y são independentes? Justifique. EP 5.124. Sejam M e N duas variáveis aleatórias independentes com as seguintes distribuições: M 1 3 N 5 10 12 P(m) 0, 6 0, 4 P(n) 0, 3 0, 5 0, 2 Achar a distribuição conjunta da variável aleatória conjunta (M, N). 5.7.2 Variáveis Aleatórias Contínuas Independentes De forma análoga, duas variáveis aleatórias contínuas X e Y são independentes se, e somente se: ( 5.47) f (x, y ) = FX (x) · FY (y ), ∀ (x, y ). ER 5.85. Seja S = {(x, y ) ∈ R2 ; 0 ≤ x ≤ 2 e 0 ≤ y ≤ x}. A variável aleatória bidimensional contínua (X ; Y ) tem a seguinte função densidade de probabilidade: f (x, y ) = xy 2 0 , (x, y ) ∈ S , (x, y )

(184) ∈ S (a) Calcule P(0 ≤ X ≤ 1; 0 ≤ y ≤ 1); (b) Verifique se as variáveis X e Y são independentes. 5.8 Probabilidade Condicional Seja xi um valor da variável aleatória discreta X , tal que P(X = xi ) > 0. A probabilidade P(Y = yj |X = xi ) = P(X = xi , Y = yj ) , P(X = xi ) ( 5.48) é denominada probabilidade condicional de Y = yj dado que X = xi ocorreu. Desta forma, uma vez fixado o valor xi , os pares (yj , P(Y = yj |X = xi )) definem uma distribuição condicional de Y , dado que X = xi , pois

(185) j=1

(186) P(X = x , Y = y )

(187) P(X = x ) ∞ ∞ ∞ P(Y = yj |X = xi ) = i j P(X = xi ) j=1 i = j=1 P(X = xi ) = 1. ( 5.49) ER 5.86. Considere a seguinte distribuição de probabilidade: xi \yj 0 1 2 0 0, 10 0, 04 0, 06 1 0, 20 0, 08 0, 12 2 0, 12 0, 20 0, 08 e calcule a distribuição de probabilidade de X , dado Y = 1. 99

(188) 5.8. PROBABILIDADE CONDICIONAL Solução: P(X = 0|Y = 1) = 0, 04 P(X = 0, Y = 1) = = 0, 125; P(Y = 1) 0, 32 P(X = 1|Y = 1) = 0, 08 P(X = 1, Y = 1) = = 0, 25; P(Y = 1) 0, 32 P(X = 2|Y = 1) = 0, 20 P(X = 2, Y = 1) = = 0, 625; P(Y = 1) 0, 32 A distribuição de probabilidade condicionada fica: xi 0 P(X = xi |Y = 1) 0, 125 1 0, 25 2 0, 625 Total 1 ER 5.87. Seja X uma variável aleatória contínua que expressa o diâmetro de um cabo elétrico cuja função densidade de probabilidade é:  f (x) = 6x(1 − x) , x ∈ [0; 1] , x ∈ R \ [0; 1]. 0 (a) Obtenha a função de repartição;  (b) Calcule P X ≤  2 1 1 | 1 1 1 1
(189) Estatística 6.1 Esperança de uma Variável Aleatória Seja X uma variável aleatória. A esperança matemática E (X ) ou, simplesmente, esperança, valor esperado, expectância ou média de uma distribuição de probabilidade, é a média dos valores da variável aleatória quando repetimos o experimento um grande número de vezes. 6.1.1 Esperança de uma Variável Aleatória Discreta Seja X é uma variável aleatória discreta com a seguinte distribuição de probabilidade: X x1 x2 x3 P(X = xi ) P(X = x1 ) P(X = x2 ) P(X = x3 ) O valor esperado de X é dado por

(190) ··· ··· xn P(X = xn ) ··· ··· ∞ E (X ) = i =1 ( 6.50) xi · P(X = xi ) ER 6.88. Ao lançarmos um dado um grande número de vezes, qual a esperança? Solução: 1 X P(X = xi ) O valor esperado de X é

(191) 2 1 6 1 6 6 E (X ) = i =1 6.1.2 xi · P(X = xi ) = 3 1 6 4 1 6 5 1 6 6 1 6 7 1 · (1 + 2 + 3 + 4 + 5 + 6) = . 6 2 Esperança de uma Variável Aleatória Contínua Seja X é uma variável aleatória contínua com densidade de probabilidade f (x). De forma análoga ao caso discreto, o valor esperado de X é dado por E (X ) = ! +∞ −∞ x · f (x) dx. ( 6.51) ER 6.89. Uma liga metálica é formada ao misturarmos dois metais em estado líquido. A liga resultante contém uma certa percentagem de chumbo, que pode ser considerada uma variável aleatória X cuja função densidade de probabilidade é dada por: f (x) = 0, 3 · 10−5 x(100 − x), 0 ≤ x ≤ 100. 101

(192) 6.1. ESPERANÇA DE UMA VARIÁVEL ALEATÓRIA Solução: O valor esperado de X é ! E (X ) = +∞ −∞ x · 0, 3 · 10−5 x(100 − x) dx 0, 3 · 10−5 = = 0, 3 · 10−5 = 0, 3 · 10 −5 = 0, 3 · 103 ! % 100 0 # (100x 2 − x 3 ) dx "" & " $" x3 x4 − 3 4 108 108 − 3 4 100 100 0 1 = 25 12 Isto significa que é esperado, em média, 25% em chumbo nessa liga. ER 6.90. O tempo T , em minutos, necessário para um operário processar certa peça é uma variável aleatória com a seguinte distribuição de probabilidade: T 1 2 3 4 5 6 7 P(T = ti ) 0, 1 0, 2 0, 1 0, 3 0, 1 0, 1 0, 1. (a) Estabeleça a função de repartição; (b) Calcule o tempo médio de processamento. Solução: (a) A função de repartição conjunta é:  0  0, 1  0, 3  0, 4  0, 7  0, 8  0, 9  1, 0 , , , , , , , , se t < 1 se 1 ≤ t < 2 se 2 ≤ t < 3 se 3 ≤ t < 4 se 4 ≤ t < 5 se 5 ≤ t < 6 se 6 ≤ t < 7 se t ≥ 7 (b) O valor esperado de T é

(193) 7 E (T ) = i =1 ti · P(T = ti ) = 0, 1 · 1 + 0, 2 · 2 + 0, 1 · 3 + 0, 3 · 4 + 0, 1 · 5 + 0, 1 · 6 + 0, 1 · 7 = 0, 1 + 0, 6 + 0, 3 + 1, 2 + 0, 5 + 0, 6 + 0, 7 = 3, 8. 6.1.3 Propriedades da Esperança Sejam k ∈ R uma constante, X e Y duas variáveis aleatórias com esperanças E (X ) e E (Y ), respecti- vamente. Então 1. E (k) = k; 102

(194) Estatística Prova. Seja X uma variável aleatória com distribuição de probabilidade P(X = xi ) = P(xi ), i ∈ N.

(195) Então ∞ E (k) = i =1

(196) ∞ k · P(xi ) = k P(xi ) = k. i =1 2. E (k + X ) = k + E (X ); Prova. Se X é uma variável aleatória discreta, então

(197)

(198)

(199) ∞ E (k + X ) = i =1 ∞ = i =1 = (k + xi ) · P(xi ) (k · P(xi ) + xi · P(xi )) P(xi ) + i =1 =

(200) ∞ ∞ k i =1 xi · P(xi ) k + E (X ) 3. E (k · X ) = k · E (X ); Prova. Se X é uma variável aleatória discreta, então

(201)

(202) ∞ E (k · X ) = i =1 (k · xi ) · P(xi ) ∞ = k i =1 xi · P(xi ) = k · E (X ) 4. E (X + Y ) = E (X ) + E (Y ); Prova. Se X e Y são duas variáveis aleatórias discretas com distribuições de probabilidade, respectivamente, P(X = xi ) = P(Y = yj ) = então i =1 j=1 ∞ ∞ = (xi + yj ) · P(xi , yj ) (xi · P(xi , yj ) + yj · P(xi , yj )) ∞ i =1 j=1 ∞ ∞ P(xi , yj ) + xi i =1 ∞ = j=1 yj · P(xi , yj ) yj j=1 ∞ xi P(xi ) + i =1 = ∞ xi · P(xi , yj ) + i =1 j=1 ∞ ∞ = , ∞ i =1 j=1 ∞ ∞ = P(yj ), j ∈ N

(203)

(204)

(205)

(206)

(207)

(208)

(209)

(210)

(211)

(212)

(213)

(214)

(215)

(216) ∞ E (X + Y ) = P(xi ), i ∈ N P(xi , yj ) i =1 yj P(yj ) j=1 E (X ) + E (Y ) 5. Se X e Y são duas variáveis aleatórias discretas independentes, então E (X · Y ) = E (X ) · E (Y ); Prova. Se X e Y são duas variáveis aleatórias discretas com distribuições de probabilidade, respectivamente, P(X = xi ) = P(Y = yj ) = P(xi ), i ∈ N P(yj ), j ∈ N . 103

(217) 6.2. MEDIANA Como X e Y são independentes P(xi , yj ) = P(xi ) · P(yj ), ∀ i, j. Então E (X · Y ) ∞ ∞

(218)

(219) = (xi · yj ) · P(xi , yj )

(220)

(221) i =1 j=1 ∞ ∞ =

(222) i =1 j=1 ∞ = i =1 xi · P(xi ) · yj · P(yj ) xi · P(xi ) · ∞

(223) j=1 yj · P(yj ) = E (X ) · E (Y ) Em todos estes casos, supondo a presença de variáveis aleatórias contínuas, a demonstração seria similar. ER 6.91. Sejam X e Y duas variáveis aleatórias e Z = 5X + 3Y + 2. Sabendo-se que E (X ) = 3 e E (Y ) = 2, calcule E (Z ). Solução: E (Z ) = E (5X + 3Y + 2) = 5E (X ) + 3E (Y ) + 2 = 15 + 6 + 2 = 23. 6.2 Mediana A mediana de uma distribuição de probabilidades é o valor Md da variável aleatória que divide a distribuição em duas partes iguais, ou seja 1 (variável aleatória discreta); 2 1 F (Md) = (variável aleatória contínua). 2 ER 6.92. Seja X uma variável aleatória cuja densidade de probabilidade é P(Md) =  f (x) = 0 2x , x ∈ R \ [0, 1] . , x ∈ [0, 1] Qual a mediana? Solução: 1 = F (x) = 2 √ 2 1 2 . Logo, x = . Segue que x = 2 2 6.3 !x !0 f (x) dx = −∞ !x 0 dx + −∞ 2x dx = x 2 . 0 Moda A moda de uma distribuição de probabilidades é o valor Mo da variável aleatória que possui a maior probabilidade, se X for discreta, ou maior densidade, se X for contínua 104

(224) Estatística ER 6.93. Seja X uma variável aleatória com a seguinte distribuição de probabilidade X 0 1 2 P(X = xi ) 0, 2 0, 3 0, 5 Qual a moda? Solução: Claramente, pela definição de moda, temos Mo = 2. ER 6.94. Seja X uma variável aleatória cuja densidade de probabilidade é  f (x) = 0 2x , x ∈ R \ [0, 1] , x ∈ [0, 1] . Qual a moda? Solução: Claramente, pela definição de moda, temos Mo = 1, pois, é neste ponto que a função assume o valor máximo 2, (f (1) = 2). 6.4 Variância A variância de uma variável aleatória corresponde à uma dispersão ou variabilidade dos diferentes valores possíveis em torno da esperança. Seja X uma variável aleatória. A variância VAR(X ) ou σ2 de X é definida por: VAR(X ) = σ 2 = E [(X − E (X ))2 ]. 6.4.1 ( 6.52) Variância de uma variável aleatória discreta 6.34 Teorema. Seja X uma variável aleatória discreta. Então VAR(X ) = ∞

(225) i =1 Prova. VAR(X ) = E [(X − E (X ))2 ] = [xi − E (X )]2 · P(xi ). ( 6.53) ∞

(226) i =1 [xi − E (X )]2 · P(xi ). ER 6.95. Admita que a variável aleatória X assuma valores 1, 2 e 3, com probabilidades 1/8, 1/2 e 3/8, respectivamente. (a) Determine sua função de repartição e a represente graficamente; (b) P(1 < X < 3), P(1 ≤ X ≤ 2), P(1 < X ≤ 3), F (1) e F (2); (c) E (X ) e VAR(X ). 105

(227) 6.4. VARIÂNCIA 6.4.2 Variância de uma variável aleatória contínua 6.35 Teorema. Sejam X uma variável aleatória contínua com função densidade de probabilidade f (x) e esperança E (X ). Então ! +∞ VAR(X ) = −∞ ! Prova. VAR(X ) = E [(X − E (X ))2 ] = +∞ −∞ [x − E (X )]2 · f (x) dx. ( 6.54) [x − E (X )]2 · f (x) dx. 6.36 Teorema. Seja X uma variável aleatória com esperança E (X ). Então VAR(X ) = E (X 2 ) − [E (X )]2 . ( 6.55) Prova. Seja X uma variável aleatória discreta com distribuição de probabilidade P(X = xi ) = P(xi ) e esperança E (X ). Então, VAR(X ) = E [(x−E (X ))2 ] = E [x 2 −2xE (X )+E 2 (X )] = E (X 2 )−E [2xE (X )]+E [E 2(X )] == E (X 2 )−2E (X )·E (X )+E 2 (X ) = E (X 2 )− Pode-se demonstrar, analogamente, se considerarmos X uma variável aleatória contínua com densidade de probabilidade f (x) e esperança E (X ). 6.4.3 Propriedades da variância de uma variável aleatória Sejam k ∈ R uma constante, X e Y duas variáveis aleatórias com esperanças E (X ) e E (Y ). Então 1. VAR(k) = 0 Prova. VAR(k) = E [(k − E (k))2 ] = E [(k − k)2 ] = E (0) = 0. 2. VAR(k + X ) = VAR(X ). Prova. VAR(k + X ) E [(k + X − E (k + X ))2 ] = E ([k + X − {k + E (X )}2 ]) = E ([X − E (X )]2 ) = VAR(X ) = 3. VAR(kX ) = k 2 VAR(X ). Prova. VAR(kX ) ' ( ' ( = E [kX − kE (X )]2 ' ( = E {k[X − E (X )]}2 ' ( = E k 2 [X − E (X )]2 ' ( 2 2 = E [kX − E (kX )]2 = k E [X − E (X )] = 106 k 2 VAR(X )

(228) Estatística 6.5 Desvio Padrão O desvio padrão σ de uma variável aleatória X é a raiz quadrada da variância, isto é σ = σ(X ) =  ( 6.56) VAR(X ) ER 6.96. Qual o desvio padrão de uma distribuição obtida ao lançarmos um dado um grande número de vezes? Solução: A distribuição de probabilidade é dada por E (X ) = X 1 2 3 4 5 6 P(X = xi ) 1 6 1 6 1 6 1 6 1 6 1 6 1 7 1 91 (1 + 2 + 3 + 4 + 5 + 6) = e E (X 2 ) = (1 + 4 + 9 + 16 + 25 + 36) = . Logo, 6 2 6 6 91 − VAR(X ) = 6  7 2 2  Portanto, 182 − 147 35 91 49 − = = . 6 4 12 12 = σ= 35 ≈ 1, 71. 12 De modo geral, o desvio padrão é mais importante e útil medida de variação. O desvio padrão de um conjunto de valores é uma medida de variação dos valores em relação à média aritmética. A variância é o quadrado do desvio padrão, ou, podemos dizer que o desvio padrão é igual a raiz quadrada positiva da variância. Uma dificuldade com a variância é que ela não é expressa nas mesmas unidades dos dados originais, enquanto que o desvio padrão tem a mesma unidade de medida dos dados originais. ER 6.97. Sejam S = [0, 1] e X uma variável aleatória contínua com densidade de probabilidade  f (x) = 0 3x 2 , x ∈S , x ∈S . Calcule σ(X ). Solução: E (X ) = ! +∞ −∞ VAR(X ) = xf (x) dx = ! +∞ = σ(X ) = 0 x · 3x 2 dx = 3 (x − E (X ))2 f (x) dx = !1 x 0 ! 1 3 x4 dx = 3 4 x− 3 4 2 ""1 3 "" = . 4 0 · 3x 2 dx 0 !  3 9 ! 1 3  9 2 2 2 4 3 3 x − x+ · x dx = 3 x − x + x 2 16 " & 0 %0 5   2 3 16 1 3 4 3 x 1 3 3 3 "" 3 − x + x " =3 − + . = 5 4 16 0 5 4 16 80 )3 −∞ 1 = !1 80 dx . ER 6.98. Para cada peça processada, o operário ganha um valor fixo de R$10, 00, mas, se ele processa a peça em menos de 6 minutos, ganha 1% deste valor, por cada minuto poupado. Encontre a distribuição, a média e o desvio padrão da variável aleatória G : quantia em reais ganha por peça. 107

(229) 6.6. COVARIÂNCIA ENTRE DUAS VARIÁVEIS ALEATÓRIAS Solução: (a) A função de repartição conjunta é:  0  0, 1  0, 3  0, 4  0, 7  0, 8  0, 9  1, 0 , se t < 1 , se 1 ≤ t < 2 , , , , , , se 2 ≤ t < 3 se 3 ≤ t < 4 se 4 ≤ t < 5 se 5 ≤ t < 6 se 6 ≤ t < 7 se t ≥ 7 (b) O valor esperado de T é

(230) 7 E (T ) = i =1 ti · P(T = ti ) = 0, 1 · 1 + 0, 2 · 3 + 0, 1 · 3 + 0, 3 · 4 + 0, 1 · 5 + 0, 1 · 6 + 0, 1 · 7 = 0, 1 + 0, 6 + 0, 3 + 1, 2 + 0, 5 + 0, 6 + 0, 7 = 4. 6.6 Covariância entre duas Variáveis Aleatórias A covariância é uma medida da distribuição conjunta dos valores dos desvios de X e Y em relação às respectivas médias, que descreve a dependência linear entre as variáveis. Se X e Y são duas variáveis aleatórias, então a covariância COV(X , Y ) entre X e Y é definida por: COV(X , Y ) = E ([X − E (X )] · [Y − E (Y )]). ( 6.57) 6.37 Teorema. A covariância entre duas variáveis aleatórias X e Y é COV(X , Y ) = E (X Y ) − E (X )E (Y ). Prova. COV(X , Y ) = = = = E ([X − E (X )] · [Y − E (Y )]) E (X Y − X E (Y ) + E (X )Y − X E (Y )) E (X Y ) − E (X )E (Y ) + E (X )E (Y ) − E (X )E (Y ) E (X Y ) − E (X )E (Y ). ER 6.99. De acordo com a distribuição conjunta de X e Y , a seguir, calcule a covariância. Y \X 0 1 0 1 5 0 1 0 0 2 0 3 1 5 2 5 1 5 Solução: Primeiramente calcula-se as distribuições de probabilidade marginais para cada variável 108

(231) Estatística aleatória. Y \X 0 1 P(yi ) 0 1 5 0 0 1 0 0 0 2 0 3 1 5 2 5 2 5 1 5 3 5 2 5 2 5 P(xi ) 1 Agora, calcularemos, separadamente, as esperanças necessárias.

(232)

(233)

(234)

(235) 2 E (X ) = i =1 4 E (Y ) = i =1 2 E (X Y ) = xi P(xi ) = 0 · 3 3 2 +1· = 5 5 5 yi P(yi ) = 0 · 2 2 10 1 +1·0+2· +3· = =2 5 5 5 5 4 xi yj P(xi , yj ) i =1 j=1 1 2 1 7 1 +0·1·0+0·2·0+0·3· +1·0·0+1·1·0+1·2· +1·3· = 5 5 5 5 5 7 3 E (X Y ) − E (X )E (Y ) = − · 2 = 0, 2 5 5 0·0· = COV(X , Y ) = 6.38 Teorema. Sejam X e Y duas variáveis aleatórias. Então VAR(X ± Y ) = VAR(X ) + VAR(Y ) ± 2 · COV(X , Y ). Prova. VAR(X + Y ) = = = = + = + = + = + = = ' ' ' ' E [X + Y − E (X + Y )]2 ( E (X + Y )2 − 2(X + Y )E (X + Y ) + [E (X + Y )]2 ( E X 2 + 2X Y + Y 2 − 2(X + Y )[E (X ) + E (Y )] + [E (X ) + E (Y )]2 ( ( E X 2 + 2X Y + Y 2 − 2(X + Y )E (X ) − 2(X + Y )E (Y ) [E (X )]2 + 2E (X )E (Y ) + [E (Y )]2 E (X 2 ) + 2E (X Y ) + E (Y 2 ) − 2E (X )E (X + Y ) − 2E (Y )E (X + Y ) [E (X )]2 + 2E (X )E (Y ) + [E (Y )]2 E (X 2 ) + 2E (X Y ) + E (Y 2 ) − 2E (X )[E (X ) + E (Y )] − 2E (Y )[E (X ) + E (Y )] [E (X )]2 + 2E (X )E (Y ) + [E (Y )]2 E (X 2 ) + 2E (X Y ) + E (Y 2 ) − 2[E (X )]2 − 2E (X )E (Y ) − 2E (Y )E (X ) − 2[E (Y )]2 [E (X )]2 + 2E (X )E (Y ) + [E (Y )]2 E (X 2 ) − [E (X )]2 + E (Y 2 ) − [E (Y )]2 + 2E (X Y ) − 2E (X )E (Y ) VAR(X ) + VAR(Y ) + 2 · COV(X , Y ) A demonstração para VAR(X − Y ) = VAR(X ) + VAR(Y )2 · COV(X , Y ) é análoga. 6.39 Teorema. Sejam X e Y duas variáveis aleatórias independentes. Então COV(X , Y ) = 0 e VAR(X ± Y ) = VAR(X ) + VAR(Y ). Prova. COV(X , Y ) = E (X Y ) − E (X )E (Y ) = E (X )E (Y ) − E (X )E (Y ) = 0 e VAR(X ± Y ) = VAR(X ) + VAR(Y ) ± 2 · COV(X , Y ) = VAR(X ) + VAR(Y ). 109

(236) 6.7. ATIVIDADE Quando COV(X , Y ) = 0 dizemos que as variáveis aleatórias X e Y são não correlacionadas. A recíproca do Teorema 6.39 não é verdadeira, isto é, se COV(X , Y ) = 0, não podemos afirmar que as variáveis aleatórias X e Y sejam independentes. ER 6.100. Dada a distribuição de probabilidade conjunta abaixo, verificar se X e Y são independentes e calcular a covariância entre X e Y . Y \X −1 1 −1 0 1 0, 10 0, 30 0, 10 0, 25 0, 00 0, 25 Solução: Se X e Y são independentes a probabilidade da distribuição conjunta é igual ao produto das distribuições marginais. Então, calculando as distribuições marginais para verificar a independência: Y \X −1 0 1 P(yi ) −1 0, 10 0, 30 0, 10 0, 50 1 0, 25 0, 00 0, 25 0, 50 P(xi ) 0, 35 0, 30 0, 35 1, 00 Para que duas variáveis aleatórias X e Y sejam independentes a condição de independência tem que ser verificada para todos os pares de valores possíveis de X e Y . Sendo assim, observe que as variáveis X e Y são dependentes, pois, P(X = −1, Y = −1) = 0, 1 e P(X = −1) · P(Y = −1) = 0, 35 · 0, 50 = 0, 175.

(237)

(238)

(239)

(240) Entretanto, COV(X , Y ) = E (X Y ) − E (X )E (Y ) = 0. De fato, E (X ) = i E (Y ) = j E (X Y ) = i 6.7 xi P(xi ) = −1 · 0, 35 + 0 · 0, 3 + 1 · 0, 35 = 0 yj P(yj ) = −1 · 0, 50 + 1 · 0, 50 = 0 xi yj P(xi , yj ) = 0 j Atividade EP 6.125. No lançamento simultâneo de dois dados, considere as seguintes variáveis aleatórias: X : o número obtido na face superior do 1◦ dado; Y : o número obtido na face superior do 2◦ dado. (a) Construir a distribuição de probabilidade através de uma tabela e de um gráfico das seguinte variáveis: 1. W = X − Y ; 2. A = 2Y ; 3. Z = X · Y . (b) Construir a função de repartição das Variáveis W, A e Z 110

(241) Estatística (c) Aplicar as propriedades e determinar: (i) P(−3 < W ≤ 3); (ii) P(0 ≤ W ≤ 4) (iii) P(A > 6) (v) P(Z = 3) (vi) P(A ≥ 11) (iv) P(Z ≤ 5.5) (iii) P(20 ≤ Z ≤ 35) (viii) P(3, 5 < Z < 34) (d) Determine E (W ), E (A), E (Z ), V (W ), V (A) e V (Z ). EP 6.126. Uma variável aleatória discreta tem a distribuição de probabilidade dada por: k , para x = 1, 3, 5, 7. x P(X ) = (a) Calcule o valor de k; (b) Calcular P(X = 5); (c) VAR(X ) EP 6.127. Seja Z a variável aleatória correspondente ao número de pontos de uma peça de dominó. (a) Construir a tabela e traçar o gráfico P(Z ); (b) Determinar F (Z ) e traçar o gráfico; (c) Calcular P(2 ≤ Z < 6); (d) Calcular F (8). (e) VAR(Z ). EP 6.128. Um dado é viciado, de modo que cada número par tem cinco vezes mais chances de aparecer num lançamento, que qualquer número ímpar. Determine a esperança e o desvio padrão. EP 6.129. Considere a seguinte distribuição conjunta de X e Y : X Y −2 −1 4 5 1 0, 1 0, 2 0 0, 3 2 0, 2 0, 1 0, 1 0 (a) Determine as distribuições marginais de X e Y ; (b) Calcule E (X ), E (Y ) e E (X Y ); (c) As variáveis X e Y são independentes. Por quê? (d) Calcule a covariância entre X e Y ; (e) Calcule os desvios padrões de X e de Y ; EP 6.130. Seja X uma variável aleatória cuja função densidade de probabilidade é dada por: f (x) = 3 (1 − x 2 ) , x ∈ (0, 1) 2 0 , x ∈ R \ (0, 1) 111

(242) 6.7. ATIVIDADE (a) Ache a função de repartição e esboce o gráfico; (b) Calcule P(0, 25 < X < 0, 65) (b) Determine VAR(X ). f (x) = EP 6.131. Seja x 2 0 , x ∈ [0, 2] , x ∈ R \ [0, 2] (a) Ache a função de repartição e esboce o gráfico; (b) P(1 < X < 1, 5); (c) VAR(X ). EP 6.132. Uma variável aleatória X tem a seguinte função densidade de probabilidade:  f (x) =  k , 0≤x <2 k(x − 1) , 2 ≤ x < 4 0 , x < 0 ou x ≥ 4. (a) Determine k e represente graficamente f (x); (b) Determine FX (x) e esboce o gráfico; (c) VAR(X ). EP 6.133. A função densidade de probabilidade de uma variável aleatória X é  f (x) = 6x(1 − x) , x ∈ (0; 1) 0 , x ∈ R \ (0; 1). (a) Determine FX (x) e a represente graficamente;  (b) Calcule P X ≥  1 ; 2 (c) Calcule E (X ) e VAR(X ). Alguns Modelos Probabilísticos para Variáveis Aleatórias Existem modelos probabilísticos que ocorrem com freqüência na prática. Nas próximas seções, serão definidos alguns modelos, apresentando as condições que devem ser satisfeitas e algumas características, tais como, esperança, variância e como calcular probabilidade. 112

(243) Estatística 7.1 7.1.1 Modelos Probabilísticos para Variáveis Aleatórias Discretas Distribuição de Bernoulli Uma variável aleatória discreta X tem distribuição, prova ou ensaio de Bernoulli, X ∼ B(p), se é um modelo probabilístico aplicado a variáveis aleatórias dicotômicas, isto é, se representa um experimento cujo resultado pode ser um sucesso (se ocorrer o evento de interesse) ou um fracasso (o evento de interesse não ocorre). Por exemplo: (a) de um lote contendo um certo número de peças, escolher, ao acaso, uma peça é defeituosa ou não; (b) no lançamento de um dado, observar se o resultado foi o lado “2” ou outro lado qualquer; (c) observar se uma peça produzida por uma empresa é perfeita ou defeituosa. Probabilidade numa distribuição de Bernoulli Seja X uma variável aleatória definida para um experimento aleatório E com apenas dois resultados possíveis. Podemos associar o valor 0 ao fracasso e o valor 1 ao sucesso. Portanto, o espaço amostral associado a este experimento pode ser representado da seguinte forma: S = f r acasso; sucessoouS = 0; 1 Suponha que um sucesso ocorra com probabilidade p. Então, a função de probabilidade de X é definida como: P(X = 1) = P(ocorrer sucesso) = P(1) = p P(X = 0) = P(ocorrer fracasso) = P(0) = q = 1 − p, ou seja, 0 1 1−p p X P(X = xi ) NOTAÇÃO: X ∼ Ber noulli(p). Lê-se da seguinte forma: X tem distribuição Bernoulli com parâmetro p. ER 7.101. Qual a função de probabilidade no lançamento de um dado e a ocorrência da face “6”? Solução: Sucesso: ocorrer a face “6”. Podemos definir a variável aleatória X da seguinte forma X face 6 demais faces 1 0 A função de probabilidade da variável aleatória X é, portanto,  P(X = x) = 1 6 5 6 se x = 1 se x = 0 113

(244) 7.1. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS A Esperança e a Variância numa Distribuição de Bernoulli 7.40 Teorema. A esperança e a variância de sucessos de uma variável aleatória X em uma distribuição Bernoulli com parâmetro p são, respectivamente E (X ) = p e VAR(X ) = p(1 − p). Prova. Seja a variável aleatória X com distribuição de Bernoulli: 0 1 1−p p X P(X = xi ) Sendo X uma variável aleatória discreta, temos: 2

(245) E (X ) = i =1 VAR(X ) xi · P(X = xi ) = 1 · p + 0 · (1 − p) = p. E (X 2 ) − [E (X )]2 = p − p 2 = p(1 − p). = ER 7.102. Qual a variância numa distribuição dada ao consideramos o lançamento de um dado e obtenção da face 2? Solução: Consideremos o evento E (sucesso): ocorrer a face 2. Podemos definir uma variável aleatória  X da seguinte forma: X = 1 , se ocorrer a face 2 0 , se ocorrer uma face diferente de2 A distribuição de Bernoulli da variável aleatória X é   P(X = x) =   1 6 , se x = 1 5 6 , se x = 0 A esperança e a variância de X são, respectivamente, E (X ) = 7.1.2 1 1 5 5 e VAR(X ) = · = . 6 6 6 36 Distribuição Binomial Podemos entender a distribuição binomial como uma extensão da distribuição de Bernoulli. Considere E um experimento aleatório do tipo Bernoulli. Ao repetirmos este experimento n vezes, n ≥ 2, de forma independente, podemos associar uma variável aleatória Xi , 1 ≤ i ≤ n, a cada i-ésima repetição do experimento E . Uma vez que, para cada repetição do experimento E , temos a seguinte distribuição de probabilidade:  P(Xi = x) = P(x) = 114 p , se x = 1 1−p , se x = 0

(246) Estatística A partir dessas repetições, pode-se definir uma seqüência (X1 , X2 , X3 , . . . , Xn ) de sucessos e fracassos, ou seja, uma seqüência onde cada termo assumirá valores iguais a zero ou um, num total de n elementos. Portanto, definamos uma nova variável aleatória Y que representa o número de sucessos ocorridos nas n-ésimas repetições do experimento E , ou seja, Y : Xn → N (X1 , X2 , . . . , Xn ) → Y (X ) = #$

(247) n Xi . i =1 Nestas condições dizemos que Y tem distribuição binomial com parâmetros n e p (Y ∼ B(n, p)) P(Yi = y ) = P(y ) = n y · p y · (1 − p)n−y , em que os valores possíveis de y são inteiros positivos e no máximo igual a n. Em outras palavras, um experimento é binomial se: i) n repetições de um experimento básico que tem apenas dois resultados possíveis; ii) as repetições são independentes; iii) a probabilidade de ocorrer o evento no qual estamos interessados (sucesso) em cada repetição é sempre igual a p. #$ 7.41 Observação. n x = n! (n − x)! · x! ER 7.103. Uma usina hidrelétrica tem 5 geradores que funcionam independentemente, cada um com probabilidade 0, 98 de estar em operação. Qual a probabilidade de que exatamente dois estejam em funcionamento em determinado instante? Solução: Seja Y a variável aleatória que expressa se o gerador está ou não em funcionamento. A probabilidade de um gerador estar em funcionamento (a probabilidade de sucesso) é p = 0, 98 #$ Por se tratar de uma distribuição binomial, P(X = 2) = 5 0, 982 · (1 − 0, 98)5−2 = 10 · (0, 98)2 · (0, 02)3 = 0, 000077. 2 ER 7.104. Se a probabilidade de um estabelecimento agrícola possuir trator e 0, 3 e se pesquisarmos oito estabelecimentos, qual a probabilidade de: (a) Exatamente dois possuírem trator? (b) No máximo dois possuírem trator? (c) No mínimo três possuírem trator? 115

(248) 7.1. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS Solução: a) P(X = 2) = '( 8 2 · 0, 32 · 0, 76 = 0, 29647548. b) P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = '( 8 0 · 0, 30 · 0, 78 + 0, 55177381. '( 8 1 · 0, 31 · 0, 77 + '( 8 2 · 0, 32 · 0, 76 = c) P(X ≥ 3) = 1 − P(X ≤ 2) = 1 − 0, 55177381 = 0, 44822619 ER 7.105. Vinte peças são extraídas, ao acaso e com reposição, de um lote contendo 1000 peças. Qual a probabilidade de que 5 peças, dentre as 20 selecionadas, sejam defeituosas, sabendo-se que 8% das peças do lote são defeituosas? Solução: P(X = 5) = '( 20 5 · 0, 085 · 0, 9215 = 0, 014544912. ER 7.106. Para condenar um acusado são necessários ao menos 9 votos de um júri composto por 12 jurados. Suponha que a probabilidade de que um jurado vote que um culpado seja inocente é 0, 2 e a probabilidade de que um jurado vote que um inocente seja culpado é 0, 1. Se cada jurado age independentemente e se 65% dos acusados são culpados, encontre a probabilidade de que o júri tome a decisão correta. Que porcentagem de culpados são condenados? Solução: Sejam os eventos: C : o acusado é condenado. A: o acusado é inocentado. I : o acusado é inocente. P: o acusado é culpado. K : o júri toma a decisão correta. Do teorema da probabilidade total, condicionando K pelos eventos I e P, temos que P(K ) = P(K |I ) · P(I ) + P(K |P) · P(P). Como P(I ) = 0, 35 e P(P) = 0, 65, basta calcularmos as duas probabilidades condicionais. Sejam as variáveis aleatórias: X : jurados que votam que o acusado é culpado quando ele é culpado. Y : jurados que votam que o acusado é inocente quando ele é inocente. Pelo enunciado da questão, temos que X ∼ Bin(12; 0, 8) e Y ∼ Bin(12; 0, 9). Entretanto, ao menos 9 votos do júri são necessários para condenar um acusado. Sendo assim,

(249) 12 P(K |P) = P(X ≥ 9) = 116 i =9 P(X = i) = 0, 79.

(250) Estatística Se ao menos 9 votos são necessários para condenar um acusado, então, ao menos 4 votos são necessários para inocentá-lo. Daí, temos: P(K |I ) = P(Y ≥ 4) = 12

(251) P(Y = i) = 0, 99 i =4 Retornando à equação inicial, P(K ) = P(K |I ) · P(I ) + P(K |P) · P(P) = 0, 99 · 0, 35 + 0, 79 · 0, 65 = 0, 86. Logo, a probabilidade do júri tomar a decisão correta é de 0, 86. Para o segundo item vamos, novamente, utilizar o teorema da probabilidade total, condicionando C pelos dois eventos I e P. Sendo assim, temos que P(C ) = P(C |I ) · P(I ) + P(C |P) · P(P). Do enunciado já temos P(I ) e P(P). Obtivemos, anteriormente, o valor de P(C |P) (isso nada mais é do que P(K |P) = 0, 79). Nos resta calcular P(C |I ). Considere a variável aleatória W : número de jurados que condenam um inocente, em que W ∼ Bin(12; 0, 1). Sabemos que para um acusado ser condenado precisamos de ao menos 9 votos, então: P(C |I ) = P(W ≥ 9) = 12

(252) i =9 P(W = i) = 1, 65 · 10−7 . Temos, então, que: P(C ) = 1, 65 · 10−7 · 0, 35 + 0, 79 · 0, 65 = 0, 51. Logo, 51% dos acusados são condenados. Esperança e Variância de uma Distribuição Binomial 7.42 Teorema. Seja Y uma variável aleatória com distribuição binomial de parâmetros n e p. Então E (Y ) = n · p e VAR(Y ) = n · p · (1 − p). Prova. Sejam Xi , 1 ≤ i ≤ n, n variáveis aleatórias independentes do tipo Bernoulli, ou seja,  P(Xi = x) = P(x) = p , se x = 1 1−p , se x = 0 Então, E (Xi = p) e VAR(Xi ) = p · (1 − p), para cada i. Seja Y = X1 + X2 + . . . + Xn , o número de sucessos nas n provas independentes de Bernoulli, e a variável aleatória Y ∼ B(n, p). Então, a esperança de Y é dada por: E (Y ) = E (X1 + X2 + . . . + Xn ) = E (X1 ) + E (X2 ) + . . . + E (Xn ) = p + p + . . . + p = n · p 117

(253) 7.1. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS e, a variância de Y VAR(Y ) = VAR(X1 + X2 + . . . + Xn ) = VAR(X1 ) + VAR(X2 ) + . . . + VAR(Xn ) = p ·q + p · q + ...+ p ·q = n · p · q. ER 7.107. Com os dados do exemplo anterior, calcular o número esperado, a variância e o desvio-padrão dos geradores em funcionamento. Solução: E (X ) = n · p = 5 · 0, 98 = 4, 9, VAR(X ) = n · p · q = 5 · 0, 98 · 0, 02 = 0, 098 e σ(X ) = √ 0, 098 = 0, 3130. Atividade EP 7.134. Das variáveis abaixo descritas, assinale quais são binomiais, e para estas dê os respectivos campos de definição e distribuição de probabilidades. Quando julgar que a variável não é binomial, aponte as razões de sua conclusão. (a) De um urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposição, cinco bolas. Seja X é o número de bolas brancas nas 5 extrações. (b) Refaça o problema anterior, mas desta vez as n extrações são sem reposição. Resp.: Não é Binomial. (c) De 5 urnas com bolas pretas e brancas, vamos extrair de cada uma delas uma bola. Suponha que X é o número de bolas brancas obtidas no final. (d) Em uma indústria existem 100 máquinas que fabricam determinada peça. Cada peça é classificada como sendo boa ou defeituosa. Escolhemos ao acaso um instante de tempo, e verificamos uma peça de cada uma das máquinas. Suponha que X seja o número de peças defeituosas. EP 7.135. Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá, no máximo, 2 defeituosas. Se a caixa contém 18 peças, e a experiência tem demonstrado que esse processo de fabricação produz 5% das peças defeituosas, qual a probabilidade de que uma caixa satisfaça a garantia? EP 7.136. Dez peças são extraídas, ao acaso, com reposição de um lote contendo 500 peças, qual a probabilidade de que três peças, dentre as 10 selecionadas, sejam defeituosas, sabendo-se que 10% das peças do lote são defeituosas? EP 7.137. Uma tampa de garrafa é lançada 10 vezes para o alto. Calcule a probabilidade da tampa cair virada para cima: (a) 9 vezes. (b) Pelo menos 8 vezes. (c) No máximo 3 vezes. EP 7.138. Um dado honesto é lançado 5 vezes para cima. Calcule a probabilidade da face 3 aparecer: (a) 2 vezes. (b) Pelo menos 3 vezes. (c) No máximo 2 vezes. EP 7.139. Admitindo-se que as chances de saírem cara e coroa sejam iguais em uma moeda não viciada. Calcular a probabilidade de se obter 6 caras e 2 coroas. 118

(254) Estatística EP 7.140. Um time X tem 1/3 de probabilidade de vitória sempre que joga. Se X jogar 3 partidas, calcule a probabilidade de: (a) X vencer exatamente 2 partidas; (b) X vencer pelo menos uma partida EP 7.141. Uma moeda não-viciada é lançada 6 vezes: (a) Qual a probabilidade de se obter duas coroas; (b) a probabilidade de acontecer ao menos 4 caras. EP 7.142. Se 15% das peças produzidas por uma máquina tem algum defeito, determinara probabilidade de que entre 10 peças escolhidas ao acaso: (a) Uma ter defeito; (b) nenhuma ter defeito. EP 7.143. Qual a probabilidade de uma casa com 6 filhos ter 4 filhos homens e 2 mulheres, sabendo que a probabilidade de nascer filho homem é 75%? EP 7.144. Num cesto cheio de bombons onde 40% deles estão envenenados, qual a probabilidade de uma pessoa pegar 2 bombons sem veneno em 4 idas ao cesto? EP 7.145. Uma moeda não viciada é lançada 4 vezes. Encontre a probabilidade de: (a) Dar 2 caras (c) No máximo 3 caras (b) Pelo menos 1 cara (d) Calcular a variância e a média da distribuição EP 7.146. Admitindo-se a probabilidade de nascimento de meninos e meninas sejam iguais. Calcular a probabilidade de um casal com 8 filhos ter 6 homens e 2 mulheres. 7.1.3 Distribuição de Poisson A distribuição foi descoberta por Siméon-Denis Poisson (1781 − 1840) e publicada, conjuntamente com a sua teoria da probabilidade, em 1838 no seu trabalho Recherches sur la probabilité des jugements en matières criminelles et matière civile (“Inquérito sobre a probabilidade em julgamentos sobre matérias criminais e civis”). O trabalho focava-se em certas variáveis aleatórias N que contavam, entre outras coisas, o número de ocorrências discretas (por vezes chamadas de “chegadas”) que tinham lugar durante um intervalo de tempo de determinado comprimento. Em muitos casos, conhece-se o número de sucessos, porém, se torna difícil e, às vezes, sem sentido, determinar o número de fracassos ou o número total de provas. Por exemplo: automóveis que passam numa esquina. Pode-se num determinado intervalo de tempo anotar o número de carros que passaram, porém, o número de carros que deixaram de passar pela esquina não poderá ser determinado. Veremos que a distribuição de Poisson se aplica nestes casos. A distribuição de Poisson é largamente usada quando de deseja contar o número de eventos de um certo tipo que ocorrem em um intervalo de tempo, superfície ou volume. Por exemplo: o número de chamadas telefônicas recebidas por um PABX durante um intervalo pequeno de tempo; o número de falhas de um computador em um dia de operação; o número de glóbulos sanguíneos visíveis ao microscópio ou a área de superfície visível no campo do microscópio sendo dada por unidades quadradas; o número de estrelas encontradas em uma parte da Via-Láctea que tenha o volume V . 119

(255) 7.1. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS A Probabilidade numa Distribuição de Poisson Seja X a variável aleatória “número de repetições de um determinado evento”, que ocorre em um intervalo de tempo, ou em uma superfície, ou em um volume. Certamente X assume valores numa sucessão infinita 1, 2, 3, 4, . . .. Suponha que estes eventos ocorrem em instantes aleatórios de tempo ou de espaço e que as hipóteses abaixo sejam válidas: 1. o número de ocorrências de um evento em um intervalo de tempo, ou superfície, ou volume é independente do número de ocorrências do evento em qualquer outro intervalo disjunto. 2. a probabilidade de duas ou mais ocorrências simultâneas é praticamente zero. 3. o número médio de ocorrências por unidade de tempo, ou superfície, ou volume, α, é constante ao longo do tempo, ou superfície, ou volume. Nestas condições dizemos que X tem distribuição Poisson com parâmetro λ = αt (X ∼ Poisson(λ)) e a probabilidade de X assumir um valor x é calculado por P(X = x) = e −λ · λx x! ( 7.58) ER 7.108. Numa indústria têxtil existem númerosos teares de certo tipo. Depois de muitas observações, chegou-se à conclusão que o número de teares que se avariam em cada mês é uma variável aleatória X com distribuição de Poisson com parâmetro 3. Calcule a probabilidade de que 3 ou mais teares se variem durante um mês. Solução: P(X ≥ 3) = = = * + P(X = 3) + P(X = 4) + . . . = 1 − P(X < 3) = 1 − [P(X = 0) + P(X = 1) + P(X = 2)] e −3 · 30 e −3 · 31 e −3 · 32 1− + + 0! 1! 2! 9 −3 17 −3 −3 −3 1 − e − 3e − · e = 1 − · e ≈ 0, 57681 2 2 A Esperança e Variância numa Distribuição de Poisson 7.43 Teorema. Se X tem distribuição Poisson com parâmetro λ, então E (X ) = VAR(X ) = λ. Prova. Por definição

(256) i =1

(257) ∞ ∞ E (X ) = xi · P(xi ) = xi i =1 e −λ · λxi = xi !

(258) ∞ i =1 xi e −λ · λxi = xi · (xi − 1)!

(259) ∞ i =1 Por definição xi assume valores em {1, 2, 3, . . .} e fazendo xi − 1 = y , tem-se

(260) +∞ E (X ) = i =0 120 e −λ · λy+1 = λe −λ y!

(261) +∞ i =0 λy . y! e −λ · λxi (xi − 1)!

(262) Estatística

(263) n Como i =1 λy = e λ (Série de Maclaurin), obtém-se y! E (X ) = λ. Calculemos, agora,

(264) ∞ E (X 2 ) = i =1 xi2 e −λ · λxi = xi !

(265) ∞ i =1 xi2 e −λ · λxi = xi (xi − 1)!

(266) ∞ xi i =1 e −λ · λxi . (xi − 1)! Utilizando-se a mesma mudança de variável, tem-se

(267)

(268) ∞ E (X 2 ) = (yj + 1) j=0 ∞ = yj j=0 e −λ · λyi +1 + yj !

(269)

(270) ∞ = = λe −λ j=0 ∞ 2 −λ λ e e −λ · λyi +1 yj !

(271) ∞ j=0 λyi + λe −λ yj yj ! j=0 e −λ · λyi +1 yj !

(272) ∞ j=0 λyj yj ! λyj −1 + λe −λ yj yj (yj − 1)! = λ2 e −λ e λ + λe −λ e λ = λ2 + λ.

(273) ∞ j=0 λyj yj ! No caso da variância, temos, de acordo com a definição, que VAR(X ) = E (X 2 ) − [E (X )]2 = λ2 + λ − λ2 = λ. Claro que, se a variância é VAR(X ) = λ, então σ(X ) = √ λ. ER 7.109. Em média há duas chamadas por hora num certo telefone. Calcular a probabilidade de se receber no máximo 3 chamadas em duas horas e a probabilidade de nenhuma chamada em 90 minutos. Solução: Seja X o número de chamadas telefônicas em duas horas. Então, α = 2 (número médio chamadas por hora), t = 2h. Logo, λ = α · t = 4 (número médio chamadas em duas horas). Portanto,

(274)

(275) 4 4 P(X ≤ 3) = P(X = xi ) = i =1 i =1 e −4 · 4xi = 0, 4331 xi ! Seja Y o número de chamadas telefônicas em 90 minutos. Então, t = 90min, α = de chamadas por minuto) e λ = α · t = 3 (número médio chamadas em 90 minutos). P(Y = 0) = 2 (número médio 60 e −3 · 30 = 0, 0498. 0! 7.44 Teorema. A média ou valor esperado de sucesso de uma distribuição de Poisson de parâmetro λ é λ e a variância por VAR(X ) = λ. 121

(276) 7.1. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS Prova.

(277) = x=0 x · P(x) = = λ·e

(278) −λ ∞ E (X 2 ) = x=0

(279) ∞ ∞ E (X ) x=0 ,

(280) .

(281)

(282) ∞ x=0 x2 · ·

(283) ∞ ∞ λx−1 λ · λx−1 e −λ · λx = e −λ · = λ · e −λ · x2 · x· x! x · (x − 1)! (x − 1)! x=0 x=0

(284) ∞ ∞ = λ·e

(285) ∞ ·e =λ λx−1 e 0−1 + x· = λ · e −λ · 0 · (0 − 1)! x=1 (x − 1)! −λ

(286) ∞ λ x 2 · P(x) = = λ · e −λ ·

(287) λ · λx−1 e −λ · λx λx−1 = e −λ · = λ · e −λ · x· x! x · (x − 1)! (x − 1)! x=0 x=0 x· (x − 1 + 1) · x=1 ∞ - .

(288) / .

(289) λx−1 = λ · e −λ · (x − 1)! x−1 λ + eλ = λ · (x − 1) · (x − 1)! x= ∞ x= ∞ (x − 1) · λx−1 + (x − 1)! −λ x−1

(290) ∞ x= λx−1 (x − 1)! ·λ + e −λ · e λ (x − 1) · (x − 1)! x= e / / = λ · [E (x) + 1] = λ · [λ + 1] = λ2 + λ Logo, V (X ) = E (X 2 ) − [E (X )]2 = λ2 + λ − λ2 = λ. 7.1.4 Distribuição Binomial × Distribuição de Poisson 7.45 Teorema. Seja X uma variável aleatória com distribuição binomial com parâmetros n e p. Quando o número n de repetições do experimento E cresce e a probabilidade p de sucesso se aproxima de zero, de modo que n · p se aproxima de uma constante λ, dizemos que a distribuição binomial converge para a n  distribuição de Poisson com parâmetro λ. Então lim n→∞ p→0 n·p→λ x · p x · (1 − p)n−x = e −λ · λx x! A distribuição de Poisson pode ser usada como uma aproximação da distribuição Binomial quando n é grande e p é pequeno (np ≤ 7). P(X = x) = #$ n e −λ · λx , onde λ = np. · p x · (1 − p)n−x ≈ x! x Ou seja, X ∼ B(n, p) ≈ Poisson(λ = np) EP 7.147. Em um jogo de futebol, o público estimado foi de 50.000 pessoas. A probabilidade de uma pessoa consumir determinada marca de refrigerante durante o jogo é de 1/20.000, supondo que o ato do consumo de uma pessoa seja independente, qual a probabilidade de 5 pessoas comprarem esse produto durante o jogo? Solução: Sejam E o evento assistir o jogo de futebol, p = 1/20.000 a probabilidade de comprar o referido refrigerante (sucesso), n = 50.000 (número de pessoas que assistiram o jogo) e X a variável aleatória que representa o consumo por esse produto. Observe que X tem distribuição binomial, ou seja, 122 X ∼ B(50.000; 1/20.000),

(291) Estatística e que calcular a probabilidade de 5 pessoas comprarem este refrigerante por uma distribuição binomial é uma tarefa bastante extensa devido aos elevados números utilizados, como indicado a seguir # P(X = 5) = $ 50.000 0, 000055 · 0, 9999549.995 = 0, 066800108. 5 Entretanto, sendo n = 50.000, um número muito grande, e p = 0, 00005, bem próximo a zero, as condições para a aproximação entre as distribuições Binomial e de Poisson estão satisfeitas. Sendo assim, X converge para uma distribuição de Poisson com parâmetro λ = nλp = 50.000 · 0, 00005 = 2, 5 e cuja esperança é E (X ) = λ = 2, 5. Calculando, agora, a probabilidade pedida pela distribuição de Poisson: P(X = 5) = e −2,5 · 2, 55 e −λ · λx = ≈ 0, 066800942. x! 5! EP 7.148. Consideremos 1.000 ensaios independentes de Bernoulli cada um com probabilidade p = 0, 0001 de sucesso. Determine a probabilidade de observarmos exatamente 2 sucessos. Solução: P(X = 2) ≈ e −0,1 · 0, 12 = 0, 0045. 2! EP 7.149. Determinado tipo de foto-receptor é vendido em caixas com 5.000 peças. É uma característica da fabricação produzir 0, 03% de defeituosos. Determine a probabilidade de que em uma caixa haja mais de dois defeituosos. Solução: n = 5.000 e p = 0, 0003, assim λ = np = 1, 5. P(X > 2) = 1 − P(X ≤ 2) = 1 − [P(X = 0) + P(X = 1) + P(X = 2)] = 0, 1912 Comparativo entre as Distribuições Binomial e Poisson Binomial é afetada pelo tamanho da amostra n e pela Poisson é afetada apenas pela média λ. probabilidade p de ocorrer sucesso. os valores possíveis da variável aleatória X numa Poisson os valores possíveis de X são são 0,1,2,...,n 0,1,2,..., sem limite superior. indicada para fenômenos considerados raros, ou seja, quando a probabilidade de ocorrência da característica de interesse é pequena (próxima a zero). 7.1.5 Atividade EP 7.150. Uma fábrica produz tecidos com média de 2, 2 defeitos por jarda quadrada. Determine as seguintes probabilidades: 123

(292) 7.1. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS DISCRETAS (a) não mais de 4 defeitos numa jarda quadrada; (b) nenhum defeito em duas jardas quadradas; (c) duas jardas quadradas cada uma com dois defeitos. EP 7.151. O número de petroleiros que chegam a uma refinaria em cada dia ocorre segundo uma distribuição de Poisson, com λ = 2. As atuais instalações podem atender, no máximo, a 3 petroleiros por dia. Se mais de 3 aportarem num dia, o excesso é enviado a outro porto. (a) Em um dia, qual a probabilidade de se enviar petroleiros para outro porto? (b) De quanto deverão ser aumentadas as instalações para permitir atender a todos os navios que chegarem pelo menos em 95% dos dias? (c) Qual o número médio de petroleiros que chegam por dia? EP 7.152. Uma agência recebe em média 4 ligações por minuto. Calcule a probabilidade de: (a) Receber no máximo 2 ligações por minuto. (b) Receber nenhuma ligação durante 1 minuto. EP 7.153. Em uma avenida passam em média 5 carros por segundo. Calcule a probabilidade de passar: (a) Exatamente 2 carros em 1 segundo. (b) No máximo 3 carros em 2 segundos. EP 7.154. Uma montadora de carros constatou que ao testar os carros, em média, um defeito a cada 3.000km rodados. (a) Qual a probabilidade de que num teste de 2.500km haja no máximo um defeito? (b) Qual a probabilidade de que um carro ande 5.000km sem que haja defeito? EP 7.155. A média de chamadas telefônicas numa hora é 2. Qual a probabilidade de: (a) Receber exatamente 2 chamadas numa hora. (b) Receber 3 ou mais chamadas em 90 minutos. EP 7.156. Um advogado atende em média 4 clientes por hora. Calcule a probabilidade de se atendes exatamente 4 clientes. EP 7.157. Para este mesmo advogado, calcule a probabilidade de: (a) atender apenas dois clientes em uma hora; (b)não atender nenhum cliente em uma hora. EP 7.158. Se a probabilidade de um aparelho telefônico ser instado possuindo algum tipo de defeito é 0, 002, determinar a probabilidade de entre 5000 aparelhos instalados: (a) exatamente 5 serem defeituosos; (b) mais do que 2 serem defeituosos. EP 7.159. Na pintura de parede aparecem defeitos em média na proporção de 2 defeitos por metro quadrado. Qual a probabilidade de aparecerem 5 defeitos numa parede de 3 × 2 m? EP 7.160. Um call-center recebe em média 6 chamadas por hora. Qual a probabilidade de: (a) Receber 10 chamadas em 1 hora. (b) Receber 3 chamadas em 30 minutos EP 7.161. Uma loja atende em média 4 clientes por hora calcular a probabilidade de atender: (a) atender 1 cliente (b) não atender nenhum cliente EP 7.162. A média de chamadas telefônicas em uma hora é 2. Qual a probabilidade de: (a) não receber nenhuma chamada em 90 minutos.(b) receber 3 chamadas no máximo. 124

(293) Estatística 7.2 Modelos Probabilísticos para Variáveis Aleatórias Contínuas 7.2.1 Distribuição Uniforme Uma variável aleatória X é uniformemente distribuída num intervalo [a, b] se sua densidade de proba- f (x) = bilidade é dada pela função: ! 1 , a≤x ≤b b−a 0 , x

(294) ∈ [a, b] ( 7.59) y De fato, para uma variável aleatória X uniformemente distribuída em [a, b] devemos ter que Aretângulo = b f (x) f (x) dx = 1 (observe o gráfico ao lado). A a 1 , para a ≤ x ≤ b. Assim, (b − a) · f (x) = 1, ou seja, f (x) = b−a a x b Facilmente, podemos encontrar a sua função de repartição: 0,  x − a F (x) =  b − a , 1, 7.2.2 x
(295) 7.2. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS CONTÍNUAS (b) A média é obtida por E [X ] = 7.2.3 (8 − 2)2 2+8 = 5 e (c) a variância por VAR[X ] = = 3. 2 12 Atividade EP 7.164. Dada uma determinada distribuição uniforme, um intervalo [2, 5], calcule pelas fórmulas conhecidas a média e a variância. EP 7.165. Um ponto é escolhido ao acaso em um segmento de reta [5, 10]. Calcular: (a) Probabilidade de encontrar um ponto entre 6 e 8. (b) Média. (c) Variância. EP 7.166. Dado o intervalo [3/2, 8/3] um número é escolhido ao acaso calcular: (a) A probabilidade deste número estar entre [7/4, 9/4]; (b) Qual a variância da distribuição. EP 7.167. Um ponto é escolhido ao acaso no segmento de reta [1, 5]. Calcular: (a) A probabilidade de que o ponto escolhido esteja entre 5/2 e 4 (b) Calcule a média da distribuição EP 7.168. Um ponto é escolhido ao acaso no segmento [1, 5]. Calcule: (a) Probabilidade de que o ponto escolhido esteja entre 2 e 4; (b) A média dessa distribuição EP 7.169. Supondo que X seja uniformemente distribuído entre [−α, α], onde α > 0. Calcule α de modo que P(X > 1) = 1/3. EP 7.170. Um ponto é escolhido ao acaso num segmento de reta [0, 3], calcule a probabilidade de que este ponto esteja entre 1/2 e 2, sabendo-se que a f (x) é dada por (b2 − a)/18. EP 7.171. A probabilidade de um animal selvagem ir para um zoológico e permanecer vivo lá é de 0, 25. Determine a probabilidade de entre 10 animais. (a) nenhum sobreviver; (b) ao menos um sobreviver; (c) um animal sobreviver. EP 7.172. Um ponto é escolhido ao acaso no segmento de reta [2, 6]. Calcular: (a) a probabilidade de que o ponto esteja entre 4 e 5. (b) entre 3 e 6 (d) a média dessa distribuição (c) seja exatamente 5 (e) a variância dessa distribuição EP 7.173. Um ponto é escolhido ao acaso no segmento de reta [1, 10]. Qual a probabilidade de: (a) o ponto estar entre 7 e 9; (b) o ponto estar entre 1, 5 e 3;(c) o ponto ser maior que 10. EP 7.174. Dois pontos são escolhidos independentemente no intervalo [0, 1], cada um de acordo com uma distribuição uniforme. Calcule o valor esperado: (a) do quadrado da distância entre eles. (b) da distância entre eles. EP 7.175. Um número X é escolhido de acordo com uma distribuição uniforme em [a, b]. Sem conhecer o número escolhido, você deve escolher um segundo número c e pagar uma quantia igual a (X − c)2 . Como você deve escolher c para minimizar o valor esperado desta quantia? Generalize para o caso em que X é uma variável integrável qualquer. 126

(296) Estatística 7.2.4 Distribuição Normal A Normal é uma das distribuições de probabilidade mais importantes na análise de fenômenos reais e de grande utilidade na Inferência Estatística e em Amostragem. Esta distribuição é também conhecida com os nomes de Curva de Gauss, Distribuição de Laplace ou ainda como Distribuição de Laplace-Gauss. O conhecimento desta distribuição de probabilidades se deve a Abraham de Moivre (1.667 − 1.754) que, em 1.733, apresentou a função que a representa. Tratava-se até então de um exercício teórico, sem aplicação prática. J. Bernoulli (1.654 − 1.705) acreditava que poderia haver aplicação na área da economia, no entanto, o uso desses conhecimentos na prática se deve a Pierre-Simon Laplace (1.749 − 1.827) na França e a Johan K. F. Gauss (1.777 − 1.855) na Alemanha. O nome “Curva de Gauss” se deve à suposição que Gauss tivesse sido a primeira pessoa a fazer uso de suas propriedades; no entanto, em 1.924, Karl Pearson reafirmou o papel fundamental de Abraham de Moivre. 7.47 Definição. Uma variável aleatória X segue uma distribuição Normal se a sua função de densidade é definida por (x−µ)2 1 f (x) = √ · e − 2σ2 , σ 2π ( 7.61) em que µ e σ são, respectivamente, a média e o desvio-padrão da distribuição. Podemos observar que a equação da distribuição Normal utiliza 2 parâmetros: a média populacional µ e o desvio padrão populacional σ. Denotamos por y N(µ,σ2 ) X ∼ N(µ, σ 2 ) a função de probabilidade cuja variável aleatória X segue uma Distribuição Normal com média µ e variância σ2 . A média µ se refere ao centro da distribuição e o desvio padrão σ ao espalhamento de curva. A Distribuição Normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes (ver gráfico ao lado). 7.2.5 µ+σ µ−σ Mo =µ=Md x Principais Características Considere a função f em 7.61. Suas principais características são: ⋄ A variável x pode assumir qualquer valor real x ∈ (−∞, +∞); ⋄ Os valores de y = f (x) são assintóticos em relação ao eixo das abscissas, isto é, nunca tocam o eixo de x; ⋄ A curva é simétrica e unimodal, apresentando um ponto de inflexão à esquerda em x = µ − σ e outro à direita em x = µ + σ; 127

(297) 7.2. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS CONTÍNUAS ⋄ Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da média são: Parâmetro Porcentagem µ + 1σ 68.3% µ + 2σ 95.5% µ + 3σ 99.7% Este resultado é usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de peixe podem ser descritos por uma distribuição normal, com média 140mm e desvio padrão 15mm. Podemos calcular a proporção dos peixes que têm comprimentos entre 110 e 170mm, por exemplo, como a proporção da área sob a curva entre 110 e 170mm. Então, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm. É importante que se entenda como a curva (gráfico da função f ) é afetada pelos valores numéricos de µ e σ. A figura a seguir mostra isso. Nota 1. A aplicação da distribuição y normal na análise de dados na área N(3, 0.25) biomédica é grande, pois muitas variáveis numéricas contínuas que estudamos têm distribuição normal ou aproximadamente normal. N(0, 1) Em alguns casos é possível N(3, 1) transformá-las, tornando-as compatíveis com a normal. Como exemplo, podemos N(3, 4) citar a altura, o peso, o índice de massa x corporal, etc. O Cálculo da Probabilidade pela Distribuição Normal Alguns dos principais métodos empregados na análise estatística (teste t de Student, análise de variância, análise de regressão, etc.) exigem que os dados tenham distribuição normal. Como se trata de distribuição de probabilidade contínua, a área que fica entre a curva e o eixo das abscissas representa a probabilidade. A probabilidade de ocorrer um evento entre os pontos a e b é calculada pela integral definida da função avaliada neste intervalo, i.e. ! P(a ≤ X ≤ b) = a b (x−µ)2 1 √ · e − 2σ2 dx. σ 2π A probabilidade é representada pela medida de área da região hachurada no gráfico seguinte. 128 a b

(298) Estatística A probabilidade de ocorrer um evento entre: −∞ e +∞ é igual a 1 ou 100%, representada pela região hachurada no gráfico seguinte. −∞ e µ ou entre µ e +∞ é 0, 5 ou 50%, representada pela região hachurada no gráfico seguinte. µ A Curva Normal Zero-Um, Padrão ou Reduzida Como vimos, o cálculo das probabilidades usando as técnicas de integração é sofisticado e complexo. Na prática desejamos calcular probabilidades para diferentes valores de µ e σ. Para isso, a variável aleatória X cuja distribuição é N(µ, σ2 ) é transformada numa noutra distribuição padronizada N(0, 1) (distribuição normal padrão), pois, tal distribuição é tabelada. Para encontrar a nova variável, define-se uma variável aleatória Z como uma transformação linear da variável aleatória X . Temos, então: Z= X −µ σ e dizemos que Z tem distribuição normal com média zero e variância um (Z ∼ N(0; 1)). Nota 2. (X − µ) na definição da variável Z , refere-se a mudança da origem da variável X para a sua media e a divisão pelo desvio padrão de X (σ) diz respeito a mudança na escala, ou seja, a distância entre a variável aleatória X e a sua média passa a ser medida em unidades do desvio padrão de X . A função de densidade de probabilidade da variável aleatória Z assume a expressão: z2 1 f (z) = √ e − 2 . 2π Uso da Tabela da Distribuição Normal Reduzida Como a curva normal é simétrica, é somente necessário apresentar as probabilidades da metade direita da curva. A probabilidade de um intervalo qualquer da metade esquerda é igual à probabilidade do intervalo equivalente na metade direita. Na normal reduzida P(0, z) = p enquanto P(Z ≥ z) = 0, 5 − p. 129

(299) 7.2. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS CONTÍNUAS N(0, 1) p 0 z 1−p A tabela a seguir apresenta em cada célula o valor das área limitada pelo gráfico da curva e o eixo horizontal, no intervalo [0, z]. 0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 EP 7.176. Determine: (a) P(0 < z < 1, 32); 130 (b) P(−2, 15 < z < 0); (c) P(−1, 56 < z < 1, 48).

(300) Estatística Com o auxílio da tabela da distribuição normal, temos que: (a) 0,4066 ; b) 0,4842 ; c) 0,4406+0,4306=0,8712 EP 7.177. A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8, 1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10ppm? Solução: Devemos determinar a proporção da distribuição que está acima de 10ppm, i.e. P(X > 10). Usando a estatística z temos:  P(X > 10) = P Z > 10 − 8 1.5  = P (Z > 1.33) = 1 − P (Z ≤ 1.33) = 0.09. Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios cerca de 9% do tempo. Atividade EP 7.178. A concentração de cádmio em cinzas de um certo lixo radioativo tem distribuição N(1, 0.72). Quais são as chances de que uma amostra aleatória das cinzas tenha uma concentração de cádmio entre 0.5 e 1.75ppm? EP 7.179. Uma fábrica de pneus verificou que o desgaste de seus pneus tem uma média de 48.000km e desvio-padrão de 2.000km. Calcule a probabilidade de um pneu: (a) Durar mais que 50.000km. (b) Durar entre 47.000km à 48.000km. EP 7.180. Uma televisão dura em média 10 anos e tem um desvio-padrão de 1 ano. Calcule a probabilidade de durar: (a) Acima de 12 anos. (b) Menos de 9 anos. (c) Entre 11 à 12 anos. EP 7.181. As alturas dos alunos de determinada escola são distribuídas com média 1, 65m e desviopadrão 0, 35m. Encontre a probabilidade de um aluno medir entre 1, 55m e 1, 85m. EP 7.182. Considerando a distribuição de alunos onde a média é 1, 55m e o desvio-padrão é 0, 42m. Qual deve ser o menor número para que possamos escolher os 10% maiores números. EP 7.183. A média dos diâmetros de uma amostra de 100 argolas para correntes produzidas por uma máquina é de 1, 500 polegadas e o desvio padrão é 0, 003 polegadas. Sendo fabricadas para tal finalidade, permite a tolerância de 1, 495 polegadas a 1, 505 polegadas, se isso não se verificar as argolas serão consideradas defeituosas. Determine a percentagem de argolas defeituosas. EP 7.184. As alturas das portas de um determinado prédio são em média 2, 50m e o desvio padrão é de 0, 20m. Encontre a probabilidade de uma porta medir: (a) entre 2, 30 e 2, 80; (b) mais de 2, 40. EP 7.185. Numa empresa a média salarial é de R$1.500, 00 o desvio padrão é de R$200, 00. Calcule a probabilidade de um funcionário receber entre R$1.350, 00 e R$1.600, 00. EP 7.186. Uma concessionária vende em média 6 carros por dia e o desvio-padrão é de 3 carros. Qual a probabilidade de se vender mais de 7 carros em um dia? EP 7.187. A duração de um certo componente eletrônico tem média de 800 dias e desvio-padrão 40 dias. Calcular a probabilidade desse componente durar: (a) entre 700 e 800 dias; (b) mais que 700 dias; (c) menos que 750 dias. 131

(301) 7.2. MODELOS PROBABILÍSTICOS PARA VARIÁVEIS ALEATÓRIAS CONTÍNUAS EP 7.188. Um produto pesa em média, 20g , com desvio-padrão de 4g . É embalado em caixas com 100 unidades. Sabe-se que as caixas vazias pesam 1000g , com desvio-padrão de 50g . Admitindo-se uma distribuição normal nos pesos dos produtos e independência entre as variáveis dos pesos do produto e da caixa. Calcular a probabilidade de uma caixa cheia pesar mais que 3100g . 7.2.6 Distribuição Exponencial 7.48 Definição. Seja X uma variável aleatória continua. Se X tem distribuição Exponencial, sua função de densidade de probabilidade e dada por f (x) = 1 − βx e , com x ≥ 0 e β ≥ 0. β Média e Variância da Distribuição Exponencial Na distribuição Exponencial com parâmetro β, a media e a variância de X são dadas por E (X ) = β e VAR(X ) = β 2 . ER 7.110. Suponha que o tempo de vida (em horas) de um fotorreceptor se comporte segundo um modelo exponencial definido por f (t) = 1 − t e 2000 , t ≥ 0. 2000 Calcule a probabilidade do fotorreceptor: (a) Durar mais do que 2.200 horas; (b) Durar até 500 horas. Solução: ! (a) P(t g e2200) = (b) P(t le500) = ! 0 ∞ 2200 500 1 − t e 2000 dx = 0, 3328 2000 1 − t e 2000 dx = 0, 2211 2000 Regressão Regressão e Correlação Nas pesquisas estatísticas, um dos objetivos é estabelecer relações que possibilitem predizer uma ou mais variáveis em termos de outra. Podemos citar o estudo das vendas futuras de um produto em função 132

(302) Estatística do seu preço, ou a perda de peso de uma pessoa em decorrência do número de semanas que se submete a uma dieta de 500 calorias por dia, ou a despesa de uma família com a educação dos filhos em função da idade dos mesmos, etc. O ideal seria a predição de uma quantidade exata em termos de outra, mas isso raramente é possível. Na maioria dos casos podemos obter a predição de médias ou valores esperados. Por exemplo, não podemos predizer exatamente quanto ganhará um engenheiro nos cinco anos subseqüentes a sua formatura, mas, com base em dados adequados, é possível predizer o ganho médio de todos os engenheiros nos cinco anos subseqüentes às formaturas. A predição do valor médio de uma variável em termos dos valores conhecidos de outras variáveis constitui o problema análise de regressão. Portanto, a regressão e a correlação são técnicas estreitamente relacionadas que envolvem uma forma de estimação. A regressão nos dá uma equação matemática, que descreve o relacionamento entre as variáveis e a correlação mede a força, ou grau, de relacionamento entre duas variáveis. 7.3 Ajustamento de Curvas O ajustamento de curvas é um processo pelo qual procura-se adequar uma curva que melhor se ajusta ao conjunto de dados que lhe foram apresentados. Inicialmente, estudaremos o ajuste linear: método utilizado para definir dentre as retas dadas, a de melhor ajuste, considerando um conjunto de dados. Este método exige que a reta de melhor ajuste aos dados tenha como resultado o menor valor para a soma dos quadrados das distâncias verticais dos pontos dados à reta. A Regressão linear simples constitui uma tentativa de se estabelecer uma equação matemática (modelo) linear (linha reta) que descreva o relacionamento entre duas variáveis. O objetivo principal da Análise de Regressão Linear Simples (objeto de estudo nesta disciplina) é predizer o valor de uma variável (variável dependente), dado que seja conhecido o valor de uma variável associada (variável independente). A equação de regressão é uma expressão algébrica pela qual se prevê o valor da variável dependente. Desta forma, a expressão análise de regressão simples indica que a predição da variável dependente é feita através de uma variável independente, enquanto que a análise de regressão múltipla diz respeito à predição da variável dependente através de duas ou mais variáveis independentes. Para um melhor entendimento consideremos o seguinte exemplo. EP 7.189. Considerando os dados o lado, qual das duas retas y = 5 ou y = 1 + x, é a de melhor ajuste? X 4 9 1 6 Y 6 10 2 2 Solução: 133

(303) 7.4. EQUAÇÕES NORMAIS (MÉTODO DOS MÍNIMOS QUADRADOS) ⋄p : y =1+x ⋄r : y =5 (yp − yr )2 x (2 − 5) = 9 1 (6 − 5) = 1 6 9 1 2 4 (xp − yr )2 x 2 4 (2 − 5)2 = 9 6 (10 − 5)2 = 25 9 (2 − 2)2 = 0 (6 − 5)2 = 1 (2 − 7)2 = 25 (10 − 10)2 = 0 Concluímos, observando o método, que a reta de melhor ajuste para estes dados é y = x + 1, pois, comparando a soma dos quadrados das distâncias obtivemos 26 < 44. Perceba na ilustração gráfica abaixo. y 10  6 p  r 2   1 4 6 x 9 Considerando os mesmos dados anteriores, verifique se a reta 14x − 17y + 15 = 0 é de melhor ajuste que as apresentadas. Naturalmente uma questão é levantada: a partir dos dados coletados e sabendo que a curva de melhor ajuste é uma reta (y = ax + b), como determinar esta reta, ou melhor, como achar os coeficientes angular a e o linear b? Na próxima seção desenvolveremos a teoria que poderá responder essa pergunta. 7.4 Equações Normais (Método dos Mínimos Quadrados) Sejam (xi , yi ), 1 ≤ i ≤ n, n pares. As equações normais são dadas pelo sistema

(304)  y  

(305)  x y n i n = a i =1 i =1 xi + nb i =1 

(306)  n n i i 

(307)  = a xi2 i =1 

(308)  ( 7.62) n +b xi i =1

(309) As equações ( 7.62) são utilizadas para determinar os valores de a e b que minimizam o somatório do quadrados das distâncias verticais i [yi − (ax + b)]2 , isto é, são utilizadas para encontrar a equação da reta y = ax +b, chamada de equação de predição, que melhor se ajusta ao conjunto de dados. A finalidade de encontrar a equação y = ax + b é de prever ou se aproximar da realidade. 134

(310) Estatística

(311)

(312) i i Para se chegar às equações normais ( 7.62) partimos do fato de que (yi − y )2 = [yi − (ax + b)]2 e, fazendo-se uso do cálculo das derivadas parciais. EP 7.190. Consideremos os seguintes dados amostrais x 4 10 13 15 20 28 y 0, 9 1, 7 1, 3 2, 0 1, 9 2, 7 Qual a melhor reta que se ajusta a estes dados? Solução: Temos que n = 6 e 0 x y x2 xy 4 0, 9 16 3, 6 10 1, 7 100 17 13 1, 3 169 16, 9 15 2, 0 225 30 20 1, 9 400 38 28 2, 7 784 75, 6 90 10, 5 1694 181, 1 Substituindo os resultados nas equações normais ( 7.62), temos: 10, 5 = 181, 1 = 90a + 6b 1694a + 90b Resolvendo essas duas equações simultâneas pelo método da adição ou pelo método da substituição, obtém-se como resultados a = 0, 07 e b = 0, 73. Logo, a equação de predição é dada por: y = 0, 07x + 0, 73. 7.4.1 Processo Alternativo Para se ganhar tempo na resolução do sistema, obteve-se um processo alternativo para a determinação dos valores dos coeficientes da equação de predição.

(313) onde, ¯x = i n xi , Sxx =

(314) i a = b = 

(315)  Sxy Sxx y − ax 2 xi xi2 − i n e Sxx =

(316) i 

(317)  

(318)  xi xi · yi − i · yi i n . EP 7.191. Refazer o exemplo anterior, utilizando as fórmulas do processo alternativo. Solução: Sxx = 1694 − 902 90 · 10, 5 23, 6 10, 5 0, 07 · 90 = 344; Sxy = 181, 1 − = 23, 6; a = = 0, 07 e b = − = 0, 73. 6 6 344 6 6 135

(319) 7.4. EQUAÇÕES NORMAIS (MÉTODO DOS MÍNIMOS QUADRADOS) Então, a equação de predição é: y = 0, 07x + 0, 73. Uma vez determinada a equação de predição também chamada de reta de regressão ou reta de regressão estimada, podemos aplicá-la para fazer predições. Por exemplo, x = 2 na equação de predição, obtém-se: y = 0, 07(2) + 0, 73 = 0, 87. EP 7.192. Considerando os dados abaixo (números de anos que certos candidatos ao serviço diplomático estudaram alemão no curso secundário ou na faculdade e as notas por eles obtidas em um teste de proficiência naquele idioma). Achar a equação de predição. Qual a nota no teste de proficiência do candidato que estudou alemão no secundário ou na faculdade durante 6 anos? E 2 anos? Candidato N ◦ de anos Nota no teste x y 1 2 48 2 2 58 3 3 63 4 3 57 5 3 75 6 4 78 7 4 72 8 4 73 9 5 89 010 5 84 35 697 Solução: Temos que n = 10 e Candidato N ◦ de anos Nota no teste x y x2 y2 xy 1 2 48 4 2.304 96 2 2 58 4 3.364 116 3 3 63 9 3.969 189 4 3 57 9 3.249 171 5 3 75 9 5.625 225 6 4 78 16 6.084 312 7 4 72 16 5.184 288 8 4 73 16 5.329 292 9 5 89 25 7.921 445 010 5 84 25 7.056 420 35 697 133 50.085 Substituindo os resultados nas equações normais ( 7.62), temos: 697 = 2.554 = 35a + 10b 133a + 35b Resolvendo essas duas equações, obtém-se como resultados a = 10, 9 e b = 31, 55. Logo, a equação de predição é dada por: y = 10, 9x + 31, 55. 136

(320) Estatística Desta forma, fazendo x = 6 na equação de predição, obtém-se: y = 10, 90 · 6 + 31, 55 = 96, 95. Fazendo x = 2 na equação, obtém-se: y = 10, 90 · 2 + 31, 55 = 53, 35. Quando se faz uma predição, não se pode esperar atingir precisamente um valor de dado coletado como se percebe na resposta obtida para x = 2 (compare o valor obtido com o valor da tabela). Este fato ocorre devido ao erro de predição do processo chamado de Erro Padrão de Estimativa. 7.4.2 Exercício Proposto EP 7.193. A tabela a seguir mostra o número de horas que um atleta correu em cada dia x durante 8 semanas consecutivas e o seu tempo correspondente de corrida para uma milha y . x 13 15 18 20 19 17 21 16 y 5, 2 5, 1 4, 9 4, 6 4, 7 4, 8 4, 6 4, 9 Responda: (a) Qual a equação de predição que permite estabelecer a relação entre o número de horas corrida e o seu tempo para uma milha? (b) Utilize a equação obtida no item (a) para predizer o tempo de corrida de uma milha a partir de 14 horas de corrida numa determinada semana. 7.5 Correlação O coeficiente de correlação mede o grau de associação linear entre duas variáveis aleatórias. É um valor adimensional, não dependendo, portanto, de nenhuma unidade de medida. Podemos entender o termo “correlação” (“co-relacionamento”) como a indicação de até que ponto os valores de uma variável estão relacionados com os valores de outra variável. Existem muitos casos em que pode existir um relacionamento entre duas variáveis. Por exemplo: ⋄ o esforço físico e o risco de parada cardíaca; ⋄ a escolaridade e a classe social; ⋄ o sucesso em um emprego pode ser predito com base no resultado de testes; ⋄ a temperatura e a quantidade de doenças de pele em uma determinada população ou amostra. 137

(321) 7.5. CORRELAÇÃO 7.5.1 O Coeficiente de Correlação O coeficiente de correlação ρ(X , Y ) de duas variáveis aleatórias X e Y é definido por: ρ = ρ(X , Y ) =  COV(X , Y ) E (X Y ) − E (X )E (Y ) = σ(X ) · σ(Y ) VAR(X ) · VAR(Y ) ( 7.63) O coeficiente de correlação ρ é calculado a partir de uma amostra de n pares de observações de duas variáveis e mede a quantidade de dispersão em torno de equação linear ajustada através do método dos mínimos quadrados, ou o grau de relação das variáveis, na amostra. O valor de ρ é, portanto, uma estimativa que mede os desvios em relação à reta determinada pelo método dos mínimos quadrados. É importante notar que a dispersão em torno da reta poderia igualmente ser medida através do desvio-padrão, sendo esse último preferido por muitos estatísticos. Não obstante, o uso do coeficiente de correlação permanece, principalmente, devido à vantagem que apresenta decorrente da facilidade de interpretação e de seu intervalo compreender valores com uma escala reduzida. O sinal aritmético associado com o coeficiente de correlação indica a direção da relação entre x e y , ou seja, se ρ > 0 e o valor de x aumenta (diminui), o valor de y também aumenta (diminui); se ρ < 0 e o valor de x diminui (aumenta), o valor de y aumenta (diminui). Já o valor absoluto do coeficiente indica a extensão da relação. No entanto, o coeficiente de correlação é mais freqüentemente apresentado como medida de relação. 7.49 Teorema. O coeficiente de correlação entre duas variáveis aleatórias está definido no intervalo [−1; 1], ou seja, −1 ≤ ρ ≤ 1. 7.50 Teorema. Se X e Y são variáveis aleatórias independentes, então o coeficiente de correlação é zero. A recíproca deste teorema não é verdadeira. Observe que, no exemplo anterior verificamos que, embora X e Y não sejam variáveis aleatórias independentes, a COV(X , Y ) = 0. Conseqüentemente, o coeficiente de correlação também é zero. 7.5.2 Interpretação Gráfica A correlação linear entre X e Y é positiva se 0 < ρ ≤ 1 e negativa se −1 ≤ ρ < 0. Quando |ρ| = 1 a correlação linear é dita perfeita. Observe os gráficos ilustrando cada uma destas situações. Y Y Y X X X Observe entre ρ =que 1 o grau de associação linearρ = −1 duas variáveis muda à medida −1 < ρque < 0 o coeficiente de correlação varia entre −1 e 1. Nos gráficos apresentamos distribuições em que ρ = 1 e ρ = −1 as 138

(322) Estatística correlações lineares são, respectivamente, positiva e negativa perfeitas, enquanto que na distribuição em que −1 < ρ < 0 é não perfeita e negativa. EP 7.194. Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos com o peso real e a média dos pesos aparentes. Obteve-se a tabela: i Peso Real (X ) Peso Aparente (Y ) 1 18 10 2 30 23 3 42 33 4 62 60 5 73 93 6 96 98 7 120 159 Calcule o coeficiente de correlação. Solução:

(323) ) X Y X − E (X ) Y − E (Y ) (X − E (X )) · (Y − E (Y )) [X − E (X )]2 [Y − E (Y )]2 18 10 2.025 3.364 23 −58 2.610 30 −45 1.485 1.089 2.025 42 33 441 1.225 60 −35 735 62 −21 −45 8 1 64 73 93 −8 25 250 100 625 96 98 33 30 990 1.089 900 120 159 57 91 5.187 3.249 8.281 441 476 11.265 7.994 16.484 −33 −1 10 ) 476 11.265 441 = 63, E (Y ) = = 68, COV(X , Y ) = = 1.609, 3, σ(X ) = 7 7 7 1.609, 3 16.484 ≈ 48, 5 e ρ ≈ ≈ 0, 98. 7 33, 8 · 48, 5 Portanto, temos que E (X ) = 7.994 ≈ 33, 8, σ(Y ) = 7 EP 7.195. A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura: i Temperatura (X ) Comprimento (Y ) 1 10 1, 003 2 15 1, 005 3 20 1, 010 4 25 1, 011 5 30 1, 014 Determine: (a) O coeficiente de correlação; (b) O valor estimado do comprimento da barra para a temperatura de 18◦ C ; (c) O valor estimado do comprimento da barra para a temperatura de 35◦ C . 139

(324) 7.6. ERRO PADRÃO 7.6 Erro Padrão O erro padrão de uma estimativa, denotado por Se , significa determinar o intervalo de variação dos valores calculados para a e b na equação de predição e tem por objetivo determinar o grau de certeza dos 1

(325) resultados obtidos. O seu valor é dado por: (yi − y ) i Se = n−2 ( 7.64) . onde, yi são valores observados, y são os valores calculados a partir da reta de predição e n−2 é chamado de grau de liberdade. Desenvolvendo a fórmula, obtém-se  Syy − aSxy . n−2 EP 7.196. Com base nos dados do exercício anterior, qual é o erro-padrão estimado? Se = Solução: 

(326) 

(327)  ) ( 7.65) 2 yi Syy = yi2 i Se 7.7 = i − = 50.085 − n Syy − aSxy = n−2 6972 = 1.504, 1 10 1504, 1 − 10, 9114, 5 = 5, 66. 8 Limites de Confiança para Coeficientes de Regressão Os intervalos de confiança para os coeficientes de regressão a e b tem por objetivo determinar os intervalos que contém os coeficientes a e b e são definidos através do valor médio da dupla desigualdade −tb tb < t < , onde t é a distribuição t-student. O valor algébrico é obtido através das fórmulas: 2 2 Se a ± t α2 √ b ± t α2 Se Sxx 2 1 ¯x 2 + n Sxx ( 7.66) onde o grau de confiança é igual a (1 − α)100% e o valor de t α2 é encontrado na tabela da distribuição t-student cruzando o valor de α 2 (coluna) pelo valor de n − 2 (linha) chamado de grau de liberdade. EP 7.197. Baseados nos dados a seguir (tempo médio semanais, em horas, que seis estudantes gastaram em seus trabalhos para casa e os índices de pontuação para os cursos que fizeram em determinado semestre), construa os intervalos de 95% de confiança para a e b. 140 Horas gastas em Índice de deveres de casa X pontuação Y 15 2, 0 28 2, 7 13 1, 3 20 1, 9 4 0, 9 10 1, 7

(328) Estatística

(329)

(330) Solução: Calculando inicialmente as somas necessárias, obtém-se: ¯x = 90; ¯y = 10, 5; Daí, Sxx Syy Sxy x 2 = 1.694; n = 6; xy = 181, 1;

(331) y 2 = 20, 29 902 = 344 6 2 10, 5 = 1, 915 = 20, 29 − 6 90 · 10, 5 = 23, 6 = 181, 1 − 6 = 1.694 − 10, 5 − 0, 686 · 90 = −8, 54 e n − 2 = 4 (grau de liberdade). Então, t0, 025 = 2, 776. Portanto, 6 os limites de confiança para a e b são: b : 0, 06860, 0407 e a : −8, 540, 684 Logo, a, b = Ou seja, o intervalo de 95% de confiança para b e a são: 0, 028 < b < 0, l09 e −9, 224 < a < −7, 856. Esses intervalos de confiança são bastante amplos, e isso se deve a dois fatores, ao tamanho da amostra e à variação medida por Se, ou seja, a variação entre os índices de pontuação de estudantes sujeitos à mesma quantidade de trabalho para casa. 7.8 Gabarito 141

(332) 7.7. LIMITES DE CONFIANÇA PARA COEFICIENTES DE REGRESSÃO EP 3.62. Com o objetivo de estudar a influência de uma dieta no ganho de peso de crianças prematuras (com pesos entre 1500g e 2000g ), foram investigados dois grupos de crianças, compostos de 50 crianças cada grupo, submetidas a diferentes dietas (dietas 1 e 2) durante 10 dias e também as seguintes características: peso ao nascer, peso após 10 dias e classe social (baixa = 1; média = 2, alta = 3). As informações foram coletadas a partir das mães que fizeram o pré-natal no Hospital WWW de Salvador em 1998. HOSPITAL WWW DE SALVADOR EM 1998 Criança Tipo de dieta 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Peso ao nascer 10◦ dia 1741 1974 1709 1809 1671 1589 1619 1809 1912 1896 1710 1590 1942 1544 1880 1511 1684 1526 1606 1740 1915 1703 1797 1653 1685 1827 1845 1833 1775 1688 1764 1631 1507 1729 1613 1558 1950 1752 1623 1953 1812 1565 1681 1699 1571 1683 1614 1941 1642 1942 1778 2006 1730 1835 1705 1622 1647 1841 1944 1905 1751 1622 1976 1578 1911 1541 1720 1550 1634 1770 1944 1735 1835 1680 1700 1857 1872 1859 1810 1725 1786 1670 1530 1750 1650 1599 1987 1795 1640 1965 1842 1591 1708 1725 1610 1715 1644 1971 1670 1975 Classe social Criança Tipo de dieta 3 3 1 1 2 2 1 2 2 1 3 2 3 1 2 2 3 1 2 3 2 1 3 2 1 1 2 2 3 3 1 1 1 1 3 3 3 1 3 2 2 2 2 2 3 2 2 2 2 2 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 Determine: Qual o peso médio das crianças ao nascerem e no 10◦ ? Qual dieta é mais vantajosa para o ganho de peso? 142 Peso ao nascer 10◦ dia 1743 1977 1705 1810 1670 1585 1628 1810 1911 1897 1712 1589 1940 1545 1881 1510 1684 1525 1605 1744 1916 1705 1795 1655 1686 1829 1840 1830 1777 1688 1765 1630 1502 1730 1540 1558 1950 1750 1623 1953 1812 1563 1681 1699 1571 1683 1614 1940 1642 1937 1765 2007 1755 1850 1710 1601 1695 1825 1950 1960 1779 1630 1977 1566 1920 1536 1705 1575 1655 1800 1985 1755 1832 1668 1707 1869 1875 1860 1809 1745 1806 1680 1552 1780 1575 1601 2006 1807 1683 1983 1865 1602 1725 1754 1606 1710 1658 1987 1682 1967 Classe social 3 3 1 2 3 3 1 2 2 1 1 2 2 3 2 3 3 1 1 1 1 1 2 3 1 1 2 2 2 1 2 2 2 1 3 2 1 2 1 3 1 2 2 1 2 1 2 2 2 2

(333) Estatística Teoria Amostral Fundamentos de Amostragem Vimos, em seções anteriores, que: População: É o conjunto formado por indivíduos ou objetos que têm pelo menos uma variável comum e observável. Podemos classificar uma população quanto ao número de elementos em finita ou infinita. São exemplos de população finita : ⊲ Número de alunos matriculados em uma determinada faculdade; ⊲ Número de livros de uma biblioteca; ⊲ Número de funcionários de uma empresa, etc. infinita : ⊲ Número de ligações recebidas por uma empresa; ⊲ Número de acidentes de trânsito que ocorrerá no próximo ano; ⊲ Número de pessoas que entram e saem em um determinado shopping, etc. Nota 3. Dizemos que estes últimos três exemplos fazem parte de uma população infinita por não termos como contar ou controlar estes números. Amostra É um subconjunto de uma população. Amostragem É o processo de seleção de uma amostra, que possibilita o estudo das características da população. Censo: Examina todos os elementos da população. 8.0.1 Vantagens e Desvantagens da Amostragem e do Censo Em caso de populações infinitas utilizamos a amostragem. No caso de testes destrutivos nós também utilizamos a amostragem. Por exemplo, para testarmos a vida útil de determinado lote de lâmpadas, nós tomamos uma amostra deste lote e a testamos. Quando queremos obter informações mais rápidas nós utilizamos a amostragem. 143

(334) 7.7. LIMITES DE CONFIANÇA PARA COEFICIENTES DE REGRESSÃO Temos como desvantagem do censo o seu alto custo. Porém, na análise de populações pequenas é recomendado o censo. Por exemplo, se tivermos que analisar os moradores de uma determinada casa, devemos tomar toda a população. Uma vantagem do censo é que temos uma completa precisão da análise. 8.0.2 Tipos de Amostragem Amostragem Aleatória : É a retirada de uma amostra da população de forma aleatória. Amostragem com reposição e sem reposição : [Vantagens e desvantagens]: ⊲ Alto custo: Na amostragem com reposição. pelo fato de podermos ter que analisar o mesmo elemento mais de uma vez. ⊲ Caráter destrutivo: com reposição não é possível. 8.0.3 Classificação das Amostragens Amostragem Probabilística : Quando cada unidade amostral na população tem uma probabilidade conhecida e não nula de pertencer à amostra. Amostragem não probabilística: A probabilidade de seleção de cada amostra é desconhecida para alguns ou todos elementos da população, sendo que algumas amostras podem ter probabilidade nula de pertencer à amostra. Por exemplo, se temos como população o conjunto dos funcionários de 10 empresas, cada empresa com determinado número de funcionários. Suponha que desejamos obter uma amostra com 4 empresas. Se escolhermos as empresas A, C , D e G , essa amostra é obtida de modo não probabilístico. Porém, se utilizarmos um processo aleatório, onde a probabilidade de escolha de determinada empresa fosse proporcional ao número de funcionários que ela tivesse, esse processo seria de amostragem probabilística. As amostragens probabilísticas subdividem-se em: Aleatória ou Sistemática : É a amostragem em que todos os elementos da população têm a mesma probabilidade de serem selecionados; Estratificação : Propõe a divisão da população em subgrupos homogêneos. Ex: Pesquisa entre pessoas de classes diferentes; Por conglomerado : Propõe a divisão em subgrupos heterogêneos. 144

(335) Estatística 8.1 Inferências Estatísticas Estimar é a ação de fazer uma suposição generalizada a respeito de um todo baseado em informações lógicas. ER 8.111. Uma pesquisa mostrou que em 1999, 90% dos acidentes de trânsito foram com homens e 10% com mulheres. A mesma pesquisa foi feita em 2000 e mostrou que 95% eram homens e 5% mulheres. Não podemos concluir que o número de acidentes com homens aumentaram, pois não foi aplicado à pesquisa nenhum fator que minimizasse as margens de erros. Usamos, então, o fator de correção que minimiza estes tipos de erros e falaremos sobre eles mais tarde. Parâmetro : É uma função do conjunto de valores da população. Por exemplo: a média aritmética, a variância, etc. Estimativa : É o valor assumido pelo parâmetro em determinada amostra. Estimar parâmetros é basear-se nos resultados da amostra para estimá-los à população. No exemplo acima temos que o parâmetro usado para análise foi a proporção. A estimativa para caracterizar a população foi de 90% para os homens em 1999. Estimadores mais usados: Parâmetro Populacional Estimadores Média ¯x Diferença entre as médias de duas populações ¯x1 − ¯x2 Proporção Diferença entre proporções de duas populações p p1 − p2 Desvio padrão 8.1.1 σ Formas de Estimativas Estimativa pontual : Determina um valor específico de um parâmetro. Estimativa intervalar : Dá um intervalo de valores possíveis onde está o valor parâmetro populacional. ER 8.112. Temos a porcentagem de acidentes registrado envolvendo homens e mulheres no ano de 1999. A estimativa pontual é de 90% de homens e 10% de mulheres. Uma estimativa intervalar se dá, por exemplo, entre 88% e 92% de homens e entre 8% e 12% de mulheres. 145

(336) 8.1. INFERÊNCIAS ESTATÍSTICAS 8.1.2 Distribuição de Médias Amostrais É uma distribuição de probabilidade que indica a probabilidade das médias amostrais. Esta distribuição é uma função da média e do desvio padrão populacional e do tamanho da amostra. ⋄ As médias amostrais tendem a agrupar-se em torno da média populacional. ????????????? FIGURA ⋄ As distribuições amostrais de grandes amostras têm menor variabilidade que as de pequeno tamanho amostral. (tamanho da amostra n) Denotaremos por µ¯x a média da população amostral e por µx a média da população. A média de uma distribuição amostral é sempre igual a média populacional, isto é, µ¯x = µx . Quando o tamanho da população é muito grande ou infinita, ou quando n ≥ 30, o desvio padrão da σx distribuição de média amostral é dado por σ¯x = √ , onde σ¯x é o desvio (ou dispersão) padrão amostral, n σx é o desvio (ou dispersão) padrão da população e n é o tamanho da amostra. Notamos que a dispersão (desvio padrão) da distribuição amostral σ¯x depende da dispersão (desvio padrão) da população σx e do tamanho da amostra n. Uma amostra maior resulta em uma menor variabilidade entre possíveis médias amostras. Populações muito dispersas geram maior variabilidade entre as médias amostrais. 8.1.3 Teorema do Limite Central Há uma tendência para as distribuições de média e de proporções aproximarem-se da distribuição normal. Se uma população tem distribuição normal, a distribuição das médias amostrais também será normal, para qualquer tamanho de amostra. Se uma população não tem distribuição normal, para amostras grandes a distribuição das médias amostrais pode ser aproximada para normal. Como regra adotamos que, para n ≥ 30, aproximamos a distribuição das médias amostrais para normal. Este resultado é conhecido como teorema do limite central. ER 8.113. De uma grande população de média 32 e desvio padrão 3, 7 retira-se uma amostra de 56 elementos. Determine: (a) A média da distribuição amostral. 146

(337) Estatística (b) O desvio padrão da distribuição amostral (c) A percentagem das possíveis médias amostrais que diferirão por mais de 1, 3 da média da população. Solução: (a) A média da população é igual à média da distribuição amostral. Logo, µ¯x = µx = 32. 3, 7 σx (b) σ¯x = √ = √ = 0, 5. n 56 (c) Como n = 56 ≥ 30, podemos supor que a distribuição amostral é normal. Como queremos a pro- porção das médias que diferirão por mais de 1, 3 da média populacional, então estamos interessados nas proporções das médias amostrais que estarão abaixo de 32 − 1, 3 = 30, 7 e nas que estarão acima de 32 + 1, 3 = 33, 3. Queremos determinar P(x < 30, 7) + P(x > 33, 7). Façamos a mudança de variável de x para z. Assim, para x = 30, 7, temos: z= 30, 7 − 32 x −µ = = −2, 6 σ 0, 5 z= 33, 3 − 32 x −µ = = 2, 6. σ 0, 5 e para x = 33, 3, temos Logo, queremos determinar P(z < −2, 6) + P(z > 2, 6). Utilizando a tabela da distribuição normal, temos que: P(z < −2, 6) + P(z > 2, 6) = 0, 0047 + 0, 0047 = 0, 0094 = 0, 94%. ER 8.114. Um fabricante de sapatos diz que seus sapatos têm média de vida de 28 meses e desvio padrão de 6 meses. Qual a percentagem de amostras de tamanho 38 que terão média de vida em um intervalo de 1 mês em torno da média? Qual será sua percentagem se n = 62? Solução: A média da população é igual a média da população amostral, isto é, µ¯x = µx = 28. Como σx 6 = 0, 9733. A percentagem ou probabilidade que n = 38 > 30, temos que σ¯x = √ , onde σ¯x = √ n 38 queremos, corresponde à área hachurada no gráfico abaixo. Fazendo a mudança de variável de x para z, temos, para x = 27, z= 27 − 28 x −µ = = −1, 03 σ 0, 9733 e para x = 29, 29 − 28 x −µ = = 1, 03. σ 0, 9733 Desta forma a percentagem que procuramos, corresponde à área do gráfico abaixo. z= Logo, a percentagem que queremos é P(27 < x < 29) = P(−1, 03 < z < 1, 03) = 0, 3485 + 0, 3485 = 0, 6970 = 69, 70%. 6 σx Se n = 62, então σ¯x = √ = √ = 0, 7620. Fazendo a mudança de variável de x para z temos, para n 62 x = 27, 27 − 28 x −µ = = −1, 31, z= σ 0, 7620 147

(338) 8.1. INFERÊNCIAS ESTATÍSTICAS para x = 29, 29 − 28 x −µ = = 1, 31. σ 0, 7620 Desta forma, a percentagem que queremos corresponde à área do gráfico abaixo. z= Logo, a percentagem que queremos é P(27 < x < 29) = P(−1, 31 < z < 1, 31) = 0, 4049 + 0, 4049 = 0, 8098 = 80, 98%. Notamos que se o tamanho da amostra for maior, teremos uma maior concentração do gráfico da função f (x) em torno da média. É por esta razão que temos a proporção de n = 62 maior do que para n = 38. EP 8.198. Qual a probabilidade de se obter uma média amostral superior a 28, 7 meses em uma amostra de 66 observações. Resposta: 17, 11% 8.1.4 Distribuição de Proporções Amostrais Esta distribuição indica a probabilidade de determinado conjunto de proporções amostrais, dados o tamanho da amostra e a proporção populacional. A média da distribuição de proporção amostral ¯p é igual a proporção populacional p, isto é ¯p = p. Quando temos o tamanho da amostra maior ou igual a trinta, a distribuição de proporções amostrais se aproxima da distribuição normal. Então, quando (n ≥ 30), nós vamos aproximar a distribuição de proporções amostrais para a distribuição normal.  Quando a população é muito grande ou infinita, nós calculamos o desvio padrão da distribuição de p · (1 − p) proporções amostrais pela expressão σp = . n ER 8.115. Um comerciante compra jarros em grandes lotes. Periodicamente ele verifica os lotes para determinar a proporção de quebrados. Se um lote contém 13% de jarros quebrados, qual a probabilidade do comerciante em uma amostra de 89 jarros encontrar 21% ou mais de jarros quebrados? Solução: Queremos encontrar P(X > 21%), o que corresponde à área hachurada na distribuição de proporções amostrais abaixo. Como n = 89 > 30, podemos aproximar a distribuição de proporções amostrais para a distribuição normal. Temos que o desvio padrão da distribuição de proporções é σp =  p · (1 − p)  0, 13 · (1 − 0, 13) = n 89 = 0, 0356 = 3, 56%. Logo, para x = 0, 21 = 21%, temos que z= 21% − 13% 0, 21 − 0, 13 = = 2, 25. 0, 0356 3, 56% Segue que, 148 P(x > 21%) ≈ P(z > 2, 25) = 0, 5 − 0, 4878 = 0, 0122 = 1, 22%.

(339) Estatística 8.1.5 Amostragem de uma População Finita A maior parte das amostras são feitas sem reposição por motivos de custos e conveniência. Se o tamanho da amostra for pequeno em relação à população a amostragem com reposição e sem reposição não apresentam grandes variações. Se a amostragem for maior que 5% da população as amostragens  começam a diferir, neste caso as fórmulas do desvio padrão das médias amostrais e das proporções N −n (N amostrais devem sofrer uma correção. Utilizamos então o fator de correção finita dado por N −1 é o tamanho da população e n é o tamanho da amostra), que deve ser multiplicado pelo desvio padrão  das médias e das proporções amostrais para fazermos as devidas correções. Desta forma ficamos com N −n σx o desvio das médias amostrais corrigido sendo σ¯x = √ · e o desvio padrão das proporções N −1 n p · (1 − p) N −n amostrais corrigido sendo σp = · . n N −1   ER 8.116. Uma máquina de encher recipientes de refrigerantes está regulada para encher o recipiente com 300ml e desvio padrão de 5ml. Se o processo tem distribuição normal, qual a probabilidade de em uma amostra de 30 refrigerantes de um lote de 172 refrigerantes termos uma média superior a 303ml? Solução: Neste caso temos uma população finita que é o lote de 172 refrigerantes, logo N = 172 e temos o tamanho da amostra sendo n = 30. Logo, podemos aproximar a distribuição das médias amostrais para a distribuição normal. Como o tamanho da amostra corresponde a mais que 5% da população. De fato, n/N = 30/172 = 0, 1744 = 17, 44%. Temos então que corrigir o desvio padrão da distribuição. Logo, σx σ¯x = √ · n N − n 5 =√ · N −1 30  172 − 30 172 − 1 = 0, 8319. Na distribuição das médias amostrais queremos a probabilidade P(X > 303) que corresponde à área abaixo. Transformando a variável x para z temos: se x = 303, então z = (303 − 300)/0, 8319 = 3, 60. Logo, P(X > 303) ≈ P(Z > 3, 60) = 0, 5 − 0, 4998 = 0, 0002 = 0, 02%. ER 8.117. Uma fábrica de CD’s tem uma média de 7% de CD’s fabricados com defeito. Uma amostra de 123 CD’s é retirada de um lote de 1021 CD’s. Qual a probabilidade da proporção amostral de CD’s com defeito esteja entre 6% e 8%? Solução: Neste caso temos uma população finita que é o lote de 1.021 CD’s. Logo N = 1.021 e temos o tamanho da amostra sendo n = 123 > 30. Logo, podemos aproximar a distribuição das proporções amostrais para a distribuição normal. Como o tamanho da amostra corresponde a mais que 5% da população. De fato, n/N = 123/1021 = 0, 1205 = 12, 05%. Temos então que corrigir o desvio padrão da distribuição. Logo, σp =  p(1 − p)  N − n  0, 07 · (1 − 0, 07)  1.021 − 123 n · N −1 = 123 · 1.021 − 1 = 0, 0216. Na distribuição das proporções amostrais queremos a probabilidade P(6% < X < 8%) que corresponde à área abaixo. 149

(340) 8.1. INFERÊNCIAS ESTATÍSTICAS Transformando a variável X para Z temos: se x = 6% = 0, 06, então z = (0, 06 − 0, 07)/0, 0216 = −0, 46 e se x = 8% = 0, 08, então z = (0, 08 − 0, 07)/0, 0216 = 0, 46. Logo, P(6% < X < 8%) ≈ P(−0, 46 < Z < 0, 46) = 0, 1772 + 0, 1772 = 0, 3544 = 35, 44%. 8.1.6 Estimação da Média de uma População Grandes amostras produzem médias amostrais mais próximas da média da distribuição amostral (mépois temos que o desvio padrão da distribuição amostral diminui quando n cresce dia populacional),  σx σ¯x = √ . Para estimarmos da média de uma população nós precisamos do desvio padrão, que pode n ser o desvio padrão da população se este for conhecido, senão utilizaremos o desvio padrão amostral que calcularemos utilizando os dados amostrais. Quando o desvio padrão populacional é conhecido e a população tem distribuição normal ou n ≥ 30 nós estimamos a média populacional sendo: µx = ¯x ± zσ¯x (estimativa intervalar) ou µx = ¯x (estimativa σx pontual), onde ¯x é a média da amostra (média amostral), σ¯x = √ e z é a variável aleatória normal que n determinará o grau de confiança do intervalo. ER 8.118. Foi extraída uma amostra de 47 funcionários de uma empresa e foi calculada a média amostral de 35, 7 anos de idade, supondo o desvio padrão desta poulação igual a 3 anos. Determine o intervalo de confiança para a média de idade dos funcionários com 60%, 70% e 80% de confiança. Solução: Como n = 47 > 30, temos que a distribuição da população se aproxima da distribuição normal. Para termos um intervalo de confiança de 60%, nós tomamos um valor de z que nos dá uma porcentagem de 60% em torno da média, isto é, procuramos na tabela da distribuição normal o valor de z que nos dá o valor mais próximo e superior a 30% de área, logo o valor −z nos dá os outros 30%. Este valor corresponde a z = 0, 85, que nos dá uma área de 30, 23%. Calculando o desvio padrão temos que 3 σx σ¯x = √ = √ = 0, 4376. Logo, estimamos a média dos funcionários em um intervalo de confiança de n 47 60% da seguinte maneira: ¯x ± zσ¯x ⇔ 35, 7 ± 0, 85.0, 4376 ⇔ 35, 7 ± 0, 3720. Isto é, nós temos 60% de probabilidade de que a média da população esteja neste intervalo. Para 70% temos z = 1, 04 que corresponde a um área de 0, 3508. Logo, o intervalo de confiança é ¯x ± zσ¯x ⇔ 35, 7 ± 1, 04 · 0, 4376 ⇔ 35, 7 ± 0, 4551. Para 80%, temos z = 1, 29, que corresponde a um área de 0, 4015. Logo, o intervalo de confiança é ¯x ± zσ¯x ⇔ 35, 7 ± 1, 29 · 0, 4376 ⇔ 35, 7 ± 0, 5645. 8.1.7 Erro de Estimação O erro em um intervalo de estimação da média de uma população é a diferença entre a média amostral e a média populacional. Como o intervalo tem centro na média amostral e a média da população suposta150

(341) Estatística mente está no intervalo com determinada confiança, então temos que o erro máximo é dado por e = zσ¯x , σx onde e é o erro de estimação. Logo, e = z √ . n 8.1.8 Determinação do Tamanho da Amostra Para determinarmos o tamanho de uma amostra em função do erro desejado, do desvio padrão da população e da confiança também desejada na estimação, nós utilizamos a expressão de n abaixo decorrente 3 4 da expressão do erro σx zσx z 2 σ2 e = z √ ⇒ n = 2x ⇒ n = e e n 2 . ER 8.119. Qual o tamanho da amostra que devemos tomar, para termos um intervalo de 80% de confiança, com um erro de 0, 83 em torno da média, onde o desvio padrão da população é de 3, 7? 3 4   Solução: Para termos um intervalo de 80% de confiança nós tomamos z = 1, 29, que corresponde zσx 2 1, 29 · 3, 7 2 a uma área de 0, 4015. Logo, o tamanho da amostra será n = = 33, 07, vamos = e 0, 83 tomar então n = 34, por uma medida de segurança, isto é, para garantirmos no mínimo nossas exigências de erro e confiança. 8.1.9 Estimação da Média de uma População quando o Desvio Padrão da População é Desconhecido Se σx é desconhecido, utilizamos o desvio padrão amostral sx para estimar o desvio padrão da popusx lação σx . Isto é, substituímos nas equações σ¯x por s¯x , onde s¯x = √ . Temos na prática que se o desvio n padrão amostral s¯x é uma boa aproximação do desvio padrão da população da população sσx . Quando o tamanho da amostra for menor que 30, devemos usar a distribuição de student (t), pois ela se aproximará melhor da distribuição das médias amostrais e por ser a mais indicada quando não conhecemos o desvio padrão da população σx . Para usarmos a distribuição t, temos que ter uma população com distribuição normal ou próxima da normal. Porém, se o tamanho da amostra for maior ou igual a 30, esta informação é desnecessária e poderemos usar a distribuição normal 5

(342) (x − ¯x )2 , onde n − 1 n−1 é o número de graus de liberdade que utilizaremos para determinarmos os valores de t na tabela da Temos que o desvio padrão amostral é calculado pela expressão sx = distribuição de student logo abaixo. Desta forma quando não tivermos o desvio padrão da população nós sx estimaremos a média populacional pelo intervalo ¯x ± t √ . Porém, se o tamanho da amostra for maior ou n igual a 30, nós podemos substituir o t pelo z, isto é, a distribuição de student. Graus de liberdade (n − 1) Duas caudas 0,1000 0,0900 0,0800 0,0700 0,0600 0,0500 0,0400 0,0300 0,0200 Uma cauda 0,0100 0,0050 0,0025 0,0010 0,0005 0,0003 0,0500 0,0450 0,0400 0,0350 0,0300 0,0250 0,0200 0,0150 0,0100 0,0050 0,0025 0,0013 0,0005 1 6,3138 7,0264 7,9158 9,0579 10,5789 12,7062 15,8945 21,2049 31,8205 63,6567 127,3213 254,6466 636,6192 1273,2393 2 2,9200 3,1040 3,3198 3,5782 3,8964 4,3027 4,8487 5,6428 6,9646 9,9248 14,0890 19,9625 31,5991 44,7046 3 2,3534 2,4708 2,6054 2,7626 2,9505 3,1824 3,4819 3,8960 4,5407 5,8409 7,4533 9,4649 12,9240 16,3263 4 2,1318 2,2261 2,3329 2,4559 2,6008 2,7764 2,9985 3,2976 3,7469 4,6041 5,5976 6,7583 8,6103 10,3063 151

(343) 8.1. INFERÊNCIAS ESTATÍSTICAS 5 2,0150 2,0978 2,1910 2,2974 2,4216 2,5706 2,7565 3,0029 3,3649 4,0321 4,7733 5,6042 6,8688 7,9757 11, 6 1,9432 2,0192 2,1043 2,2011 2,3133 2,4469 2,6122 2,8289 3,1427 3,7074 4,3168 4,9807 5,9588 6,7883 9,0 7 1,8946 1,9662 2,0460 2,1365 2,2409 2,3646 2,5168 2,7146 2,9980 3,4995 4,0293 4,5946 5,4079 6,0818 7,8 8 1,8595 1,9280 2,0042 2,0902 2,1892 2,3060 2,4490 2,6338 2,8965 3,3554 3,8325 4,3335 5,0413 5,6174 7,1 9 1,8331 1,8992 1,9727 2,0554 2,1504 2,2622 2,3984 2,5738 2,8214 3,2498 3,6897 4,1458 4,7809 5,2907 6,5 10 1,8125 1,8768 1,9481 2,0283 2,1202 2,2281 2,3593 2,5275 2,7638 3,1693 3,5814 4,0045 4,5869 5,0490 6,2 11 1,7959 1,8588 1,9284 2,0067 2,0961 2,2010 2,3281 2,4907 2,7181 3,1058 3,4966 3,8945 4,4370 4,8633 5,9 12 1,7823 1,8440 1,9123 1,9889 2,0764 2,1788 2,3027 2,4607 2,6810 3,0545 3,4284 3,8065 4,3178 4,7165 5,6 13 1,7709 1,8317 1,8989 1,9742 2,0600 2,1604 2,2816 2,4358 2,6503 3,0123 3,3725 3,7345 4,2208 4,5975 5,5 14 1,7613 1,8213 1,8875 1,9617 2,0462 2,1448 2,2638 2,4149 2,6245 2,9768 3,3257 3,6746 4,1405 4,4992 5,3 15 1,7531 1,8123 1,8777 1,9509 2,0343 2,1314 2,2485 2,3970 2,6025 2,9467 3,2860 3,6239 4,0728 4,4166 5,2 16 1,7459 1,8046 1,8693 1,9417 2,0240 2,1199 2,2354 2,3815 2,5835 2,9208 3,2520 3,5805 4,0150 4,3463 5,1 17 1,7396 1,7978 1,8619 1,9335 2,0150 2,1098 2,2238 2,3681 2,5669 2,8982 3,2224 3,5429 3,9651 4,2858 5,0 18 1,7341 1,7918 1,8553 1,9264 2,0071 2,1009 2,2137 2,3562 2,5524 2,8784 3,1966 3,5101 3,9216 4,2332 4,9 19 1,7291 1,7864 1,8495 1,9200 2,0000 2,0930 2,2047 2,3456 2,5395 2,8609 3,1737 3,4812 3,8834 4,1869 4,8 20 1,7247 1,7816 1,8443 1,9143 1,9937 2,0860 2,1967 2,3362 2,5280 2,8453 3,1534 3,4554 3,8495 4,1460 4,8 21 1,7207 1,7773 1,8397 1,9092 1,9880 2,0796 2,1894 2,3278 2,5176 2,8314 3,1352 3,4325 3,8193 4,1096 4,7 22 1,7171 1,7734 1,8354 1,9045 1,9829 2,0739 2,1829 2,3202 2,5083 2,8188 3,1188 3,4118 3,7921 4,0769 4,7 23 1,7139 1,7699 1,8316 1,9003 1,9782 2,0687 2,1770 2,3132 2,4999 2,8073 3,1040 3,3931 3,7676 4,0474 4,6 24 1,7109 1,7667 1,8281 1,8965 1,9740 2,0639 2,1715 2,3069 2,4922 2,7969 3,0905 3,3761 3,7454 4,0207 4,6 25 1,7081 1,7637 1,8248 1,8929 1,9701 2,0595 2,1666 2,3011 2,4851 2,7874 3,0782 3,3606 3,7251 3,9964 4,6 26 1,7056 1,7610 1,8219 1,8897 1,9665 2,0555 2,1620 2,2958 2,4786 2,7787 3,0669 3,3464 3,7066 3,9742 4,5 27 1,7033 1,7585 1,8191 1,8867 1,9632 2,0518 2,1578 2,2909 2,4727 2,7707 3,0565 3,3334 3,6896 3,9538 4,5 28 1,7011 1,7561 1,8166 1,8839 1,9601 2,0484 2,1539 2,2864 2,4671 2,7633 3,0469 3,3214 3,6739 3,9351 4,5 29 1,6991 1,7540 1,8142 1,8813 1,9573 2,0452 2,1503 2,2822 2,4620 2,7564 3,0380 3,3102 3,6594 3,9177 4,5 30 1,6973 1,7520 1,8120 1,8789 1,9546 2,0423 2,1470 2,2783 2,4573 2,7500 3,0298 3,2999 3,6460 3,9016 4,4 31 1,6955 1,7501 1,8100 1,8767 1,9522 2,0395 2,1438 2,2746 2,4528 2,7440 3,0221 3,2903 3,6335 3,8867 4,4 32 1,6939 1,7483 1,8081 1,8746 1,9499 2,0369 2,1409 2,2712 2,4487 2,7385 3,0149 3,2813 3,6218 3,8728 4,4 33 1,6924 1,7467 1,8063 1,8726 1,9477 2,0345 2,1382 2,2680 2,4448 2,7333 3,0082 3,2729 3,6109 3,8598 4,4 34 1,6909 1,7451 1,8046 1,8708 1,9457 2,0322 2,1356 2,2650 2,4411 2,7284 3,0020 3,2651 3,6007 3,8476 4,4 35 1,6896 1,7436 1,8030 1,8691 1,9438 2,0301 2,1332 2,2622 2,4377 2,7238 2,9960 3,2577 3,5911 3,8362 4,3 36 1,6883 1,7423 1,8015 1,8674 1,9419 2,0281 2,1309 2,2595 2,4345 2,7195 2,9905 3,2507 3,5821 3,8255 4,3 37 1,6871 1,7410 1,8001 1,8659 1,9402 2,0262 2,1287 2,2570 2,4314 2,7154 2,9852 3,2442 3,5737 3,8154 4,3 38 1,6860 1,7397 1,7988 1,8644 1,9386 2,0244 2,1267 2,2546 2,4286 2,7116 2,9803 3,2380 3,5657 3,8059 4,3 39 1,6849 1,7386 1,7975 1,8630 1,9371 2,0227 2,1247 2,2524 2,4258 2,7079 2,9756 3,2322 3,5581 3,7969 4,3 40 1,6839 1,7375 1,7963 1,8617 1,9357 2,0211 2,1229 2,2503 2,4233 2,7045 2,9712 3,2266 3,5510 3,7884 4,3 41 1,6829 1,7364 1,7952 1,8605 1,9343 2,0195 2,1212 2,2482 2,4208 2,7012 2,9670 3,2214 3,5442 3,7803 4,3 42 1,6820 1,7354 1,7941 1,8593 1,9330 2,0181 2,1195 2,2463 2,4185 2,6981 2,9630 3,2164 3,5377 3,7727 4,2 43 1,6811 1,7345 1,7931 1,8582 1,9317 2,0167 2,1179 2,2445 2,4163 2,6951 2,9592 3,2117 3,5316 3,7654 4,2 44 1,6802 1,7336 1,7921 1,8571 1,9305 2,0154 2,1164 2,2427 2,4141 2,6923 2,9555 3,2071 3,5258 3,7585 4,2 45 1,6794 1,7327 1,7911 1,8561 1,9294 2,0141 2,1150 2,2411 2,4121 2,6896 2,9521 3,2028 3,5203 3,7519 4,2 46 1,6787 1,7319 1,7902 1,8551 1,9283 2,0129 2,1136 2,2395 2,4102 2,6870 2,9488 3,1987 3,5150 3,7456 4,2 47 1,6779 1,7311 1,7894 1,8541 1,9273 2,0117 2,1123 2,2380 2,4083 2,6846 2,9456 3,1948 3,5099 3,7396 4,2 48 1,6772 1,7303 1,7885 1,8532 1,9263 2,0106 2,1111 2,2365 2,4066 2,6822 2,9426 3,1911 3,5051 3,7339 4,2 49 1,6766 1,7296 1,7878 1,8524 1,9253 2,0096 2,1099 2,2351 2,4049 2,6800 2,9397 3,1875 3,5004 3,7284 4,2 50 1,6759 1,7289 1,7870 1,8516 1,9244 2,0086 2,1087 2,2338 2,4033 2,6778 2,9370 3,1840 3,4960 3,7231 4,2 60 1,6706 1,7232 1,7808 1,8448 1,9170 2,0003 2,0994 2,2229 2,3901 2,6603 2,9146 3,1562 3,4602 3,6807 4,1 70 1,6669 1,7192 1,7765 1,8401 1,9118 1,9944 2,0927 2,2152 2,3808 2,6479 2,8987 3,1366 3,4350 3,6509 4,1 80 1,6641 1,7162 1,7732 1,8365 1,9078 1,9901 2,0878 2,2095 2,3739 2,6387 2,8870 3,1220 3,4163 3,6288 4,0 90 1,6620 1,7138 1,7707 1,8337 1,9048 1,9867 2,0839 2,2050 2,3685 2,6316 2,8779 3,1108 3,4019 3,6118 4,0 100 1,6602 1,7120 1,7687 1,8315 1,9024 1,9840 2,0809 2,2015 2,3642 2,6259 2,8707 3,1018 3,3905 3,5983 4,0 200 1,6525 1,7036 1,7596 1,8217 1,8915 1,9719 2,0672 2,1857 2,3451 2,6006 2,8385 3,0621 3,3398 3,5387 3,9 250 1,6510 1,7020 1,7578 1,8197 1,8894 1,9695 2,0645 2,1825 2,3414 2,5956 2,8322 3,0543 3,3299 3,5270 3,9 500 1,6479 1,6987 1,7543 1,8158 1,8851 1,9647 2,0591 2,1763 2,3338 2,5857 2,8195 3,0387 3,3101 3,5037 3,9 750 1,6469 1,6976 1,7531 1,8145 1,8836 1,9631 2,0573 2,1742 2,3313 2,5824 2,8154 3,0336 3,3035 3,4960 3,9 1.000 1,6464 1,6970 1,7525 1,8139 1,8829 1,9623 2,0564 2,1732 2,3301 2,5808 2,8133 3,0310 3,3003 3,4922 3,9 10.000 1,6450 1,6956 1,7509 1,8121 1,8810 1,9602 2,0540 2,1704 2,3267 2,5763 2,8077 3,0241 3,2915 3,4819 3,8 ER 8.120. Uma amostra de uma população de distribuição normal de tamanho 25 tem média 38 e desvio padrão 2. Determine um intervalo de confiança para a média desta população com uma confiança de 95%. Solução: Como n = 25 < 30 nós vamos usar a distribuição de student. O grau de liberdade é n − 1 = 25 − 1 = 24. Logo, devemos olhar na tabela da distribuição de student na linha do grau de liberdade 152

(344) Estatística 24 à área de uma cauda (unicaudal) da distribuição de student que corresponde a 0, 025 ou a área das duas caudas (bicaudal) que corresponde a 0, 05, pois a tabela da distribuição de student ou contrario da tabela da distribuição normal nos dá a área das caudas da distribuição. Então, olhando na tabela de student, temos que o valor de t que corresponde à área de uma cauda igual a 0, 025 é t = 2, 0639. Logo, determinamos o intervalo de confiança sendo 2 sx ¯x ± t √ ⇔ 38 ± 2, 06339 · √ ⇔ 38 ± 0, 8256. n 25 ER 8.121. Suponha que uma amostra de tamanho 35, média 55 e desvio padrão 3, 5 foi retirada de uma população para análise. Determine um intervalo de 98% de confiança para a média desta população. Solução: Como n = 35 > 30 nós usaremos a distribuição normal. Olhando na tabela da distribuição normal temos que o valor de z que corresponde a uma área de 0, 4901 é z = 2, 33. Logo, o nosso intervalo de confiança é o seguinte: 8.1.10 3, 5 sx ¯x ± z √ ⇔ 55 ± 2, 33 · √ ⇔ 55 ± 1, 3784. n 35 Estimação da Média Populacional para Populações Finitas  Se tivermos que o tamanho da amostra (n) corresponde a mais que 5% da população (N), então temos N −n . que corrigir o desvio padrão, onde o fator de correção é N −1 Se o desvio padrão da população σx for conhecido nós estimaremos a média da população com o desvio padrão corrigido da seguinte maneira: σx ¯x ± z √ n onde o erro de estimação agora será dado por σx e = z√ n N − n , N − n . N −1 N −1  Se o desvio padrão da população σx for desconhecido nós usamos o desvio padrão amostral sx e N −n sx , estimaremos a média da população com desvio padrão corrigido da seguinte maneira: ¯x ± t √ n N −1 N−n sx . onde o erro de estimação agora será dado por e = t √ n N −1  ER 8.122. Uma amostra de 17 elementos é retirada de uma população com distribuição próxima da normal composta de 202 elementos. A média amostral é 14, 7 e o desvio padrão de 1, 6. Estime a média populacional em um intervalo com 99, 75% de confiança. Solução: Como n = 17 < 30, devemos usar a distribuição de student. Temos que a amostra de  17 elementos corresponde a mais que 5% da população de 202 elementos. De fato n/N = 17/202 = N −n 0, 0842 = 8, 42%. Logo, devemos utilizar o fator de correção finita . Como o grau de liberdade é N −1 n − 1 = 17 − 1 = 16, olhando na tabela de student à área de duas caudas de 0, 0025 obtemos t = 3, 5805. Logo, estimamos a média da população com 99, 75% de confiança no intervalo seguinte: sx ¯x ± t √ n N − n 1, 6 = 14, 7 ± 3, 5805 · √ · N −1 17  202 − 17 202 − 1 = 14, 7 ± 1, 3330. 153

(345) 8.1. INFERÊNCIAS ESTATÍSTICAS Se o tamanho da amostra n fosse maior ou igual a 30, nós utilizaríamos a distribuição normal. 8.1.11 Determinação do Tamanho da Amostra para Desvios Padrões Corrigidos Se o desvio padrão populacional σx for conhecido, então o erro é dado por σx e = z√ n N − n N −1 . Logo, n= e2 z 2 · σx2 · N . · (N − 1) + z 2 · σx2 Se o desvio padrão populacional σx for desconhecido, então o erro é dado por sx e = t√ n N − n N −1 . Logo, n= 8.1.12 t 2 · sx2 · N . e 2 · (N − 1) + t 2 · sx2 Intervalos de Confiança Unilaterais para Médias de uma População Utilizamos os intervalos de confiança unilaterais para estimarmos a média de uma população, quando estamos apenas interessados nos limites inferiores ou superiores dos intervalos de confiança. ER 8.123. Uma empresa de distribuição de energia elétrica de uma cidade quer saber o mínimo de energia consumida por residência, para que a empresa tenha lucro. ER 8.124. Uma empresa que produz cabos de energia elétrica deseja saber o máximo de amperagem que os seus cabos suportam. ER 8.125. Uma amostra de 113 observações é retirada de uma população. A média amostral é 27, 9 e o desvio padrão de 2, 3. (a) Determine um limite superior para a média com 98% de confiança. (b) Qual a probabilidade da média ser maior que 28, 1? (c) Determine um limite inferior para a médias com 98% de confiança. (d) Qual a probabilidade da média populacional ser menor que 27, 3? Solução: (a) Como n = 113 > 30, usaremos a distribuição normal. Logo olhando na tabela da distribuição normal o valor limite superior de z que nos dá uma área próxima de 98% é z = 2, 06, isto é a área à esquerda de z = 2, 06 é de 0, 9803 = 98, 03%. Desta forma estimamos o limite máximo da média populacional sendo: sx 2, 3 ¯x + z √ ⇔ 27, 9 + 2, 06 · √ ⇔ 27, 9 + 0, 4457 ⇔ 28, 3457, n 113 154

(346) Estatística isto é, a probabilidade de que a média populacional seja menor que 28, 3457 é de 98, 03%. (b) Queremos a probabilidade da média populacional ser maior que 28, 1, isto é P(µx > 28, 1). Logo, transformando µx para variável z usando a média amostral de 27, 9 e o desvio padrão da distribuição sendo 2, 3 sx = 0, 2164 s¯x = √ = √ n 113 28, 1 − 27, 9 = 0, 92. Logo, temos: z = 0, 2164 P(µx > 28, 1) ≈ P(z > 0, 92) = 0, 5 − 0, 3212 = 0, 1788 = 17, 88%. (c) Como n = 113 > 30, usaremos a distribuição normal. Logo olhando na tabela da distribuição normal o valor limite inferior de z que nos dá uma área próxima de 98% é z = −2, 06, isto é a área à direita de z = −2, 06 é de 0, 9803 = 98, 03%. Desta forma estimamos o limite mínimo da média populacional sendo: 2, 3 sx ⇔ 27, 9 − 0, 4457 ⇔ 27, 4543, ¯x − z √ ⇔ 27, 9 − 2, 06. √ n 113 isto é, a probabilidade de que a média populacional seja maior que 27, 4543 é de 98, 03%. (d) Queremos a probabilidade da média populacional ser menor que 27, 3, isto é P(µx < 27, 3). Logo, transformando µx para variável z usando a média amostral de 27, 9 e o desvio padrão da distribuição sendo 2, 3 sx = 0, 2164, s¯x = √ = √ n 113 27, 3 − 27, 9 = −2, 77. Logo, temos: z = 0, 2164 P(µx < 27, 3) ≈ P(z < −2, 77) = 0, 5 − 0, 4972 = 0, 0028 = 0, 28%. 8.1.13 Estimação da Proporção de uma População Usamos a proporção amostral para estimar a proporção populacional. A estimativa pontual é quando estimamos a proporção populacional pela amostral, isto é, p = x/n, onde x é o número de ítens na amostra e n é o tamanho da amostra. ER 8.126. Em um lote de CD’s é retirada uma amostra de 123 CD’s e observamos que 47 estão com defeito. Estime a proporção de CD’s com defeito deste lote pontualmente. Solução: p = 47 x = = 0, 3821 = 38, 21%. n 123 A estimativa intervalar de proporções populacionais é feita da seguinte maneira: x 3 x ±z n n · 1− n 4 x n , onde x é o número de ítens da amostra, z é a variável aleatória normal e n o tamanho da amostra. O desvio padrão da proporção é calculado da seguinte maneira: x 3 σp = pois p = n · 1− n x n 4  p(1 − p) = n , x . Na estimativa intervalar de proporções populacionais não utilizamos a distribuição de student. n 155

(347) 8.1. INFERÊNCIAS ESTATÍSTICAS ER 8.127. Considere o exemplo anterior. Estime a proporção populacional com uma confiança de 96%. Solução: Temos que p = 47 x = = 0, 3821 = 38, 21% e n 123 σp =  p(1 − p)  0, 3821(1 − 0, 3821) = n 123 = 0, 0438. O valor de z que nos dá uma confiança mais próxima de 96% é z = 2, 06, que nos dá uma área de 0, 4803%. Logo, estimamos a proporção populacional da seguinte maneira: x 3 x ±z n n · 1− n x n 4 ⇔  p(1 − p) p±z n  0, 3821(1 − 0, 3821) ⇔ 0, 3821 ± 2, 06 123 ⇔ 0, 3821 ± 0, 0902 ⇔ 38, 21% ± 9, 02% 8.1.14 Erro de Estimação da Proporção Populacional O erro de estimação da proporção populacional é a diferença entre a proporção amostral e a proporção populacional, como supomos que a proporção amostral no intervalo de estimação da proporção populacional, logo o erro máximo é dado por  p(1 − p) , n notamos que o erro aumenta quando p · (1 − p) aumenta, isto é quando −p2 + p aumenta, considerando 1 a função f (p) = −p 2 + p, temos que seu ponto de mínimo é p = . Logo, o erro é máximo quando 2 1 = 0, 5 = 50%. Desta forma, quando tivermos situações onde a proporção p não for conhecida, p = 2 1 nós vamos supor que p = , pois, para este valor de p, teremos um erro máximo, desta forma estaremos 2 aumentando o desvio padrão e aumentando a confiança de nossa estimação. e =z ER 8.128. Qual o tamanho da amostra que devemos tomar para estimarmos a proporção de uma população com um nível de significância de 6% e um erro de 0, 03? Solução: Nível de significância é o complementar do nível de confiança e é denotado pela letra grega alfa (α), isto é, α = 1 − NC . Logo, NC = 1 − α = 1 − 0, 06 = 0, 94 = 94%, onde NC é o nível de confiança.  Como a proporção p não é conhecida tomamos p = 0, 5, para um nível de confiança de 94% tomamos p(1 − p) z = 1, 89 que nos dá uma área de 0, 4706. Como o erro é dado por e = z , temos que n n= 1, 892 · 0, 5(1 − 0, 5) z 2 · p(1 − p) = = 992, 25, 2 e 0, 032 vamos tomar então n = 993 para garantirmos no mínimo nossas exigências de confiança e erro. EP 8.199. De uma amostra de 153 observações de um lote de parafusos, foi detectado 29 parafusos com defeito. Determine o erro de estimação da proporção populacional se α = 4%. Resposta: 6, 53%. 156

(348) Estatística EP 8.200. De um lote de 1.791 canetas, foi retirada uma amostra de 93 canetas, desta amostra foram encontradas 13 canetas com defeito. Estime a proporção de canetas defeituosas deste lote com um nível de confiança de 97, 5%. Resposta: 13,98%, 7,84%. 8.1.15 Determinação do Tamanho da Amostra em Populações Finitas   O erro de estimação da proporção populacional de populações finitas é dado por e =z p(1 − p) · n N −n . N −1 Logo, temos que: n= onde p = x . n z 2 · p(1 − p) · N , e 2 · (N − 1) + z 2 · p(1 − p) EP 8.201. Qual o tamanho da amostra que devemos retirar de um lote de 2.795 relógios, para estimarmos a proporção de defeituosos com um nível de confiança de 95, 8% e com um erro de 0, 023? ER 8.129. Foi retirada uma amostra dos pesos dos estudantes de uma faculdade conforme os seguintes dados: 68; 70; 56; 78; 49; 62; 67; 91; 58; 62; 71; 78. Estime a média populacional com um nível de significância de 6%. Solução: Temos que a média dos dados é ¯x = 67, 5 e o desvio padrão amostral sx é dado pela 5

(349) expressão sx = (¯x − xi )2 n−1 =  1.417 = 11, 3498. 11 Com n = 12 < 30 vamos utilizar a distribuição de student, o valor de t que nos dá um nível de significância de 6%, para um grau de liberdade de 11 é t = 2, 0961. Logo, estimamos a média populacional sendo: sx 11, 3498 ¯x ± t √ ⇒ 67, 5 ± 2, 0961 · √ ⇒ 67, 5 ± 6, 8677. n 12 EP 8.202. Uma amostra de 41 observações de uma população apresentou uma média de 33, 7. Se a variância populacional é de 11, 3. Determine um limite máximo para a média populacional com α = 7%. Resposta: µ¯x = 34, 4770 EP 8.203. Em um estudo sobre o grau de impurezas em lotes de 3, 2kg de determinado composto medicinal, o erro máximo tolerável é de 1, 03kg . Se o grau de impurezas apresenta um desvio padrão populacional de 5, 03g . Determine o tamanho da amostra que devemos tomar neste estudo, se desejamos um nível de significância de 4%. Resposta: n=102. 157

(350) 8.1. INFERÊNCIAS ESTATÍSTICAS 8.1.16 Testes de Hipóteses (ou de Significância) A finalidade do teste de hipóteses é avaliar afirmações sobre valores de parâmetros populacionais. 1◦ Passo: Formular a hipótese nula H0 e a alternativa H1 ; 2◦ Passo: Escolher a distribuição adequada (t ou z); 3◦ Passo: Escolher o nível de significância (ou seja, os valores críticos); 4◦ Passo: Calcular a estatística teste e compará-la com os valores críticos. 5◦ Passo: Rejeitar a hipótese nula se a estatística teste exceder os valores críticos, caso contrário aceitar a hipótese nula H0 . A hipótese nula H0 é uma afirmação que diz que o parâmetro populacional é como o especificado, isto é, a afirmação é verdadeira. A hipótese alternativa H1 é uma afirmação que oferece uma alternativa ao especificado, isto é, o parâmetro é maior ou menor do que o valor especificado. Testes de Hipóteses Bilaterais e Unilaterais ER 8.130. Um fabricante de parafusos para automóveis afirma que o diâmetro de seus parafusos é de 6mm. Uma amostra de 43 parafusos apresentou uma média de 5, 8mm e desvio padrão de 0, 2mm. Assumindo α = 4% o que podemos dizer sobre a afirmação do fabricante? Solução: 1◦ Passo: Vamos formular a hipótese nula H0 e a hipótese alternativa H1 . Seja H0 a afirmação do fabricante, isto é µ = 6mm e a alternativa H1 que µ

(351) = 6mm. H0 : µ = 6mm e H1 : µ

(352) = 6mm. 2◦ Passo: Como n = 43 > 30 usaremos a distribuição normal. O parafuso tem um limite máximo e um limite mínimo de diâmetro para ser útil, temos então um teste bilateral. 3◦ Passo: Como α = 4%, temos então que o nível de confiança NC = 96%. Logo, os valores de z que nos dá uma área mais próxima de 0, 96 em torno o eixo vertical F (z) são z = −2, 06 e z = 2, 06. Estes valores de z são ditos valores críticos. 4◦ Passo: Transformando a média amostral obtida, para a variável zteste , usando a média µ da população informada pelo fabricante temos: zteste = 158 ¯x − µ 5, 8 − 6 sx = 0, 2 = −6, 56. √ √ n 43

(353) Estatística 5◦ Passo: Como zteste = −6, 56 < −2, 06, devemos rejeitar a hipótese H0 , isto é, a média da população não é de 6mm. Logo, aceitamos a hipótese alternativa, ou seja, a média da população é diferente de 6mm. ER 8.131. Um gerente de um determinado banco disse que em média seus clientes esperam 30 minutos para serem atendidos. Um teste foi feito com 23 clientes e observamos uma média de 34 minutos, com um desvio padrão de 5 minutos. Considerando α = 3% o que podemos dizer da afirmação do gerente? Solução: Vamos tomar a hipótese nula sendo H0 : µ = 30 minutos, e a alternativa sendo H1 : µ > 30 minutos. Como n = 23 < 30 vamos usar a distribuição de student. O grau de liberdade é n−1 = 23−1 = 22. Logo, o valor de t que nos dá uma área à direita de 0, 03 é t = 1, 9829, isto é, para valores de tteste maiores que 1, 9829 rejeitamos H0 , para valores de tteste menores que 1, 9829 aceitamos H0 . ¯x − µ 34 − 30 = 3, 8367. Como o tteste = 3, 8367 > 1, 9829 nós sx = 5 √ √ n 23 rejeitamos H0 , isto é, não aceitamos a afirmação do gerente. Calculando tteste temos tteste = 8.1.17 Tipos de Erros Associados aos Testes de Hipóteses Temos o erro chamado de erro tipo I que seria considerar H0 falsa, isto é, rejeitar H0 , sendo H0 verdadeira. A probabilidade de cometermos este erro é igual ao nível de significância α. Temos o erro chamado de erro tipo II, que seria aceitar H0 sendo H0 falsa, indicamos este tipo de erro por β. 8.1.18 Atividade EP 8.204. Um fabricante de determinada lâmpada afirma que a vida útil de suas lâmpadas é de no mínimo 8.000 horas. Uma amostra de 43 observações apresentou média de 7.800 horas de vida útil. Sabendo-se que o desvio padrão populacional é de 400 horas, o que podemos dizer da afirmação do fabricante supondo α = 5%? Resp: H0 : µ = 8000 horas e H1 : µ < 8000hor as. Rejeitamos H0 . EP 8.205. Um fabricante de monitores afirma que a vida útil de seus monitores é de 15.000 horas. Uma amostra de 7 monitores apresentou uma média de 15.990 horas e desvio padrão de 1.552 horas. O que podemos dizer da afirmação do fabricante supondo α = 0, 05? Resp: Aceitamos a afirmação do fabricante. EP 8.206. Determine o intervalo de confiança 95% para a percentagem populacional de defeituosos para os seguintes dados: N = 1.000, n = 100 e x = 10. Resp: 10% 5,58%.. 159

(354) 8.1. INFERÊNCIAS ESTATÍSTICAS EP 8.207. Estime a média populacional com 90% de confiança para as seguintes situações: (a) ¯x = 30, σx = 4, n = 200 e N = 2.000; (b) ¯x = 45, σx = 6, n = 48 e N = 600; (c) ¯x = 10, σx = 2, n = 120 e N = 840. Resp: (a) 30 ± 0, 4426; (b) 45 ± 1, 3717; (c) 10 ± 0, 2790 EP 8.208. Numa amostra de 300 observações acusou 30 pneus defeituosos numa remessa. Usando uma confiança de 99%, determine o erro de estimação. Resp:e = 0, 04468. EP 8.209. Numa tentativa de melhorar o atendimento no SAC, os funcionários procuraram estimar o tempo médio que gastam com cada cliente. Numa amostra aleatória de 60 clientes colhida no período de três semanas acusou uma média de 30 minutos com desvio padrão de 6 minutos. Construa o intervalo de confiança de 98% para o verdadeiro tempo médio gasto em cada atendimento. Resp: 30 ± 1, 8048. EP 8.210. Numa estação de trem de grande circulação foi colhida uma amostra aleatória de 100 observações com média 30 e desvio padrão de 7. Determine com 99% de confiança uma cota superior para a média. Resp: 30 + 1, 8060. EP 8.211. Um maratonista afirma ser capaz de dar 200 voltas em uma pista de corrida em 3 horas. Um estudo realizado através de uma associação atlética utilizando-se de 14 maratonistas, revelou que eles são capazes de executar 180 voltas no mesmo período de tempo, havendo um desvio padrão de 25 voltas. Assumindo α = 5%, o que podemos dizer acerca do preparo físico do maratonista? Resp: H0 : µ = 200; H1 : µ

(355) = 200; V c = 1, 96; tteste = −2, 99. Rejeitamos a afirmação do maratonista. EP 8.212. Um pescador afirma pescar 18 quilos de peixe em uma hora. Uma pesquisa realizada em um grupo de 10 pescadores revelou que em média eles pescam 12 quilos de peixe em uma hora, com um desvio padrão de 4 quilos. Pode-se aceitar a afirmação do pescador? Resposta: H0 = µ = 18; H1 : µ < 18; tteste = −4, 7434. Rejeitamos. EP 8.213. Uma embalagem de repelente para insetos indica um conteúdo de 100ml. De uma amostra de 16 embalagens verificou-se uma média de 95, 7ml com desvio de 3, 4ml. O que podemos dizer sobre a afirmação do fabricante? Resposta: H0 : µ = 100; H1 : µ

(356) = 100. Rejeitamos. EP 8.214. Uma empresa que produz cordas afirma que suas cordas suportam 720 quilos. Uma amostra de 35 cordas foi testada e apresentou uma média de 698 quilos com desvio de 35 quilos. O que podemos dizer sobre a afirmação do fabricante? 160

(357) Estatística Resp: H0 : µ = 720; H1 : µ < 720; tteste = −3, 326. Rejeitamos a afirmação do fabricante. EP 8.215. O juizado de pequenas causas de uma cidade diz que em média seus processos são concluídos em 233 dias. Uma pesquisa foi feita com 50 usuários deste juizado e obtemos uma média de 231, 5 dias para a conclusão de seus processos com um desvio padrão de 7, 6 dias. Que podemos dizer sobre a afirmação deste juizado de pequenas causas? Resp:H0 : µ = 233; H1 : µ > 233; zteste = −1, 3956. Aceitamos a afirmação do juizado. 8.1.19 Testes ou Provas Não-Paramétricos Os testes não-paramétricos são bastante utilizados para tomada de decisões em relação a certos dados obtidos de pesquisas nas áreas das ciências humanas. Não é preciso admitir hipóteses sobre a distribuição de probabilidade da população, de onde foi retirada a amostra para análise, por essa razão os testes nãoparamétricos são também conhecidos por testes ou provas livres de distribuição. 8.1.20 Teste Qui-Quadrado (ou de Adequação do Ajustamento) É o mais conhecido dos testes não-paramétricos. Considere um espaço amostral ω de um experimento aleatório. Sejam os eventos A1 , A2 , . . . , Ak associados a esse experimento aleatório. Suponha que esse experimento aleatório foi repetido n vezes em idênticas condições. Sejam F o1 , F o2 , . . . , F ok as freqüências observadas dos eventos A1 , A2 , . . . , Ak e F e1 , F e2 , . . . , F ek as freqüências esperadas (ou teóricas) desse K eventos. Faremos o teste do Qui-Quadrado para verificarmos se há adequação de ajustamento entre as freqüências observadas e as esperadas. Ou seja, fazemos o teste para sabermos se as discrepâncias (F oi − F ei ), para i = 1, 2, . . . , k são devidas ao acaso, ou se existe de fato uma diferença significativa entre as freqüências observadas e as esperadas. Os passos para se fazer o teste do Qui-Quadrado são os seguintes: 1. Formular as hipóteses H0 e H1 . (H0 afirma não haver discrepâncias entre as freqüências, H1 afirma que há discrepância entre as freqüências) 2. Fixa-se o nível de significância α do teste e acha-se o valor crítico χc2 na tabela da distribuição QuiQuadrado usando que o grau de liberdade é g l = k − 1, onde k é o número de eventos. 3. Determina-se no gráfico da distribuição Qui-Quadrado a região de aceitação de H0 (AC) e de rejeição de H0 (RJ). 4. Calcula-se o valor teste utilizando a fórmula:

(358) K χ2t = i =1 (F o1 − F e1 )2 (F o2 − F e2 )2 (F ok − F ek )2 (F oi − F ei )2 = + + ...+ F ei F e1 F e2 F ek 5. Se χ2t < χ2c , então aceitamos H0 . Se χ2t > χ2c , rejeitamos H0 . 161

(359) 8.1. INFERÊNCIAS ESTATÍSTICAS ER 8.132. Suponha que lançamos uma moeda 124 vezes e observamos cara (K) 81 vezes e coroa (C) 43 vezes. Vamos fazer o teste do Qui-Quadrado para sabermos se a moeda é honesta, usando um nível se significância de 5%, ou seja, α = 5%. Solução: 1. H0 : A moeda é honesta e H1 : A moeda não é honesta. 2. Para α = 5% temos na tabela da distribuição Qui-Quadrado χ2c = 3, 841, pois o grau de liberdade é g l = k − 1 = 2 − 1 = 1. Lembrando que neste exemplo temos k = 2, que é o número de eventos, ou seja, cara (K) e coroa (C). 3. Determina-se no gráfico da distribuição Qui-Quadrado as regiões de aceitação de H0 (AC) e de rejeição de H0 (RJ). 4. Calcula-se o valor teste χ2t : As freqüências esperadas (ou teóricas) para os eventos A1 = K cara e A2 = C coroa, são exatamente a metade para cada evento, ou seja, F e1 = 62 e F e2 = 62, pois lançamos a moeda 124 vezes. Logo, esperamos que ocorra cara 62 vezes e coroa 62 vezes, isto é, metade de 124 para cada evento. A freqüência observada para o evento cara A1 = K foi F o1 = 81 e para o coroa A2 = C foi F o2 = 43.

(360) 2 χ2t = i =1 (81 − 62)2 (43 − 62)2 (Foi − Fei )2 + = 11, 645 = Fei 62 62 5. Como χ2t = 11, 645 > χ2c = 3, 841 rejeitamos H0 , ou seja, consideramos que a moeda não é honesta com um nível de significância α = 5%, isto é, com um risco de 5% 8.1.21 Regressão e Correlação São técnicas estreitamente relacionadas que envolvem uma forma de estimação. Essas técnicas são utilizadas para estimar uma relação, que possa existir na população. A correlação mede a força, ou grau, de relacionamento entre duas variáveis. A regressão nos dá uma equação matemática, que descreve o relacionamento entre as variáveis. 8.1.22 Regressão Linear É a técnica de estabelecer uma equação matemática linear, que descreve o relacionamento entre duas variáveis. Por exemplo: 1. Dureza e resistência de um metal. 2. Procura de automóveis usados × aumento de carros novos (Causa e efeito). 3. Estimação de lucros (predizer valores futuros). 162

(361) Estatística Função linear y = a + bx ou f (x) = a + bx, onde b coeficiente angular, e a é o coeficiente linear. Os coeficientes b e a, são determinados com base nos dados amostrais. Por exemplo, y = 2 + 5x. A reta intercepta o eixo y no ponto (0; a), isto é, y = a, neste caso no ponto (0; 2), isto é, y = 2. Este ponto é chamado intercepto-y . O coeficiente angular indica a variação de y , por unidade de variação de x. No exemplo, para cada unidade de variação de x, correspondem a 5 unidades de variação de y . 8.1.23 Decisão por um Tipo de Relação Nem todas as situações são bem aproximadas por uma função linear. Uma forma simples de verificar isto é colocar os dados no gráfico. Ex: Linear Exemplo: 8.1.24 Determinação da Função Linear (Método dos Mínimos Quadrados) É o método mais usado para ajustar uma linha reta a um conjunto de pontos (xi ; yi ). Esta reta tem as seguintes características:

(362) 1. A soma dos desvios padrões verticais dos pontos em relação à reta é zero. (yi − yc ) = 0, onde yi são as ordenadas dos pontos e yc são as ordenadas dos pontos que estão sobre a reta que tem como abscissa xi .

(363) 2. A soma dos quadrados desses desvios é mínimo. (yi − yc )2 é mínimo. Os valores dos coeficientes de a e b, da equação da reta de ajuste yc = a + bx, são calculados resolvendo as seguintes equações ditas normais: 1.

(364) y = na + b

(365) x; 163

(366) 2.

(367) xy = a

(368)

(369) 8.1. INFERÊNCIAS ESTATÍSTICAS x2 x +b onde n é o número de pares de dados (x; y ) observados.

(370)

(371)

(372)

(373) 

(374) Resolvendo o sistema de equações acima, temos: b= n n xy − x x2 − x y 2 ea=

(375)

(376) y −b n x . A reta de regressão passa pelo ponto (¯x ; ¯y ), isto é, determinada a equação de ajuste yc = a + bx, tem-se que ¯y = a + b¯x , onde ¯x e ¯y são, respectivamente, a média das abscissas x e das ordenadas y , dos pares de dados (x; y ). ER 8.133. Os dados abaixo representam a freqüência de acidentes e o nível de esforço preventivo educacional. Acidentes por milhão de Homens/horas por mês para ed- homens/horas (y) ucação(x) 7 200 6,4 500 5,2 450 4,0 800 3,1 900 8,0 150 6,5 300 4,4 600 Suponha que queiramos saber se há uma relação entre o nível de esforço preventivo, e a freqüência de acidentes, isto é, se a freqüência de acidentes depende do nível de esforço preventivo. O nível de esforço preventivo seria a variável independente (x) e a freqüência de acidentes a variável dependente (y ). Colocando os dados no gráfico, vemos que eles podem ser aproximados por uma equação linear, pois estão próximos a uma reta. Veja o gráfico abaixo. (a) Determine a equação da reta, que melhor descreva a relação entre acidentes e horas de esforço preventivo. (b) Estime a freqüência de acidentes se o esforço preventivo for de 700 horas. Solução: (a) b = n

(377)

(378)

(379)

(380) 

(381) n 164 xy − 2 x − x x y 2 = 8 · 18720 − 3900 · 44, 6 = −0, 0059 8 · 241.5000 − 152.1000

(382)

(383)

(384) Estatística y −b x 44, 6 + 0, 0059 · 3900 = = 8, 4513 n 8 Como a equação da reta de ajuste é y = a + bx, temos y = 8, 45 − 0, 0059x. a= (b) y = 8, 4513 − 0, 0059 · 700 = 4, 3213. ER 8.134. [Stevenson, p.351 ex.9)] Determine uma equação preditora do montante de seguro, em função da renda anual, com base nos seguintes dados: Renda anual (em $1000) (x) Seguro (y) 20 10 25 12 26 15 18 10 16 15 17 20 32 30 13 5 38 40 40 50 42 40 (a) Qual o montante do seguro se a renda for 29? (b) Qual a renda anual se o montante do seguro for 25?

(385)

(386)

(387)

(388) 

(389) Solução: Temos que: b= n xy − n x2 − x x y 2

(390) x = 287,

(391)

(392)

(393)

(394) x 2 = 8571, y −b = 1, 3210, a = x y = 247,

(395) y 2 = 7819 e

(396) xy = 7875. Portanto, = −12, 0121 e y = −12, 0121 + 1, 3210x. n (a) y = −12, 0121 + 1, 3210 · 29 = 26, 2969 (b) 25 = −12, 0121 + 1, 3110x ⇒ x = 28, 0182(HP12C x = 28, 0178) 8.1.25 O Coeficiente de Determinação ρ2 É definido por: 6

(397)

(398)

(399) 7 8

(400) 6

(401) 7 : 8

(402) 6

(403) 7 : 9 ;9 ; xy n 2 ρ = x2 n − x n − x n y · n 2 · 2 y2 n − y 2 n Temos que 0 ≤ ρ2 ≤ 1. Se ρ2 estiver próximo de 1, significa que os pontos estão próximos da reta de 165

(404) 8.1. INFERÊNCIAS ESTATÍSTICAS ajuste. Logo, temos uma boa estimação. Se estiver próximo de zero, significa que temos dados distantes da reta de ajuste. Logo, temos uma péssima estimação. ER 8.135. No exemplo da freqüência de acidentes × nível de esforço preventivo educacional temos que ρ2 = 0, 9084, um valor próximo de 1, significando que 90, 84% da variação dos acidentes estão relacionados com a variação do nível de esforço preventivo, e apenas 9, 16% da variação não são explicados pela variação do nível de esforço. 8.1.26 Correlação (o Coeficiente ρ de Pearson)

(405)

(406)

(407) )

(408) 

(409) )

(410) 

(411) O coeficiente de correlação de Pearson é definido por ρ= xy − n x2 − n x 2 x· · y y2 − n y 2 Temos que −1 ≤ ρ ≤ 1. Se ρ estiver próximo de −1, então os dados estão próximos da reta de ajuste, que é decrescente. Se r estiver próximo de 1, então os dados estão próximos da reta de ajuste, que é crescente. Se r estiver próximo de zero, temos que os dados estão distantes da reta de ajuste. Logo, temos uma péssima estimação. 8.1.27 Atividade EP 8.216. Deseja-se avaliar a relação existente entre o número de horas (xi ) e a nota obtida (yi ). Os dados estão apresentados na tabela seguinte. Qual a equação da reta ajustada entre x e y ? Qual a qualidade do ajuste? i 1 2 3 4 5 6 xi 1 3 4 5 6 6, 5 yi 6 7 7.5 8 8, 5 8, 7 Resp: y = 55146 + 0, 4946x; ρ = 0, 9997 = 99, 97% EP 8.217. Os dados da tabela abaixo representam o consumo e a renda disponível. Com base nos dados apresentados, responda as questões apresentadas a seguir. Anos Consumo(y), em R$ milhões Renda(x), em R$ milhões 1960 158 189 1961 160 209 1962 163 220 1963 165 235 1964 170 250 (a) Verificar a qualidade do ajuste dos dados à reta de regressão. (b) Se a qualidade do ajuste for boa, encontre a reta de regressão. 166

(412) Estatística (c) Qual o consumo esperado para uma renda de 400 milhões de reais? Resp: (a)ρ2 = 0, 9543; (b)y = 120, 4445 + 0, 1938x; (c)R$197, 9703 milhões EP 8.218. A seguir estão apresentadas as vendas e os custos da industria água fria Ltda. Com base nos valores apresentados determine: (a) a equação da de ajuste; (b) os coeficientes de correlação e determinação; (c) o volume dos custos fixos projetados para vendas de 300 e 650; (d) o volume de vendas previsto, para custos iguais a 220. Resp: (a)y = 20, 5716 + 0, 4582x; (b)r = 0, 9826eρ = 0, 9656; (c)158, 0175e318, 3710; (d)435, 2878 8.2 Números Índices São usados para indicar variações relativas em quantidades, preços, ou valores de um artigo, durante dado período de tempo. 8.2.1 Números Índices Simples Avalia a variação relativa de um único item ou variável econômica, entre dois períodos de tempo. Relativo de preço: pn · 100. p0 Relativo da quantidade: Relativo do valor: qn · 100. q0 pn · qn · 100. p0 · q0 onde, p0 é o preço de um item no ano-base q0 é a quantidade de um item no ano-base pn é o preço de um item em determinado ano-base qn é a quantidade de um item em determinado ano-base ER 8.136. Considere a tabela abaixo, que indica o preço e o volume médio de um determinado modelo de moto: 167

(413) 8.2. NÚMEROS ÍNDICES Ano Preço médio de venda N ◦ Vendido Receita (em 1.000) 1996 1.500 30 45,0 1997 1.800 33 59,4 1998 2.100 31 65,1 1999 2.300 35 80,5 2000 2.350 42 98,7 Solução: Tomando 1.996 como ano-base, temos o preço de $1.500 relativo a $100% e os outros preços medidos em relação a este. Analogamente, o volume de 30 será relacionado a 100% e a receita de 45.000 relacionada também a 100%, os outros volumes e receitas medidos em relação a estes. Os números - índices (relativos) para preço, quantidade e valor de 1.998, tomando 1.996 como ano-base são os seguintes: 2.100 p1.998 · 100 = 140 ou 140%. Como 140% − 100% = 40%, este índice · 100% = p 1.996 = p1.996 1.500 1.998 indica um aumento de 40% no preço em relação ao preço de 1.996. Preço: 31 q1.998 · 100 = 103, 3 ou 103, 3%. Como 103, 3% − 100% = 3, 3%, este · 100% = q 1.996 = q1.996 30 1.998 índice indica um aumento de 3, 3% da quantidade vendida em 1.998, em relação a quantidade de 1.996. Quantidade: 31 q1.998 · 100 = 103, 3 ou 144, 7%. Como 144, 7% − 100% = 44, 7%, este índice · 100% = q 1.996 = q1.996 30 1.998 indica um aumento de 44, 7% na receita de 1.998, em relação à receita de 1.996. Valor: 8.2.2 Elos e Cadeias Relativos Elos de relativos: p 21 , p 32 , p 34 , . . ., representam os preços relativos de cada intervalo de tempo, referidos ao anterior. Relativos em cadeia: p n1 = p 21 · p 32 · . . . · p n−1 n p n1 = p2 p3 p4 pn−1 pn pn = · · · ...· · p1 p1 p2 p3 pn−2 pn−1 ER 8.137. Os elos relativos dos preços no período de 1.997 a 2.000 são: 111; 109; 132; 121; respectivamente. Determine o preço relativo de 2.000, tomando 1.996 como ano-base. Solução: 168 p1.996 p1.997 p1.997 p1.998 p1.998 p1.999 p1.999 p2.000 = 1, 11; = p 1.997 1.996 = 1, 09; = p 1.998 1.997 = p 1.999 = 1, 32; 1.998 = p 2.000 = 1, 21. 1.999

(414) Estatística Logo p1.996 p2.000 = = p 2.000 1.996 p1.996 p1.997 p1.998 p1.999 · · · p1.997 p1.998 p1.999 p2.000 = 1, 11 · 1, 09 · 1, 32 · 1, 21 = 1, 93 = 193 ou 193%. Logo, um aumento de 93%. 8.2.3 Método Agregativo Simples

(415)

(416) Índice de preço agregativo simples: pn p0 , onde pn são os preços em um determinado ano e p0 os preços do ano-base. ER 8.138. A tabela abaixo apresenta o preço médio da saca de 50Kg do feijão, açúcar e farinha nos anos de 1.996, 1.998 e 2.000. Calcule o índice agregativo simples dos preços para o ano de 2.000, tomando como ano-base 1.996.

(417)

(418) pn p0 1.996 1.998 2.000 Feijão 50 55 53 Açúcar 30 36 40 Farinha 40 38 40 = 53 + 40 + 40 = 1, 11 ⇒ 111 ou 111%. 50 + 30 + 40 Logo, um aumento de 11%. 8.2.4 Método das Médias Simples dos Relativos

(419) N pn p0 , onde N é o número de relativos. ER 8.139. Considere o exemplo acima. Calcule a média simples dos relativos. 53 40 40 + + Solução: 50 30 40 = 1, 13 = 113%. Logo, um aumento de 13%. 3 169

(420) 8.2. NÚMEROS ÍNDICES 8.2.5 Método Agregativo Ponderado São mais precisos que o agregativo simples, pois considera-se o preço, e a quantidade. Índice de Laspeyres ou Método do Ano-Base Preço:

(421)

(422) pn q0 Quantidade: Valor: 8.2.6 Preço:

(423)

(424) · 100

(425)

(426) p0 q0 pn qn qn p0 p0 q0 · 100 · 100 p0 q0 Índice de Paasche ou Método do Determinado ou Época Atual

(427)

(428) pn qn Quantidade: · 100

(429)

(430) p0 qn pn qn q0 pn · 100 Índice de Fischer ou Método Ideal Utiliza os dois índices anteriores. IFp = < I LP · I PP , onde I LP é o índice de Laspeyres para preços e I PP é o índice de Paasche para preços. IFQ =  I LQ · I PQ , onde I LQ é o índice de Laspeyres para quantidade e I PQ é o índice de Paasche para quantidade. ER 8.140. Calcule os índices de Laspeyres, Paasche e Fischer, dos produtos dados na tabela abaixo: ANO 170 1.999 1.999 1.999 2.000 2.000 2.000 Preço Quantidade Valor Preço quantidade Valor Feijão 50 20 1.000 60 30 1.800 Açucar 30 50 1.500 40 60 2.400

(431) Estatística Laspeyres Laspeyres Paasche Paasche Fischer Fischer ANO 1.999 2.000 1.999 2.000 1.999 2.000 Preços 100 128 100 127 100 128 Quantidade 100 132 100 131 100 131,5

(432)

(433) Laspeyres. Preço: pn q0

(434)

(435)

(436)

(437) p0 q0 Quantidade: · 100 = qn p0 p0 q0 60 · 20 + 40 · 50 · 100 = 1, 28 · 100 = 128 ou 128%. 2.500 · 100 = 30 · 50 + 60 · 30 · 100 = 1, 32 · 100 = 132 ou 132%. 2.500 Paasche. Preço: pn qn

(438)

(439) p0 qn Quantidade: · 100 = pn qn q0 pn 4.200 · 100 = 1, 27 · 100 = 178 ou 127% 50 · 30 + 60 · 30 · 100 = 42.000 · 100 = 1, 31 · 100 = 131 ou 131%. 20 · 60 + 50 · 40 Fischer. Preço: I F p = √ Quantidade: I F Q = 8.2.7 < I LP · I PP = √ 128 · 127 = 128 I LQ · I PQ = √ 132 · 131 = 131, 5 Atividade EP 8.219. Calcule o índice de preço de Laspeyres, admitindo como ano-base 1991, e utilizando os dados da tabela abaixo. 1991 1991 1992 1992 1993 1993 1994 1994 Preço Quantidade Preço Quantidade Preço Quantidade Preço Quantidade Lápis 0,5 125 0,5 140 0,3 234 0,4 179 Caneta 3,2 103 3,3 105 3,4 96 3,5 69 Grafite 1,4 56 1,3 62 1,4 81 1,5 85 EP 8.220. Obtenha os índices de quantidade de Paasche, utilizando os dados da tabela da questão anterior. EP 8.221. Um apartamento foi comprado por R$10.000 em 1.998 e por R$10.500 no ano seguinte. Calcule o relativo de preço em 1.999, considerando como ano-base o ano de 1.998. EP 8.222. Um corretor vendeu 800 apartamentos em 1.997 e em 1.995 vendeu 6.000. Calcule o relativo de quantidade em 1.995, considerando 1.995 como ano-base. 171

(440) 8.2. NÚMEROS ÍNDICES EP 8.223. Uma concessionária vendeu em 1.996, 16.000 carros com preço unitário de R$10.000. Em 1.998 vendeu 19.000 carros com preço unitário de R$12.000. Calcule o relativo de valor em 1.998. EP 8.224. Os preços de uma saco de arroz eram de R$1, 00 em 1.995 e R$2, 00 em 2.000. Calcule o preço relativo tomando 1995 com ano-base e 2.000 como o ano dado. 172

(441)

Novo documento