Wednesday 16 August 2017

3 Year Moving Average Excel


Excel para Análise de Dados Estatísticos Este é um site de acompanhamento de webtext do Site de Estatísticas de Negócios de EUA para usuários do mundo de hispana, este site se encontra disponível em espanhol em: Sitio Espejo para Amrica Latina Site de los E. E.U. U. O Excel é o pacote estatístico amplamente utilizado, que serve como uma ferramenta para entender conceitos estatísticos e computação para verificar seu cálculo trabalhado manualmente na solução de seus problemas de lição de casa. O site fornece uma introdução para entender o básico e o trabalho com o Excel. Reduzir os exemplos numéricos ilustrados neste site ajudará a melhorar a sua familiaridade e, como resultado, aumentará a eficácia ea eficiência do seu processo em estatísticas. Para pesquisar o site. Experimente E dit F ind na página Ctrl f. Digite uma palavra ou frase na caixa de diálogo, p. ex. Quot variancequot ou quot meanquot Se a primeira aparência da frase em palavra não for o que você procura, tente F ind Next. Introdução Este site fornece experiência ilustrativa no uso do Excel para resumo de dados, apresentação e outras análises estatísticas básicas. Eu acredito que o uso popular do Excel é nas áreas onde o Excel realmente pode se destacar. Isso inclui organizar dados, ou seja, gerenciamento básico de dados, tabulação e gráficos. Para uma análise estatística real, é necessário aprender usando os pacotes estatísticos comerciais profissionais, como SAS e SPSS. O Microsoft Excel 2000 (versão 9) fornece um conjunto de ferramentas de análise de dados denominadas Analysis ToolPak que você pode usar para salvar etapas quando você desenvolve análises estatísticas complexas. Você fornece os dados e parâmetros para cada análise, a ferramenta usa as funções de macro estatísticas apropriadas e, em seguida, exibe os resultados em uma tabela de saída. Algumas ferramentas geram gráficos além das tabelas de saída. Se o comando Análise de dados for selecionável no menu Ferramentas, o Analysis ToolPak está instalado no seu sistema. No entanto, se o comando Data Analysis não estiver no menu Ferramentas, você precisará instalar o Analysis ToolPak fazendo o seguinte: Etapa 1: no menu Ferramentas, clique em Add-Ins. Se o Analysis ToolPak não estiver listado na caixa de diálogo Complementos, clique em Procurar e localize a unidade, o nome da pasta e o nome do arquivo para o Analysis ToolPak Add-in Analys32.xll geralmente localizado na pasta Program FilesMicrosoft OfficeOfficeLibraryAnalysis. Depois de encontrar o arquivo, selecione-o e clique em OK. Etapa 2: se você não encontrar o arquivo Analys32.xll, então você deve instalá-lo. Insira o Microsoft Office 2000 Disk 1 na unidade de CD-ROM. Selecione Executar no menu Iniciar do Windows. Navegue e selecione a unidade para o seu CD. Selecione Setup. exe, clique em Abrir e clique em OK. Clique no botão Adicionar ou Remover recursos. Clique no próximo ao Microsoft Excel para Windows. Clique no próximo para Add-ins. Clique na seta para baixo ao lado do Analysis ToolPak. Selecione Executar a partir do Meu Computador. Selecione o botão Atualizar agora. O Excel agora atualizará seu sistema para incluir o Analysis ToolPak. Inicie o Excel. No menu Ferramentas, clique em Add-Ins. - e marque a caixa de seleção Analysis ToolPak. Etapa 3: o Add-In Analysis ToolPak está agora instalado e análise de dados. Agora será selecionável no menu Ferramentas. O Microsoft Excel é um poderoso pacote de planilhas disponível para o Microsoft Windows e o Apple Macintosh. O software Spreadsheet é usado para armazenar informações em colunas e linhas que podem ser organizadas ou processadas. As planilhas são projetadas para funcionar bem com os números, mas geralmente incluem texto. O Excel organiza o seu trabalho em pastas de trabalho, cada livro de trabalho pode conter muitas planilhas de cálculo que são usadas para listar e analisar dados. O Excel está disponível em todos os PCs de acesso público (ou seja, aqueles, por exemplo, na Biblioteca e PC Labs). Ele pode ser aberto selecionando Iniciar - Programas - Microsoft Excel ou clicando no Corte curto de Excel que está em sua área de trabalho, ou em qualquer PC ou na barra de ferramentas do Office. Abrindo um documento: clique em Arquivo aberto (CtrlO) para abrir uma nova pasta de trabalho altere a área de diretório ou a unidade para procurar arquivos em outros locais. Para criar uma nova pasta de trabalho, clique em Arquivo em Novo Documento em branco. Salvando e fechando um documento: para salvar seu documento com seu nome de arquivo atual, local e formato de arquivo, clique em Arquivo - Salvar. Se você estiver salvando pela primeira vez, clique em Arquivo-Salvar, escolha o nome do documento e clique em OK. Também use File-Save se desejar salvar em um arquivo diferente. Quando você terminar de trabalhar em um documento, você deve fechá-lo. Vá para o menu Arquivo e clique em Fechar. Se você fez alguma alteração desde que o arquivo foi salvo pela última vez, você será perguntado se deseja salvá-los. A tela do Excel Folhas de trabalho e planilhas: quando você inicia o Excel, é exibida uma planilha em branco que consiste em uma grade múltipla de células com linhas numeradas na página e colunas alfabeticamente intituladas em toda a página. Cada célula é referenciada por suas coordenadas (por exemplo, A3 é usado para se referir à célula na coluna A e linha 3 B10: B20 é usado para se referir ao intervalo de células na coluna B e as linhas 10 a 20). Seu trabalho é armazenado em um arquivo do Excel chamado uma pasta de trabalho. Cada caderno de trabalho pode conter várias planilhas e gráficos - a planilha atual é chamada de folha ativa. Para visualizar uma planilha diferente em uma pasta de trabalho, clique na guia Folha apropriada. Você pode acessar e executar comandos diretamente no menu principal ou pode apontar para um dos botões da barra de ferramentas (a caixa de exibição que aparece abaixo do botão, quando coloca o cursor sobre ele, indica a ação de nome do botão) e clique uma vez. Movendo-se ao redor da planilha: É importante poder mover-se pela folha de cálculo efetivamente porque você só pode inserir ou alterar dados na posição do cursor. Você pode mover o cursor usando as teclas de seta ou movendo o mouse para a célula desejada e clicando. Uma vez selecionada, a célula se torna a célula ativa e é identificada por uma borda grossa apenas uma célula pode estar ativa por vez. Para mover de uma folha de cálculo para outra, clique nas guias da folha. (Se o seu livro contiver muitas folhas, clique com o botão direito do mouse nos botões de rolagem da guia e clique na folha que deseja.) O nome da folha ativa é exibido em negrito. Movendo-se entre as células: Aqui estão os atalhos de teclado para mover a célula ativa: Início - move para a primeira coluna na linha atual CtrlHome - move para o canto superior esquerdo do documento Feche depois Início - move para a última célula no documento Para Mova-se entre células em uma planilha, clique em qualquer célula ou use as teclas de seta. Para ver uma área diferente da folha, use as barras de rolagem e clique nas setas ou na área abaixo da caixa de rolagem nas barras de rolagem vertical ou horizontal. Observe que o tamanho de uma caixa de rolagem indica a quantidade proporcional da área usada da folha visível na janela. A posição de uma caixa de rolagem indica a localização relativa da área visível dentro da planilha. Introduzir dados Uma nova planilha é uma grade de linhas e colunas. As linhas são rotuladas com números e as colunas são rotuladas com letras. Cada cruzamento de uma linha e uma coluna é uma célula. Cada célula possui um endereço. Qual é a letra da coluna e o número da linha. A seta na planilha para a direita aponta para a célula A1, que está atualmente destacada. Indicando que é uma célula ativa. Uma célula deve estar ativa para inserir informações nela. Para destacar (selecionar) uma célula, clique nele. Para selecionar mais de uma célula: clique em uma célula (por exemplo, A1), depois segure a tecla Shift enquanto você clica em outra (por exemplo, D4) para selecionar todas as células entre e incluindo A1 e D4. Clique em uma célula (por exemplo, A1) e arraste o mouse pelo alcance desejado, desclassificando em outra célula (por exemplo, D4) para selecionar todas as células entre e incluindo A1 e D4.Para selecionar várias células que não sejam adjacentes, pressione o controle e clique em As células que deseja selecionar. Clique em um número ou letra rotulando uma linha ou coluna para selecionar essa linha ou coluna inteira. Uma planilha pode ter até 256 colunas e 65.536 linhas, então será um pouco antes de você ficar sem espaço. Cada célula pode conter um rótulo. valor . Valor lógico. Ou fórmula. As etiquetas podem conter qualquer combinação de letras, números ou símbolos. Os valores são números. Apenas os valores (números) podem ser usados ​​nos cálculos. Um valor também pode ser uma data ou um tempo. Os valores lógicos são verdadeiros ou falsos. As fórmulas automaticamente fazem cálculos nos valores em outras células especificadas e exibem o resultado na célula em que a fórmula foi inserida (por exemplo, você pode especificar essa célula D3 É conter a soma dos números em B3 e C3, o número exibido em D3 será uma função dos números inseridos em B3 e C3). Para inserir informações em uma célula, selecione a célula e comece a digitar. Observe que ao digitar informações na célula, as informações que você inserir também são exibidas na barra de fórmulas. Você também pode inserir informações na barra de fórmulas e as informações aparecerão na célula selecionada. Quando você tiver terminado de inserir o rótulo ou o valor: Pressione Enter para mover para a próxima célula abaixo (neste caso, A2) Pressione Tab para mover para a próxima célula à direita (neste caso, B1) Clique em qualquer célula para selecionar Iniciando etiquetas A menos que as informações que você inserir sejam formatadas como um valor ou uma fórmula, o Excel irá interpretá-lo como um rótulo e, por padrão, alinhar o texto no lado esquerdo da célula. Se você estiver criando uma planilha longa e você estará repetindo a mesma informação de rótulo em muitas células diferentes, você pode usar a função AutoCompletar. Essa função examinará outras entradas na mesma coluna e tentará combinar uma entrada anterior com sua entrada atual. Por exemplo, se você já digitou o Wesleyan em outra célula e digitar W em uma nova célula, o Excel entrará automaticamente no Wesleyan. Se você pretende digitar Wesleyan na célula, sua tarefa está concluída e você pode passar para a próxima célula. Se você pretendesse digitar algo mais, por exemplo, Williams, na célula, continue a digitar para inserir o termo. Para ativar o Funcionamento de preenchimento automático, clique em Ferramentas na barra de menu e, em seguida, selecione Opções, selecione Editar e clique para colocar uma seleção na caixa ao lado de Ativar preenchimento automático para valores de célula. Outra maneira de inserir rapidamente rótulos repetidos é usar o recurso Selecionar lista. Clique com o botão direito do mouse em uma célula e selecione Escolher da lista. Isso lhe dará um menu de todas as outras entradas nas células nessa coluna. Clique em um item no menu para inseri-lo na célula atualmente selecionada. Um valor é um número, data ou hora, além de alguns símbolos, se necessário, para definir ainda mais os números 91. - () 93. Os números são assumidos como positivos para inserir um número negativo, usar um sinal de menos - ou incluir o número entre parênteses (). As datas são armazenadas como MMDDYYYY, mas você não precisa inseri-lo precisamente nesse formato. Se você entrar em 9 de janeiro ou 9 de janeiro, o Excel irá reconhecê-lo em 9 de janeiro do ano atual e armazená-lo como 192002. Digite o ano de quatro dígitos por um ano diferente do ano atual (por exemplo, 9 de janeiro de 1999). Para inserir a data dos dias atuais, pressione o controle e ao mesmo tempo. Horários padrão para um relógio de 24 horas. Use a ou p para indicar am ou pm se você usar um relógio de 12 horas (por exemplo, 8:30 p é interpretado como 8:30 PM). Para inserir a hora atual, pressione o controle e: (ponto-e-vírgula) ao mesmo tempo. Uma entrada interpretada como um valor (número, data ou hora) está alinhada ao lado direito da célula, para reformatar um valor. Números de arredondamento que atendem aos critérios especificados: para aplicar cores aos valores máximos e / ou mínimos: selecione uma célula na região e pressione CtrlShift (no Excel 2003, pressione esta ou CtrlA) para selecionar a Região atual. No menu Formatar, selecione Formatação condicional. Na condição 1, selecione Fórmula e, digite MAX (F: F) F1. Clique em Formatar, selecione a guia Fonte, selecione uma cor e clique em OK. Na condição 2, selecione Fórmula e digite MIN (F: F) F1. Repita o passo 4, selecione uma cor diferente da que você selecionou para a Condição 1 e clique em OK. Nota: Certifique-se de distinguir entre referência absoluta e referência relativa ao inserir as fórmulas. Números de rodagem que atendem critérios especificados Problema: arredondando todos os números na coluna A para zero casas decimais, exceto aqueles que possuem 5 na primeira casa decimal. Solução: Use as funções IF, MOD e ROUND na seguinte fórmula: IF (MOD (A2,1) 0.5, A2, ROUND (A2,0)) Para copiar e colar todas as células em uma folha Selecione as células na folha Pressionando CtrlA (no Excel 2003, selecione uma célula em uma área em branco antes de pressionar CtrlA ou de uma célula selecionada em um intervalo RegionList atual, pressione CtrlAA). OU Clique em Selecionar Tudo na interseção superior-esquerda de linhas e colunas. Pressione CtrlC. Pressione CtrlPage Down para selecionar outra folha, depois selecione a célula A1. Pressione Enter. Para copiar a folha completa Copiar a folha inteira significa copiar as células, os parâmetros de configuração da página e os nomes de alcance definidos. Opção 1: mova o ponteiro do mouse para uma guia de folha. Pressione Ctrl e segure o mouse para arrastar a folha para um local diferente. Solte o botão do mouse e a tecla Ctrl. Opção 2: clique com o botão direito do mouse na guia da folha apropriada. No menu de atalho, selecione Mover ou Copiar. A caixa de diálogo Mover ou Copiar permite copiar a folha para uma localização diferente no livro atual ou para uma pasta de trabalho diferente. Certifique-se de marcar a caixa de seleção Criar uma cópia. Opção 3: no menu Janela, selecione Organizar. Selecione Tiled to tile todos os livros abertos na janela. Use a Opção 1 (arrastando a folha enquanto pressiona Ctrl) para copiar ou mover uma folha. Ordenar por colunas A configuração padrão para classificação em ordem ascendente ou decrescente é por linha. Para classificar por colunas: no menu Dados, selecione Ordenar e, em seguida, Opções. Selecione o botão de seleção de opção para a esquerda para a direita e clique em OK. Na opção Ordenar por da caixa de diálogo Classificar, selecione o número da linha pelo qual as colunas serão ordenadas e clique em OK. Estatísticas descritivas O Data Analysis ToolPak possui uma ferramenta de Estatística Descritiva que fornece uma maneira fácil de calcular estatísticas de resumo para um conjunto de dados de amostra. As estatísticas resumidas incluem Média, Erro Padrão, Média, Modo, Desvio Padrão, Variância, Kurtosis, Skewness, Faixa, Mínimo, Máximo, Soma e Contagem. Esta ferramenta elimina a necessidade de digitar funções individuais para encontrar cada um desses resultados. O Excel inclui barras de ferramentas elaboradas e personalizáveis, por exemplo, a barra de ferramentas padrão mostrada aqui: alguns dos ícones são computação matemática útil: o ícone Autosum, que entra na soma da fórmula () para adicionar um intervalo de células. É o ícone do FunctionWizard, que lhe dá acesso a todas as funções disponíveis. É o ícone GraphWizard, dando acesso a todos os tipos de gráficos disponíveis, como mostrado nesta exibição: o Excel pode ser usado para gerar medidas de localização e variabilidade para uma variável. Suponhamos que desejemos encontrar estatísticas descritivas para uma amostra de dados: 2, 4, 6 e 8. Etapa 1. Selecione o menu suspenso Ferramentas, se você vir análise de dados, clique nessa opção, caso contrário, clique no complemento. . Opção para instalar a ferramenta de análise pak. Etapa 2. Clique na opção de análise de dados. Etapa 3. Escolha a estatística descritiva da lista de ferramentas de análise. Etapa 4. Quando a caixa de diálogo aparecer: Digite A1: A4 na caixa do intervalo de entrada, A1 é um valor na coluna A e na linha 1. Neste caso, este valor é 2. Usando a mesma técnica, entre outros VALORES até chegar ao último. Se uma amostra é composta por 20 números, você pode selecionar, por exemplo, A1, A2, A3, etc. como o intervalo de entrada. Passo 5. Selecione um intervalo de saída. Neste caso B1. Clique nas estatísticas de resumo para ver os resultados. Quando você clicar em OK. Você verá o resultado no intervalo selecionado. Como você verá, a média da amostra é 5, a mediana é 5, o desvio padrão é 2.581989, a variância da amostra é 6.666667, o alcance é 6 e assim por diante. Cada um desses fatores pode ser importante no cálculo de diferentes procedimentos estatísticos. Distribuição normal Considere o problema de encontrar a probabilidade de obter menos de um determinado valor em qualquer distribuição de probabilidade normal. Como exemplo ilustrativo, suponha que os escores SAT em todo o país sejam normalmente distribuídos com um desvio padrão médio e de 500 e 100, respectivamente. Responda as seguintes perguntas com base nas informações fornecidas: A: Qual a probabilidade de uma pontuação de estudante selecionada aleatoriamente ser inferior a 600 pontos B: Qual a probabilidade de uma pontuação de estudante selecionada aleatoriamente exceder 600 pontos C: Qual a probabilidade Que uma pontuação de estudante selecionada aleatoriamente será entre 400 e 600 Dica: usando o Excel, você pode encontrar a probabilidade de obter um valor aproximadamente inferior ou igual a um determinado valor. Em um problema, quando a média e o desvio padrão da população são fornecidos, você deve usar o senso comum para encontrar diferentes probabilidades com base na pergunta, pois você sabe que a área sob uma curva normal é 1. Na folha de trabalho, selecione a Célula onde você deseja que a resposta apareça. Suponha, você escolheu a célula número um, A1. Nos menus, selecione quotinsert pull-downquot. Passos 2-3 Nos menus, selecione inserir e clique na opção Função. Etapa 4. Depois de clicar na opção Função, a caixa de diálogo Pasta de Função aparece na Categoria Função. Escolha Estatística, em seguida, NORMDIST na caixa Nome da função Clique em OK Etapa 5. Depois de clicar em OK, a caixa de distribuição do NORMDIST aparece: i. Digite 600 em X (caixa de valor) ii. Insira 500 na caixa média iii. Insira 100 na caixa de desvio padrão iv. Digite quottruequot na caixa cumulativa e clique em OK. Como você vê, o valor 0.84134474 aparece em A1, indicando a probabilidade de que uma pontuação de alunos selecionados aleatoriamente seja inferior a 600 pontos. Usando o senso comum, podemos responder a parte quotbquot subtraindo 0.84134474 de 1. Portanto, a resposta da parte quotbquot é 1- 0.8413474 ou 0.158653. Esta é a probabilidade de uma pontuação de estudantes selecionados aleatoriamente ser superior a 600 pontos. Para responder a quota parcial, use as mesmas técnicas para encontrar as probabilidades ou área nos lados esquerdos dos valores 600 e 400. Uma vez que essas áreas ou probabilidades se sobrepõem para responder a pergunta, você deve subtrair a menor probabilidade da probabilidade maior. A resposta é igual a 0,84134474 - 0,15865526, isto é, 0,68269. A captura de tela deve ser a seguinte: Cálculo do valor de uma variável aleatória, muitas vezes chamado de valor quotxquot. Você pode usar NORMINV da caixa de função para calcular um valor para a variável aleatória - se a probabilidade para o lado esquerdo dessa variável for dada. Na verdade, você deve usar esta função para calcular diferentes percentis. Neste problema, pode-se perguntar qual é a pontuação de um aluno cujo percentil é 90. Isso significa que aproximadamente 90 dos alunos são inferiores a este número. Por outro lado, se nos pedisse para fazer este problema à mão, teríamos que calcular o valor x usando a fórmula de distribuição normal x m zd. Agora, use o Excel para calcular P90. Na função Paste, diálogo clique em estatísticas e, em seguida, clique em NORMINV. A captura de tela ficaria como a seguinte: quando você vê NORMINV, a caixa de diálogo aparece. Eu. Insira 0.90 para a probabilidade (isto significa que aproximadamente 90 dos alunos pontuação são inferiores ao valor que estamos procurando) ii. Digite 500 para a média (esta é a média da distribuição normal em nosso caso) iii. Digite 100 para o desvio padrão (este é o desvio padrão da distribuição normal no nosso caso) No final desta tela, você verá o resultado da fórmula, que é aproximadamente 628 pontos. Isso significa que os 10 melhores alunos obtiveram melhores resultados do que 628. Intervalo de Confiança para a Média. Suponhamos que desejemos estimar um intervalo de confiança para a média de uma população. Dependendo do tamanho do tamanho da amostra, você pode usar um dos seguintes casos: Tamanho Grande da Amostra (n é maior do que, digamos, 30): A fórmula geral para desenvolver um intervalo de confiança para uma população significa é: Nesta fórmula é a média Da amostra Z é o coeficiente de intervalo, que pode ser encontrado a partir da tabela de distribuição normal (por exemplo, o coeficiente de intervalo para um nível de confiança 95 é de 1,96). S é o desvio padrão da amostra e n é o tamanho da amostra. Agora, gostaríamos de mostrar como o Excel é usado para desenvolver um determinado intervalo de confiança de uma média de população com base em uma amostra de informação. Como você vê, para avaliar esta fórmula, você precisa do significado da quantia de amostragem e da margem de erro, o Excel calculará automaticamente essas quantidades para você. As únicas coisas que você precisa fazer são: adicionar a margem de erro à média da amostra, Localizar o limite superior do intervalo e subtrair a margem de erro do limite médio para o limite inferior do intervalo. Para demonstrar como o Excel encontra essas quantidades, usaremos o conjunto de dados, que contém a renda horária de 36 estudantes de estudo de trabalho aqui, na Universidade de Baltimore. Esses números aparecem nas células A1 a A36 em uma folha de trabalho do Excel. Depois de inserir os dados, seguimos o procedimento estatístico descritivo para calcular as quantidades desconhecidas. O único passo adicional é clicar no intervalo de confiança na caixa de diálogo de estatística descritiva e inserir o nível de confiança dado, neste caso 95. Aqui está, os procedimentos acima em passo a passo: Etapa 1. Digite dados nas células A1 Para A36 (na planilha) Etapa 2. Nos menus, selecione Ferramentas Etapa 3. Clique em Análise de dados, em seguida, escolha a opção Estatística descritiva e clique em OK. Na caixa de diálogo de estatística descritiva, clique em Estatística de resumo. Depois de ter feito isso, clique no nível do intervalo de confiança e digite 95 - ou em outros problemas, independentemente do intervalo de confiança que desejar. Na caixa Gama de saída, digite B1 ou o que você deseja. Agora, clique em OK. A captura de tela seria semelhante à seguinte: como você vê, a planilha mostra que a média da amostra é 6.902777778 eo valor absoluto da margem de erro 0.231678109. Isso significa que é baseado nesta informação de amostra. Um intervalo de confiança de 95 para a renda horária dos estudantes de estudo de trabalho da UB tem um limite superior de 6.902777778 0.231678109 e um limite inferior de 6.902777778 - 0.231678109. Por outro lado, podemos dizer que de todos os intervalos formados desta forma 95 contém a média da população. Ou, para fins práticos, podemos confiar que a média da população está entre 6.902777778 - 0.231678109 e 6.902777778 0.231678109. Podemos ter, pelo menos, 95 confiantes de que o intervalo 6.68 e 7.13 contém a renda horária média de um estudante de trabalho-estudo. Tamanho da Amostra Smal (digamos menos de 30) Se a amostra n for inferior a 30 ou devemos usar o pequeno procedimento da amostra para desenvolver um intervalo de confiança para a média de uma população. A fórmula geral para o desenvolvimento de intervalos de confiança para a média da população com base em pequena amostra é: Nesta fórmula é a média da amostra. É o coeficiente de intervalo que fornece uma área na parte superior da cauda de uma distribuição t com n-1 graus de liberdade que pode ser encontrada a partir de uma tabela de distribuição t (por exemplo, o coeficiente de intervalo para um nível de confiança 90 é 1,833 se a amostra for 10). S é o desvio padrão da amostra e n é o tamanho da amostra. Agora, você gostaria de ver como o Excel é usado para desenvolver um certo intervalo de confiança de uma média de população com base nessa pequena amostra de informação. Como você vê, para avaliar esta fórmula, você precisa da média da amostra e da margem de erro, o Excel calculará automaticamente essas quantidades da maneira que fez para grandes amostras. Novamente, as únicas coisas que você precisa fazer são: adicionar a margem de erro à média da amostra, encontrar o limite superior do intervalo e subtrair a margem de erro da média para encontrar o limite inferior do intervalo. Para demonstrar como o Excel encontra essas quantidades, usaremos o conjunto de dados, que contém os rendimentos horários de 10 estudantes de estudo de trabalho aqui, na Universidade de Baltimore. Esses números aparecem nas células A1 a A10 em uma folha de trabalho do Excel. Depois de inserir os dados, seguimos o procedimento estatístico descritivo para calcular as quantidades desconhecidas (exatamente como encontramos quantidades para grande amostra). Aqui você está com os procedimentos no formulário passo a passo: Etapa 1. Digite os dados nas células A1 a A10 na planilha Etapa 2. Nos menus, selecione Ferramentas Etapa 3. Clique em Análise de dados e escolha a opção Estatística descritiva. Clique em OK na caixa de diálogo de estatística descritiva, clique em Estatística de resumo, clique no nível de intervalo de confiança e digite 90 ou em outros problemas, independentemente do intervalo de confiança desejado. Na caixa Gama de saída, digite B1 ou qualquer local que desejar. Agora, clique em OK. A captura de tela será semelhante à seguinte: agora, como o cálculo do intervalo de confiança para a amostra grande, calcule o intervalo de confiança da população com base nesta pequena amostra de informação. O intervalo de confiança é: 6.8 0.414426102 ou 6.39 7.21. Podemos ter no mínimo 90 confidentes que o intervalo 6.39 e 7.21 contém a verdadeira média da população. Teste de Hipótese Sobre a Média de População Novamente, devemos distinguir dois casos em relação ao tamanho de sua amostra Tamanho Grande da Amostra (digamos, mais de 30): Nesta seção você deseja saber como o Excel pode ser usado para realizar um teste de hipótese sobre Uma média de população. Utilizaremos os rendimentos horários de diferentes estudantes de estudo de trabalho do que os apresentados anteriormente na seção de intervalo de confiança. Os dados são inseridos nas células A1 a A36. O objetivo é testar a seguinte hipótese nula e alternativa: a hipótese nula indica que a renda horária média de um estudante de trabalho-estudo é igual a 7 por hora no entanto, a hipótese alternativa indica que a renda horária média não é igual a 7 por hora. Vou repetir as etapas tomadas na estatística descritiva e, no final, mostrará como encontrar o valor das estatísticas de teste neste caso, z, usando uma fórmula de célula. Etapa 1. Digite os dados nas células A1 a A36 (na planilha) Etapa 2. Nos menus, selecione Ferramentas Etapa 3. Clique em Análise de dados e escolha a opção Estatística descritiva, clique em OK. Na caixa de diálogo de estatística descritiva, clique em Estatística de resumo. Selecione a caixa Gama de saída, digite B1 ou qualquer local que desejar. Agora, clique em OK. (Para calcular o valor da pesquisa de estatísticas de teste para a média da amostra, em seguida, o erro padrão. Nesta saída, esses valores estão nas células C3 e C4.) Etapa 4. Selecione a célula D1 e insira a fórmula da célula (C3-7 ) C4. A captura de tela deve ser a seguinte: O valor na célula D1 é o valor das estatísticas de teste. Como esse valor cai no intervalo de aceitação de -1,96 a 1,96 (da tabela de distribuição normal), não rejeitamos a hipótese nula. Tamanho da amostra pequena (digamos, menos de 30): usando as etapas tomadas no caso do tamanho da amostra grande, o Excel pode ser usado para realizar uma hipótese para o caso da pequena amostra. Permite usar a renda horária de 10 estudantes de estudo de trabalho na UB para realizar a seguinte hipótese. A hipótese nula indica que a renda horária média de um estudante de trabalho e estudo é igual a 7 por hora. A hipótese alternativa indica que a renda horária média não é igual a 7 por hora. Vou repetir as etapas tomadas na estatística descritiva e, no final, mostrará como encontrar o valor das estatísticas de teste neste caso, quottquot usando uma fórmula de célula. Etapa 1. Digite os dados nas células A1 a A10 (na planilha) Etapa 2. Nos menus, selecione Ferramentas Etapa 3. Clique em Análise de dados e escolha a opção Estatística descritiva. Clique em OK. Na caixa de diálogo de estatística descritiva, clique em Estatística de resumo. Selecione as caixas do intervalo de saída, digite B1 ou qualquer local escolhido. Novamente, clique em OK. (Para calcular o valor da pesquisa de estatísticas de teste para a média da amostra, em seguida, o erro padrão, nesta saída, esses valores estão nas células C3 e C4.) Etapa 4. Selecione a célula D1 e insira a fórmula da célula (C3-7) C4. A captura de tela pareceria ser a seguinte: uma vez que o valor da estatística de teste t -0.66896 cai no intervalo de aceitação -2.262 a 2.262 (da tabela t, onde 0.025 e os graus de liberdade são 9), não rejeitamos a hipótese nula. Diferença entre o meio de duas populações Nesta seção, mostraremos como o Excel é usado para realizar um teste de hipóteses sobre a diferença entre dois meios de população, assumindo que as populações têm variações iguais. Os dados neste caso são retirados de vários escritórios aqui na Universidade de Baltimore. Eu colecionei os dados de renda horária de 36 estudantes de estudo de trabalho selecionados aleatoriamente e 36 assistentes de estudantes. O intervalo de renda horária para estudantes de trabalho e estudo foi de 6 a 8 anos, enquanto o intervalo de renda horária para assistentes estudantis foi de 6-9. O objetivo principal neste teste de hipóteses é verificar se há uma diferença significativa entre os meios das duas populações. A hipótese NULL e ALTERNATIVA é que os meios são iguais e os meios não são iguais, respectivamente. Referindo-se à planilha, escolhi A1 e A2 como centros de etiquetas. A renda horária dos alunos do estudo de trabalho para um tamanho de amostra 36 é mostrada nas células A2: A37. E a receita horária dos assistentes estudantis para um tamanho de amostra 36 é mostrada nas células B2: B37 Data for Work Study Student: 6, 6, 6, 6, 6, 6, 6, 6,5, 6,5, 6,5, 6,5, 6,5, 6,5, 7, 7, 7, 7, 7, 7, 7, 7,5, 7,5, 7,5, 7,5, 7,5, 7,5, 8, 8, 8, 8, 8, 8, 8, 8, 8. Dados para Assistente de Estudante: 6 6, 6, 6, 6, 6,5, 6,5, 6,5, 6,5, 6,5, 7, 7, 7, 7, 7, 7,5, 7,5, 7,5, 7,5, 7,5, 7,5, 8, 8, 8, 8, 8 8, 8, 8.5, 8.5, 8.5, 8.5, 8.5, 9, 9, 9, 9. Use o procedimento de Estatística Descritiva para calcular as variâncias das duas amostras. O procedimento do Excel para testar a diferença entre os dois meios populacionais exigirá informações sobre as variâncias das duas populações. Uma vez que as variâncias das duas populações são desconhecidas, elas devem ser substituídas por variações da amostra. O descritivo para ambas as amostras mostra que a variância da primeira amostra é s 1 2 0.55546218. Enquanto a variância da segunda amostra s 2 2 0,969748. Para realizar a hipótese de teste desejada com o Excel, as seguintes etapas podem ser tomadas: Etapa 1. Nos menus, selecione Ferramentas e clique na opção Análise de Dados. Passo 2. Quando a caixa de diálogo Análise de dados aparecer: Escolha z-Test: Duas amostras para os meios e clique em OK Etapa 3. Quando a caixa de diálogo z-Test: Two Sample for means for exibida: Digite A1: A36 na caixa da variável 1 range (Renda horária dos estudantes de estudo de trabalho) Digite B1: B36 na caixa variável de 2 intervalos (receita horária dos assistentes de estudantes) Digite 0 na caixa Diferença média da hipótese (se desejar testar uma diferença de diferença diferente de 0, insira esse valor) Digite A variância da primeira amostra na caixa Variance 1 Variance Digite a variância da segunda amostra na caixa Variance 2 Variance e selecione Labels Enter 0.05 ou, independentemente do nível de significância desejado, na caixa Alpha Selecione um intervalo de saída adequado para o Resultados, eu escolhi C19. E clique em OK. O valor da estatística de teste z-1.9845824 aparece em nosso caso na célula D24. A regra de rejeição para este teste é z 1.96 da tabela de distribuição normal. Na saída do Excel, esses valores para um teste de duas colunas são z 1.959961082. Uma vez que o valor da estatística de teste z-1.9845824 é inferior a -1.959961082, rejeitamos a hipótese nula. We can also draw this conclusion by comparing the p-value for a two tail - test and the alpha value. Since p-value 0.047190813 is less than a0.05 we reject the null hypothesis. Overall we can say, based on the sample results, the two populations means are different. Small Samples: n 1 OR n 2 are less than 30 In this section we will show how Excel is used to conduct a hypothesis test about the difference between two population means. - Given that the populations have equal variances when two small independent samples are taken from both populations. Similar to the above case, the data in this case are taken from various offices here at the University of Baltimore. I collected hourly income data of 11 randomly selected work-study students and 11 randomly selected student assistants. The hourly income range for both groups was similar range, 6 - 8 and 6-9. The main objective in this hypothesis testing is similar too, to see whether there is a significant difference between the means of the two populations. The NULL and the ALTERNATIVE hypothesis are that the means are equal and they are not equal, respectively. Referring to the spreadsheet, we chose A1 and A2 as label centers. The work-study students hourly income for a sample size 11 are shown in cells A2:A12 . and the student assistants hourly income for a sample size 11 is shown in cells B2:B12 . Unlike previous case, you do not have to calculate the variances of the two samples, Excel will automatically calculate these quantities and use them in the calculation of the value of the test statistic. Similar to the previous case, but a bit different in step 2, to conduct the desired test hypothesis with Excel the following steps can be taken: Step 1. From the menus select Tools then click on the Data Analysis option. Step 2. When the Data Analysis dialog box appears: Choose t-Test: Two Sample Assuming Equal Variances then click OK Step 3 When the t-Test: Two Sample Assuming Equal Variances dialog box appears : Enter A1:A12 in the variable 1 range box (work-study student hourly income) Enter B1:B12 in the variable 2 range box (student assistant hourly income) Enter 0 in the Hypothesis Mean Difference box(if you desire to test a mean difference other than zero, enter that value) then select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C1, then click OK. The value of the test statistic t-1.362229828 appears, in our case, in cell D10. The rejection rule for this test is t 2.086 from the t distribution table where the t value is based on a t distribution with n 1 - n 2 -2 degrees of freedom and where the area of the upper one tail is 0.025 ( that is equal to alpha2). In the Excel output the values for a two-tail test are t 2.085962478. Since the value of the test statistic t-1.362229828, is in an acceptance range of t 2.085962478, we fail to reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two-tail test and the alpha value. Since the p-value 0.188271278 is greater than a0.05 again . we fail to reject the null hypothesis. Overall we can say, based on sample results, the two populations means are equal. Enter data in an Excel work sheet starting with cell A2 and ending with cell C8. The following steps should be taken to find the proper output for interpretation. Step 1. From the menus select Tools and click on Data Analysis option. Step 2. When data analysis dialog appears, choose Anova single-factor option enter A2:C8 in the input range box. Select labels in first row. Step3. Select any cell as output(in here we selected A11). Clique em OK. The general form of Anova table looks like following: Source of Variation Suppose the test is done at level of significance a 0.05, we reject the null hypothesis. This means there is a significant difference between means of hourly incomes of student assistants in these departments. The Two-way ANOVA Without Replication In this section, the study involves six students who were offered different hourly wages in three different department services here at the University of Baltimore. The objective is to see whether the hourly incomes are the same. Therefore, we can consider the following: Treatment: Hourly payments in the three departments Blocks: Each student is a block since each student has worked in the three different departments The general form of Anova table would look like: Source of Variation Degrees of freedom To find the Excel output for the above data the following steps can be taken: Step 1. From the menus select Tools and click on Data Analysis option. Step2. When data analysis box appears: select Anova two-factor without replication then Enter A2: D8 in the input range. Select labels in first row. Step3. Select an output range (in here we selected A11) then OK. Source of Variation NOTE: FMSTMSE 0.9805560.497222 1.972067 F 3.33 from table (5 numerator DF and 10 denominator DF) Since 1.972067 Goodness-of-Fit Test for Discrete Random Variables The CHI-SQUARE distribution can be used in a hypothesis test involving a population variance. However, in this section we would like to test and see how close a sample results are to the expected results. Example: The Multinomial Random Variable In this example the objective is to see whether or not based on a randomly selected sample information the standards set for a population is met. There are so many practical examples that can be used in this situation. For example it is assumed the guidelines for hiring people with different ethnic background for the US government is set at 70(WHITE), 20(African American) and 10(others), respectively. A randomly selected sample of 1000 US employees shows the following results that is summarized in a table. EXPECTED NUMBER OF EMPLOYEES OBSERVED FROM SAMPLE As you see the observed sample numbers for groups two and three are lower than their expected values unlike group one which has a higher expected value. Is this a clear sign of discrimination with respect to ethnic background Well depends on how much lower the expected values are. The lower amount might not statistically be significant. To see whether these differences are significant we can use Excel and find the value of the CHI-SQUARE. If this value falls within the acceptance region we can assume that the guidelines are met otherwise they are not. Now lets enter these numbers into Excel spread - sheet. We used cells B7-B9 for the expected proportions, C7-C9 for the observed values and D7-D9 for the expected frequency. To calculate the expected frequency for a category, you can multiply the proportion of that category by the sample size (in here 1000). The formula for the first cell of the expected value column, D7 is 1000B7. To find other entries in the expected value column, use the copy and the paste menu as shown in the following picture. These are important values for the chi-square test. The observed range in this case is C7: C9 while the expected range is D7: D9. The null and the alternative hypothesis for this test are as follows: H A . The population proportions are not P W 0.70, P A 0.20 and P O 0.10 Now lets use Excel to calculate the p-value in a CHI-SQUARE test. Step 1. Select a cell in the work sheet, the location which you like the p value of the CHI-SQUARE to appear. We chose cell D12. Step 2. From the menus, select insert then click on the Function option, Paste Function dialog box appears. Step 3. Refer to function category box and choose statistical . from function name box select CHITEST and click on OK . Step 4. When the CHITEST dialog appears: Enter C7: C9 in the actual-range box then enter D7: D9 in the expected-range box, and finally click on OK . The p-value will appear in the selected cell, D12. As you see the p value is 0.002392 which is less than the value of the level of significance (in this case the level of significance, a 0.10). Hence the null hypothesis should be rejected. This means based on the sample information the guidelines are not met. Notice if you type CHITEST(C7:C9,D7:D9) in the formula bar the p-value will show up in the designated cell. NOTE: Excel can actually find the value of the CHI-SQUARE. To find this value first select an empty cell on the spread sheet then in the formula bar type CHIINV(D12,2). D12 designates the p-Value found previously and 2 is the degrees of freedom (number of rows minus one). The CHI-SQUARE value in this case is 12.07121. If we refer to the CHI-SQUARE table we will see that the cut off is 4.60517 since 12.071214.60517 we reject the null. The following screen shot shows you how to the CHI-SQUARE value. Test of Independence: Contingency Tables The CHI-SQUARE distribution is also used to test and see whether two variables are independent or not. For example based on sample data you might want to see whether smoking and gender are independent events for a certain population. The variables of interest in this case are smoking and the gender of an individual. Another example in this situation could involve the age range of an individual and his or her smoking habit. Similar to case one data may appear in a table but unlike the case one this table may contains several columns in addition to rows. The initial table contains the observed values. To find expected values for this table we set up another table similar to this one. To find the value of each cell in the new table we should multiply the sum of the cell column by the sum of the cell row and divide the results by the grand total. The grand total is the total number of observations in a study. Now based on the following table test whether or not the smoking habit and gender of the population that the following sample taken from are independent. On the other hand is that true that males in this population smoke more than females You could use formula bar to calculate the expected values for the expected range. For example to find the expected value for the cell C5 which is replaced in c11 you could click on the formula bar and enter C6D5D6 then enter in cell C11. Step 1. Observed Range b4:c5 Smoking and gender So the observed range is b4:c5 and the expected range is b10:c11. Step 3. Click on fx (paste function) Step 4. When Paste Function dialog box appears, click on Statistical in function category and CHITEST in the function name then click OK. When the CHITEST box appears, enter b4:c5 for the actual range, then b10:c11 for the expected range. Step 5. Click on OK (the p-value appears). 0.477395 Conclusion: Since p-value is greater than the level of significance (0.05), fails to reject the null. This means smoking and gender are independent events. Based on sample information one can not assure females smoke more than males or the other way around. Step 6. To find the chi-square value, use CHINV function, when Chinv box appears enter 0.477395 for probability part, then 1 for the degrees of freedom. Degrees of freedom(number of columns-1)X(number of rows-1) Test Hypothesis Concerning the Variance of Two Populations In this section we would like to examine whether or not the variances of two populations are equal. Whenever independent simple random samples of equal or different sizes such as n 1 and n 2 are taken from two normal distributions with equal variances, the sampling distribution of s 1 2 s 2 2 has F distribution with n 1 - 1 degrees of freedom for the numerator and n 2 - 1 degrees of freedom for the denominator. In the ratio s 1 2 s 2 2 the numerator s 1 2 and the denominator s 2 2 are variances of the first and the second sample, respectively. The following figure shows the graph of an F distribution with 10 degrees of freedom for both the numerator and the denominator. Unlike the normal distribution as you see the F distribution is not symmetric. The shape of an F distribution is positively skewed and depends on the degrees of freedom for the numerator and the denominator. The value of F is always positive. Now let see whether or not the variances of hourly income of student-assistant and work-study students based on samples taken from populations previously are equal. Assume that the hypothesis test in this case is conducted at a 0.10. The null and the alternative are: Rejection Rule: Reject the null hypothesis if Flt F 0.095 or Fgt F 0.05 where F, the value of the test statistic is equal to s 1 2 s 2 2. with 10 degrees of freedom for both the numerator and the denominator. We can find the value of F .05 from the F distribution table. If s 1 2 s 2 2. we do not need to know the value of F 0.095 otherwise, F 0.95 1 F 0.05 for equal sample sizes. A survey of eleven student-assistant and eleven work-study students shows the following descriptive statistics. Our objective is to find the value of s 1 2 s 2 2. where s 1 2 is the value of the variance of student assistant sample and s 2 2 is the value of the variance of the work study students sample. As you see these values are in cells F8 and D8 of the descriptive statistic output. To calculate the value of s 1 2 s 2 2. select a cell such as A16 and enter cell formula F8D8 and enter. This is the value of F in our problem. Since this value, F1.984615385, falls in acceptance area we fail to reject the null hypothesis. Hence, the sample results do support the conclusion that student assistants hourly income variance is equal to the work study students hourly income variance. The following screen shoot shows how to find the F value. We can follow the same format for one tail test(s). Linear Correlation and Regression Analysis In this section the objective is to see whether there is a correlation between two variables and to find a model that predicts one variable in terms of the other variable. There are so many examples that we could mention but we will mention the popular ones in the world of business. Usually independent variable is presented by the letter x and the dependent variable is presented by the letter y. A business man would like to see whether there is a relationship between the number of cases of sold and the temperature in a hot summer day based on information taken from the past. He also would like to estimate the number cases of soda which will be sold in a particular hot summer day in a ball game. He clearly recorded temperatures and number of cases of soda sold on those particular days. The following table shows the recorded data from June 1 through June 13. The weatherman predicts a 94F degree temperature for June 14. The businessman would like to meet all demands for the cases of sodas ordered by customers on June 14. Now lets use Excel to find the linear correlation coefficient and the regression line equation. The linear correlation coefficient is a quantity between -1 and 1. This quantity is denoted by R . The closer R to 1 the stronger positive (direct) correlation and similarly the closer R to -1 the stronger negative (inverse) correlation exists between the two variables. The general form of the regression line is y mx b. In this formula, m is the slope of the line and b is the y-intercept. You can find these quantities from the Excel output. In this situation the variable y (the dependent variable) is the number of cases of soda and the x (independent variable) is the temperature. To find the Excel output the following steps can be taken: Step 1. From the menus choose Tools and click on Data Analysis. Step 2. When Data Analysis dialog box appears, click on correlation. Step 3. When correlation dialog box appears, enter B1:C14 in the input range box. Click on Labels in first row and enter a16 in the output range box. Click on OK. As you see the correlation between the number of cases of soda demanded and the temperature is a very strong positive correlation. This means as the temperature increases the demand for cases of soda is also increasing. The linear correlation coefficient is 0.966598577 which is very close to 1. Now lets follow same steps but a bit different to find the regression equation. Step 1. From the menus choose Tools and click on Data Analysis Step 2 . When Data Analysis dialog box appears, click on regression . Step 3. When Regression dialog box appears, enter b1:b14 in the y-range box and c1:c14 in the x-range box. Click on labels . Step 4. Enter a19 in the output range box . Note: The regression equation in general should look like Ym X b. In this equation m is the slope of the regression line and b is its y-intercept. Adjusted R Square The relationship between the number of cans of soda and the temperature is: Y 0.879202711 X 9.17800767 The number of cans of soda 0.879202711(Temperature) 9.17800767. Referring to this expression we can approximately predict the number of cases of soda needed on June 14. The weather forecast for this is 94 degrees, hence the number of cans of soda needed is equal to The number of cases of soda0.879202711(94) 9.17800767 91.82 or about 92 cases. Moving Average and Exponential Smoothing Moving Average Models: Use the Add Trendline option to analyze a moving average forecasting model in Excel. You must first create a graph of the time series you want to analyze. Select the range that contains your data and make a scatter plot of the data. Once the chart is created, follow these steps: Click on the chart to select it, and click on any point on the line to select the data series. When you click on the chart to select it, a new option, Chart, s added to the menu bar. From the Chart menu, select Add Trendline. The following is the moving average of order 4 for weekly sales: Exponential Smoothing Models: The simplest way to analyze a timer series using an Exponential Smoothing model in Excel is to use the data analysis tool. This tool works almost exactly like the one for Moving Average, except that you will need to input the value of a instead of the number of periods, k. Once you have entered the data range and the damping factor, 1- a. and indicated what output you want and a location, the analysis is the same as the one for the Moving Average model. Applications and Numerical Examples Descriptive Statistics: Suppose you have the following, n 10, data: 1.2, 1.5, 2.6, 3.8, 2.4, 1.9, 3.5, 2.5, 2.4, 3.0 Type your n data points into the cells A1 through An. Click on the Tools menu. (At the bottom of the Tools menu will be a submenu Data Analysis. , if the Analysis Tool Pack has been properly installed.) Clicking on Data Analysis. will lead to a menu from which Descriptive Statistics is to be selected. Select Descriptive Statistics by pointing at it and clicking twice, or by highlighting it and clicking on the Okay button. Within the Descriptive Statistics submenu, a. for the input range enter A1:Dn, assuming you typed the data into cells A1 to An. b. click on the output range button and enter the output range C1:C16. C. click on the Summary Statistics box d. finally, click on Okay. The Central Tendency: The data can be sorted in ascending order: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 The mean, median and mode are computed as follows: (1.2 1.5 2.6 3.8 2.4 1.9 3.5 2.5 2.4 3.0) 10 2.48 The mode is 2.4, since it is the only value that occurs twice. The midrange is (1.2 3.8) 2 2.5. Note that the mean, median and mode of this set of data are very close to each other. This suggests that the data is very symmetrically distributed. Variance: The variance of a set of data is the average of the cumulative measure of the squares of the difference of all the data values from the mean. The sample variance-based estimation for the population variance are computed differently. The sample variance is simply the arithmetic mean of the squares of the difference between each data value in the sample and the mean of the sample. On the other hand, the formula for an estimate for the variance in the population is similar to the formula for the sample variance, except that the denominator in the fraction is (n-1) instead of n. However, you should not worry about this difference if the sample size is large, say over 30. Compute an estimate for the variance of the population . given the following sorted data: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 mean 2.48 as computed earlier. An estimate for the population variance is: s 2 1 (10-1) (1.2 - 2.48) 2 (1.5 - 2.48) 2 (1.9 - 2.48) 2 (2.4 -2.48) 2 (2.4 - 2.48) 2 (2.5 - 2.48) 2 (2.6 - 2.48) 2 (3.0 - 2.48) 2 (3.5 -2.48) 2 (3.8 - 2.48) 2 (1 9) (1.6384 0.9604 0.3364 0.0064 0.0064 0.0004 0.0144 0.2704 1.0404 1.7424) 0.6684 Therefore, the standard deviation is s ( 0.6684 ) 12 0.8176 Probability and Expected Values: Newsweek reported that average take for bank robberies was 3,244 but 85 percent of the robbers were caught. Assuming 60 percent of those caught lose their entire take and 40 percent lose half, graph the probability mass function using EXCEL. Calculate the expected take from a bank robbery. Does it pay to be a bank robber To construct the probability function for bank robberies, first define the random variable x, bank robbery take. If the robber is not caught, x 3,244. If the robber is caught and manages to keep half, x 1,622. If the robber is caught and loses it all, then x 0. The associated probabilities for these x values are 0.15 (1 - 0.85), 0.34 (0.85)(0.4), and 0.51 (0.85)(0.6). After entering the x values in cells A1, A2 and A3 and after entering the associated probabilities in B1, B2, and B3, the following steps lead to the probability mass function: Click on ChartWizard. The ChartWizard Step 1 of 4 screen will appear. Highlight Column at ChartWizard Step 1 of 4 and click Next. At ChartWizard Step 2 of 4 Chart Source Data, enter B1:B3 for Data range, and click column button for Series in. A graph will appear. Click on series toward the top of the screen to get a new page. At the bottom of the Series page, is a rectangle for Category (X) axis labels: Click on this rectangle and then highlight A1:A3. At Step 3 of 4 move on by clicking on Next, and at Step 4 of 4, click on Finish. The expected value of a robbery is 1,038.08. E(X) (0)(0.51)(1622)(0.34) (3244)(0.15) 0 551.48 486.60 1038.08 The expected return on a bank robbery is positive. On average, bank robbers get 1,038.08 per heist. If criminals make their decisions strictly on this expected value, then it pays to rob banks. A decision rule based only on an expected value, however, ignores the risks or variability in the returns. In addition, our expected value calculations do not include the cost of jail time, which could be viewed by criminals as substantial. Discrete Continuous Random Variables: Binomial Distribution Application: A multiple choice test has four unrelated questions. Each question has five possible choices but only one is correct. Thus, a person who guesses randomly has a probability of 0.2 of guessing correctly. Draw a tree diagram showing the different ways in which a test taker could get 0, 1, 2, 3 and 4 correct answers. Sketch the probability mass function for this test. What is the probability a person who guesses will get two or more correct Solution: Letting Y stand for a correct answer and N a wrong answer, where the probability of Y is 0.2 and the probability of N is 0.8 for each of the four questions, the probability tree diagram is shown in the textbook on page 182. This probability tree diagram shows the branches that must be followed to show the calculations captured in the binomial mass function for n 4 and 0.2. For example, the tree diagram shows the six different branch systems that yield two correct and two wrong answers (which corresponds to 4(22) 6. The binomial mass function shows the probability of two correct answers as P(x 2 n 4, p 0.2) 6(.2)2(.8)2 6(0.0256) 0.1536 P(2) Which is obtained from excel by using the BINOMDIST Command, where the first entry is x, the second is n, and the third is mass (0) or cumulative (1) that is, entering BINOMDIST(2,4,0.2,0) IN ANY EXCEL CELL YIELDS 0.1536 AND BINOMDIST(3,4,0.2,0) YIELDS P(x3n4, p 0.2) 0.0256 BINOMDIST(4,4,0.2,0) YIELDS P(x4n4, p 0.2) 0.0016 1-BINOMDIST(1,4,0.2,1) YIELDS P(x 179 2 n 4, p 0.2) 0.1808 Normal Example: If the time required to complete an examination by those with a certain learning disability is believed to be distributed normally, with mean of 65 minutes and a standard deviation of 15 minutes, then when can the exam be terminated so that 99 percent of those with the disability can finish Solution: Because t he average and standard deviation are known, what needs to be established is the amount of time, above the mean time, such that 99 percent of the distribution is lower. This is a distance that is measured in standard deviations as given by the Z value corresponding to the 0.99 probability found in the body of Appendix B, Table 5,as shown in the textbook OR the commands entered into any cell of Excel to find this Z value is NORMINV(0.99,0,1) for 2.326342. The closest cumulative probability that can be found is 0.9901, in the row labeled 2.3 and column headed by .03, Z 2.33, which is only an approximation for the more exact 2.326342 found in Excel. Using this more exact value the calculation with mean m and standard deviation s in the following formula would be Z ( X - m ) s That is, Z ( x - 65)15 Thus, x 65 15(2.32634) 99.9 minutes. Alternatively, instead of standardizing with the Z distribution using Excel we can simply work directly with the normal distribution with a mean of 65 and standard deviation of 15 and enter NORMINV(0.99,65,15). In general to obtain the x value for which alpha percent of a normal random variables values are lower, the following NORMINV command may be used, where the first entry is a. the second is m. and the third is s. Another Example: In the early 1980s, the Toro Company of Minneapolis, Minnesota, advertised that it would refund the purchase price of a snow blower if the following winters snowfall was less than 21 percent of the local average. If the average snowfall is 45.25 inches, with a standard deviation of 12.2 inches, what is the likelihood that Toro will have to make refunds Solution: Within limits, snowfall is a continuous random variable that can be expected to vary symmetrically around its mean, with values closer to the mean occurring most often. Thus, it seems reasonable to assume that snowfall (x) is approximately normally distributed with a mean of 45.25 inches and standard deviation of 12.2 inches. Nine and one half inches is 21 percent of the mean snowfall of 45.25 inches and, with a standard deviation of 12.2 inches, the number of standard deviations between 45.25 inches and 9.5 inches is Z: Z ( x - m ) s (9.50 - 45.25)12.2 -2.93 Using Appendix B, Table 5, the textbook demonstrates the determination of P(x 163 9.50) P(z 163 -2.93) 0.17, the probability of snowfall less than 9.5 inches. Using Excel, this normal probability is obtained with the NORMDIST command, where the first entry is x, the second is mean m. the third is standard deviation s, and the fourth is CUMULATIVE (1). Entering NORMDIST(9.5,45.25,12.2,1), Gives P( x 163 9.50) 0.001693. Sampling Distribution and the Central Limit Theorem : A bakery sells an average of 24 loaves of bread per day. Sales (x) are normally distributed with a standard deviation of 4. If a random sample of size n 1 (day) is selected, what is the probability this x value will exceed 28 If a random sample of size n 4 (days) is selected, what is theprobability that xbar 179 28 Why does the answer in part 1 differ from that in part 2 1. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 4. Thus, using Excel, 0.15866 1-NORMDIST(28,24,4,1). 2. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 2 using Excel, 0.02275 1-NORMDIST(28,24,2,1). Regression Analysis: The highway deaths per 100 million vehicle miles and highway speed limits for 10 countries, are given below: (Death, Speed) (3.0, 55), (3.3, 55), (3.4, 55), (3.5, 70), (4.1, 55), (4.3, 60), (4.7, 55), (4.9, 60), (5.1, 60), and (6.1, 75). From this we can see that five countries with the same speed limit have very different positions on the safety list. For example, Britain. with a speed limit of 70 is demonstrably safer than Japan, at 55. Can we argue that, speed has little to do with safety. Use regression analysis to answer this question. Solution: Enter the ten paired y and x data into cells A2 to A11 and B2 to B11, with the death rate label in A1 and speed limits label in B1, the following steps produce the regression output. Choose Regression from Data Analysis in the Tools menu. The Regression dialog box will will appear. Note: Use the mouse to move between the boxes and buttons. Click on the desired box or button. The large rectangular boxes require a range from the worksheet. A range may be typed in or selected by highlighting the cells with the mouse after clicking on the box. If the dialog box blocks the data, it can be moved on the screen by clicking on the title bar and dragging. For the Input Y Range, enter A1 to A11, and for the Input X Range enter B1 to B11. Because the Y and X ranges include the Death and Speed labels in A1 and B1, select the Labels box with a click. Click the Output Range button and type reference cell, which in this demonstration is A13. To get the predicted values of Y (Death rates) and residuals select the Residuals box with a click. Your screen display should show a Table, clicking OK will give the SUMMARY OUTPUT, ANOVA AND RESIDUAL OUTPUT The first section of the EXCEL printout gives SUMMARY OUTPUT. The Multiple R is the square root of the R Square the computation and interpretation of which we have already discussed. The Standard Error of estimate (which will be discussed in the next chapter) is s 0.86423, which is the square root of Residual SS 5.97511 divided by its degrees of freedom, df 8, as given in the ANOVA section. We will also discuss the adjusted R-square of 0.21325 in the following chapters. Under the ANOVA section are the estimated regression coefficients and related statistics that will be discussed in detail in the next chapter. For now it is sufficient to recognize that the calculated coefficient values for the slope and y intercept are provided (b 0.07556 and a -0.29333). Next to these coefficient estimates is information on the variability in the distribution of the least-squares estimators from which these specific estimates were drawn: the column titled Std. Error contains the standard deviations (standard errors) of the intercept and slope distributions the t-ratio and p columns give the calculated values of the t statistics and associated p-values. As shown in Chapter 13, the t statistic of 1.85458 and p-value of 0.10077, for example, indicates that the sample slope (0.07556) is sufficiently different from zero, at even the 0.10 two-tail Type I error level, to conclude that there is a significant relationship between deaths and speed limits in the population. This conclusion is contrary to assertion that speed has little to do with safety. SUMMARY OUTPUT: Multiple R 0.54833, R Square 0.30067, Adjusted R Square 0.21325, Standard Error 0.86423, Observations 10 ANOVA df SS MS F P-value Regression 1 2.56889 2.56889 3.43945 0.10077 Residual 8 5.97511 0.74689 Total 9 8.54400 Coeffs. Estimate Std. Error T Stat P-value Lower 95 Upper 95 Intercept -0.29333 2.45963 -0.11926 0.90801 -5.96526 5.37860 Speed 0.07556 0.04074 1.85458 0.10077 -0.01839 0.16950 Predicted Residuals 3.86222 -0.86222 3.86222 -0.56222 3.86222 -0.46222 4.99556 -1.49556 3.86222 0.23778 4.24000 0.06000 3.86222 0.83778 4.24000 0.66000 4.24000 0.86000 5.37333 0.72667 Microsoft Excel Add-Ins Forecasting with regression requires the Excel add-in called Analysis ToolPak , and linear programming requires the Excel add-in called Solver . How you check to see if these are activated on your computer, and how to activate them if they are not active, varies with Excel version. Here are instructions for the most common versions. If Excel will not let you activate Data Analysis and Solver, you must use a different computer. Excel 20022003: Start Excel, then click Tools and look for Data Analysis and for Solver. If both are there, press Esc (escape) and continue with the respective assignment. Otherwise click Tools, Add-Ins, and check the boxes for Analysis ToolPak and for Solver, then click OK. Click Tools again, and both tools should be there. Excel 2007: Start Excel 2007 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the 8220Office Button8221 at top left - click the Excel Options button near the bottom of the resulting window - click the Add-ins button on the left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Excel 2010: Start Excel 2010 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the File tab at top left - click the Options button near the bottom of the left side - click the Add-ins button near the bottom left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Solving Linear Programs by Excel Some of these examples can be modified for other types problems Computer-assisted Learning: E-Labs and Computational Tools My teaching style deprecates the plug the numbers into the software and let the magic box work it out approach. Personal computers, spreadsheets, e. g. Excel. professional statistical packages (e. g. such as SPSS), and other information technologies are now ubiquitous in statistical data analysis. Without using these tools, one cannot perform any realistic statistical data analysis on large data sets. The appearance of other computer software, JavaScript Applets. Statistical Demonstrations Applets. and Online Computation are the most important events in the process of teaching and learning concepts in model-based statistical decision making courses. These tools allow you to construct numerical examples to understand the concepts, and to find their significance for yourself. Use any or online interactive tools available on the WWW to perform statistical experiments (with the same purpose, as you used to do experiments in physics labs to learn physics) to understand statistical concepts such as Central Limit Theorem are entertaining and educating. Computer-assisted learning is similar to the experiential model of learning. The adherents of experiential learning are fairly adamant about how we learn. Learning seldom takes place by rote. Learning occurs because we immerse ourselves in a situation in which we are forced to perform and think. You get feedback from the computer output and then adjust your thinking-process if needed. A SPSS-Example . SPSS-Examples . SPSS-More Examples . (Statistical Package for the Social Sciences) is a data management and analysis product. It can perform a variety of data analysis and presentation functions, including statistical analyses and graphical presentation of data. SAS (Statistical Analysis System) is a system of software packages some of its basic functions and uses are: database management inputting, cleaning and manipulating data, statistical analysis, calculating simple statistics such as means, variances, correlations running standard routines such as regressions. Available at: SPSSSAS Packages on Citrix (Installing and Accessing ) Use your email ID and Password: Technical Difficulties OTS Call Center (401) 837-6262 Excel Examples. Excel More Examples It is Excellent for Descriptive Statistics, and getting acceptance is improving, as computational tool for Inferential Statistics. The Value of Performing Experiment: If the learning environment is focused on background information, knowledge of terms and new concepts, the learner is likely to learn that basic information successfully. However, this basic knowledge may not be sufficient to enable the learner to carry out successfully the on-the-job tasks that require more than basic knowledge. Thus, the probability of making real errors in the business environment is high. On the other hand, if the learning environment allows the learner to experience and learn from failures within a variety of situations similar to what they would experience in the real world of their job, the probability of having similar failures in their business environment is low. This is the realm of simulations-a safe place to fail. The appearance of statistical software is one of the most important events in the process of decision making under uncertainty. Statistical software systems are used to construct examples, to understand the existing concepts, and to find new statistical properties. On the other hand, new developments in the process of decision making under uncertainty often motivate developments of new approaches and revision of the existing software systems. Statistical software systems rely on a cooperation of statisticians, and software developers. Beside the professional statistical software Online statistical computation . and the use of a scientific calculator is required for the course. A Scientific Calculator is the one, which has capability to give you, say, the result of square root of 5. Any calculator that goes beyond the 4 operations is fine for this course. These calculators allow you to perform simple calculations you need in this course, for example, enabling you to take square root, to raise e to the power of say, 0.36. e assim por diante. These types of calculators are called general Scientific Calculators. There are also more specific and advanced calculators for mathematical computations in other areas such as Finance, Accounting, and even Statistics. The last one, for example, computes mean, variance, skewness, and kurtosis of a sample by simply entering all data one-by-one and then pressing any of the mean, variance, skewness, and kurtosis keys. Without a computer one cannot perform any realistic statistical data analysis. Students who are signing up for the course are expected to know the basics of Excel. As a starting point, you need visiting the Excel Web site created for this course. If you are challenged by or unfamiliar with Excel, you may seek tutorial help from the Academic Resource Center at 410-837-5385, E-mail. What and How to Hand-in My Computer Assignment For the computer assignment I do recommend in checking your hand computation homework, and checking some of the numerical examples from your textbook. As part of your homework assignment you don not have to hand in the printout of the computer assisted learning, however, you must include within your handing homework a paragraph entitled Computer Implementation describing your (positive or negative) experience. Interesting and Useful Sites The Copyright Statement: The fair use, according to the 1996 Fair Use Guidelines for Educational Multimedia. of materials presented on this Web site is permitted for non-commercial and classroom purposes only. This site may be mirrored intact (including these notices), on any server with public access. All files are available at home. ubalt. eduntsbarshBusiness-stat for mirroring. Kindly e-mail me your comments, suggestions, and concerns. Obrigado. EOF: CopyRights 1994-2015.wiki How to Do Trend Analysis in Excel Enter the data into your Excel spreadsheet. You should have enough data to cover a reasonable period of time, such as two years or more. You should also have consistent intervals, such as weekly, monthly, or yearly entries. If youre missing data for a given period of time, you can interpolate a reasonable estimate based on the figures you do have. For example, if youre missing Aprils sales figure, and you have a sales figure of 200 for February, 250 for March, 350 for May, and 400 for June, you can reasonably conclude that Aprils sales were 300 and enter that figure. Likewise, if you have the figures for the previous year and notice that this years sales run about 10 percent higher than last years, and you have last Aprils figures but not this Aprils, you can enter a figure for this April 10 percent higher than the figure you have for last year. Select the data you want to include in the chart. You can select the data either by using your mouse or by selecting a single cell and pressing the Ctrl and A keys simultaneously to select all adjacent cells with data in them. Access the Chart feature. While Excel offers a number of chart options, youll want to set up a line chart for your trendline. In Excel 2003, select Chart from the Insert menu. Click the Standard Types tab, then choose Line under Chart type, and then click Finish. In Excel 2007 and 2010, click the Insert tab, then click Line dropdown button in the Charts section of the Insert menu ribbon. Select the line chart you want from the options displayed. Remove the chart legend, if desired. The chart legend explains which colors represent which dataset in the chart. Removing the legend offers more space for the chart itself. To remove the legend in Excel 2003, click the Legend button on the Chart toolbar. To remove the legend in Excel 2007 or 2010, click the Legend dropdown button in the Labels group on the Layout menu ribbon and select None. Click on the chart. This displays the menus or menu tabs you need to access Excels trendline features. In Excel 2003, this displays the Chart menu. In Excel 2007 and 2010, this displays the Design, Layout, and Format tabs. Select the data series you wish to have a trend line for. This is necessary only if you have more than one data series on your chart. You can select the data series by clicking its line in the chart. Excel 2007 and 2010 also let you select the series from the dropdown list at the top of the Current Selection section of the Layout menu ribbon. If you dont select a series, Excel will prompt you for the series once you choose to apply a trendline to your chart. Access the trendline feature. In Excel 2003, select Add Trendline from the Chart menu. This displays the Add Trendline dialog. In Excel 2007 and 2010, click the Trendline dropdown button in the Analysis group of the Layout menu ribbon. Choose the type of trendline you want. What type of trendline you want depends on how you want to analyze your data. See Choosing the Right Trendline for a discussion of the trendline types. In Excel 2003s Add Trendline dialog box, click the Type tab of the Add Trendline dialog and select the trendline tab from the TrendRegression type list. In Excel 2007 and 2010, select the type of trendline from the Trendline button dropdown list. If you dont see the type of trendline you want, click More Trendline Options to select it from the Trendline Options section of the Format Trendline dialog. Establish the range you wish to forecast for. You can project a trend forward, backward, or both. In Excel 2003, click the Options tab of the Add Trendline dialog and enter a number in the Forward field of the Forecast section to project a trend forward. (To project a trend backward, enter a number in the Backward field.) In Excel 2007 and 2010, select More Trendline Options from the Trendline button dropdown list to display the Format Trendline dialog and enter a number in the Forward field of the Forecast section to project a trend forward. Display the R-squared value, if desired. The R-squared value indicates how closely your trendline follows your data the closer its value is to 1, the closer it follows your data. To display this value, check the Display R-squared value on chart box. You can move the R-squared value to another location on the chart by clicking on it to display a set of sizing handles. Move your cursor until it changes to a 4-headed arrow, then hold down your left mouse button and drag the value to a new location. You may wish to try several of the trendline types discussed below to find which trendline best fits your data. How to Do Common Ratio Analysis of the Financials How to Subtract in Excel How to Make a Pie Chart in Excel How to Reduce Size of Excel Files How to Make a Spreadsheet in Excel How to Make a Bar Graph in Excel How to Convert Excel to Word How to Change from Lowercase to Uppercase in Excel How to Convert Excel to PDF How to Create a Database from an Excel Spreadsheet

No comments:

Post a Comment