среда, 30 мая 2018 г.

Média em movimento centrada na sazonalidade


Ao calcular uma média móvel em execução, colocar a média no período de tempo médio faz sentido No exemplo anterior, calculamos a média dos primeiros 3 períodos de tempo e colocamos ao lado do período 3. Poderíamos ter colocado a média no meio do Intervalo de tempo de três períodos, isto é, ao lado do período 2. Isso funciona bem com períodos de tempo estranhos, mas não tão bons para períodos de tempo iguais. Então, onde colocamos a primeira média móvel quando M 4 Tecnicamente, a Média Móvel cairá em t 2,5, 3,5. Para evitar este problema, suavizamos as MAs usando M 2. Assim, suavizamos os valores suavizados. Se nós medimos um número par de termos, precisamos suavizar os valores suavizados. A tabela a seguir mostra os resultados usando M 4. Implementação da planilha de ajuste sazonal e Suavização exponencial É direto realizar ajustes sazonais e ajustar modelos de suavização exponencial usando o Excel. As imagens de tela e os gráficos abaixo são tirados de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e o alisamento exponencial linear nos seguintes dados de vendas trimestrais da Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão do alisamento exponencial linear que será usada aqui para fins de demonstração é a versão Brown8217s, apenas porque pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que possui constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii), então, as previsões são geradas para os dados dessazonalizados por meio de alisamento exponencial linear e (iii) finalmente, as previsões sazonalmente ajustadas são quantitativas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isso pode ser feito tomando a média de duas médias de um ano que são compensadas por um período relativo um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é igual.) O próximo passo é calcular a proporção para a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de quottrend-cyclequot componente do padrão, na medida em que os efeitos da tendência e do ciclo comercial podem ser considerados como sendo tudo isso Permanece após uma média de um ano inteiro de dados. Claro, mudanças mensais que não são devidas à sazonalidade podem ser determinadas por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida.) O índice sazonal estimado para cada estação é calculado primeiro calculando a média de todas as proporções para essa estação particular, o que é feito nas células G3-G6 usando uma fórmula AVERAGEIF. Os índices médios são então redimensionados de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400 neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que representa. A média móvel centralizada e os dados sazonalmente ajustados ficam assim: note que a média móvel geralmente se parece com uma versão mais suave da série sazonalmente ajustada, e é mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de alisamento exponencial linear aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot.) O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série dessazonalizada. A fórmula usada aqui para a previsão LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão LES para o período atual refere-se às duas observações anteriores e aos dois erros de previsão precedentes, bem como ao valor de alpha. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (Claro que, se desejássemos usar um alisamento exponencial simples em vez de linear, podemos substituir a fórmula SES aqui. Poderíamos também usar Holt8217s em vez do modelo LES Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível e a tendência Que são usados ​​na previsão.) Os erros são computados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio equivocado é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto segue a identidade matemática: VARIÂNCIA MSE (erros) (MÉDIA (erros)) 2. No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo na verdade não inicia a previsão até O terceiro período (linha 15 na planilha). O valor ideal de alfa pode ser encontrado alterando o alfa manualmente até encontrar o RMSE mínimo, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alfa que o Solver encontrou é mostrado aqui (alfa0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em atrasos de até uma estação. Aqui está uma série de séries temporais dos erros (ajustados sazonalmente): as autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um enredo das autocorrelações dos erros nos primeiros cinco atrasos: as autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas o pico no intervalo 4 (cujo valor é 0,35) é um pouco incômodo - sugere que a O processo de ajuste sazonal não foi completamente bem sucedido. No entanto, na verdade, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de n-menos-k é em torno de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor de alfa à mão neste modelo do Excel, você pode observar o efeito sobre os gráficos de séries temporais e autocorrelação dos erros, bem como sobre o erro da raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é citada no futuro, simplesmente substituindo as previsões por valores reais no ponto em que os dados reais se esgotaram - ou seja. Onde quotthe futurequot começa. (Em outras palavras, em cada célula onde um futuro valor de dados ocorreria, uma referência de célula é inserida, que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas de cima: Observe que os erros para as previsões de O futuro é calculado para ser zero. Isso não significa que os erros reais serão zero, mas sim reflete apenas o fato de que, para fins de predição, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões resultantes para os dados dessazonalizados são assim: com este valor particular de alfa, otimizado para previsões de um período de antecedência, a tendência projetada é ligeiramente ascendente, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa for ajustado manualmente para 0.25: A tendência de longo prazo projetada é agora negativa e não positiva. Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A estimativa do nível e da tendência atuais e suas previsões de longo prazo refletem a tendência de queda observada nos últimos 5 anos em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um menor valor de alfa é mais lento para responder a pontos de referência nos dados e, portanto, tende a fazer um erro do mesmo sinal por vários períodos seguidos. Seus erros de previsão de 1 passo à frente são maiores em média do que os obtidos anteriormente (RMSE de 34,4 em vez de 27,4) e fortemente auto-correlacionados positivamente. A autocorrelação de lag-1 de 0,56 excede muito o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa para diminuir o valor do alfa, a fim de introduzir mais conservadorismo em previsões de longo prazo, um fator de amortecimento de quotstend às vezes é adicionado ao modelo para que a tendência projetada se aplique depois de alguns períodos. O passo final na construção do modelo de previsão é quantificar as expectativas do LES, multiplicando-os pelos índices sazonais apropriados. Assim, as previsões não submetidas à coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões LES corrigidas sazonalmente na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo antes feitas por este modelo: primeiro Computa o RMSE (erro da raiz-médio-quadrado, que é apenas a raiz quadrada do MSE) e depois calcula um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança 95 para uma previsão de um período anterior é aproximadamente igual ao ponto de previsão mais-ou-menos-duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição do erro é aproximadamente normal e o tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão dos futuros erros de previsão porque leva também o viés, bem como as variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então resgatados. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Nesse caso, o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (dezembro-93) é 273,2. Então o intervalo de confiança 95 ajustado sazonalmente é de 273,2-227,4 218,4 a 273,2227,4 328,0. Multiplicando esses limites pelo índice sazonal Decembers de 68,61. Obtemos limites de confiança inferiores e superiores de 149,8 e 225,0 em torno da previsão do ponto 93 de 187,4. Os limites de confiança para as previsões mais de um período adiante geralmente se ampliarão conforme o horizonte de previsão aumenta, devido à incerteza sobre o nível e a tendência, bem como os fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular os limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão de mais de um período adiante, tomando todas as fontes de Erro em sua conta, sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão anterior de 2 passos, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Ao inicializar a previsão de um passo a frente). Em seguida, calcule o RMSE dos erros de previsão de 2 passos e use isso como base para um intervalo de confiança de 2 passos. Médias migratórias e médias móveis centradas. Alguns pontos sobre a sazonalidade em séries temporais são repetidos, mesmo que Parecem óbvias. Um é que o termo 8220season8221 não se refere necessariamente às quatro estações do ano que resultam da inclinação do eixo Earth8217s. Na análise preditiva, 8220season8221 muitas vezes significa precisamente isso, porque muitos dos fenômenos que estudamos variam de acordo com a progressão da primavera até o inverno: vendas de artes de inverno ou de verão, incidência de certas doenças generalizadas, eventos climáticos causados ​​pela localização da Fluxo de jato e mudanças na temperatura da água no oceano Pacífico oriental, e assim por diante. Igualmente, os eventos que ocorrem regularmente podem atuar como estações meteorológicas, mesmo que tenham apenas uma conexão tênue com os solstícios e equinócios. Mudanças de oito horas em hospitais e fábricas muitas vezes se expressam na incidência de ingestas e gastos de energia lá, uma temporada é de oito horas e as estações circulam todos os dias e não todos os anos. As datas de vencimento dos impostos sinalizam o início de uma inundação de dólares em tesouros municipais, estaduais e federais, a estação pode ser de um ano (impostos sobre o rendimento das pessoas físicas), seis meses (impostos sobre a propriedade em muitos estados), trimestralmente (muitos impostos corporativos ), e assim por diante. É um pouco estranho que tenhamos a palavra 8220season8221 para se referir geralmente ao período de tempo regularmente recorrente, mas nenhum termo geral para o período de tempo durante o qual ocorre uma volta completa das estações. 8220Cycle8221 é possível, mas na análise e previsão de que o termo geralmente é usado como um período de duração indeterminada, como um ciclo comercial. Na ausência de um termo melhor, I8217ve usado 8220encompatibilidade período8221 neste e subseqüentes capítulos. Isso não é apenas uma reflexão terminológica. As formas em que identificamos as estações e o período de tempo durante o qual as estações passam têm implicações reais, mesmo que menores, para a forma como medimos os efeitos. As seções a seguir descrevem como alguns analistas variam da forma como calculam as médias móveis de acordo com o número de estações é ímpar ou par. Usando médias móveis em vez de médias simples Suponha que uma grande cidade esteja considerando a reafectação de sua polícia de trânsito para melhor abordar a incidência de condução enquanto está prejudicada, o que a cidade acredita ter aumentado. Há quatro semanas, entrou em vigor uma nova legislação, legalizando a posse e o uso recreativo da maconha. Desde então, o número diário de detenções de trânsito para a DWI parece estar a tendência. Complicar questões é o fato de que o número de paradas parece aumentar nas sextas e sábados. Para ajudar a planejar os requisitos de mão-de-obra no futuro, you8217d gostaria de prever qualquer tendência subjacente que se estabelecesse8217s. You8217d também gosta de tempo a implantação de seus recursos para levar em consideração qualquer temporada sazonal que 8217s ocorrem. A Figura 5.9 possui os dados relevantes com os quais você deve trabalhar. Figura 5.9 Com este conjunto de dados, cada dia da semana constitui uma estação. Mesmo apenas observando o gráfico na Figura 5.9. Você pode dizer que a tendência do número de prisões diárias está em alta. Você deve planejar expandir o número de agentes de trânsito e esperar que a tendência diminua em breve. Além disso, os dados confirmam a noção de que mais detenções ocorrem rotineiramente nas sextas e sábados, de modo que sua alocação de recursos precisa abordar essas espinhas. Mas você precisa quantificar a tendência subjacente, para determinar a quantidade de policiais adicionais que você precisa trazer. Você também precisa quantificar o tamanho esperado dos picos de fim de semana, para determinar quantos policiais adicionais você precisa prestar atenção a motoristas erráticos naqueles dias. O problema é que, até o momento, você não sabe o quanto do aumento diário é devido à tendência e quanto é devido ao efeito desse fim de semana. Você pode começar diminuindo as séries temporais. Anteriormente, neste capítulo, em 8220Simple Seasonal Medias, 8221 você viu um exemplo de como detrender uma série de tempo para isolar os efeitos sazonais usando o método de médias simples. Nesta seção, você verá como fazê-lo, usando as médias móveis, muito provável, a abordagem das médias móveis é usada com mais freqüência na análise preditiva do que a abordagem das médias simples. Existem várias razões para a maior popularidade das médias móveis, entre elas, que a abordagem de médias móveis não pede que você colapse seus dados no processo de quantificação de uma tendência. Lembre-se de que o exemplo anterior tornou necessário o colapso das médias trimestrais para as médias anuais, calcular uma tendência anual e, em seguida, distribuir um quarto da tendência anual em cada trimestre do ano. Esse passo era necessário para remover a tendência dos efeitos sazonais. Em contrapartida, a abordagem de médias móveis permite que você desmonte a série temporal sem recorrer a esse tipo de maquinação. A Figura 5.10 mostra como a abordagem de médias móveis funciona no presente exemplo. Figura 5.10 A média móvel no segundo gráfico esclarece a tendência subjacente. A Figura 5.10 adiciona uma coluna de média móvel e uma coluna para estações sazonais específicas. Para o conjunto de dados na Figura 5.9. Ambas as adições requerem alguma discussão. As picos nas prisões que ocorrem nos fins de semana oferecem motivos para acreditar que você trabalha com estações que repetem uma vez por semana. Portanto, comece obtendo a média para o período abrangente8212, isto é, as sete primeiras estações, de segunda a domingo. A fórmula para a média na célula D5, a primeira média móvel disponível, é a seguinte: Essa fórmula é copiada e colada através da célula D29, então você tem 25 médias móveis com base em 25 corridas de sete dias consecutivos. Observe que, para mostrar tanto as primeiras quanto as últimas observações na série temporal, esconderi as linhas 10 a 17. Você pode exibi-las, se quiser, neste livro do capítulo8217s, disponível no site do publisher8217s. Faça uma seleção múltipla de linhas visíveis 9 e 18, clique com o botão direito do mouse em um de seus cabeçalhos de linha e escolha Desligar no menu de atalho. Quando você esconde as linhas da planilha 8217s, como I8217ve feito na Figura 5.10. Qualquer informação traçada nas linhas ocultas também está escondida no gráfico. Os rótulos dos eixos x identificam apenas os pontos de dados que aparecem no gráfico. Como cada média móvel na Figura 5.10 abrange sete dias, nenhuma média móvel é emparelhada com as três primeiras ou últimas três observações reais. Copiar e colar a fórmula na célula D5 até um dia para a célula D4 corre para fora das observações8212. Não há observação registrada na célula C1. Da mesma forma, não existe uma média móvel registrada abaixo da célula D29. Copiar e colar a fórmula em D29 em D30 exigiria uma observação na célula C33, e nenhuma observação está disponível para o dia em que a célula representaria. Seria possível, é claro, encurtar o comprimento da média móvel para, digamos, cinco em vez de sete. Assim, significaria que as fórmulas de média móvel na Figura 5.10 poderiam começar na célula D4 em vez de D5. No entanto, nesse tipo de análise, você quer que o comprimento da média móvel seja igual ao número de estações: sete dias por semana para eventos que se repetem semanalmente implicam uma média móvel de comprimento sete e quatro trimestres por ano para eventos que Repetir anualmente implica uma média móvel de comprimento quatro. Ao longo de linhas semelhantes, geralmente quantificamos os efeitos sazonais de tal forma que eles totalizam para zero dentro do período de tempo abrangente. Como você viu na primeira seção deste capítulo8217s, em médias simples, isso é feito calculando a média de (digamos) os quatro trimestres em um ano e subtraindo a média do ano de cada figura trimestral. Assim, garante que o total dos efeitos sazonais seja zero. Por sua vez, isso é util porque ele coloca os efeitos sazonais em um efeito comum de verão de 8212a é tão distante da média como um efeito de inverno de 821111. Se você quiser uma média de cinco temporadas em vez de sete para obter sua média móvel, você é melhor Descobrindo um fenômeno que se repete a cada cinco temporadas em vez de cada sete. No entanto, quando você tira a média dos efeitos sazonais mais tarde no processo, é improvável que essas médias somem a zero. É necessário nesse ponto recalibrar ou normalizar. As médias de modo que sua soma seja zero. Quando isso ocorreu, as médias sazonais médias expressam o efeito em um período de tempo de pertença a uma determinada estação. Uma vez normalizadas, as médias sazonais são denominadas os índices sazonais que este capítulo já mencionou várias vezes. Você verá como funciona mais adiante neste capítulo, em 8220Detrending the Series with Moving Moys.8221 Compreendendo Sazonais Específicos A Figura 5.10 também mostra o que são chamados de sazonais específicos na coluna E. Eles são o que resta disso depois de subtrair a média móvel da observação real. Para ter uma idéia do que os sazonais específicos representam, considere a média móvel na célula D5. É a média das observações em C2: C8. Os desvios de cada observação a partir da média móvel (por exemplo, C2 8211 D5) são garantidos para somar zero8212 a 8217s uma característica de uma média. Portanto, cada desvio expressa o efeito de estar associado a esse dia particular naquela semana em particular. It8217s é específico específico de temporada e então, porque o desvio se aplica a determinada segunda-feira ou terça-feira e assim por diante e sazonal, porque neste exemplo, estamos tratando cada dia como se fosse uma estação no período abrangente de uma semana. Como cada medida sazonal específica o efeito de estar naquela época vis-224-vis a média móvel para esse grupo de (aqui) sete temporadas, você pode, posteriormente, calcular os períodos de temporada específicos para uma determinada temporada (por exemplo, todas as sextas na sua Séries temporais) para estimar que o efeito geral, em vez de específico, da estação8217s. Essa média não é confundida por uma tendência subjacente na série temporal, porque cada estação específica expressa um desvio de sua própria média móvel particular. Alinhando as médias móveis There8217s também a questão de alinhar as médias móveis com o conjunto de dados original. Na Figura 5.10. Tenho alinhado cada média móvel com o ponto médio da gama de observações que inclui. Assim, por exemplo, a fórmula na célula D5 é a média das observações em C2: C8, e alinhei com a quarta observação, o ponto médio do intervalo médio, colocando-a na linha 5. Esse arranjo é denominado média móvel centrada . E muitos analistas preferem alinhar cada média móvel com o ponto médio das observações que mede. Tenha em mente que, neste contexto, 8220midpoint8221 se refere ao meio de um período de tempo: quinta-feira é o ponto médio de segunda a domingo. Não se refere à mediana dos valores observados, embora, claro, isso possa funcionar dessa maneira na prática. Outra abordagem é a média móvel final. Nesse caso, cada média móvel está alinhada com a observação final de que ela é média8212 e, portanto, fica atrás de seus argumentos. Este é frequentemente o arranjo preferido se você deseja usar uma média móvel como uma previsão, como é feito com suavização exponencial, porque sua média móvel final ocorre coincidente com a observação final disponível. Médias móveis centradas com números pares de estações Nós costumamos adotar um procedimento especial quando o número de estações é mesmo em vez de estranho. Esse é o estado típico das coisas: tende a ter um número uniforme de estações no período abrangente para as estações típicas, como meses, trimestres e períodos quadriênicos (para eleições). A dificuldade com um número par de temporadas é que não há ponto médio. Dois não são o ponto médio de um intervalo que começa em 1 e termina em 4, e nenhum deles é 3 se se pode dizer ter um, seu ponto médio é 2,5. Seis não é o ponto médio de 1 a 12, e nem 7 é o ponto médio puramente teórico é de 6,5. Para agir como se um ponto médio exista, você precisa adicionar uma camada de média acima das médias móveis. Veja a Figura 5.11. Figura 5.11 O Excel oferece várias maneiras de calcular uma média móvel centrada. A idéia por trás dessa abordagem de obter uma média móvel que o 8217 se centrou em um ponto médio existente, quando há um número par de temporadas, é puxar esse ponto médio para a frente em meia temporada. Você calcula uma média móvel que seria centrada em, digamos, o terceiro ponto no tempo, se cinco estações em vez de quatro constituíram uma volta total do calendário. Isso foi feito tomando duas médias móveis consecutivas e as médias delas. Assim, na Figura 5.11. Uma média móvel na célula E6 que mede os valores em D3: D9. Porque há quatro valores sazonais em D3: D9, a média móvel em E6 é pensada como centrada na estação imaginária 2,5, meio ponto abaixo da primeira temporada candidata disponível, 3. (Estações 1 e 2 não estão disponíveis como pontos médios para Falta de dados para a média antes da temporada 1.) Note, no entanto, que a média móvel na célula E8 é a média dos valores em D5: D11, o segundo ao quinto na série temporal. Essa média é centrada no ponto (imaginário) 3.5, um período completo antes da média centrada em 2.5. Ao calcular a média das duas médias móveis, então, o pensamento corre, você pode puxar o ponto central da primeira média móvel para a frente em meio ponto, de 2,5 para 3. Que essas são as médias na coluna F da Figura 5.11. A célula F7 fornece a média das médias móveis em E6 e E8. E a média em F7 está alinhada com o terceiro ponto de dados na série temporal original, na célula D7, para enfatizar que a média está centrada nessa estação. Se você expandir a fórmula na célula F7, bem como as médias móveis nas células E6 e E8, você verificou que se trata de uma média ponderada dos primeiros cinco valores na série temporal, com o primeiro e o quinto valor dados um peso De 1 e o segundo ao quarto valor, dado um peso de 2. Isso nos leva a uma maneira mais rápida e simples de calcular uma média móvel centrada com um número par de temporadas. Ainda na Figura 5.11. Os pesos são armazenados no intervalo H3: H11. Esta fórmula retorna a primeira média móvel centrada, na célula I7: Essa fórmula retorna 13.75. Que é idêntico ao valor calculado pela fórmula de média dupla na célula F7. Fazendo a referência aos pesos absolutos, por meio dos sinais de dólar em H3: H11. Você pode copiar a fórmula e colá-la, na medida do necessário, para obter o resto das médias móveis centradas. Detrendendo a série com médias móveis Quando você subtraiu as médias móveis das observações originais para obter os sazonais específicos, você removeu a tendência subjacente da série. O que é deixado nos temporários específicos é normalmente uma série horizontal estacionária com dois efeitos que fazem com que os sazonais específicos partem de uma linha absolutamente reta: os efeitos sazonais e o erro aleatório nas observações originais. A Figura 5.12 mostra os resultados para este exemplo. Figura 5.12 Os efeitos sazonais específicos para sexta-feira e sábado permanecem claros na série detrada. O gráfico superior da Figura 5.12 mostra as observações diárias originais. Tanto a tendência geral como os picos sazonais de fim de semana são claros. O gráfico inferior mostra os sazonais específicos: o resultado da destruição da série original com um filtro de média móvel, conforme descrito anteriormente em 8220Understanding Seasonals específicos.8221 Você pode ver que a série detrended agora é praticamente horizontal (uma linha de tendência linear para os seasonals específicos Tem uma leve deriva para baixo), mas os picos sazonais de sexta-feira e sábado ainda estão no lugar. O próximo passo é avançar para além dos sazonais específicos para os índices sazonais. Veja a Figura 5.13. Figura 5.13 Os efeitos sazonais específicos são inicialmente calculados em média e depois normalizados para atingir os índices sazonais. Na Figura 5.13. Os sazonais específicos na coluna E são rearranjados na forma tabular mostrada na faixa H4: N7. O objetivo é simplesmente facilitar o cálculo das médias sazonais. Essas médias são mostradas em H11: N11. No entanto, os números em H11: N11 são médias, não desvios de uma média, e, portanto, não podemos esperar que somem a zero. Nós ainda precisamos ajustá-los para que eles expressem desvios de um grande meio. Essa grande média aparece na célula N13, e é a média das médias sazonais. Podemos chegar aos índices sazonais, subtraindo a média principal em N13 de cada uma das médias sazonais. O resultado está na faixa H17: N17. Esses índices sazonais não são mais específicos de uma média móvel em particular, como é o caso dos sazonais específicos na coluna E. Como eles são baseados em uma média de cada instância de uma determinada estação, expressam o efeito médio de uma determinada estação ao longo da Quatro semanas na série temporal. Além disso, eles são medidas de uma estação, depois de um apito8217s8212, um dia, um efeito de 8212s em prisões de trânsito em relação à média de um período de sete dias. Agora podemos usar esses índices sazonais para dessazonalizar a série. Utilizamos a série dessazonalizada para obter previsões por meio de regressão linear ou método Holt8217s de série tendencial de suavização (discutido no Capítulo 4). Então, simplesmente adicionamos os índices sazonais de volta às previsões para redimensioná-los. Tudo isso aparece na Figura 5.14. Figura 5.14 Depois de ter os índices sazonais, os toques finais aplicados aqui são os mesmos que no método das médias simples. As etapas ilustradas na Figura 5.14 são em grande parte as mesmas das Figuras 5.6 e 5.7. Discutido nas seções a seguir. Desalentando as Observações Subtrair os índices sazonais das observações originais para desestatizar os dados. Você pode fazer isso como mostrado na Figura 5.14. Em que as observações originais e os índices sazonais são organizados como duas listas que começam na mesma linha, as colunas C e F. Este arranjo torna um pouco mais fácil estruturar os cálculos. Você também pode fazer a subtração, como mostrado na Figura 5.6. Em que as observações trimestrais originais (C12: F16), os índices trimestrais (C8: F8) e os resultados dessazonalizados (C20: F24) são mostrados em um formato tabular. Esse arranjo torna um pouco mais fácil se concentrar nos índices sazonais e nos trimestres dessazonados. Previsão das Observações Deseasonalized na Figura 5.14. As observações dessazonalizadas estão na coluna H e na Figura 5.7 são na coluna C. Independentemente de querer usar uma abordagem de regressão ou uma abordagem de suavização para a previsão, é o melhor para organizar as observações dessazonalizadas em uma lista de uma única coluna. Na Figura 5.14. As previsões estão na coluna J. A seguinte fórmula de matriz é inserida no intervalo J2: J32. No início deste capítulo, apontou que, se você omitir o argumento x-values ​​dos argumentos TREND () function8217s, o Excel fornece os valores padrão 1. 2. N. Onde n é o número de valores y. Na fórmula dada, H2: H32 contém 31 valores de y. Como o argumento que normalmente contém os valores x está faltando, o Excel fornece os valores padrão 1. 2. 31. Esses são os valores que gostaríamos de usar de qualquer maneira, na coluna B, então a fórmula como dada é equivalente a TREND (H2: H32, B2: B32). E que a estrutura utilizada em D5: D24 da Figura 5.7: Fazendo a previsão de um passo a frente Até agora você organizou as previsões das séries temporais dessazonalizadas de t 1 a t 31 na Figura 5.14. E de t 1 a t 20 na Figura 5.7. Estas previsões constituem informações úteis para vários fins, incluindo a avaliação da precisão das previsões por meio de uma análise RMSE. Mas seu objetivo principal é prever pelo menos o próximo período de tempo, ainda não observado. Para obter isso, você poderia primeiro prever da função TREND () ou LINEST () se you8217re usando regressão ou da fórmula de suavização exponencial se you8217re usando o método Holt8217s. Então você pode adicionar o índice sazonal associado à previsão de regressão ou suavização, para obter uma previsão que inclua tanto a tendência como o efeito sazonal. Na Figura 5.14. Você obtém a previsão de regressão na célula J33 com esta fórmula: Nesta fórmula, os valores y em H2: H32 são os mesmos nas demais fórmulas TREND () na coluna J. Assim, os valores x (padrão) de 1 Através de 32. Agora, no entanto, você fornece um novo valor x como o terceiro argumento do function8217s, que você diz TREND () para procurar na célula B33. It8217s 32. O próximo valor de t. E o Excel retorna o valor 156.3 na célula J33. A função TREND () na célula J33 está dizendo ao Excel, de fato, 8220Calcular a equação de regressão para os valores em H2: H32 regredido nos valores t de 1 a 31. Aplica essa equação de regressão ao novo valor x de 32 e retorna o resultado.8221 You8217ll encontra a mesma abordagem tomada na célula D25 da Figura 5.7. Onde a fórmula para obter a previsão one-step-ahead é esta: Adicionando os índices sazonais de volta. O último passo é redimensionar as previsões adicionando os índices sazonais às previsões de tendências, revendo o que você fez quatro passos atrás quando você subtraiu a Índices das observações originais. Isso é feito na coluna F na Figura 5.7 e na coluna K na Figura 5.14. Don8217t esqueça de adicionar o índice sazonal apropriado para a previsão one-step-ahead, com os resultados mostrados na célula F25 na Figura 5.7 e na célula K33 na Figura 5.14. (I8217ve sombreou as células de um passo à frente, tanto na Figura 5.7 como na Figura 5.14 para destacar as previsões). Você pode encontrar gráficos de três representações dos dados de trânsito na Figura 5.15. A série dessazonalizada, a previsão linear dos dados dessazonalizados e as previsões reserizadas. Observe que as previsões incorporam tanto a tendência geral quanto os dados originais e os pontos de sexta-feira. Figura 5.15 Traçando as previsões.

Комментариев нет:

Отправить комментарий