Sunday 18 August 2019

Média de movimentação de três vezes exponencialmente suavizada


Suavização exponencial explicada. Copie os direitos autorais. O conteúdo no InventoryOps é protegido por direitos autorais e não está disponível para republicação. Quando as pessoas primeiro encontram o termo Suavização Exponencial, eles podem pensar que isso parece ser um monte de alisamento. Seja qual for o alisamento. Eles então começam a imaginar um cálculo matemático complicado que provavelmente requer um diploma em matemática para entender, e espero que exista uma função incorporada do Excel disponível se eles precisarem fazê-lo. A realidade do alisamento exponencial é muito menos dramática e muito menos traumática. A verdade é que o alisamento exponencial é um cálculo muito simples que realiza uma tarefa bastante simples. Ele só tem um nome complicado, porque o que tecnicamente acontece como resultado desse simples cálculo é realmente um pouco complicado. Para entender o suavização exponencial, ajuda a começar com o conceito geral de suavização e alguns outros métodos comuns usados ​​para o alisamento. O que é o alisamento O suavização é um processo estatístico muito comum. De fato, nós encontramos regularmente dados suavizados em várias formas em nossa vida cotidiana. Sempre que usar uma média para descrever algo, você está usando um número suavizado. Se você pensa sobre o motivo pelo qual você usa uma média para descrever algo, você entenderá rapidamente o conceito de suavização. Por exemplo, acabamos de experimentar o inverno mais caloroso registrado. Como podemos quantificar isso? Bem, começamos com conjuntos de dados das temperaturas diárias altas e baixas durante o período que chamamos de Inverno por ano na história registrada. Mas isso nos deixa com um monte de números que saltam bastante (não é como todos os dias que este inverno foi mais quente do que os dias correspondentes de todos os anos anteriores). Precisamos de um número que remova todo esse salto dos dados para que possamos comparar mais facilmente um inverno com o próximo. Remover o salto nos dados é chamado de suavização e, neste caso, podemos usar apenas uma média simples para realizar o alisamento. Na previsão de demanda, usamos alisamento para remover a variação aleatória (ruído) de nossa demanda histórica. Isso nos permite identificar melhor os padrões de demanda (principalmente tendência e sazonalidade) e níveis de demanda que podem ser usados ​​para estimar a demanda futura. O ruído em demanda é o mesmo conceito que o salto diário dos dados de temperatura. Não surpreendentemente, a maneira mais comum de remover o ruído do histórico de demanda é usar uma média simples ou mais especificamente, uma média móvel. Uma média móvel apenas usa um número predefinido de períodos para calcular a média, e esses períodos se movem à medida que o tempo passa. Por exemplo, se eu estiver usando uma média móvel de 4 meses e hoje é 1 de maio, estou usando uma média de demanda ocorrida em janeiro, fevereiro, março e abril. Em 1º de junho, vou usar a demanda de fevereiro, março, abril e maio. Média móvel ponderada. Ao usar uma média, estamos aplicando a mesma importância (peso) a cada valor no conjunto de dados. Na média móvel de 4 meses, cada mês representou 25 da média móvel. Ao usar o histórico de demanda para projetar a demanda futura (e especialmente a tendência futura), é lógico chegar à conclusão de que você gostaria que o histórico mais recente tenha um impacto maior na sua previsão. Podemos adaptar nosso cálculo de média móvel para aplicar vários pesos a cada período para obter os resultados desejados. Nós expressamos esses pesos como porcentagens e o total de todos os pesos para todos os períodos deve somar até 100. Portanto, se decidimos que queremos aplicar 35 como o peso para o período mais próximo em nossa média móvel ponderada de 4 meses, podemos Subtrair 35 de 100 para descobrir que temos 65 restantes para dividir nos outros 3 períodos. Por exemplo, podemos terminar com uma ponderação de 15, 20, 30 e 35 respectivamente para os 4 meses (15 20 30 35 100). Suavização exponencial. Se voltarmos ao conceito de aplicar um peso ao período mais recente (como 35 no exemplo anterior) e espalhar o peso restante (calculado subtraindo o peso do período mais recente de 35 de 100 para obter 65), temos Os blocos de construção básicos para nosso cálculo exponencial de suavização. A entrada de controle do cálculo de suavização exponencial é conhecida como o fator de suavização (também chamado de constante de suavização). Representa essencialmente a ponderação aplicada à demanda de períodos mais recentes. Então, onde usamos 35 como a ponderação para o período mais recente no cálculo da média móvel ponderada, também poderíamos escolher usar 35 como fator de suavização em nosso cálculo exponencial de suavização para obter um efeito semelhante. A diferença com o cálculo de suavização exponencial é que ao invés de nós ter que descobrir o quanto de peso a aplicar a cada período anterior, o fator de suavização é usado para fazer isso automaticamente. Então, aqui vem a parte exponencial. Se usarmos 35 como fator de suavização, a ponderação da demanda de períodos mais recente será de 35. A ponderação da demanda nos próximos períodos mais recentes (o período anterior ao mais recente) será 65 de 35 (65 provém de subtrair 35 de 100). Isso equivale a 22,75 ponderações para esse período se você fizer a matemática. Nos próximos períodos, a demanda será 65 de 65 de 35, o que equivale a 14,79. O período anterior será ponderado como 65 de 65 de 65 de 35, o que equivale a 9.61, e assim por diante. E isso continua com todos os seus períodos anteriores até o início do tempo (ou o ponto em que você começou a usar o alisamento exponencial para esse item em particular). Você provavelmente está pensando que parece um monte de matemática. Mas a beleza do cálculo de suavização exponencial é que ao invés de ter que recalcular em relação a cada período anterior sempre que você obtém uma nova demanda de períodos, você simplesmente usa a saída do cálculo de suavização exponencial do período anterior para representar todos os períodos anteriores. Você está confuso ainda Isso fará mais sentido quando olhamos para o cálculo real Normalmente, nos referimos à saída do cálculo de suavização exponencial como a próxima previsão do período. Na realidade, a previsão final precisa de um pouco mais de trabalho, mas para os fins desse cálculo específico, nos referiremos como a previsão. O cálculo de suavização exponencial é o seguinte: a demanda de períodos mais recente multiplicada pelo fator de suavização. PLUS A previsão de períodos mais recente multiplicada por (um menos o fator de suavização). D os períodos mais recentes exigem S o fator de suavização representado na forma decimal (então 35 seria representado como 0,35). F os períodos mais recentes previstos (a saída do cálculo de suavização do período anterior). OU (assumindo um fator de suavização de 0,35) (D 0,35) (F 0,65) Não é muito mais simples do que isso. Como você pode ver, tudo o que precisamos para obter dados aqui são os períodos mais recentes, a demanda e os períodos mais recentes previstos. Nós aplicamos o fator de suavização (ponderação) para os períodos mais recentes exigindo da mesma maneira que seria no cálculo da média móvel ponderada. Em seguida, aplicamos a ponderação restante (1 menos o fator de suavização) até a previsão de períodos mais recentes. Uma vez que a previsão de períodos mais recentes foi criada com base na demanda dos períodos anteriores e nos períodos anteriores, que se baseou na demanda do período anterior e na previsão do período anterior, que se baseou na demanda do período anterior E a previsão para o período anterior, que se baseou no período anterior. Bem, você pode ver como todos os períodos anteriores são representados no cálculo, sem realmente voltar e recalcular qualquer coisa. E é isso que impulsionou a popularidade inicial do alisamento exponencial. Não foi por ter feito um melhor trabalho de suavização do que a média móvel ponderada, foi porque era mais fácil de calcular em um programa de computador. E, porque você não precisava pensar sobre a ponderação para dar períodos anteriores ou quantos períodos anteriores usar, como você faria na média móvel ponderada. E, porque soava mais frio do que a média móvel ponderada. Na verdade, pode-se argumentar que a média móvel ponderada proporciona maior flexibilidade, pois você tem mais controle sobre a ponderação de períodos anteriores. A realidade é que qualquer um destes pode fornecer resultados respeitáveis, então por que não ir com um som mais fácil e mais frio. Suavização exponencial no Excel Veja como isso realmente seria exibido em uma planilha com dados reais. Copie os direitos autorais. O conteúdo no InventoryOps é protegido por direitos autorais e não está disponível para republicação. Na Figura 1A, temos uma planilha do Excel com 11 semanas de demanda e uma previsão exponencialmente suavizada calculada a partir dessa demanda. Eu usei um fator de suavização de 25 (0,25 na célula C1). A célula ativa atual é Cell M4 que contém a previsão para a semana 12. Você pode ver na barra de fórmulas, a fórmula é (L3C1) (L4 (1-C1)). Assim, as únicas entradas diretas para este cálculo são a demanda de períodos anteriores (Cell L3), os períodos anteriores previstos (Cell L4) e o fator de suavização (Cell C1, mostrado como referência de célula absoluta C1). Quando começamos um cálculo de suavização exponencial, precisamos conectar manualmente o valor para a 1ª previsão. Então, na célula B4, em vez de uma fórmula, acabamos de digitar a demanda do mesmo período que a previsão. Na célula C4, temos o nosso 1º cálculo exponencial de suavização (B3C1) (B4 (1-C1)). Podemos copiar Cell C4 e colá-lo nas células D4 através de M4 para preencher o resto das nossas células de previsão. Agora você pode clicar duas vezes em qualquer célula de previsão para ver se é baseada na célula de previsão de períodos anteriores e na célula de demanda de períodos anteriores. Portanto, cada cálculo subseqüente de suavização exponencial herda a saída do cálculo de suavização exponencial anterior. É assim que a demanda de cada período anterior é representada no cálculo dos períodos mais recentes, embora esse cálculo não faça referência direta a esses períodos anteriores. Se você deseja ter fantasia, você pode usar a função Excels trace precedents. Para fazer isso, clique em Cell M4, depois na barra de ferramentas da fita (Excel 2007 ou 2018) clique na guia Fórmulas e, em seguida, clique em Preocupações de rastreamento. Ele irá desenhar linhas de conector para o primeiro nível de precedentes, mas se você continuar clicando em Preocupações de rastreamento, irá desenhar linhas de conector para todos os períodos anteriores para mostrar as relações herdadas. Agora, vamos ver o que o alisamento exponencial fez por nós. A Figura 1B mostra um gráfico de linha de nossa demanda e previsão. Você vê como a previsão exponencialmente alisada remove a maior parte da irregularidade (o salto em torno) da demanda semanal, mas ainda consegue seguir o que parece ser uma tendência ascendente na demanda. Você também notará que a linha de previsão suavizada tende a ser menor do que a linha de demanda. Isso é conhecido como atraso de tendência e é um efeito colateral do processo de suavização. Sempre que usar o suavização quando uma tendência estiver presente, sua previsão ficará para trás da tendência. Isso é verdade para qualquer técnica de suavização. De fato, se continuássemos esta planilha e começássemos a inserir números de demanda menores (fazendo uma tendência decrescente), você veria a queda da linha de demanda e a linha de tendência se deslocará acima dela antes de começar a seguir a tendência descendente. É por isso que eu mencionei anteriormente a saída do cálculo de suavização exponencial que chamamos de previsão, ainda precisa de mais algum trabalho. Há muito mais para a previsão do que apenas suavizar os solavancos na demanda. Precisamos fazer ajustes adicionais para coisas como atraso de tendência, sazonalidade, eventos conhecidos que podem afetar demanda, etc. Mas tudo isso está além do escopo deste artigo. Você provavelmente também irá encontrar termos como suavização de dois níveis exponencial e suavização triplo-exponencial. Esses termos são um pouco enganadores, pois você não está re-suavizando a demanda várias vezes (você poderia, se quiser, mas isso não é o ponto aqui). Estes termos representam o uso de suavização exponencial em elementos adicionais da previsão. Assim, com um alisamento exponencial simples, você está suavizando a demanda base, mas com o alisamento duplo-exponencial, você suaviza a demanda base mais a tendência, e com alisamento triplo-exponencial você suaviza a demanda base mais a tendência mais a sazonalidade. A outra pergunta mais comum sobre o alisamento exponencial é onde eu obtenho meu fator de suavização. Não há resposta mágica aqui, você precisa testar vários fatores de suavização com seus dados de demanda para ver o que obtém os melhores resultados. Existem cálculos que podem definir automaticamente (e alterar) o fator de suavização. Estes se enquadram no termo alisamento adaptativo, mas você precisa ter cuidado com eles. Simplesmente não há uma resposta perfeita e você não deve implementar de forma cega nenhum cálculo sem testes completos e desenvolver uma compreensão completa do que esse cálculo faz. Você também deve executar cenários do que-se para ver como esses cálculos reagem às mudanças de demanda que podem não existir atualmente nos dados de demanda que você está usando para testar. O exemplo de dados que usei anteriormente é um exemplo muito bom de uma situação em que você realmente precisa testar alguns outros cenários. Esse exemplo de dados específicos mostra uma tendência ascendente bastante consistente. Muitas grandes empresas com software de previsão muito caro conseguiram grandes problemas no passado não tão distante, quando as configurações de software que foram ajustadas para uma economia em crescimento não reagiram bem quando a economia começou a estagnar ou encolher. Coisas como esta acontecem quando você não entende o que seus cálculos (software) estão realmente fazendo. Se eles entendessem seu sistema de previsão, eles saberiam que precisavam entrar e mudar algo quando houve mudanças súbitas e dramáticas em seus negócios. Então, você tem os conceitos básicos de suavização exponencial explicados. Quer saber mais sobre o uso de suavização exponencial em uma previsão real, verifique meu livro Gerenciamento de inventário explicado. Copie os direitos autorais. O conteúdo no InventoryOps é protegido por direitos autorais e não está disponível para republicação. Dave Piasecki. É um operador próprio da Inventory Operations Consulting LLC. Uma empresa de consultoria que presta serviços relacionados à gestão de estoque, manuseio de materiais e operações de armazém. Possui mais de 25 anos de experiência no gerenciamento de operações e pode ser alcançado através do seu site (inventário), onde ele mantém informações relevantes adicionais. Análise da Tendência da Análise BusinessTrend Como observado na introdução deste tópico geral, onde séries temporais incluem tendência e comportamento periódico, é usual que esses componentes sejam identificados e removidos antes de uma análise mais aprofundada. Nesta seção, analisamos diferentes formas de identificar e remover tendências e efeitos sazonais (periódicos) e ferramentas para separar uma série de tempo em tendência. Componentes sazonais e residuais (conhecidos como decomposição). Isso leva à consideração de modelos mais avançados, que desenvolvem esses elementos para produzir modelos mais sofisticados e de vários componentes, que fornecem a base para a previsão estatística. Muitas séries temporais contêm tendências, ou seja, não são estacionárias. As tendências podem ser lineares ou ter uma forma mais complexa, como polinômio ou logística. Seja qual for a forma da tendência, geralmente é preferível remover e especificar a tendência explicitamente antes de novas análises e modelagem. Existem várias maneiras pelas quais isso pode ser realizado. O primeiro passo geralmente é examinar o gráfico da série temporal visualmente, para ver se qualquer comportamento de linha de tendência pode ser observado. Pode ser que uma série não tenha uma tendência observável, tenha uma tendência em toda a sua gama, ou exiba uma tendência em parte de sua gama. No último caso, seria sensível separar as séries temporais em vários subconjuntos, cada um dos quais poderia ser modelado separadamente. A análise de autocorrelação é uma técnica muito útil para identificar tendências e periodicidades nos dados, de uma maneira que é muitas vezes mais precisa do que pode ser obtida com inspeção visual simples. Tendo identificado que existe uma tendência, pode-se considerar procedimentos para identificar e gerenciar tendências. Estes incluem: ajuste de curva - por exemplo, aplicando uma curva de crescimento ou regressão linear de mínimos quadrados (por exemplo, função Logística ou Gompertz) para o filtro de dados - alisamento único ou múltiplo usando filtros lineares de movimentação diferencial de médias - um operador de diferença simples nabla txt - x t -1 produzirá uma nova série de uma série existente, em que qualquer tendência linear foi removida Em cada um desses procedimentos, o objetivo é remover a tendência e produzir uma série de tempo estacionária composta pelos resultados da operação ou os resíduos restantes após Remoção da tendência. Este novo conjunto de dados é então analisado, por exemplo, para modelar o comportamento dos resíduos e, em seguida, pode ser recombinado com o elemento de tendência para produzir um modelo que descreva as séries temporais e oferece a possibilidade de prever o seu comportamento futuro. Na subseção anterior, em médias móveis ponderadas exponencialmente (EWMA), mostramos que a média móvel no tempo t poderia ser obtida como a soma ponderada do último valor observado xt e do EWMA anterior: onde 01. Este modelo não permite tendências Nos dados. Se uma série de tempo inclui uma tendência linear simples e deixamos representar Bt a taxa de mudança dos dados por unidade de tempo, podemos aumentar a expressão anterior pela inclusão do componente de taxa: a partir do qual se obtém a relação de recorrência revisada: Ou usando a notação de suavização: isso deixa a questão de como determinar a taxa de mudança, b t. E se isso deve ser tomado como uma constante ou também pode variar com o tempo, t. É usual assumir que a taxa varia com o tempo e é estimada iterativamente da seguinte maneira: Isso fornece o modelo conhecido como suavização exponencial dupla. Este processo introduz um novo parâmetro, gama. E requer valores iniciais para S t e b t. Os valores de inicialização mais simples são S 1 x 1 e b 1 x 2 - x 1. Os parâmetros geralmente são estimados por algum tipo de procedimento iterativo de otimização de mínimos quadrados. Análise sazonal (periódica) Os dados das séries temporais freqüentemente exibem periodicidade, o que, em alguns casos, reflete a sazonalidade, como por exemplo no crescimento da planta ou nos padrões de compras. Tais padrões podem ser identificados pela inspeção visual do gráfico da série temporal e pela análise de autocorrelação (veja a seção Análise Espectral para discussão de análise no domínio da frequência). Tendo identificado esses padrões, eles podem ser removidos e incorporados explicitamente em modelos, que podem ser usados ​​para fins descritivos ou de previsão. Uma média móvel simples, por exemplo, uma média móvel centrada. Que abrange a hora atual, t. - p 2, onde p é o período em questão, eliminará um efeito sazonal do período p. A média móvel neste caso consiste em p 1 termos, então o primeiro e o último recebem um peso de 0,5 e o divisor é p. Por exemplo, com os efeitos sazonais dos dados mensais, muitas vezes podem ser removidos (suavizados ou filtrados) por uma média móvel do formulário: a diferenciação simples também pode remover efeitos sazonais, ou seja, usando um operador da forma: nabla txt - x t-12 Se, Como é frequentemente o caso, as séries temporais incluem efeitos de tendência e sazonal, e são relativamente bem definidas, é possível ampliar as idéias de suavização exponencial descrita acima para o alisamento exponencial triplo. Requer três equações, a equação de suavização exponencial inicial, a equação de tendência e uma equação adicional de suavização sazonal. Como antes, essas equações possuem parâmetros cujos valores ótimos são encontrados por iteração. O procedimento, conhecido como procedimento de previsão de Holt-Winters, é descrito em mais detalhes em Chatfield (1975, pp87-89 CHA1) e no site do NIST (com exemplos trabalhados - veja mais adiante, abaixo). Como observa Chatfield, quando os componentes sazonais estão incluídos em modelos deste tipo, os efeitos podem ser incluídos de forma simples (o efeito sazonal é um fator que é adicionado ao efeito médio) ou multiplicativo, no qual o efeito da temporada aumenta ou Diminui o nível médio por uma quantidade múltipla em vez de fixa. Se um forte efeito multiplicativo é suspeitado, uma transformação de log pode ser útil, pois isso o converterá em um efeito aditivo. Os pacotes de software que fornecem suporte à análise de séries temporais geralmente oferecem uma variedade de opções para a construção de modelos desse tipo. Por exemplo, como é ilustrado no formulário de diálogo de seleção abaixo, o SPSS suporta modelos de suavização exponencial de tipos sazonais e não sazonais, com e sem transformação de dados, mas com definição prévia da periodicidade nos dados. Neste caso particular, o conjunto de dados de poluição PM10 Kerbside descrito nas subseções anteriores deste tópico foi analisado usando o modelo de suavização exponencial do SPSS com uma periodicidade pré-definida de 7 dias (para explicar as flutuações semanais no tráfego). As ferramentas desse tipo permitem a experimentação de modelos e transformações alternativos, com saídas comparadas por qualidade de ajuste aos dados. Uma ampla gama de medidas de ajuste pode ser selecionada, incluindo correlação e erro absoluto absoluto (MAE). Conforme observado anteriormente, a análise deste conjunto de dados específico sugere um alto nível de aleatoriedade, com alguma periodicidade, e isso nasceu pelo processo de montagem exponencial, com o melhor ajuste para dados transformados em log com um modelo aditivo, embora isso explique apenas sobre 30 da variância nos dados observados utilizando a estatística de correlação r 2 padrão, mas é melhor do que um modelo simples que representa a média da série diferenciada - isto é medido pela chamada estatística estacionária r 2. Isso é definido como: O numerador na soma é a diferença quadrática entre os valores de dados observados e modelados, enquanto o denominador é calculado a partir da série diferenciada para a periodicidade especificada (7 dias no exemplo acima). Se aplicarmos uma análise semelhante aos dados de temperatura do Aeroporto de Heathrow discutidos quando analisamos a autocorrelação temporal (mostrada abaixo), que é claramente sazonal, um modelo sazonal simples é suficiente para produzir um ajuste excelente, com um valor de r 2 de 0,925 e um Nível absoluto de erro absoluto de apenas 1 grau. Temperatura máxima mensal, Aeroporto de Heathrow, 1948-2009 O exemplo de dados do NIST acima referido consiste em dados para 24 períodos de vendas trimestrais a partir de 1990. Os itens de dados são: podemos modelar este conjunto de dados usando a facilidade de previsão SPSS, opção automatizada e estender o modelo para fornecer uma previsão para 1996 e 1997. Neste exemplo, o software selecionou alisamento exponencial com um fator multiplicativo como o melhor modelo e Calculou o ajuste, limites de confiança e previsões com base neste modelo (veja o quadro abaixo). Como pode ser visto, o ajuste é excelente (r 2 0.973) e a previsão desenvolve claramente esse padrão em trimestres futuros - o que, é claro, pode ou não ser um modelo realista na prática Dados de vendas do modelo NIST Dada uma série de tempo, que é Suspeita que exibem uma mistura de componentes (atuais), sazonais e residuais (locais), existem ferramentas que tornam a separação desses componentes um processo rápido e simples. O procedimento é conhecido como a decomposição da série de tempo, e está disponível em muitos pacotes de software. O procedimento em R tem a vantagem de que ele se decompõe simultaneamente e traça os resultados, então devemos usar isso para ilustrar o processo. Devemos aplicá-lo ao conjunto de dados de temperatura de Heathrow, com periodicidade especificada como 12 meses. As etapas envolvidas são: (i) ler no conjunto de dados de temperatura (ii) criar um objeto de série temporal do conjunto de dados usando a função ts () e uma freqüência definida como 12 (meses) (iii) usar a função de decomposição, stl (s) Easonal t ime l oess), com o parâmetro quotperiodicquot para quebrar os dados em seus componentes e, finalmente (iv) traçar os resultados (como ilustrado abaixo). O procedimento loess é um utilitário de montagem polinomial local simples que é chamado a partir da função stl () (veja o site NIST, seção loess, para uma descrição mais completa). A seção de detalhes do procedimento stl () descreve sua operação da seguinte maneira: O componente sazonal é encontrado por Loess, suavizando as sub-séries sazonais (a série de todos os valores de janeiro). Se o retardo da velocidade do tempo for efetivamente substituído tomando a média . Os valores sazonais são removidos e o restante alisado para encontrar a tendência. O nível geral é removido do componente sazonal e adicionado ao componente de tendência. Esse processo é iterado algumas vezes. O componente restante é o residual do ajuste de tendência sazonal. Decomposição do conjunto de dados de temperatura de Heathrow CHA1 Chatfield C (1975) The Analysis of Times Series: Theory and Practice. Chapman and Hall, Londres

No comments:

Post a Comment