понедельник, 14 мая 2018 г.

Stata 12 moving average


Ao computar uma média móvel, colocar a média no meio período faz sentido. No exemplo anterior calculamos a média dos três primeiros períodos de tempo e a colocamos ao lado do período 3. Poderíamos ter colocado a média no meio do período. intervalo de tempo de três períodos, isto é, próximo ao período 2. Isso funciona bem com períodos de tempo ímpares, mas não tão bons para períodos de tempo pares. Então onde colocaríamos a primeira média móvel quando M 4 Tecnicamente, a Média Móvel cairia em t 2,5, 3,5. Para evitar esse problema, suavizamos os MAs usando M 2. Assim, suavizamos os valores suavizados Se calcularmos um número par de termos, precisamos suavizar os valores suavizados A tabela a seguir mostra os resultados usando M 4.Essa estrutura de dados é bastante inadequada para fins. Assumindo um ID de identificador, você precisa reformular. por exemplo. Então, uma média móvel é fácil. Use tssmooth ou apenas gerar. por exemplo. Mais sobre por que sua estrutura de dados é bastante imprópria: não apenas o cálculo de uma média móvel precisa de um loop (não necessariamente envolvendo egen), mas você estaria criando várias novas variáveis ​​extras. Usando aqueles em qualquer análise subseqüente seria em algum lugar entre estranho e impossível. EDIT Ill dar um loop de amostra, enquanto não se move da minha postura que é técnica pobre. Eu não vejo uma razão por trás de sua convenção de nomenclatura em que P1947 é uma média para 1943-1945 eu suponho que é apenas um erro de digitação. Vamos supor que temos dados para 1913-2012. Por um período de 3 anos, perdemos um ano em cada final. Isso poderia ser escrito de forma mais concisa, à custa de uma enxurrada de macros dentro de macros. Usar pesos desiguais é fácil, como acima. A única razão para usar egen é que ele não desista se houver falhas, o que o acima fará. Por uma questão de completude, note que é fácil lidar com as falhas sem recorrer ao egen. e o denominador Se todos os valores estiverem faltando, isso reduz para 0/0 ou está faltando. Caso contrário, se algum valor estiver faltando, adicionamos 0 ao numerador e 0 ao denominador, que é o mesmo que ignorá-lo. Naturalmente o código é tolerável como acima para médias de 3 anos, mas para esse caso ou para a média ao longo de mais anos, substituiríamos as linhas acima por um loop, que é o que egen faz. Stata: Análise de Dados e Software Estatístico Nicholas J Cox, Universidade de Durham, Reino Unido Christopher Baum, Boston College egen, ma () e suas limitações O mais óbvio comando para calcular médias móveis é a função ma () de egen. Dada uma expressão, ela cria uma média móvel de - período dessa expressão. Por padrão, é considerado como 3. deve ser ímpar. No entanto, como indica a entrada manual, egen, ma () pode não ser combinado com varlist:. e, por essa razão, não é aplicável aos dados do painel. Em qualquer caso, está fora do conjunto de comandos escritos especificamente para séries temporais, veja séries temporais para detalhes. Abordagens alternativas Para calcular as médias móveis dos dados do painel, existem pelo menos duas opções. Ambos dependem do conjunto de dados que foi previamente definido. Isso vale muito a pena: não só você pode salvar a si mesmo repetidamente, especificando a variável do painel e a variável de tempo, mas o Stata se comporta de maneira inteligente, considerando quaisquer lacunas nos dados. 1. Escreva sua própria definição usando gerar Usando operadores de séries temporais, como L. e F.. dê a definição da média móvel como o argumento para gerar uma declaração. Se você fizer isso, você está, naturalmente, não limitado às médias móveis centradas igualmente ponderadas (não ponderadas) calculadas por egen, ma (). Por exemplo, médias móveis de três períodos igualmente ponderadas seriam dadas por e alguns pesos podem ser facilmente especificados: Você pode, obviamente, especificar uma expressão como log (myvar) em vez de um nome de variável como myvar. Uma grande vantagem dessa abordagem é que o Stata automaticamente faz a coisa certa para os dados do painel: os valores iniciais e finais são trabalhados dentro dos painéis, assim como a lógica determina que eles devem ser. A desvantagem mais notável é que a linha de comando pode ficar bastante longa se a média móvel envolver vários termos. Outro exemplo é uma média móvel unilateral baseada apenas em valores anteriores. Isso pode ser útil para gerar uma expectativa adaptativa do que uma variável será baseada puramente na informação até o momento: o que alguém poderia prever para o período atual baseado nos últimos quatro valores, usando um esquema de ponderação fixo? especialmente usado com timeseries trimestrais.) 2. Use egen, filter () do SSC Use o filtro de função egen gravado pelo usuário () do pacote egenmore no SSC. No Stata 7 (atualizado após 14 de novembro de 2001), você pode instalar este pacote depois de qual ajuda egenmore aponta para detalhes no filter (). Os dois exemplos acima seriam renderizados (nessa comparação, a abordagem de geração é talvez mais transparente, mas veremos um exemplo do oposto em um momento). Os atrasos são um numlist. leads são lags negativos: nesse caso, -1/1 se expande para -1 0 1 ou lead 1, lag 0, lag 1. Os coeficientes, outro numlist, multiplicam os itens atrasados ​​ou principais correspondentes: nesse caso, esses itens são F1.myvar. myvar e L1.myvar. O efeito da opção normalizar é escalar cada coeficiente pela soma dos coeficientes de modo que coef (1 1 1) normalize é equivalente a coeficientes de 1/3 1/3 1/3 e coef (1 2 1) normalizar é equivalente para coeficientes de 1/4 1/2 1/4. Você deve especificar não apenas os atrasos, mas também os coeficientes. Como egen, ma () fornece o caso igualmente ponderado, a principal justificativa para egen, filter () é suportar o caso com ponderação desigual, para o qual você deve especificar coeficientes. Pode-se dizer também que obrigar os usuários a especificar coeficientes é um pouco mais de pressão para pensar sobre quais coeficientes eles querem. A principal justificativa para pesos iguais é, nós achamos, simplicidade, mas pesos iguais têm péssimas propriedades no domínio da frequência, para mencionar apenas uma consideração. O terceiro exemplo acima pode ser qualquer um dos dois, tão complicado quanto a abordagem de geração. Há casos em que egen, filter () fornece uma formulação mais simples do que gerar. Se você quer um filtro binomial de nove termos, que os climatologistas acham útil, então parece talvez menos horrível do que, e mais fácil de acertar do que, assim como na abordagem gerar, egen, filter () funciona corretamente com dados em painel. De fato, como dito acima, depende do conjunto de dados ter sido previamente definido. Uma dica gráfica Depois de calcular suas médias móveis, você provavelmente vai querer olhar para um gráfico. O comando tsgraph escrito pelo usuário é inteligente sobre conjuntos de dados tsset. Instale-o em um Stata 7 atualizado por ssc inst tsgraph. E sobre o subconjunto com Se nenhum dos exemplos acima fizer uso de restrições. Na verdade egen, ma () não permitirá se ser especificado. Ocasionalmente, as pessoas querem usar quando calculam as médias móveis, mas seu uso é um pouco mais complicado do que costuma ser. O que você esperaria de uma média móvel calculada com if? Vamos identificar duas possibilidades: Interpretação fraca: Eu não quero ver nenhum resultado para as observações excluídas. Interpretação forte: eu nem quero que você use os valores para as observações excluídas. Aqui está um exemplo concreto. Suponha, como consequência de alguma condição if, que as observações 1-42 sejam incluídas, mas não as observações 43 em diante. Mas a média móvel para 42 dependerá, entre outras coisas, do valor da observação 43 se a média se estender para trás e para frente e tiver pelo menos 3 de comprimento, e dependerá de forma semelhante de algumas das observações 44 em algumas circunstâncias. Nosso palpite é que a maioria das pessoas iria para a interpretação fraca, mas se isso é correto, egen, filter () não suporta se qualquer um deles. Você sempre pode ignorar o que você não quer ou até mesmo definir valores indesejados para perder depois usando substituir. Uma nota sobre resultados perdidos nos finais das séries Como as médias móveis são funções de atrasos e leads, egen, ma () produz falta onde as defasagens e os leads não existem, no início e no fim da série. Uma opção de opção força o cálculo de médias móveis mais curtas e não centradas para as caudas. Em contraste, nem gerar nem egen, filter () faz, ou permite, qualquer coisa especial para evitar a perda de resultados. Se algum dos valores necessários para o cálculo estiver faltando, esse resultado estará ausente. Cabe aos usuários decidir se e qual cirurgia corretiva é necessária para tais observações, presumivelmente depois de olhar para o conjunto de dados e considerar qualquer ciência subjacente que possa ser usada.

Комментариев нет:

Отправить комментарий