[Up|Down]sampling em séries temporais

Nem sempre temos os dados na granularidade em que precisamos. Neste artigo vamos ver como transformar nossas séries temporais mensais em séries temporais diárias ou anuais com o uso das técnicas de Resampling  e Interpolation!

As duas técnicas de resampling para séries temporais são:

  • Upsampling: quando queremos aumentar a frequência da amostra, por exemplo, de meses para dias. Neste cenário precisamos criar novos dados por meio de interpolation.
  • Downsampling: quando queremos diminuir a frequência da amostra, por exemplo, de meses para anos. Neste cenário, precisamos criar novos dados por meio de funções de agrupamento.

Geralmente recorremos à estas técnicas porque nossos dados de treino não estão na mesma granularidade dos resultados que queremos prever, ou simplesmente porque desejamos criar novas informações para tentar entender melhor o problema.

Esquematizando Upsampling

 upsampling

Esquematizando Downsampling

downsampling

Acesse os exemplos em Python aqui. Baixe o dataset de exemplo neste link: shampoo-sales (salve-o como .csv).

Como sempre, minha referência foi Mastery Machine Learning.

Grande abraço!

1 comentário

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: