Acabei de desenvolver e testar o meu modelo de machine learning! Agora é só colocar em produção e comemorar. […] Ops, como é que coloca em produção mesmo?

Aparentemente esta é uma pergunta simples, mas deve ser bem respondida para que você conclua seu projeto com sucesso. Modelos estatísticos ou de aprendizagem de máquina geralmente são compostos por representações matemáticas ou lógicas, que geralmente são formados por coeficientes, condições, chaves internas, etc.

Falando assim até parece ser algo de outro mundo, mas veja como é fácil de entender: um modelo de regressão linear simples é dado pela equação y = ax + b, já falamos sobre isso no post https://hackinganalytics.com/2016/08/23/simple-linear-regression-from-scratch. Sendo X o valor de entrada (dado pelo usuário) e Y o valor que você quer encontrar (resposta da equação), o seu modelo terá que calcular os valores de a e b. É isso que eu chamei de representação matemática no parágrafo anterior.

Imagine que o resultado deste seu modelo seja Y = 1021.X + 53 (não se esforce para entender como chegamos nestes coeficientes, não é este o ponto aqui). Pois bem, operacionalizar um modelo de regressão linear simples é basicamente transcrever esta equação em seu ambiente produtivo (seja ele um software ou qualquer outro tipo de aplicativo, incluindo um arquivo Excel).

E se você estiver construindo um modelo de classificação binária baseado em árvore de decisão? Bom, neste caso, seu modelo treinado será representado por diversas condições (se o valor da variável A for maior do que X então processe este ramo da árvore, caso contrário processo este outro). Operacionalizar um modelo deste tipo significa extrair estas condições e aplicá-las em seus dados novos.

Esta é basicamente a lógica empregada quando se pretende operacionalizar um modelo estatístico ou de aprendizagem de máquina. Ferramentas como o SAS permitem que o usuário extraia estas representações em forma de código SAS, por exemplo. Outras ferramentas, como o R, permite que você grave o seu modelo como um objeto, sendo que você pode recuperá-lo quando quiser executá-lo contra dados novos.

Cada ferramenta deve te auxiliar de uma forma, mas todas elas devem trabalhar ao redor desta lógica principal: como extrair ou armazenar a representação do modelo.

Legal, não? Só para não dizer que este será meu primeiro post sem código, guarde ai um exemplo de como armazenar e recuperar seu modelo em R.

Faça aqui o download do exemplo em R

Abraços!
Weslley Moura

Sobre o Autor: Weslley Moura

Mestre em engenharia da computação, professor de cursos relacionados a análise de dados e co-fundador da empresa Pepsoft Sistemas. Profissional apaixonado pela ciência existente nos dados e suas aplicações práticas. Nos últimos anos vem dedicando seu tempo a projetos de aprendizagem de máquina e mantém seu site pessoal com dicas e aulas relacionadas ao tema em Hacking Analytics.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

w

Conectando a %s