Comparando textos com TF-IDF e Cosine Similarity no Gensim

Neste artigo vou utilizar gensim para criar uma modelo capaz de identificar a similaridade entre textos. A ideia é que você consiga identificar o(s) texto(s) mais similares(s) a um determinado texto de entrada.

Você pode usar este modelo em inúmeras aplicações, por exemplo, pesquisa de produtos ou serviços por meio de suas descrições ou até mesmo em aplicações mais complexas de análise de sentimentos.

Neste post  resolvi criar um notebook com o passo a passo + explicações, segue o link:

https://anaconda.org/weslleymoura/tf_idf_similarity/notebook

Boa leitura 🙂

Weslley Moura

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: