Manipulando dados com Python

Às vezes precisamos de uma ajuda para alavancar nossos estudos em programação. Este curso é para você que já sabe manipular dados usando SQL e agora deseja fazer o mesmo em Python.

Conteúdo programático

  • Conhecendo o pacote Pandas
  • Importando e exportando dados
  • Filtrando linhas e colunas
  • Criando novas colunas
  • Unindo bases (horizontal e vertical)
  • Utilizando funções de agrupamento

Duração
3h

Número máximo de alunos na transmissão
5

Transmissão
Ao vivo na data selecionada durante a inscrição

Instrutor
Weslley Moura

Mestre em engenharia da computação, professor de cursos relacionados a análise de dados e co-fundador da empresa Pepsoft Sistemas. Profissional apaixonado pela ciência existente nos dados e suas aplicações práticas. Nos últimos anos vem dedicando seu tempo a projetos de aprendizagem de máquina e mantém seu site pessoal com dicas e aulas relacionadas ao tema em Hacking Analytics.

INSCREVA-SE

Últimos Artigos

Time series forecasting com Python

Neste artigo vou passar pelas principais etapas de modelagem para criação de um modelo de forecasting. O notebook foi escrito em Python e possui conceitos importantes sobre decomposição de série temporal, diferenciação, estacionariedade e visualizações. O material está disponível em…

AWS CloudTrail

AWS CloudTrail é um serviço da Amazon AWS que permite monitorar todas as requisições API feitas em uma conta AWS. Estas requisições são representadas eventos, que por sua vez são gravados em arquivos de log dentro do S3 a cada…

AWS Database Foundation

Os serviços de database da Amazon AWS estão divididos entre bancos de dados relacionais (relational databses), bancos de dados não relacional (non-relational databases) e serviços de migração de dados (database migration services). Neste artigo iremos descrever cada um destes serviços.

AWS Storage e Data Services

Amazon AWS oferece uma série de serviços relacionados ao armazenamento e acesso aos dados. Podemos categorizar estes serviços entre Amazon Storage (S3, Glacier, EC2 Instance Storage, EBS, EFS e Cloudfront) e Amazon Data Services (AWS Storage Gateway e AWS Snowball).…

SNA com NetworkX

Python possui um excelente pacote para trabalharmos com Social Network Analysis chamado NetworkX. Este post apresenta um resumão sobre SNA + NetworkX, com base no curso ministrado pela universidade de Michigan e disponibilizado no site da Coursera.

Word Embedding

Word Embedding é uma abordagem de mineração de textos em que as palavras são representadas de forma matemática em um vetor. Diferentemente da abordagem mais simples utilizada no modelo conhecido como bag of words, na qual as palavras costumam ser representadas…

O coeficiente de Gini

Neste artigo vamos explorar o coeficiente de Gini ou Gini index, muito utilizado para avaliação de modelos estatísticos. Faremos uma implementação do zero com Python e depois passaremos em cada ponto para explicar sua construção.

Análise exploratória de dados com R

Antes de começar a usar algoritmos de machine learning é importante entender a estrutura dos dados que temos em mãos. Por exemplo, presença de missing values, distribuição de variáveis, correlação, desvio padrão, etc. Chamamos esta atividade de análise exploratória de dados.