Conheça meu novo curso sobre Apache Spark

Manipulação de dados em Dataframes

Prepare-se para aprender a usar o framework de processamento de dados distribuído mais utilizado por profissionais de data science, Apache Spark!
Entenda como Spark processa dados de forma distribuída, como é feito o gerenciamento de memória e como Spark se integra do Hadoop. Aprenda tudo sobre planos de execução lógico, físico, tasks e stages.

Sabe aquelas consultas SQL que você costuma fazer? Neste curso você vai aprender a implementá-las no Apache Spark.

SAIBA MAIS

ACOMPANHA MEU BLOG?
PAGUE APENAS R$199 R$29 NESTE CURSO

Últimos Artigos

AWS CloudTrail

AWS CloudTrail é um serviço da Amazon AWS que permite monitorar todas as requisições API feitas em uma conta AWS. Estas requisições são representadas eventos, que por sua vez são gravados em arquivos de log dentro do S3 a cada…

AWS Database Foundation

Os serviços de database da Amazon AWS estão divididos entre bancos de dados relacionais (relational databses), bancos de dados não relacional (non-relational databases) e serviços de migração de dados (database migration services). Neste artigo iremos descrever cada um destes serviços.

AWS Storage e Data Services

Amazon AWS oferece uma série de serviços relacionados ao armazenamento e acesso aos dados. Podemos categorizar estes serviços entre Amazon Storage (S3, Glacier, EC2 Instance Storage, EBS, EFS e Cloudfront) e Amazon Data Services (AWS Storage Gateway e AWS Snowball).…