Posts

Um data lake simples com Amazon Web Services

18 August 2020

Este post descreve uma solução de data lake de pequeno porte, resultado das minhas experiências iniciais com a Amazon Web Services.

Uma formulação matemática para otimização de estoques

11 June 2020

Motivado por um desafio interno na SLC Agrícola, resolvi pesquisar mais a fundo sobre otimização de estoques, especificamente em estratégias que diminuem desequilíbrios de oferta e demanda de um determinado item em várias localidades/armazéns. Acontece que este é um dos objetos de estudo da pesquisa operacional, que é uma área do conhecimento que busca aplicar soluções matemáticas e estatísticas à tomada de decisão em geral.

Automação robótica de processos: do zero à implantação

31 January 2020

Neste post, vou comentar desafios e experiências pessoais que tive na implantação de uma solução de automação robótica de processos (conhecida também pelo seu acrônimo em inglês, RPA) em uma empresa de grande porte.

Slides interativos com reveal-js

11 January 2020

Há alguns dias descobri uma ferramenta bem legal para criar apresentações interativas: o reveal.js. Ele é ideal para quem faz apresentações com várias mídias ou código (ele tem suporte a highlight de sintaxe). As apresentações são montadas a partir de código HTML ou Markdown, mas também existe um editor online.

Visualizando fluxos de turistas ao Brasil com o Tableau

20 February 2019

Este é um infográfico que mostra os influxos de turistas para o Brasil, de janeiro de 1989 à dezembro de 2017. Os dados são do Ministério do Turismo.

Predicting car prices with scikit-learn

29 January 2019

In this notebook I will attempt to predict automobile prices using Python and its data analysis and machine learning packages such as pandas and scikit-learn. Forecasting car prices can be useful for businesses in general: insurance companies can use this information to calculate their premia; websites and enterprises can provide estimates even when asking prices are not available in a specific application; enterprises can set contracts where a car’s resale value must be defined a priori with greater information, or determine if a car is overvalued or undervalued with respect to the market.

Análise de dados financeiros com pandas e matplotlib

22 January 2019

Aqui veremos uma análise de dados financeiros e de performance de uma empresa fictícia, para mostrar as capacidades de análise e visualização de dados no Python, através dos pacotes pandas e matplotlib. A empresa possui os seguintes dados:

Análise de dados no Python: Diárias e passagens gaúchas

28 July 2018

Olá! Este é um exercício em análise e exploração de dados em Python. Aqui, vamos aplicar as funcionalidades do pacote pandas em um arquivo que contém o histório de concessões de diárias e passagens a pessoas físicas no estado do Rio Grande do Sul, em 2017. Os dados contém informações sobre órgãos responsáveis, origens e destinos de viagens, pessoas beneficiadas e valores pagos em R$ correntes de 2017.

Acessando os dados do Sistema Expectativas do Bacen no R

01 March 2018

Recentemente o Banco Central do Brasil divulgou a disponibilização dos dados do Sistema de Expectativas de Mercado no seu Portal de Dados Abertos através de uma API, facilitando consultas mais complexas de dados. O Sistema compreende todas as informações sobre projeções de mercado dos principais agregados macroeconômicos (PIB, meta de juros, inflação, balança comercial), coletados em uma série de instituições financeiras, sendo assim um importante termômetro da economia brasileira.

Explorando a Penn World Table com R e shiny

13 April 2017

A Penn World Table é uma base de dados que contém variáveis relevantes de desenvolvimento econômico para países ao redor do mundo. Esse post apresenta uma construção em shiny, um pacote que possibilita desenvolver aplicações web a partir do R. O objetivo foi montar uma ferramenta para comparar países visualmente, com dados anuais de 1980 a 2014.

Alterar variáveis de acordo com condições no R

12 October 2016

Para gerar ou alterar condicionalmente valores de variáveis no R, comumente usamos a notação de linhas e colunas de um data.frame: