Testando o pacote CoronaBr [R]
O pacote coronabr [R]
Diversas iniciativas têm facilitado o acesso a dados relativos aos casos de COVID-19 ao redor do mundo. Eu mesmo fiz um post aqui no blog ensinando a usar a API covid19api (você pode acessar clicando aqui), que permite acessar dados relativos aos casos, mortes e recuperados por país. Outras iniciativas interessantes têm organizado os dados em maior granularidade, permitindo visualizar a situação por estados com foco no Brasil, como é o caso da iniciativa do Brasil.io.
Recentemente um grupo de pesquisadores desenvolveu o pacote coronabr
que simplesmente centraliza diversos dos recursos que comentei. O pacote permite de forma simples e prática buscar dados de diversas fontes, baixar esses dados atualizados diretamente para sua seção do R
já formatados como data.frame
e prontos para sua análise. Além disso, essa ferramenta fornece visualizações gráficas com mapas e tendências, e já se encontra disponível para download e utilização no GitHub =)
Os pesquisadores responsáveis pelo pacote são: Sara Mortara, Andrea Sánchez-Tapia e Karlo Guidoni Martins, clicando aqui você pode saber um pouco mais sobre eles.
Nas próximas seções vamos instalar o pacote coronabr
, testar as principais funções e gerar algumas visualizações.
Instalando coronabr e baixando dados
O pacote está disponível no GitHub, isso significa que precisamos instalar via o pacote remotes
. Caso você já tenha o pacote remotes
pode pular essa etapa. No código abaixo instalamos o remotes
e na sequência o coronabr
:
install.packages('remotes') # remotes
remotes::install_github("liibre/coronabr") # coronabr
No momento da instalação talvez seja requerido a atualização dos pacotes que são dependências para o coronabr
, sugiro selecionar a opção CRAN packages only
.
Após a instalação vamos carregar o pacote e baixar os dados do Brasil por estado.
library(coronabr) # carregando pacote
dados <- get_corona_br(by_uf = TRUE) # baixando dados
View(dados) # vizualizando dados
Usando a função View()
podemos ver que os dados já estão organizados em data.frame
contendo diversas informações interessantes, como por exemplo a taxa de mortalidade por região.
Temos outras funções que baixam dados de diferentes fontes, segundo o site do projeto essas são as possibilidades:
get_corona_minsaude()
: Extrai dados de COVID-19 para o Brasil da página do Ministério da Saúde
get_corona_br()
: Extrai dados de coronavírus para o Brasil de Brasil.io
format_corona_br()
: Preenche as datas vazias nos dados de COVID-19 do Brasil.io
get_corona_jhu()
: Extrai dados mundiais de coronavírus
Clicando nas funções acima você será direcionado para o site oficial com o help completo da função, contendo a descrição dos argumentos.
Gráficos e mapas com o pacote coronabr
Agora com nossos dados já baixados vamos gerar alguns gráficos de forma bem simples. O primeiro é o histórico de todos os estados, para isso usamos as funções:
dados <- format_corona_br(dados)
plot_uf(dados)
Você pode customizar bastante o gráfico, selecionando o tipo de dado por casos confirmados ou mortes, mostrar dados proporcionais a população, entre outras possibilidades.
Outro gráfico interessante é um mapa mostrando a dispersão dos casos pelo Brasil, com a possibilidade de gerar esse gráfico como uma animação:
map_corona_br(dados, anim = TRUE)
Também é possível gerar animações dos gráficos de tendências:
plot_uf(dados, anim = TRUE)
Infelizmente para esse último caso eu não consegui alterar a proporção do gráfico, prejudicando um pouco a visualização das datas. Vale ressaltar que o pacote está em constante desenvolvimento, provavelmente logo eles permitirão de forma simples alterar essa opção.
Lembrando que existem outras possibilidades de gráficos derivados das outras fontes de dados =)
Chegamos ao fim
O pacote coronabr
é bem direto ao ponto e eficiente, facilitando o fluxo de buscar dados atualizados de diferentes fontes e permitir a geração de gráficos, mapas e animações. Vale lembrar que você pode usar o pacote para baixar os dados já em data.frame
e criar modelos preditivos.
Parabéns aos criadores do coronabr
, acredito que essa ferramenta será muito útil para pesquisadores brasileiros na busca de entender como combater esse problema =)
Não deixe de visitar o site oficial do pacote, lá você terá todas as informações: https://liibre.github.io/coronabr/index.html
Se esse post foi útil para você me marque em um tweet, meu user é @icaroagostino
. Você pode me seguir nas minhas redes (nos botões a seguir). Se quiser interagir comigo o twitter é a plataforma que mais uso para se comunicar com a comunidade de R
.
R
é uma linguagem de programação open source. Todos os recursos, bibliotecas, dados e implementações são gratuitos e desenvolvidos pela comunidade.Se você tem interesse de aprender a instalar o R e os passos básicos para iniciar nesse mundo, sugiro o tutorial básico desenvolvido pelo pessoal do curso-r: http://material.curso-r.com/instalacao/
Até o próximo post, bons estudos em R
:D
Você pode compartilhar esse post nas redes sociais utilizando os botões no fim dessa página.