“Nenhum homem é uma ilha, isolado em si mesmo; todos são parte do continente, uma parte de um todo.”
John Donne
Esse é o primeiro post desse estudo, a intenção e ir atualizando as análises e a medida que forem feitas. O intuito de publicações parciais é permitir que outras pessoas possam utilizar os resultados e metodologias para seguir com suas próprias perguntas ou mesmo sugerir melhorias. Caso você utilize algum dos insights gerados por esse estudo ou códigos em seu projeto pessoal, be nice, cite este artigo!
Última atualização: 13/08/2020
1 – Introdução
O intuito desse projeto junto ao Covid-Radar é tentar entender melhor as dinâmicas de quarentena que ocorrem nas cidades brasileiras. Os resultados desse estudo podem ser utilizados na melhor gestão do fechamento de estabelecimentos não essenciais, redução do fluxo e contato social. Além do objetivo acadêmico, gostaríamos de mostrar um pouco como são desenvolvidos os trabalhos científicos introduzindo o público geral no formato, métodos e auxiliar ao melhor entendimento de como os resultados são obtidos.
[Falamos um pouco sobre a motivação do estudo que será conduzido]
Hoje já foram publicados alguns estudo ligados à mobilidade por faixa de renda e etária (Folha, 01/05/2020) e existem índices de adesão a quarentena publicados por Google e Apple. O estudo proposto contribui aumentando a resolução no entendimento adicionando as distâncias percorridas aos resultados anteriores e segmentando as viagens de acordo com os setores censitários.
[Passamos uma pequena revisão do que já temos sobre o tema. Ela está bem pobre na verdade e tem que ser melhorada com mais referências]
Nossa hipótese de trabalho é que as medidas de quarentena não apresentaram resultados homogêneos para todos os setores censitários. Além disso, também temos como hipótese que seja possível que tais medidas tenham afetado de forma mais eficiente trajetos de distâncias mais longas, trabalho e encontro sociais, que de curtas distância, trajetos ligado à reabastecimento de alimentos e produtos essenciais.
[Colocamos aqui a motivação do estudo e as hipóteses que vamos buscar testar com o desenvolvimento do artigo]
Para buscar esclarecer tais perguntas, vamos utilizar bases públicas de caracterização geográfica como o IBGE e OpenStreetMap e cruza-las com a base de mobilidade disponível no Covid-Radar. Dessa forma será possível verificar se tais hipóteses apresentam coerência com os dados levantados.
2 – Materiais e Métodos
2.1 – Software
A maior parte do estudo será desenvolvido através de scripts Python. Será utilizado como banco de dados o Postgres com extensão PostGis para o armazenamento de dados georreferenciados.
2.2 – Base de dados
2.2.1 – Dados de mobilidade disponíveis do Covid-Radar
Essa base de dados será obtida através do Covid-Radar, atualmente trabalham de forma colaborativa sobre estes dados empresas, pesquisadores e veículos de imprensa. Os dados de mobilidade que serão utilizados são anônimos e agregados.
2.2.2 – Dados do censo de 2010
Os dados do censo de 2010 podem ser obtidos gratuitamente através do site do IBGE. Inicialmente vamos trabalhar com a malhas censitárias para poder encontrar os centróides, que são os pontos que correspondem ao centro do setor. Posteriormente será calculada as distâncias entre setores utilizando a fórmula de Fórmula de Haversine.
2.2.3 – Dados disponíveis no Open Street Map
O OpenStreetMap é um repositório open-source de dados geolocalizados. Nesse repositório é possível encontrar informações das vias públicas com informações de velocidade máxima e sentido, também estão disponíveis dados de pontos de interesse como estabelecimentos comerciais, transporte público, caixas eletrônicos, bancos, etc… Esses dados são atualizados voluntariamente, por isso, é possível que não estejam atualizados em muitas localidades. De qualquer forma podemos considerar como uma aproximação do real para as localidades disponíveis.
O objetivo da utilização dessa base de dados é criar métricas que possam caracterizar melhor os setores censitários, como por exemplo, número de caixas eletrônicos, bancos, restaurantes, velocidade média e tipo de vias dos setores.
2.3 – Aquisição e tratamento dos dados
- Tratamento das regiões censitárias para obter os valores centróides
- Cálculo da distância entre os centróides
- Carregamento do OpenStreetMap em uma base de dados Postgresql com extensão PostGis
[Vamos acrescentar mais alguns passos metodológicos durante a construção da análise…]