Metodologia: Cálculo da distância entre os centroides

The Earth was small, light blue, and so touchingly alone, our home that must be defended like a holy relic. The Earth was absolutely round. I believe I never knew what the word round meant until I saw Earth from space.

Alexey Leonov

O objetivo dessa passagem é pré calcular as distâncias entre os centroides dos setores censitários do IBGE. Para fazer esse cálculo devemos primeiro lembrar que a terra é redonda (na verdade não, mas também não é plana). Dessa forma, para calcular a distância entre os pontos temos que “caminhar” na curvatura da terra (Fig. 1).

Disposição de um triângulo sobre uma esfera. É possível verificar que as linhas que unem os pontos não ficam exatamente “retas”. (Wikipedia)

Para para fazer essa caminhada matemática temos que utilizar a fórmula de Haversine, na qual é calculada a distância em graus entre dois pontos em uma esfera. Depois disso podemos converter em km utilizando como base o diâmetro da terra (12,742 km).

Para a conversão de graus em Km, o que facilita muito a análise, visto que é difícil pensar distância em graus, vamos utilizar fórmulas básicas do raio do círculo. Considerando que a terra no equador é um círculo (aproximadamente) e lembrando um pouco do 2º colegial, temos:

Substituindo com o diâmetro da terra:

Considerando que são 360 graus para uma volta completa, podemos calcular quantos km temos que andar para corresponder à um grau na superfície da terra.

Dessa forma temos todos os elementos para calcular as distâncias entre os centroides dos setores censitários. Para o cálculo devemos considerar a quantidade de dados que serão gerados se cruzarmos todos os centroides disponíveis na base do IBGE. No total, temos 316.575 setores censitários, assim se fizermos o cruzamento de todos contra todos teremos um total de 100.219.730.625 linhas na nossa base de dados de distâncias.

Considerando que vamos demorar cerca de 0.01 segundos para fazer cada um dos cálculos e salvar, então demoraremos 100.219.730.6,25 segundos, que são 16.703.288 minutos, que são 278.388,1 horas, que são 11.599,5 dias, que são 32.22 anos… É, acho que não vamos esperar 32 anos só para ter uma base de distâncias de centroides para então fazermos a análise sobre qual foi o efeito da quarenta sobre o deslocamento de pessoas.

Esperar por 32.22 anos para ter uma análise sobre a pandemia. Acho que até lá não deve ter mais a covid-19…

Uma solução para o problema acima é reduzir a amostra. Vamos calcular as distâncias para os centroides que sejam distantes menos de 25km. Essa distância abarca por exemplo o raio do centro de São Paulo e a maior parte da região metropolitana.

Outra estratégia é paralelizar o processo, isso significa que são feitos diversos cálculos ao mesmo tempo. Essa metodologia é amplamente utilizada nas placas de vídeo utilizadas tanto nos jogos de videogame de última geração como em modelo de inteligência artificial. O código utilizado para gerar a combinação de distâncias, utilizando como base os centroides calculados no passo anterior está disponível aqui.

Com o código foi possível obter as distâncias para os centroides de distância inferior a 25km em um dia de cálculo. A base foi posteriormente agregada e utilizada para a criação de uma base de dados à ser utilizada no estudo de distância.

Compartilhe:

Compartilhar no facebook
Facebook
Compartilhar no twitter
Twitter
Compartilhar no pinterest
Pinterest
Compartilhar no linkedin
LinkedIn
Leia também

Relacionados

Iniciativas

Conheça nossas frentes

Conectando quem precisa de ajuda com os que podem ajudar. De um lado estão cadastradas as necessidades do sistema de saúde e apoio aos vulneráveis. Do outro, as empresas que podem ajudar com os seus recursos.

Informações da pandemia em tempo real, que permitem acompanhar e simular o avanço da Covid-19 por regiões, cidades e até bairros. Utiliza dados de mobilidade e propagação fornecidos por fontes oficiais.

Um espaço onde você também pode compartilhar informações para ajudar a mapear e conter o avanço da Covid-19 no país.

O Covid Radar é o resultado da coalizão de diversas organizações que estâo contribuindo para minimizar os impactos da COVID-19 no país. Juntos estamos desenvolvendo soluções para apoiar instituições de saúde, empresas públicas e privadas, mídia e sociedade.