Chegamos essa semana, mais precisamente no dia 07 de outubro, a 5000 mortes por COVID-19 oficialmente registradas em Goiás, segundo o portal da Secretaria da Saúde do Estado de Goiás, cerca de 5 meses e meio depois da primeira morte. Embora esse número “em si” não tenha obviamente nenhum significado em particular, temos uma certa atenção para número “redondos”. Sem dúvida, é um número excessivo e realmente poucos acreditavam, ainda em março ou abril, no início da pandemia, ou mesmo já no início de julho com a tentativa de prolongar a quarentena (aliás, duramente criticada por alguns empresários e comerciantes em Goiás), que isso fosse realmente acontecer! Mesmo assim, houve pouca ou nenhuma divulgação sobre o número e, talvez, ele tenha mesmo pouca repercussão (na verdade, a única notícia que vi no dia 7 de outubro é justamente que poucos dos candidatos à prefeitura de Goiânia falam algo da COVID-19 nos planos). Como já colocamos antes, a sociedade brasileira aparentemente já “normalizou” e “relativizou” as mortes e o sofrimento das famílias. É sempre difícil escrever sobre mortalidade e letalidade da COVID-19 sem considerar toda a questão do drama humano envolvido, mas é importante estarmos atentos a esses números e seu significado, até para isso não seja tão facilmente racionalizado e justificado...
Muitas das medidas e políticas públicas durante a pandemia dependem de informações o mais atualizadas possível, quase em “tempo real”, já que pequenos atrasos de poucos dias na tomada de decisão podem piorar a situação. Fala-se disso desde o início da pandemia, inclusive com a ideia de que uma diferença de uma semana para implementar uma medida de quarentena ou lockdown poderia custar dezenas ou mesmo centenas de vida em um Estado ou uma grande cidade. Entretanto, como fazer isso considerando a dificuldade de obter rapidamente os dados e todo o problema no fluxo de informações entre hospitais, secretarias municipais, e o Estado ou o próprio Ministério da Saúde? Se olhamos, por exemplo, os dados do Portal da Secretaria de Saúde do Estado de Goiás no dia 7 de outubro e prestarmos atenção à figura com numero de novos óbitos por semana epidemiológica, abaixo, poderíamos concluir que o número de óbitos está diminuindo nas últimas semanas, sem dúvida uma boa notícia!
Uma versão mais detalhada dessa curva pode ser feita com os dados diários, mostrando que, no final de setembro, chegou-se a um pico de algo próximo a 60 óbitos por dia em Goiás, e que a partir dai o número começaria a diminuir (de fato a mesma figura do portal, só que por dia e não por semana). Vemos então um “pico”, um valor máximo, seguido de um declínio, algo de que falamos muito desde o início da pandemia...Já era tempo! De forma complementar, podemos ver também a curva acumulada de óbitos mostrando o crescimento em forma de “S” (logístico), com a aceleração, depois uma fase mais linear seguida de uma desaceleração que levaria finalmente a uma estabilização, ou seja, o número de óbitos começa a chegar ao seu máximo (um valor “final”). É importante entender bem a diferença entre as duas maneiras de expressar a dinâmica do número de eventos (por dia ou acumulados).
Mas será que essa estabilização não seria o que chamamos de “wishfull thinking”? Ou seja, estamos vendo o que queremos ver... Até que ponto podemos confiar nos nossos sentidos e nessas informações “empíricas”? São os dados que temos, certo? Sim, mas realmente precisamos pensar um pouco mais profundamente e entender o que esses dados realmente mostram...Infelizmente, como vou mostrar a seguir, a questão não é tão simples assim e ainda há um longo caminho em termos de aumento no número de mortes por aqui.
Durante a pandemia aprendi muitas coisas sobre a questão da comunicação entre os cientistas, gestores e o público em geral, e uma das mais importantes (e mais difíceis) é exatamente tentar explicar e lidar com a questão da defasagem da informação (embora, nesse momento, ela já tenha sido amplamente divulgada, vejam algumas das excelentes reportagens sobre o tema no jornal “O Popular” feitas por Vandré Abreu e Thalys Alcântara). Dada a urgência das medidas necessárias e a relevância da própria informação, em termos de saúde pública, precisamos resolver esse problema e, novamente, o nosso conhecimento científico e o uso de modelos podem, como sempre, nos ajudar.
Os modelos são simplificações ou idealizações da realidade, usualmente expressos na forma de equações ou de algoritmos, que podem ser utilizados como uma ferramenta de avaliação das hipóteses a partir de uma “formalização” de teorias científicas ou de seus principais componentes. Quando criamos modelos e contrastamos seus resultados ou predições com o “mundo real” (seja lá o que isso signifique...), assumimos que “entendemos” essa realidade. E, uma vez que achamos que entendemos essa realidade, podemos usar esses modelos para fazer previsões. Essas previsões são sempre “indutivas”, generalizações e projeções no sentido de assumirem que as condições usadas na construção do modelo vão permanecer válidas na projeção. Existem muitas discussões filosóficas super interessantes aqui sobre teorias, modelos e realidade, mas vamos nos manter mais “operacionais” e pragmáticos.
É muito comum usarmos os modelos para fazer previsões para o futuro e, no caso da COVID-19, não foi diferente. Uma das ideias sempre foi utilizar os modelos da classe SIR (de Suscetíveis, Infectados e Recuperados) para tentar prever o pico da pandemia ou balizar decisões sobre qual o máximo de recursos hospitalares seriam necessários sob diferentes cenários de expansão da pandemia. Outro exemplo bem conhecido na minha área de pesquisa em Biodiversidade, Ecologia e Ciências Ambientais, se me permitem uma rápida digressão, são as previsões dos modelos climáticos e toda a discussão sobre aquecimento global, ou melhor dizendo, sobre as sobre mudanças globais (aproveitando e conectando os assuntos, aliás não é à toa que estamos vendo um aquecimento enorme e recorde de temperaturas nesse ano de 2020...). Os modelos que fazem projeções para o futuro estão fazendo o que chamamos, em inglês, de “forecasting”, ou seja, antevendo o futuro. Falar dos modelos climáticos nesse contexto de previsão é interessante pois uma vez que passamos a entender melhor o funcionamento dos sistemas atmosféricos em escala global, há pouco mais de duas décadas, passamos também a projetar os resultados dos modelos e fazer previsões para o passado, para épocas em que não tínhamos dados! Podemos, por exemplo, usar o mesmo tipo de modelo que usamos para projetar as mudanças globais antrópicas para tentar entender como era o clima no planeta há cerca de 21 mil anos atrás, na última era glacial, e como isso pode ter desencadeado a extinções de grandes mamíferos. Ou podemos até recuar bem mais tempo (temos modelos hoje recuando há alguns milhões de anos, que podemos usar, por exemplo, para entender o efeito do clima sobre a biodiversidade, em termos de extinções e formação de novas espécies). Nesses casos, estamos falando do que chamamos de “hindcasting”, e isso pode ser pensado em termos de validar o modelo (em termos de “prever” eventos que sabemos que já aconteceram) ou realmente entender o passado que desconhecemos.
Entretanto, é interessante pensar que a definição de passado e futuro, na verdade, é bastante arbitrária, depende do contexto do qual estamos falando e do objetivo a ser alcançado com um modelo. Claro, passado, presente e futuro, obviamente, fazem parte de um continuum direcional no tempo. Voltando para a COVID-19, dada a urgência da tomada de decisão, se o nosso dado sobre óbitos ou casos está defasado em alguns dias, ou mesmo semanas e meses, já que ainda estamos aguardando o laboratório confirmar os resultados por análises moleculares ou ainda estamos aguardando as atualizações do sistema de informação entre hospitais e municípios, podemos não ficar satisfeitos com uma tomada de decisão com base nesses dados. Então, nessa situação emergencial, passei a ouvir cada vez mais, no contexto de epidemiologia e da pandemia, o termo nowcasting, ou seja, prever o presente! Pode parecer estranho e de certo modo contraintuitivo e paradoxal: se estamos no presente podemos simplesmente coletar os dados, não precisamos “prever o presente”. Mas será que estamos mesmo no “presente”? Nesse caso não, pois considerando todos problemas com os dados empíricos não sabemos exatamente o que é o “presente”, pois só temos informação fragmentada para diferentes momentos do passado, variando continuamente ao longo do tempo! Só sabemos, intuitivamente, que quanto mais recuamos em direção ao passado mais confiamos que a informação está correta, ou um pouco mais completa. Na verdade, filosófica e conceitualmente é bastante interessante pensarmos que o tempo depende, de fato, da nossa percepção sobre a importância de definição de “presente”.
Como podemos resolver esse problema? Vamos primeiro entender melhor essas defasagens e atrasos e seu significado e alguns exemplos podem ajudar. Por exemplo, quando o Governador Ronaldo Caiado anunciou o ultimo decreto estadual aqui em Goiás tentando controlar a pandemia por implementação de mais uma quarentena (o início de um modelo de aberturas e fechamentos sucessivos de 14 dias), no dia 30 de setembro ele mencionou que já haviam sido registrados 437 óbitos em Goiás. Esse era um número muito elevado e era preciso tomar novas medidas (ele se baseou no boletim da SES do domingo, mas no final do próprio dia 30 de junho o portal já foi atualizado para 475 óbitos). Certamente outras pessoas já tinham morrido por COVID-19 até esse dia, sabíamos disso, mas quantas? O que poderia ter sido falado sobre isso? Olhando retrospectivamente os dados de óbito, pouco mais de 3 meses depois, sabemos que já tinham ocorrido, na verdade, 754 óbitos por COVID-19 naquela data! Não sabemos se todos os eventos já foram efetivamente registrados, mas é bem provável que a grande maioria sim, embora sempre haja casos antigos que nunca serão solucionados (toda a questão da subnotificação). Mas, de qualquer modo, o ponto é que, enquanto o Governador falava, só sabíamos sobre cerca de 58% dos óbitos que já haviam acontecido em Goiás até então. Não sabíamos desses óbitos porque as confirmações dos laboratórios espalhados pelo Estado ainda não haviam chegado, porque os hospitais e os municípios ainda não haviam atualizado seus sistemas. Lembro de ter olhado o número de óbitos até o dia 30 de junho, em algum momento já mais no final de julho, e vi que já haviam chegado mais dados e sabíamos já de pouco mais de 600 óbitos acumulados até então...Interessante, e isso nos dá uma pista de como podemos tentar resolver o problema!
Na verdade, o que precisamos é, mais uma vez, de um MODELO que nos ajude a estimar o número de óbitos HOJE, ou seja, precisamos "prever o presente" a partir do passado. Uma possibilidade seria usarmos o próprio modelo SIR calibrado em algum momento do passado e projetar para o presente. O problema é que os modelos tipo SIR são bem mais complexos e possuem de fato outros objetivos, além de requererem muitas informações que, por sua vez, também possuem defasagens e incertezas. Mas podemos usar uma ideia mais simples para previsões de curto prazo, nesse caso, e construir um MODELO EMPÍRICO a partir dos próprios dados de defasagem. Ou seja, não estamos buscando entender a progressão da pandemia sob dadas situações, mas sim modelando a maneira como a informação é atualizada nos sistemas durante a pandemia!
Voltando ao dia 30 de junho, quando da fala do Governador, sabemos hoje que somente naquele dia faleceram 25 pessoas de COVID-19 em Goiás, mas NENHUMA delas foi notificada no mesmo dia. Mesmo considerando que a maioria faleceu nos hospitais e já tinha sido diagnosticada anteriormente, na internação, há sempre alguma demora em atualizar os sistemas de informação. Na verdade, dos 25 óbitos, 10 foram conhecidos em até 2 dias, mas alguns deles só foram conhecidos mais de 50 dias depois! Esses efeitos, lógico, são acumulativos em relação aos dias anteriores ao dia 30 de junho, de modo que o número total acumulado aumentou muito desde a divulgação, na própria data. Então, temos uma distribuição estatística dos dias de defasagem entre a data do óbito e a data de divulgação desse óbito e se fizermos isso para vários dias do passado um pouco mais distante (digamos, para os dias de junho e julho, assumindo que essa informação já estaria razoavelmente completa), podemos chegar a uma distribuição acumulativa do conhecimento sobre a defasagem, como está na Figura abaixo.
Então, isso significa que, em média, cerca de 12,7% dos óbitos que ocorreram no dia foram registrados no sistema da SES até 1 dia depois da ocorrência (mas com uma grande variação, entre 0% e 35% para diferentes dias). Na verdade é preciso esperar cerca de 9-10 dias para chegar a 50% dos óbitos ocorridos naquele dia, e os intervalos de confiança da curva refletem a variação da defasagem ao longo dos dias de junho e julho. Mesmo depois de 60 dias, em média conhecemos pouco mais de 92% dos óbitos que ocorreram naquele dia. Com isso, podemos então aplicar esse modelo ao número de óbitos, por dia, que ocorreram nos últimos dias corrigindo por esse modelo de defasagem. Por exemplo, entre os dias 6 e 7 de outubro foram registrados apenas 7 novos óbitos para todo o Estado de Goiás, mas sabemos pelo modelo de defasagem que isso representa provavelmente só cerca de 12,7% do total de óbitos nesse dia, de modo que teríamos algo como 55 novos óbitos de fato. Essa curva é então um MODELO EMPÍRICO da maneira como os dados de acumulam e a curva média é uma síntese do nosso conhecimento sobre o padrão de defasagem a partir de uma amostra de alguns dias. Vejam também que estamos assumindo que o modelo acima, ou seja, o padrão de defasagem em junho e julho continua valendo e pode ser utilizado para corrigir os dados de hoje. Se, por exemplo, os municípios colocarem agora mais técnicos para atualizar o sistema ou os laboratórios comprarem mais equipamentos e liberarem os resultados com mais rapidez, o número de óbitos vai estar sobrestimado (e, obviamente, o contrário pode ser verdadeiro...). Essa é uma estratégia simples e outros modelos bem mais sofisticados podem ser aplicados.
De qualquer modo, fazendo-se essas correções e acumulando-se os números corrigidos de óbitos ao longo dos dias (e isso pode gerar, talvez, algum viés de acúmulo de erro...), chegamos à curva corrigida de óbitos acumulados apresentada abaixo. Como mostrei acima, temos pouco mais de 5000 óbitos em Goiás no início de outubro mas já vemos uma certa inflexão formando uma função logística a partir de setembro, de modo que poderíamos imaginar que realmente a pandemia está “no final” realmente (o padrão para os casos é até mais forte em termos de “estabilização”, vejam nossa Nota Técnica 09 sobre estimativa do R efetivo em www.covid.bio.br). Infelizmente, se pensamos no modelo de defasagem da figura acima, vamos rapidamente perceber que não é tão simples assim. Na verdade, a projeção corrigida pela defasagem mostra que a curva continuou subindo ainda de forma mais ou menos linear ao longo de agosto e setembro. Notem que isso não é uma projeção para o futuro, é uma “correção do presente”, pensando nos últimos 60 dias. De acordo com esse modelo, podemos ver que o número de óbitos chegou de fato em 5000 na 2ª quinzena de setembro (talvez entre os dias 15 e 25 de setembro, uns 20 dias atrás portanto; mas vamos precisar esperar pelo menos 2-3 meses para confirmar essas estimativas!). Hoje já estaríamos, pelo modelo, mais próximos de 6000 óbitos, embora no intervalo de confiança inferior talvez já seja possível ver alguma redução e desaceleração (e nesse caso hoje seriam cerca de 5400 óbitos).
Poderíamos pensar também em validar essas ideias de defasagem utilizando diferentes conjuntos de dados. Em tese, pela lei, os familiares devem registrar oficialmente os óbitos em 24 horas, mas ainda assim há um fluxo complexo até que a informação se torne disponível (e em tempos de pandemia mesmo essas 24 horas ficam comprometidas). No Portal de Registro Civil consta a mensagem de que “...a família tem até 24h após o falecimento para registrar o óbito em Cartório que, por sua vez, tem até cinco dias para efetuar o registro de óbito, e depois até oito dias para enviar o ato feito à Central Nacional de Informações do Registro Civil (CRC Nacional), que atualiza esta plataforma.” O sistema já dá, portanto, uma ideia das defasagens que podem ser esperadas pelo fluxo de informações, similar ao que descrevi acima. Para nossa facilidade, o Registro Civil montou um excelente painel em separado para divulgar os óbitos relacionados à COVID-19 para os Estados e as maiores cidades. Por exemplo, o registro civil de Goiás já registrou, até o dia 7 de outubro, um total de 5461 óbitos e, considerando os atrasos do fluxo de informações descrito pelo próprio sistema de registro civil, esse número seria coerente com uma projeção maior de eventos que já teriam acontecido hoje (vejam que mesmo com os atrasos esse dado do registro civil está acima do intervalo de confiança inferior do nosso nowcasting). Claro que, por outro lado, pode haver também alguma sobrestimativa nesse número do registro civil pois nem todos esses óbitos foram realmente por COVID-19, já que alguns poderiam ainda não ter sido confirmados laboratorialmente quando do registro e depois, se a causa realmente não tiver sido essa, não há correção (mas acredito que essa sobrestimativa seja pequena atualmente, dada a situação epidemiológica mais geral). De qualquer modo, são sempre estimativas e esse exemplo mostra que há, sem dúvida, muito atraso na notificação e que um modelo de nowcasting pode ser importante para a tomada de decisão.
De qualquer modo, mesmo considerando a incerteza em todas essas estimativas, certamente é muito importante tentar “corrigir” as séries temporais de casos ou óbitos que, por sua vez, podem ser utilizadas para outras análises. Por exemplo, sempre ignorávamos os últimos 20-30 dias, no mínimo, para calibrar o nosso modelo de projeções ou para tentar calcular o número efetivo de transmissões (o Re) a partir dos casos. Mas, no final, isso limitava o conhecimento do presente e causava dificuldades, pois o impacto dessas transmissões e a forma das curvas já estava muito no passado e a situação atual já poderia ser muito diferente (vimos isso acontecer algumas vezes). Mas se corrigimos as séries de dados com um modelo de nowcasting podemos chegar a um número um pouco mais atualizado. Para Goiás, chegamos recentemente a valores próximos a 1,0 na primeira quinzena de setembro (para o Estado como um todo e para as maiores cidades). Esse crescimento linear no início de setembro é coerente com a projeção do número de óbitos ainda aumentando de forma linear que descrevi acima até início de outubro (e não com uma forte redução), considerando que o tempo médio entre os sintomas e o óbito é de cerca de 15-20 dias. Vamos ver o que o futuro nos reserva, mas pela experiência dos outros Estados e de outros locais é possível que o Re já tenha começado a cair e esteja abaixo de 1,0, de modo que as curvas de novos casos tenham efetivamente começado a declinar gradualmente (não as empíricas, mas as reais, que poderemos conhecer em breve pelo modelo do nowcasting). Mas ainda há muitos eventos pela frente, considerando o “tamanho” dos números em Goiás hoje e, claro, se houver mudanças drásticas de comportamento das pessoas, os números de transmissões podem aumentar e a pandemia volta a crescer, como estamos vendo em vários locais.
Outro exemplo de aplicação: na nossa última projeção para o crescimento da pandemia em Goiás, feito com o nosso modelo ABM-COVID-GO III, previmos o número de óbitos no final de agosto sob diferentes cenários. No dia 30 de agosto a SES divulgou que Goiás tinha 3094 óbitos, mas pelos dados que temos agora, no início de outubro, já tínhamos de fato, nessa data, pelo menos 3708 óbitos. Corrigindo com o nowcasting, devemos ter chegado a algo em torno de ~3900 óbitos em 30 de agosto, vamos ver...Na realidade esse caso é muito interessante, pois de fato estamos prevendo o passado (30 de agosto), mas possamos falar em nowcasting porque achamos que o presente ainda não chegou lá...Ou seja, ainda não é o "presente" para dados de 30 de agosto...De qualquer modo, o ponto é que essas estimativas nos colocam apenas um pouco abaixo do centro das estimativas do “cenário laranja”, que assumia um crescimento com um Re oscilando entre 1,0 e 1,2 de forma intermitente mas com uma redução por um forte efeito de rastreamento de casos e contatos (e isso é em grande parte o que de fato está acontecendo, principalmente em Goiânia e outras cidades maiores, com programas de testagem em massa e fortes campanhas de conscientização a partir de julho). Então, de um jeito ou de outro os resultados dos modelos e projeções são coerentes.
Assim, as ferramentas de nowcasting têm se tornado cada vez mais importantes nesse momento em que decisões, especialmente agora em que as previsões de longo prazo se tornam mais difíceis, por várias questões. Nossos colegas do Observatório COVID19BR, dentre eles meu amigo Paulo Inácio Prado, do Departamento de Ecologia da USP, desde o início da pandemia estudam esses modelos mais complexos de nowcasting e têm aplicado aos Estados do Brasil e suas principais cidades. Em Goiás nosso grupo estava mais concentrados em desenvolver o ABM para fazer as projeções de médio/longo prazo, mas agora em que é preciso entender melhor as mudanças em curto espaço de tempo, devemos investir mais nessa abordagem. As estimativas do Observatório, que são baseadas em modelos Bayesianos de nowcasting a partir de dados de casos graves do SIVEP, são um pouco mais conservadoras do que os valores apresentados aqui (sugerem algo como 5179 óbitos para o dia 3 de outubro, embora as estimativas de Re ao longo dos últimos dois meses sejam semelhantes).
Enfim, essa abordagem de “predizer o presente” é bem interessante e útil. Há muito a explorar em termos conceituais e filosóficos, mas pragmática e operacionalmente temos uma maneira de tentar corrigir os dados para tomar decisões com informações mais próximas do que deve estar acontecendo agora. Existe uma discussão super interessante aqui sobre a própria natureza do que podemos conhecer em um dado momento, nesse caso da pandemia da COVID-19, e algo mais geral sobre os limites dos dados empíricos. Precisamos pensar de forma científica para ir “além” de uma percepção ingênua do empírico (mesmo que o modelo usado venha, em última instância, de outras avaliações do próprio dado empírico) e pensar em soluções para o problema. De forma ainda mais abstrata, esse tipo de problema nos leva a pensar sobre a natureza do tempo e do seu significado para diferentes questões científicas. O que é o presente, o passado e o futuro diante das nossas perguntas científicas? Esses momentos têm significados diferentes para...O presente para a COVID-19 requer precisão de dias, pois “...o tal futuro fica logo ali”, como disse Venturini! Mas muitas das preocupações com o futuro estão mais distantes, de modo que a precisão sobre a definição do presente pouco importa (mesmo com o calor infernal, continuamos não enxergando as implicações das mudanças climáticas no final do século XXI...). Enfim, mais uma vez fica claro que é importante pensar e investir na ciência para que possamos resolver de forma mais rápida e eficiente nossos problemas!
PS: Tivemos ontem à noite, dia 7/10, um editorial no "O Popular" chamando atenção para a marca de 5000 obitos por COVID-19 em Goiás. Curto, mas direto ao ponto e bem conectado às questões políticas e eleitorais.
Comments