PROFEPI PROGRAMA DE FORTALECIMENTO DA EPIDEMIOLOGIA NOS SERVIÇOS DE SAÚDE ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Prof. José Leopoldo Ferreira Antunes • Coordenação Acadêmica FICHA TÉCNICA EQUIPE DO PROGRAMA DE FORTALECIMENTO DA EPIDEMIOLOGIA NOS SERVIÇOS DE SAÚDE – PROFEPI Secretaria de Vigilância em Saúde/ SVS/ MS Arnaldo Correia de Medeiros Departamento de Articulação Estratégica de Vigilância em Saúde/DAEVS/SVS Breno Leite Soares Coordenação Geral de Desenvolvimento da Epidemiologia nos Serviços/CGDEP/ DAEVS/SVS Fátima Sonally Sousa Gondim Equipe Executiva Fátima Sonally Sousa Gondim – Coordenação Geral Maryane Oliveira Campos Scherer – Coordenação Executiva Tatiane Leite – Coordenação Pedagógica Sheyla Leite, Claudia Spinola Leal Costa e Dalila Gonzaga – Equipe de Execução Regina Falcão – Apoio Administrativo Equipe Criação Digital Raones Ramos da Silva – Designer Gráfico/Web Otávio Francisco Batista Martins – Motion Designer Equipe pedagógica do curso Análise de Séries Temporais em Vigilância em Saúde José Leopoldo Ferreira Antunes – Coordenação acadêmica e professor facilitador Tatiane Leite – Coordenação Pedagógica Ronaldo de Jesus, Danielly Batista Xavier, Maryane Oliveira Campos Scherer, Lucia Rolim Santana de Freitas – Colaboradores SUMÁRIO INTRODUÇÃO 04 MÓDULO 1 • SÉRIES TEMPORAIS: ASPECTOS CONCEITUAIS DA ORGANIZAÇÃO DAS MEDIDAS DE DOENÇAS NO TEMPO 06 1.1 Melodia e tendência........................................................................................06 1.2 Harmonia e associação..................................................................................06 1.3 Ritmo e sazonalidade.....................................................................................06 1.4 Ruído e variação aleatória............................................................................06 Conclusão...................................................................................................................06 MÓDULO 2 • SÉRIES TEMPORAIS: ASPECTOS METODOLÓGICOS DA ORGANIZAÇÃO DAS MEDIDAS DE DOENÇAS NO TEMPO 17 2.1 Estimar tendências.......................................................................................... 18 2.2 Modelar sazonalidade ................................................................................... 35 2.3 Alisamento das séries temporais ............................................................. 41 MÓDULO 3 • SÉRIES TEMPORAIS INTERROMPIDAS E AVALIAÇÃO DAS INTERVENÇÕES EM SAÚDE 47 3.1 Modelos de regressão segmentada...........................................................48 Considerações finais .............................................................................................. 55 GLOSSÁRIO 58 INSTRUMENTO DE AVALIAÇÃO 62 ANEXOS 63 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE INTRODUÇÃO A perspectiva de antever o futuro sempre encantou o ser humano. Saber o que vai acontecer antes mesmo que os primeiros sinais se manifestem pode propiciar um melhor aproveitamento de efeitos benéficos dos eventos futuros, pode propiciar uma preparação antecipada para eventuais efeitos adversos. Talvez até mais importante que antecipar os resultados seja o reconhecimento de tudo quanto possa interferir favorável ou desfavoravelmente nos processos em curso, para permitir o planejamento de nossas ações individuais e coletivas. De fato, lançar os olhos para o futuro é importante para qualquer tomada de decisão no presente! A epidemiologia é a disciplina que se aplica ao estudo da distribuição dos problemas de saúde, dos determinantes que influenciam esses problemas e dos esforços para seu controle (Porta, 2016). Para essa área de estudos, a necessidade de antever o futuro e, com base nessa antevisão, intervir nos processos do presente é muito mais que mera curiosidade ou interesse mesquinho. De fato, é assunto de vida ou morte, pois a redução da carga de doença na população depende da efetividade desses esforços. 4 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Nesse sentido, este curso focaliza a análise de séries temporais, um tópico da epidemiologia que permite antever futuros cenários da distribuição de doenças na população e dos fatores que podem modificar esta distribuição para melhor ou para pior. O curso foi organizado em três módulos. No primeiro, são introduzidos aspectos conceituais sobre as séries temporais, enquanto recurso lógico para organizar as medidas epidemiológicas no tempo. No segundo módulo, discutiremos os aspectos práticos desta metodologia, exercitando as técnicas de análise das séries temporais. Por fim, no terceiro módulo, iremos explorar a análise de séries temporais interrompidas ou segmentadas, um recurso de interesse para a avaliação do efeito de programas e medidas de saúde. 5 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE MÓDULO 1 Séries temporais: aspectos conceituais da organização das medidas de doenças no tempo 6 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE SÉRIES TEMPORAIS: ASPECTOS CONCEITUAIS DA ORGANIZAÇÃO DAS MEDIDAS DE DOENÇAS NO TEMPO Imagine um gestor de saúde que precise antever o coeficiente de mortalidade infantil em sua região, com o intuito de programar iniciativas de promoção da saúde. Sabe-se que este coeficiente é influenciado por algumas características da população, como condições socioeconômicas, saneamento básico, provisão e acesso a serviços de saúde. Mas estas informações podem não ser atuais, confiáveis ou facilmente recuperadas. Além disso, a relação entre mortalidade infantil e essas características é complexa e pode não ser rapidamente equacionada. Com isso, quais seriam as primeiras perguntas que esse gestor se faria, para prever o valor deste indicador? A primeira pergunta parece instintiva: “qual foi o valor deste coeficiente no ano anterior?” Continuando sua reflexão sobre o tema, o gestor decerto se perguntará: “é justo pensar que o que ocorreu no passado recente se repita no futuro imediato?” Essa segunda pergunta amplia o escopo de seu esforço de antever o futuro. Agora, o gestor quer apurar sua previsão levando em consideração não apenas o que ocorreu no último ano, mas também perguntando sobre a movimentação recente que esta medida sofreu no tempo. Daí a terceira hipotética questão: “como a mortalidade infantil tem se comportado ao longo dos últimos anos?” O estudo epidemiológico das séries temporais contempla justamente essa preocupação em derivar conhecimentos sobre a movimentação recente das medidas de interesse em saúde. Há duas finalidades para esse conhecimento: prever resultados de interesse e identificar fatores que interferem sobre esses resultados. Séries temporais foram definidas de modo breve e sucinto: “são sequências de dados quantitativos relativos a momentos específicos e estudados segundo sua distribuição no tempo” (Wiener, 1966). Essa definição indica a aplicabilidade desse recurso de análise para fins variados e diferentes campos de conhecimento. Como aperfeiçoar o fluxo de estoque de um almoxarifado? Como programar a compra de matéria prima para uma atividade industrial? Como dimensionar o fluxo de vendas num empreendimento comercial? Estes são apenas alguns exemplos de aplicação da análise de séries temporais para finalidades não imediatamente relacionadas à saúde. Nosso enfoque, no entanto, recairá sobre as medidas de saúde e como aplicar a análise de séries temporais para os estudos epidemiológicos. Esse primeiro módulo aborda aspectos conceituais relacionados a essa estratégia de análise dos estudos epidemiológicos, a qual consiste em organizar no tempo as informações sobre as doenças e derivar conhecimento desta análise. 7 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Séries temporais e música: Vimos que as séries temporais são uma forma de organizar no tempo as informações quantitativas sobre aspectos relacionados à saúde. A música também é uma forma de organizar no tempo um tipo específico de informação: os registros sonoros. A teoria musical reconhece três elementos da música, os quais podem ser pensados em correspondência com a análise epidemiológica das séries temporais: melodia, harmonia e ritmo. 1.1 Melodia e tendência Embora seja difícil de definir com precisão, a melodia pode ser pensada como uma sequência de sons organizados de modo a fazer sentido musical. A Figura 1 apresenta um trecho melódico bastante conhecido. De fato, todos se recordam da linha melódica que acompanha o trecho “Ouviram do Ipiranga as margens plácidas”. Sua representação gráfica na forma de partitura deixa bem claro que, excetuando as duas últimas notas, a melodia tem uma progressão das notas graves, representadas pelas linhas inferiores do pentagrama, para as notas agudas, as que aparecem na parte mais elevada da partitura. Os movimentos melódicos em direção às notas mais graves ou mais agudas podem ser projetados aos movimentos das tendências nas séries temporais. Observe, na Figura 2, a série temporal do coeficiente de mortalidade geral na cidade de São Paulo, de 1900 a 1994. A imagem da série deixa claro que, de modo geral, essa medida evoluiu ao longo do século reduzindo a magnitude de valores; isto é, passando de valores mais elevados na escala vertical para valores menos elevados. Isto configura uma tendência decrescente. Figura 1. Compassos iniciais do Hino Nacional Brasileiro Quando estudamos séries temporais em estudos epidemiológicos, um primeiro elemento da análise deve focalizar qual é a tendência da medida. O conceito de tendência também pode ser definido de forma breve e sucinta: “um movimento prolongado em uma série ordenada” (Porta, 2008). Obviamente, a tendência pode ser decrescente, como na Figura 2, mas também pode ser crescente ou estacionária. 8 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 2. Coeficiente de mortalidade geral, cidade de São Paulo, 1900-1994. Fonte: Antunes (1998) Complicando um pouco mais, uma mesma série temporal pode apresentar trechos com diferentes tendências. Observe como isso de fato ocorre na Figura 3, que mostra a série temporal da mortalidade infantil na cidade de São Paulo, abrangendo o mesmo período. A tendência secular de declínio dessa medida foi claramente interrompida no período de 1961 a 1973, quando a mortalidade infantil cresceu de modo consistente. O que teria acontecido nesse período para justificar esta observação? O que mais de interessante pode ser depreendido da apreciação visual desta série temporal? Em cada um dos primeiros anos do monitoramento, ocorreram em torno de 220, 230 óbitos de crianças com menos de um ano de idade, para cada 1000 nascidas vivas. O que pensar desses valores tão elevados? Figura 3. Coeficiente de mortalidade infantil, cidade de São Paulo, 1900-1994. Fonte: Antunes (1998) 9 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 1.2 Harmonia e associação Mas a música não se limita à linha melódica. Imagine a diferença entre um violinista ressoando seu instrumento sozinho no palco e outro que toca acompanhado de toda uma orquestra sinfônica! A mesma linha melódica executada pelo violinista decerto terá outro brilho quando reproduzida em harmonia com a orquestra. Tem coisas que definitivamente ficam melhor quando ocorrem de modo concomitante. O vinho, que deve ser tomado durante as refeições, para que harmonize com o sabor dos alimentos. Assistir a final do campeonato sozinho em casa pela televisão ou no estádio, com o calor de toda a torcida! No piano, enquanto a mão direita dedilha a melodia, a mão esquerda toca outras notas dos acordes que compõem a harmonia. Como elementos musicais complementares, a melodia é o desenvolvimento horizontal da música, enquanto a harmonia é seu desenvolvimento vertical, representado pelos acordes formados por sons concomitantes. De modo análogo, quando estudamos a tendência e sintonizamos nossa atenção no desenvolvimento horizontal da série no tempo, precisamos atentar também para a complexidade vertical da série temporal, identificando como suas medidas se harmonizam, isto é, se associam com informações adicionais sobre os fenômenos relacionados. Com essa ideia em mente, reveja a série temporal da Figura 2 e identifique o pico de mortalidade geral que ocorreu na cidade de São Paulo no ano de 1918. Por meio da análise de tendência desta série temporal, pode-se estimar que o valor observado em 1918 foi quase 50% mais elevado que a média entre os anos imediatamente anterior e posterior. Esta informação é compreensível por si só; ela indica que, de fato, algo muito ruim ocorreu naquele ano. Mas o significado desta informação decerto se amplifica quando procuramos associá-la com o conhecimento sobre o que se passou na cidade de São Paulo. Como se sabe; 1918 foi o ano da “gripe espanhola”, de triste lembrança. Naquele ano, ocorreu um grave surto de gripe, com enorme impacto na mortalidade geral. No mesmo estudo do qual foi reproduzida a Figura 2, foi delineada a série temporal da esperança de vida ao nascer, mostrando uma forte redução nessa medida. Como muitas crianças, adolescentes e adultos jovens foram vitimados pela gripe, a duração média da vida foi de cerca de 50 anos, no ano anterior, para menos de 32 em 1918. A perspectiva de harmonizar a interpretação das tendências observadas nas séries temporais com outras informações que estejam disponíveis sobre o fenômeno em questão diz respeito ao estudo de associação, que é um recurso bastante utilizado na análise epidemiológica. Estas informações adicionais podem ser qualitativas, auxiliando a interpretação dos motivos que justificam o aumento, a diminuição ou a estabilidade dos valores de uma medida de interesse para a saúde. Estas informações adicionais também podem ser quantitativas, dando ensejo à aplicação de técnicas de análise estatística para estimar sua associação com a série temporal que se tenta explicar. 10 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Exemplificando o uso de informações qualitativas para justificar movimentos de tendência das séries temporais, observa-se que o estudo original, no qual foi delineada a série temporal da Figura 3, aventou duas hipóteses para explicar a inversão de tendência da mortalidade infantil e o crescimento observado nos anos 1960 e início dos 1970. A primeira delas foi a diminuição do valor real do salário mínimo, parâmetro que regulava a remuneração de uma parcela ponderável das famílias residentes na cidade. A outra hipótese aventava o desmame precoce, a comercialização de leite em pó e a má qualidade da água de abastecimento público, com a qual o leite em pó era preparado para o consumo infantil (Antunes, 1998). Vejamos agora outro exemplo de associação dos dados obtidos em uma série temporal para gerar conhecimento em saúde. Neste caso, o estudo de associação utilizou medidas quantitativas organizadas em outra série temporal, para avaliar a concomitância entre dois fenômenos de interesse para a saúde. Examine a Figura 4, na qual se mostra a série temporal da mortalidade geral diária em São Paulo, do início de 1991 até o final de 1994. A segunda série temporal delineada organiza os dados de temperatura média diária na mesma cidade e período. Considerando a associação entre as duas medidas, o que se depreende da inspeção visual das duas séries temporais? Que conhecimento pode ser inferido? As temperaturas médias diárias são, é claro, mais baixas no inverno (meados de cada ano) e mais elevadas no verão (período do fim de ano e início do ano seguinte). Figura 4. Séries temporais: (a) mortalidade geral por dia e (b) temperatura média diária na cidade de São Paulo, 1991-1994. Fonte: Gouveia et al. (2003) Já a mortalidade geral foi mais elevada nos períodos de inverno que no verão. No estudo que delineou a Figura 4, os autores concluíram haver uma associação inversa entre os dois fenômenos. Isto é, nos períodos em que os dias são mais quentes, a mortalidade geral diária tende a ser menor, e vice-versa, a mortalidade é tendencialmente mais elevada nos períodos de frio. 11 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Diz-se que há uma associação direta ou positiva entre duas séries temporais, quando os valores de ambas aumentam ou diminuem concomitantemente. De modo complementar, a associação é inversa ou negativa se o aumento de uma medida corresponde à diminuição da outra, como no caso discutido no parágrafo anterior. E se diz que não há associação quando não há correspondência entre as mudanças de valor das duas séries. A associação entre séries temporais não necessariamente tem origem causal. O aumento de uma variável pode não ser causa do aumento ou declínio da outra, ambas podem ter causas comuns, e sua associação pode ser reflexo de processos mais complexos. 1.3 Ritmo e sazonalidade O ritmo é possivelmente o elemento mais instintivo da teoria musical. O coração bate de forma ritmada; o sol parece girar em torno da terra de forma ritmada; as estações do ano se sucedem de forma ritmada. Na música, o ritmo envolve estrofes, refrãos e repetições. Também se dão de forma ritmada os movimentos da dança, ou mesmo de quem acompanha distraidamente uma canção tamborilando os dedos. Na notação musical, o ritmo é registrado por meio da marcação do tempo em que cada nota deve soar, e pela divisão da partitura em compassos. A percepção de que os fenômenos de interesse para a saúde também podem apresentar repetições de certa forma organizadas no tempo, ou seja, de que há algum ritmo a ser reconhecido na análise de séries temporais, é muito importante para a epidemiologia. Estamos falando das variações sazonais e cíclicas que afetam a medida de muitas doenças. O movimento sazonal da temperatura média diária que foi representado na Figura 4 é bem conhecido de todos: faz mais frio no inverno que no verão... A originalidade do estudo do qual foram reproduzidas as imagens da Figura 4 diz respeito justamente à existência de variação sazonal também no número diário de mortes. Quem recuperar o manuscrito original na página que a revista mantém na Internet (o acesso é livre) poderá refletir mais detalhadamente sobre os motivos que justificam esta variação sazonal. A Figura 5 fornece outro exemplo de construção de conhecimento em saúde com base na análise da variação sazonal das séries temporais. Esta figura reproduz, para as regiões Sul e Nordeste do Brasil, a mortalidade semanal de pessoas com 65 anos ou mais por pneumonia e influenza. O período de monitoramento foi de 1996 a 1998, os três anos que antecedem a introdução do programa nacional de vacinação de idosos contra a gripe. 12 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 5. Séries temporais da mortalidade semanal de idosos (65 anos ou mais) por influenza e pneumonia nas regiões Sul e Nordeste, 1996 a 1998. Mortalidade observada, mortalidade esperada e limiar epidêmico previsto. Fonte: Oliveira (2013) Além da série temporal da mortalidade observada, foi delineada, para cada região, a sequência da mortalidade esperada para cada semana, se não houvesse variação aleatória na medida (essa “rugosidade” dos valores observados), e tampouco houvesse surtos de gripe causando um aumento brusco da mortalidade, como este, que pode ser facilmente identificado na região Sul, em meados de 1996. Também foi delineada a curva que projeta uma previsão para o limiar epidêmico, o qual, quando ultrapassado, configura a ocorrência de um surto de gripe. Os cálculos da mortalidade esperada e do limiar epidêmico previsto demandam o uso de técnicas avançadas de análise estatística, as quais não serão objeto deste módulo. Exercitando o olhar sobre as duas séries temporais da Figura 5, o que pode ser depreendido de relevante para o conhecimento em saúde? Ambas as séries apresentam tendência estacionária com variação sazonal. Notando a diferença de escala no eixo vertical, percebe-se que a magnitude da mortalidade oscila em torno de valores mais elevados na região Sul que no Nordeste. Também a amplitude da variação sazonal é mais elevada na região Sul. Estas duas diferenças podem estar relacionadas à maior amplitude de variação climática na região Sul que no Nordeste. Uma análise mais detalhada indica que o período de máxima mortalidade anual estimada para a região Sul variou entre a 28ª e a 31ª semanas epidemiológicas, respectivamente a 2ª semana de 13 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE julho e 4ª semana de julho, o que corresponde ao inverno. A hipótese subjacente é que as pessoas passam mais tempo em ambientes fechados nos dias mais frios, propiciando a transmissão da gripe. Na região Nordeste, o período de máxima mortalidade esperada ocorreu entre a 17ª e a 22ª semanas epidemiológicas, respectivamente a 4ª semana de abril e 4ª semana de maio. Como há menos variação de temperatura entre as estações no Nordeste, o período de maior permanência em ambientes fechados (e, portanto, mais propício à transmissão da gripe) ocorre no outono, quando chove mais. Estes dados são indicativos de diferenças no perfil epidemiológico da doença em cada região. Na Figura 4, o registro que permitiu visualizar a variação sazonal utilizou dados diários de temperatura e mortalidade. Nas séries da Figura 5, a variação sazonal foi apreendida em dados discriminados por semana. Utilizar a escala mensal é outra estratégia para a percepção visual de sazonalidade nas séries temporais de interesse para a saúde. Do ponto de vista etimológico, a palavra sazonal é relativa às estações do ano. Quando o ritmo, ou o ciclo de repetição da série temporal se prolonga por mais de um ano, não se fala em variação sazonal, mas sim em variação cíclica. A Figura 6 exemplifica uma série temporal com indicação de variação cíclica. Medidas epidemiológicas do sarampo são emblemáticas para a percepção de variação cíclica, pois a ocorrência de um surto tende a reduzir o risco de novos surtos em curto prazo. Os sobreviventes da doença adquirem imunidade e, com menos crianças susceptíveis, a transmissão se torna menos provável. Isto é, há imunidade individual e imunidade de rebanho interagindo para a redução do risco da doença. Contudo, nos anos seguintes, as crianças imunes vão crescendo e saindo da faixa etária de maior risco para a doença, enquanto novas crianças vão nascendo e aumentando o número de suscetíveis. Esse processo, cíclico, pode facilitar a eclosão de um novo surto e isso de fato ocorre enquanto o vírus continua circulando. A Figura 6 mostra a variação cíclica na incidência de sarampo na cidade de São Paulo. Mesmo nos períodos em que não houve surtos epidêmicos com grande aumento do número de casos da doença, como entre 1975 e 1983, houve aumento cíclico da incidência mensal. A importância epidemiológica desta variação cíclica pode ser mais bem apreciada, quando se recorda que no início dos anos 1980, o sarampo foi a segunda principal causa de morte (em seguida à pneumonia) no grupo etário de um a cinco anos (Antunes & Waldman, 2002). 14 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 6. Incidência mensal de sarampo na cidade de São Paulo, 1960-1993. Fonte: Waldman & Rosa (1998) Além da variação cíclica, a Figura 6 também apresenta uma acentuada tendência crescente na década de 60, com posterior tendência decrescente. O declínio do sarampo na cidade foi associado a melhorias gerais das condições de vida e à introdução e aumento de cobertura da vacinação nesse período (Antunes & Waldman, 2002). 1.4 Ruído e variação aleatória Em janeiro de 2012, o regente da Orquestra Filarmônica de Nova York interrompeu a execução da Nona Sinfonia de Gustav Mahler quando um telefone celular começou a tocar na plateia. Os músicos ficaram aturdidos com o barulho. A desatenção momentânea interrompeu sua percepção de ritmo, distraiu-lhes do curso da melodia e impossibilitou a manutenção do sincronismo necessário para a harmonia. Seguindo o paralelo entre música e análise de séries temporais, qual seria o elemento de variação das medidas epidemiológicas organizadas no tempo que propiciaria tamanha perturbação na percepção de tendências, associações e variações sazonal e cíclica? A variação aleatória das medidas é, para as séries temporais, o equivalente ao ruído para a música. A variação aleatória manifesta-se visualmente na forma de rugosidade nas linhas dos gráficos de séries temporais. Ao rever as figuras anteriores, pode-se notar que a variação aleatória afeta todas as séries temporais delineadas, e coexiste com os demais movimentos que foram descritos neste texto. 15 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE A variação aleatória na análise de séries temporais é definida como “flutuações irregulares e erráticas que não são importantes em si mesmas, e que são causadas por fatores que ocorrem ao acaso e não podem ser antecipados, detectados, identificados ou eliminados” (Gaynor & Kirkpatrick, 1994). Curiosamente, o termo ‘ruído’ é efetivamente empregado para referenciar a variação aleatória na análise de séries temporais. A comparação visual das figuras anteriores propicia o reconhecimento de que há mais variação aleatória na Figura 4 que na Figura 3; isto é, a primeira é mais “rugosa” que a segunda. Isto é fácil de compreender, uma medida tomada a cada dia, como na Figura 4, é decerto mais susceptível a variações aleatórias do que uma medida tomada a cada ano, como na Figura 3. Não é raro que os surtos epidêmicos ocorram de forma brusca e inesperada. Na análise de uma série temporal, o que diferencia um surto epidêmico da variação aleatória? Reveja a definição de variação aleatória no início do parágrafo anterior; surtos epidêmicos não se enquadram nessa definição. Mesmo quando escapam ao controle, os surtos epidêmicos não ocorrem ao acaso e o esforço de analisar as séries temporais vem justamente no sentido de os antecipar e prevenir. Por sua magnitude, os surtos epidêmicos não podem ser reduzidos a variações irregulares e erráticas. E, seguramente, não são desimportantes. Conclusão Tendência; sazonalidade e variação cíclica; estudos de associação e variação aleatória. Conhecemos agora os principais movimentos da análise de séries temporais. A definição desses movimentos foi fortemente apoiada na disposição gráfica das séries temporais. O recurso gráfico é o primeiro passo para compreender os processos subjacentes às medidas sequenciais ordenadas temporalmente. Esse primeiro passo é importantíssimo e não deve ser subestimado. Sempre fazer o gráfico da série temporal é imperativo para viabilizar seu estudo e compreensão. A reflexão sobre a disposição visual da série deve usar os conceitos desenvolvidos nesta primeira seção. Sabendo o que deve ser procurado nas séries temporais, podemos partir para o Módulo 2, na qual são apresentados e exercitados os métodos práticos para esta análise. 16 MÓDULO 2 Séries temporais: aspectos metodológicos da organização das medidas de doenças no tempo profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE SÉRIES TEMPORAIS: ASPECTOS METODOLÓGICOS DA ORGANIZAÇÃO DAS MEDIDAS DE DOENÇAS NO TEMPO Neste módulo, serão apresentados os recursos metodológicos para a análise epidemiológica das séries temporais. O primeiro item aborda a estimação de tendências, e busca operacionalizar procedimentos para avaliar se a série é crescente, decrescente ou estacionária, além de quantificar a porcentagem média de mudança (crescimento ou declínio) anual, mensal ou semanal da série temporal. O segundo item focaliza a variação sazonal das séries temporais, e apresenta uma metodologia para avaliar se esta variação é estatisticamente significante ou pode ser atribuída ao acaso. Em ambos os itens, se emprega o recurso da análise de regressão linear. Por fim, o terceiro item sintetiza um recurso técnico para explorar analiticamente a disposição visual das séries temporais. Complementando a apresentação dos métodos de análise das séries temporais, esta seção contém quatro atividades práticas com exercícios de aplicação. 2.1 Estimar tendências Nunca é demais insistir que, para qualquer finalidade, na análise de séries temporais, o primeiro passo deve ser sempre a disposição gráfica da sequência de valores. Isso ajuda a organizar o conhecimento prévio que se tem sobre o assunto que está sendo estudado, e contribui para delinear os procedimentos analíticos que deverão ser realizados. Quando se trata de estimar a tendência, o simples esforço de apreciar visualmente a série temporal de interesse contribui muito para orientar a análise. Vimos que as séries temporais podem ter tendência crescente, decrescente ou estacionária. Podem também apresentar tendências diferentes em trechos sequenciais. Para dar conta desta complexidade, uma alternativa consiste em utilizar funções matemáticas que melhor se ajustem aos pontos observados, seja para a série temporal como um todo, seja para o segmento que estiver em foco. Para explorar a disposição gráfica e inspeção visual das séries temporais, e para introduzir os recursos de análise que permitem determinar quantitativamente suas tendências, consideremos um exemplo de aplicação, relativo à evolução temporal da aids em alguns países europeus. É conhecida a associação entre aids e condição socioeconômica (Farias & Cardoso, 2005). De modo geral, estratos sociais mais afetados pela privação material tendem a ser mais reticentes às medidas de prevenção e proteção individual, o que os submete a risco mais elevado 18 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE para contrair a doença. Quando contraem a doença, as pessoas menos escolarizadas e/ou mais pauperizadas tendem a ter mais dificuldade para manter a adesão ao protocolo de medicação antirretroviral, o que as submete a risco mais elevado de óbito. Com base nestas indicações, poderíamos nos perguntar sobre a evolução temporal dos indicadores epidemiológicos da aids em alguns países europeus com diferentes perfis socioeconômicos. Como a doença progrediu em países ricos e com serviços de saúde relativamente bem organizados (como Inglaterra, Alemanha e Finlândia)? Como a doença progrediu em um país mais pobre, como a Hungria? E num país emergente, como a Rússia? A Figura 7 mostra as séries temporais da incidência de AIDS nesses países, no período para o qual havia dados disponíveis na European Health for All Database (HFA-DB), que é a base de dados sobre saúde mantida pela Organização Mundial da Saúde, em seu escritório regional para a Europa. Nota-se uma marcante expansão da epidemia nos países mais ricos até meados da década de 1990. Essa expansão foi maior no Reino Unido (Inglaterra, Escócia, Irlanda do Norte e País de Gales), um pouco menor na Alemanha e ainda menos intensa na Finlândia. Nos países de renda menos elevada, Rússia e Hungria, sequer se chegou a notar uma expansão da epidemia. O que justifica o sensível crescimento da incidência de aids no Reino Unido, na Alemanha e na Finlândia até meados dos anos 1990? Por que a epidemia retrocedeu subsequentemente? Estes países teriam adotado programas efetivos de prevenção? A introdução da terapêutica antirretroviral em meados da década de 1990 teria exercido algum efeito sobre a redução de incidência? Seriam confiáveis os dados de incidência da aids na Rússia e Hungria? Uma busca no PubMed por artigos científicos que tenham se aplicado a essa temática poderia auxiliar a desdobrar essas questões. 19 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 7. Incidência de aids em alguns países europeus. Fonte: European health for all database. https://gateway.euro.who.int/en/hfa-explorer/ Figura 8. Mortalidade por aids em mulheres, em alguns países europeus. Fonte: European mortality database. https://gateway.euro.who.int/en/hfa-explorer/ 20 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 9. Mortalidade por aids em homens, em alguns países europeus. Fonte: European mortality database. https://gateway.euro.who.int/en/hfa-explorer/ Os indicadores de mortalidade são consistentemente menos elevados para mulheres (Figura 8) que para homens (Figura 9) nos países monitorados. A Alemanha, que havia experimentado uma evolução de incidência menos elevada que o Reino Unido, manteve uma mortalidade mais elevada durante todo o período de monitoramento. Não obstante a conhecida diferença socioeconômica entre Finlândia e Hungria, os dois países mantiveram padrões análogos para as séries temporais de mortalidade por aids em ambos os sexos. A Rússia, surpreendentemente, teve uma enorme expansão da mortalidade por aids, tanto para homens como para mulheres, na década de 2000, período em que já era disponível a terapêutica antirretroviral, cujo efeito de redução dos indicadores populacionais de mortalidade por AIDS é conhecido (Antunes et al., 2005). Que hipóteses poderiam ser aventadas para explicar esses resultados? A expansão da mortalidade reflete o aumento real dos óbitos causados pela doença? Será que, ao menos em parte, essa expansão se deve a mudanças no registro da causa básica de morte, passando progressivamente a reconhecer a letalidade da doença? Na Figura 9, observa-se uma importante redução da mortalidade de homens por AIDS, na Alemanha e no Reino Unido, a partir de meados dos anos 90. Independente da magnitude da mortalidade ter sido mais elevada na Alemanha, a inspeção visual das séries parece indicar que o declínio foi equivalente nos dois países. Será que isto de fato ocorreu? É possível comparar quantitativamente as duas tendências? 21 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE A ideia de quantificar a tendência tem justamente o intuito de permitir a comparação entre diferentes séries temporais ou diferentes segmentos de uma mesma série temporal. O procedimento de estimação quantitativa da tendência demanda aplicação estatística, mas o esforço é recompensado pelo campo de possibilidades que se abre para a interpretação dos dados epidemiológicos. A metodologia descrita em seguida foi originalmente publicada por Antunes e Waldman (2002). Considerando o traçado da reta de melhor ajuste entre os pontos da série temporal, ou de um de seus trechos, para o qual se pretende estimar a tendência, poderíamos escrever a equação da reta indicada na Figura 10, da seguinte forma: Fórmula 1: equação de regressão linear com componente de tendência Y = b0 + b1X Considere Y como sendo a medida dos valores da série temporal, e X a medida dos anos, ou de outra unidade temporal na qual os valores de Y tenham sido monitorados. O valor de ‘b0’ corresponde à interseção entre a reta e o eixo vertical; de fato, quando X = 0, temos, na equação acima, Y = b0. O valor de ‘b1’ corresponde à inclinação da reta; para cada mudança de uma unidade na escala de X, o valor de Y é acrescido de ‘b1’ unidades. Naturalmente, se b1 for positivo, a reta é crescente, e valores mais elevados de b1 indicam retas mais inclinadas no sentido vertical. De modo complementar, se b1 for negativo, a reta é decrescente, e se b1 não for diferente de zero, a reta é paralela ao eixo X e qualquer variação de X não modifica os valores de Y, configurando a condição para a tendência estacionária. Para mensurar a taxa de variação da reta que ajusta os pontos da série temporal, é preciso focalizar o valor de b1, cuja estimação é feita por meio da análise de regressão linear. Para esse fim, vamos trabalhar com a transformação logarítmica dos valores de Y, o que propicia vantagens de ordem estatística para a aplicação da análise de regressão linear, como a redução da heterogeneidade de variância dos resíduos da análise de regressão; isto é, dos valores da diferença entre os pontos da reta média e os pontos da série temporal. Além disso, essa transformação favorece o cômputo da razão de incremento anual da série temporal, por meio do procedimento descrito em seguida. 22 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Consideremos X1, X2, X3, ..., Xi, ..., Xn como sendo os valores dos anos para os quais foram tomadas as medidas Y1, Y2, Y3, ..., Yi, ..., Yn. Então, para qualquer ano “X(i)” e seu ano subsequente “X(i+1)”, podemos escrever que: logY(i) = b0 + b1X(i); e logY(i+1) = b0 + b1X(i+1) Fazendo a diferença de ambos os termos das duas equações, teremos: logY(i+1) – logY(i) = b0 + b1X(i+1) – b0 – b1X(i) = b1[X(i+1) – X(i)] Como X(i+1) e X(i) são anos subsequentes, sua diferença é sempre igual a um. E, usando propriedades da álgebra de logaritmos, teremos: logY(i+1) – logY(i) = log[Y(i+1)/Y(i)] = b1; ou Y(i+1)/Y(i) = 10^b1 Nesta notação, o acento circunflexo corresponde à operação exponencial e deve ser lido como “elevado a”. Então, subtraindo 1 de ambos os lados da equação, teremos: Y(i+1)/Y(i) – 1 = –1 + 10^b1; ou: [Y(i+1) – Y(i)]/Y(i) = – 1 + 10^b1 Mas [Y(i+1) – Y(i)]/Y(i) é justamente a taxa de crescimento médio anual, pois foi dimensionada para qualquer ano genérico “i”. Basta, então, estimar o valor de b1 para obtermos a taxa de crescimento médio anual. Observe que esta taxa pode ser apresentada como proporção ou como porcentagem. Se a taxa for positiva, a série temporal é crescente, se for negativa é decrescente, e será estacionária se o seu valor não for significantemente diferente de zero. Como o valor de b0 é calculado por meio de regressão linear, é possível empregar o erro padrão (EP) da estimativa de b1 para construir o intervalo de confiança (IC95%) desta medida. Com isso, teremos uma expressão sintética para a estimação quantitativa da tendência: Fórmula 2: Taxa de incremento anual e intervalo de confiança (95%) Taxa de incremento anual = – 1 + 10^b1 IC (95%) = – 1 + 10^b1máximo; – 1 + 10^b1mínimo 23 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Nesta fórmula, tanto o valor de b, como os valores de b1máximo e b1mínimo são fornecidos por análise de regressão linear, disponível em muitos softwares de análise estatística. No entanto, é importante notar que a análise de regressão linear simples não se presta à análise de séries temporais, pois a autocorrelação serial usualmente encontrada em medidas de dados populacionais induz o rompimento de uma premissa desse método, que é resíduos de regressão com distribuição aleatória. Para superar essa dificuldade, é preciso recorrer a outras rotinas de análise de regressão linear, que não sejam a regressão linear simples. As mais utilizadas são as técnicas de Prais-Winsten e Cochrane-Orcutt, ambas desenvolvidas para a aplicação em séries temporais e que são facilmente executáveis em programas de informática para análise estatística que são empregados na área de saúde, como o pacote R, Stata e SPSS. Sendo dois procedimentos diferentes para a mesma finalidade, seus resultados não serão exatamente coincidentes. Apesar de alguma diferença em casas decimais dos resultados, suas interpretações (tendência crescente, decrescente ou estacionária) dificilmente diferirão. Nas séries temporais da mortalidade por aids (Figuras 8 e 9), foi verificado um impressionante crescimento na Rússia, tanto para homens como para mulheres. Independente de a mortalidade ser maior em homens que em mulheres, para qual desses grupos o crescimento terá sido mais intenso? Usando a metodologia acima descrita, encontra-se taxa de crescimento anual de 3,96% (Intervalo de Confiança 95%: 3,59% a 4,33%) para homens e 4,59% (IC95%: 3,77% a 5,43%) para mulheres. Esses valores são indicativos de tendência crescente para ambas as séries. Como há grande superposição entre os intervalos de confiança, sugere-se a hipótese de não ser significante a diferença entre as duas taxas de crescimento anual. O que poderia justificar tamanho incremento da mortalidade por aids na Rússia, num período em que houve declínio em vários países? Para testar a hipótese de que esse aumento reflete o aumento da capacidade de reconhecer a aids como causa básica de morte, poderíamos traçar as séries temporais da proporção de óbitos por causa básica não determinada ou mal especificada. Se a magnitude desta proporção for elevada, reforça-se a hipótese de que é ruim a qualidade do registro de informações de mortalidade naquele país. Se a tendência da série temporal da proporção de óbitos sem identificação de causa for decrescente nos últimos anos, reforça-se a hipótese de que o aumento recente da mortalidade por aids reflete, ao menos em parte, o aumento de capacidade do sistema de informações em reconhecer os óbitos causados pela aids. Quando a mesma análise é aplicada para a mortalidade de homens por aids na Alemanha, a partir de 1994, encontra-se taxa de crescimento anual de –9,70% (IC95%: –15,80% a –3,16%). O sinal negativo indica que a tendência é decrescente, e a magnitude desses números indica a intensidade do declínio médio anual desta medida. Como o intervalo de confiança não inclui o valor de zero, a hipótese de tendência estacionária é excluída. Por fim, quando se analisa a mortalidade por AIDS em homens na Hungria, encontra-se taxa de crescimento anual de –0,15% (IC95%: –6,48% a +6,62%). Esse resulta24 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE do é muito pequeno, próximo de zero, e o intervalo de confiança vai de valores negativos a valores positivos. Essas indicações são compatíveis com a hipótese de que a tendência é estacionária, e que a epidemia não progrediu com mais intensidade na Hungria. Naturalmente, também esse resultado é sujeito a restrições de validade relativas à qualidade do registro, naquele país, das causas de óbito em geral, da mortalidade por aids em particular. ATIVIDADE 1 Tendência da mortalidade infantil em dois Estados brasileiros Objetivo: ao final desta atividade os estudantes serão capazes de testar hipóteses quanto à tendência crescente, decrescente e estacionária das séries temporais e verificar sua correspondência para medidas de mortalidade infantil em dois estados brasileiros. O censo de 2010 levantou dados sobre a renda domiciliar média nos Estados, indicando São Paulo como o valor mais elevado no país, e Maranhão como o menor. Conhecendo a associação entre mortalidade infantil e condição socioeconômica, pode-se perguntar sobre a diferença entre os dois Estados, no que diz respeito à tendência da mortalidade infantil. Esta atividade visa testar esta hipótese. Entre no site do DATASUS (http://www2.datasus.gov.br/DATASUS/index.php) e clique em <Informações de Saúde (TABNET)> e depois em <Estatísticas Vitais>. Na página que se abre, solicite <Nascidos vivos> e <Óbitos infantis> (menu de <Mortalidade>) independentemente para cada Estado de interesse (São Paulo e Maranhão). Registre em uma planilha do Excel os valores obtidos, para cada Estado, do número de óbitos com menos de um ano de idade e de nascidos vivos a cada ano. Divida as duas medidas e multiplique o resultado por 1000, para obter o coeficiente de mortalidade infantil. Verifique se os resultados conferem com os dados da Tabela 1. Com esses dados, delineie os gráficos das séries temporais da mortalidade infantil nos dois Estados, tentando reproduzir a Figura 11. 25 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE A inspeção visual do gráfico sugere tendência decrescente em São Paulo e estacionária no Maranhão. Utilize o procedimento de estimação de tendências para verificar se estas hipóteses se confirmam estatisticamente. Para esta finalidade, calcule o logaritmo dos valores anuais do coeficiente de mortalidade infantil, transfira os dados para um dos programas que efetuam análise estatística de séries temporais, e calcule o valor do coeficiente b (e seu respectivo intervalo de confiança) da análise de regressão pelo procedimento de Prais-Winsten. Tabela 1. Coeficiente de mortalidade infantil em São Paulo e Maranhão, 1996-2010. Fonte: DATASUS São Paulo Ano Óbitos (menos de um ano de idade) Nascidos vivos Mortalidade infantil (por 1000 nascidos vivos) 1996 15710 699013 22,47 1997 15159 701947 21,60 1998 13756 693413 19,84 1999 12796 714428 17,91 2000 11922 687779 17,33 2001 10437 632483 16,50 2002 9534 623302 15,30 2003 9273 610555 15,19 2004 8959 618080 14,49 2005 8353 618880 13,50 2006 8078 603368 13,39 2007 7774 595408 13,06 2008 7585 601795 12,60 2009 7482 598473 12,50 2010 7163 601352 11,91 26 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Maranhão Ano Óbitos (menos de um ano de idade) Nascidos vivos Mortalidade infantil (por 1000 nascidos vivos) 1996 1069 61056 17,51 1997 1213 75392 16,09 1998 1501 79272 18,93 1999 1543 96587 15,98 2000 1898 100811 18,83 2001 2188 108527 20,16 2002 2425 117917 20,57 2003 2473 127920 19,33 2004 2213 126518 17,49 2005 2465 130266 18,92 2006 2240 127724 17,54 2007 2164 127307 17,00 2008 2110 128302 16,45 2009 2051 123635 16,59 2010 1860 119566 15,56 27 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 11. Coeficiente de mortalidade infantil nos Estados de São Paulo e Maranhão. Séries temporais, 1996-2010. Fonte: DATASUS Na sequência, são apresentadas as telas do Stata para o cálculo da tendência em São Paulo. Para transferir os dados do Excel, copie e cole no <Data editor> do Stata. A Tela 1 mostra como solicitar a análise de Prais-Winsten. No varal de opções do programa, clique em <Statistics>, <Time series> e <Prais-Winsten regression>. 28 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tela 1. Como solicitar a análise de regressão de Prais-Winsten no Stata. 29 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tela 2. Como indicar as variáveis de interesse para a análise de Prais-Winsten. 30 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tela 3. Como definir a série temporal. 31 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tela 4. Resultados obtidos para a análise de regressão de Prais-Winsten (dados de São Paulo). Na sequência, são apresentadas as telas do Stata para o cálculo da tendência em São Paulo. Para transferir os dados do Excel, copie e cole no <Data editor> do Stata. A Tela 1 mostra como solicitar a análise de Prais-Winsten. No varal de opções do programa, clique em <Statistics>, <Time series> e <Prais-Winsten regression>. No quadro que se abre (Tela 2), registre a variável dependente intitulada logcmi (logaritmo do coeficiente de mortalidade infantil) e a variável independente (ano). Ainda na Tela 2, clique em <Time settings> para definir a sequência de dados como sendo uma série temporal. Na tela que se abre (Tela 3), registre o nome da variável que marca o tempo (ano) e clique no tipo de variação temporal (Yearly) como indicado na Tela 3. Por fim, a Tela 4 mostra o resultado da análise, com as setas indicando os valores do coeficiente relativo à variação anual e seu respectivo intervalo de confiança. 32 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Aplique os valores obtidos para o coeficiente e o intervalo de confiança (relativos à variável “ano”) na Fórmula 2, e verifique que a taxa de crescimento anual da mortalidade infantil em São Paulo foi de –9,86%, com intervalo de confiança de –7,87% a –11,81%. Repita o procedimento substituindo os dados de São Paulo pelos dados do Maranhão para exercitar esta técnica. Os valores obtidos para São Paulo comprovam a hipótese de tendência decrescente. A taxa de incremento anual delimita a intensidade da tendência; além de ser significantemente decrescente, este resultado aponta uma intensidade de declínio de tal ordem que reduziu a mortalidade infantil a cerca de metade de seu valor durante o período monitorado, como pode ser apreendido visualmente na Figura 11. Já no Maranhão, a taxa de incremento anual foi de –0,62% ao ano, com IC95% de –2,06% a +0,84%. Esses resultados, como vimos, são compatíveis com a hipótese de tendência estacionária. Como interpretar esses resultados? Qual a gravidade deste achado de tendência estacionária para a mortalidade infantil no Estado mais pobre do país durante todo esse período? 33 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE ATIVIDADE 2 Tendência da mortalidade infantil em dois municípios brasileiros Objetivo: fixar as competências desenvolvidas na Atividade 1, repetindo as descrições e análises com sobre séries temporais do coeficiente de mortalidade infantil mas agora utilizando outras bases de dados. O Escritório Regional no Brasil do Programa das Nações Unidas para o Desenvolvimento (PNUD) identificou São Caetano do Sul, em São Paulo, e Manari, em Pernambuco, como sendo as cidades com, respectivamente, o mais elevado (0,919) e o menor valor (0,467) do índice de desenvolvimento humano dos municípios no Brasil em 2010. Levando em consideração a estreita relação entre esta medida e a mortalidade infantil, poderíamos comparar as tendências das séries temporais da mortalidade infantil nestas duas cidades. Repita os passos iniciais da atividade anterior; isto é, entre no site do DATASUS (http://www2.datasus.gov.br/DATASUS/index.php) e clique em <Informações de Saúde (TABNET)> e depois em <Estatísticas Vitais>. Na página que se abre, solicite <Óbitos infantis> e <Nascidos vivos> independentemente para cada Estado de interesse (São Paulo e Pernambuco). Quando estiver solicitando <Óbitos infantis>, indique <Município> na linha, <Ano do óbito> na coluna e <Óbitos p/residência> no conteúdo. Lembre-se de selecionar todos os anos do período de interesse. Na tabela que se abre, registre (por exemplo, copiando e colando) a linha relativa a São Caetano do Sul e a Manari. Agora repita o procedimento solicitando o número de nascidos vivos a cada ano nos dois municípios. Em uma planilha do Excel, registre os valores obtidos para cada cidade e calcule o coeficiente de mortalidade infantil dividindo o número de óbitos a cada ano pelo número de nascidos vivos e multiplicando o resultado por 1000. 34 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Com base nas séries temporais obtidas, faça o gráfico no Excel e calcule o valor da tendência nos dois municípios. Compare a magnitude dos valores: qual das duas cidades teve padrão mais elevado de mortalidade infantil? Qual é a tendência deste índice em São Caetano do Sul? E em Manari? Verifique que há rugosidade acentuada (variação aleatória) nas séries temporais delineadas. Esse efeito foi maior para as medidas aferidas para cidades nesta atividade, do que para as medidas aferidas para estados, como na Atividade 1. Observe que a variação aleatória foi maior para a cidade de Manari, o que pode ter prejudicado a aferição da tendência da mortalidade infantil nesta cidade. Procure refletir sobre os possíveis motivos do aumento da variação aleatória. Ao focalizar cidades, em vez de estados, o número mais reduzido de eventos pode prejudicar a análise. Nesse sentido, é importante fazer a crítica da base de dados. O número de óbitos infantis a cada ano em São Caetano do Sul e Manari pode não ser suficientemente elevado para permitir uma análise estável. 2.2 Modelar sazonalidade Vimos que as séries temporais podem ter variação sazonal. O termo se refere à sazão, palavra pouco usual atualmente, que é sinônimo de estação. Com isso, quando se identifica repetições em períodos mais extensos (dois anos ou mais), isto é, que não são relativas às estações, fala-se que o fenômeno tem variação cíclica, em vez de sazonal. Para identificar se há variação sazonal, é preciso decompor a série temporal, isolando o componente sazonal e verificando se atende à hipótese de significância estatística. Essa decomposição usa a equação de regressão linear com componentes específicos para aferir a tendência e sazonalidade. As variações sazonais podem ser aferidas por meio de medidas tomadas mês a mês, semana a semana ou dia a dia. Vamos estudar uma metodologia prática para determinar se há ou não há variação sazonal estatisticamente significante. O procedimento descrito a seguir consiste na forma mais simples de decomposição das séries temporais e foi originalmente proposto por Serfling (1963). Será preciso isolar o componente sazonal e verificar se ele atende à hipótese de significância estatística. 35 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Uma primeira consideração diz respeito à forma de registro do tempo nas avaliações de sazonalidade. É preciso reconhecer que há alguma irregularidade nesse registro. Se as medidas foram tomadas mês a mês, são utilizados os meses do calendário, enumerando-os sequencialmente (1, 2, 3, ..., mês genérico “i”, ..., mês final “n”). Mas sabemos que os meses não são exatamente iguais entre si. Alguns têm 30 dias, outros têm 31, e fevereiro tem 28 ou 29 dias, dependendo do ano. Apesar disso, é fácil representar os dados segundo o mês de sua ocorrência no calendário, mesmo reconhecendo que os meses não são regulares no número de dias. Uma dificuldade análoga é encontrada quando se trabalha com dados discriminados por semana. O ano não pode ser dividido de modo exato por semanas de sete dias. Para lidar com esta dificuldade, considera-se que cada ano é dividido em 52 semanas epidemiológicas, o que obriga uma ou duas semanas a ter oito dias, dependendo se o ano é bissexto ou não. Quando os dados forem discriminados dia a dia, a solução encontrada para manter a regularidade de 365 dias ao ano consiste em considerar que o registro relativo ao dia 29 de fevereiro é acrescido ao dia antecedente, ou são considerados em média. Estas soluções não são ideais, mas são aproximações plausíveis, factíveis e necessárias. Trabalharemos com meses que diferem entre si quanto ao número de dias. Teremos semanas cuja extensão de sete dias terá pelo menos uma exceção a cada ano. Se os dados forem diários, nos anos bissextos, o dia 29 de fevereiro deverá ser aritmeticamente integrado ao dia anterior, para não romper a frequência de 365 dias por ano, que é necessária para a análise estatística. Para avaliar se a variação existente na série temporal tem ou não tem alguma regularidade sazonal, será preciso decompor a série temporal em dois componentes, utilizando a equação de regressão linear, aos moldes do que foi apresentado na Figura 10. Para atender ao requisito de modelar a variação sazonal, a equação de regressão é escrita como indicado na Fórmula 3: Fórmula 3: equação de regressão linear com componente sazonal Y(i) = b0 + b1*X(i) + b2*sen[2πX(i)/L] + b3*cos[2πX(i)/L] Nesta equação, Y(i) é a medida da série temporal para cada medida diária, semanal ou mensal correspondente ao momento genérico “i” e X(i) é a numeração sequencial dos momentos de tomada da medida (dia, semana, mês). π é a conhecida constante 3,141592654... e L é uma constante relativa à forma da medida: 12 se a medida for mensal, 52 para medidas semanais e 365 para medidas diárias. Quanto aos coeficientes de regressão, b0 é a constante ou intercepto, b1 é o estimador de tendência da série temporal e b2 e b3 são os coeficientes que modelam a variação sazonal. Esta equação decompõe a série temporal em duas componentes, um para a tendência, outro para a sazonalidade. 36 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Uma vez calculada a série de valores do termo sazonal, pode-se executar a análise de regressão linear para estimar os coeficientes de regressão b0, b1, b2 e b3, e seus respectivos intervalos de confiança 95%. De modo análogo ao que fora informado ao estimar a tendência, reitera-se a indicação para não utilizar regressão linear simples para análise de séries temporais, pois um dos requisitos para esta modalidade de análise é que os resíduos da equação de regressão sejam aleatórios, o que não ocorre com medidas populacionais organizadas no tempo, as quais frequentemente apresentam autocorrelação serial elevada. A autocorrelação serial tem como efeito superestimar os indicadores de qualidade de ajuste da equação de regressão, o que, em muitos casos, implica em inversão das conclusões da análise estatística, fazendo com que variações pouco expressivas tendam a ser indevidamente indicadas como significantes. Nesse sentido, deve-se utilizar os procedimentos de Prais-Winsten ou de Cochrane-Orcutt para a análise de regressão linear em séries temporais. Na equação de regressão, se os coeficientes b2 e/ou b3, relativos ao seno e cosseno do termo sazonal, forem estatisticamente diferentes de zero (conforme indicado pelo IC95% ou por valores de p < 0,05), conclui-se que há variação sazonal significante. De modo complementar, conclui-se que a variação sazonal observada em uma série temporal pode ser atribuída ao acaso, se estes coeficientes não forem significantes, isto é, não diferirem estatisticamente de zero no teste de hipótese (p > 0,05 ou IC95% incluindo o zero). Para exercitar a metodologia de detecção de variação sazonal nas séries temporais, vamos considerar um problema prático de pesquisa. A Figura 12 mostra a série temporal da mortalidade de idosos (65 anos ou mais) por gripe e pneumonia nas regiões Nordeste e Sul do Brasil, do início de 1999 ao fim de 2009. Para favorecer a comparação visual, as séries temporais da mortalidade observada foram acompanhadas pelas séries da mortalidade esperada e pelo limiar epidêmico em cada região, de modo análogo à Figura 5. Sabe-se que a mortalidade por gripe e pneumonia é maior nos períodos mais frios do ano (Antunes et al., 2007). Mas há pouca variação climática entre o inverno e o verão no Nordeste, o que justifica avaliar a hipótese de que não seja estatisticamente significante a variação sazonal observada na mortalidade de idosos por gripe e pneumonia nesta região. Uma primeira observação diz respeito ao fato de que a série tem tendência estacionária na região Sul e crescente na região Nordeste. No estudo do qual esta imagem foi reproduzida, esta diferença foi interpretada como sendo devida ao progressivo aumento da capacidade do Sistema de Informações sobre Mortalidade em identificar as causas básicas de óbito em idosos residentes no Nordeste; enquanto, na região Sul, esta capacidade já era elevada desde o início do monitoramento. 37 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE A magnitude dos coeficientes de mortalidade é menor na região Nordeste que na Sul. Observe, inclusive, que a escala vertical utilizou valores menos elevados para a região Nordeste. Também a amplitude de variação entre as estações, a cada ano, é menor na região Nordeste que na região Sul. Estas observações podem induzir a hipótese de que a variação sazonal da mortalidade de idosos por gripe e pneumonia na região Nordeste não seja estatisticamente significante. Vamos empregar a metodologia sintetizada na Fórmula 3 para testar esta hipótese. Figura 12. Séries temporais da mortalidade semanal de idosos (65 anos ou mais) por influenza e pneumonia nas regiões Sul e Nordeste, 1999-2009. Mortalidade observada, mortalidade esperada e limiar epidêmico previsto. Fonte: Oliveira (2013) Com base na aplicação dos valores observados da série temporal da mortalidade de idosos por gripe e pneumonia na região Nordeste, a Fórmula 3 permite encontrar os seguintes coeficientes de regressão: b2 = 0,229 e b3 = –0,221. Os intervalos de confiança das duas medidas incluem o zero e os valores de p correspondentes são, respectivamente, p = 0,069 para o coeficiente relativo ao seno (b2) e p = 0,074 para o coeficiente relativo ao cosseno (b3). Com base nesses dados, concluímos que não houve variação sazonal significante do ponto de vista estatístico (p > 0,05) na mortalidade de idosos por gripe e pneumonia na região Nordeste. 38 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Quando o mesmo procedimento é aplicado à região Sul, os valores encontrados apontam a conclusão inversa. Foram calculados os seguintes valores para os coeficientes de regressão: b2 = –0,553 e b3 = –0,846. Para ambos, os valores de p foram menores que 0,001. Em outras palavras, a variação sazonal na medida de interesse, para a região Sul, não pode ser considerada como tendo ocorrido ao acaso, e a variação sazonal na mortalidade de idosos por gripe e pneumonia na região Sul é considerada estatisticamente significante. ATIVIDADE 3 Avaliação de sazonalidade na incidência de leptospirose Objetivo: ao final desta atividade os estudantes serão capazes de formular hipóteses sobre a variação sazonal em séries temporais e testar essas hipóteses utilizando a análise de regressão linear segundo o procedimento de Prais-Winsten. Sabe-se que o período de verão é mais chuvoso no Estado de São Paulo, enquanto o inverno tem clima mais seco. As chuvas de verão são fortes e intensas, o que propicia alagamentos nos grandes centros urbanos. Esta condição pode favorecer a transmissão da leptospirose. Nesta atividade, vamos testar a hipótese de variação sazonal na incidência desta doença no Estado de São Paulo. No site do DATASUS (http://www2.datasus.gov.br/DATASUS/index.php), para acessar dados do Sistema de Informação de Agravos de Notificação (SINAN), é preciso selecionar <Informações de Saúde (TABNET)>; <Epidemiológicas e Morbidade>; e <Doenças e Agravos de Notificação (SINAN)>. Para “leptospirose”, é possível selecionar o período de interesse, com dados discriminados por mês e ano dos primeiros sintomas. Transfira os dados para o Excel e tente delinear para o período mais recente o gráfico análogo à Figura 13, que informa o período de 2001 a 2006. 39 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE A percepção visual de variação sazonal coincide com a hipótese formulada no primeiro parágrafo desta Atividade. A incidência de leptospirose é mais elevada nos meses de janeiro a março de todos os anos do monitoramento. Resta saber se essa variação é estatisticamente significante. Figura 13. Série temporal da incidência mensal de leptospirose no Estado de São Paulo, 2001-2006. Fonte: Sistema de Informação de Agravos de Notificação – SINAN Para esta finalidade, transfira os dados da série temporal para os programas de análise estatística que efetuam a análise de regressão linear segundo o procedimento de Prais-Winsten e procure avaliar os valores de b2 e b3 da fórmula 3. Na análise dos dados que geraram a Figura 13, os valores obtidos foram b2 = 42,393 (erro padrão 5,938) e b3 = 21.921 (erro padrão 5,821). Ambos os resultados resultam em p < 0,001, indicando a conclusão de que a variação sazonal é estatisticamente significante. 40 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 2.3 Alisamento das séries temporais Nas seções anteriores, procuramos mostrar a complexidade da análise de variação das séries temporais, com as várias dimensões que são relevantes e devem ser consideradas na apreciação visual dos gráficos: tendências, variações cíclicas, sazonalidade, variações aleatórias. Procuramos, também, sublinhar a importância da disposição gráfica das séries temporais. No entanto, a variação aleatória nas séries temporais, como o ruído na música, pode prejudicar a percepção dos componentes mais importantes de variação nas séries temporais. Para lidar com esse problema, apresentamos nesse item um recurso metodológico que tem como objetivos instrumentar a análise exploratória das séries temporais, favorecer sua visualização gráfica e evidenciar seus componentes de variação. Vimos que a variação aleatória das séries temporais consiste em flutuações irregulares e erráticas que não são importantes, e são causadas por fatores que ocorrem ao acaso e não podem ser antecipados, detectados, identificados ou eliminados. No entanto, assim como a manifestação de ruído prejudica a percepção da música e de seus componentes (melodia, harmonia e ritmo), a variação aleatória pode dificultar a análise da série temporal e a detecção de sua tendência, seus fatores associados e variação sazonal. Nesse sentido, pode ser importante suprimir, ao menos em parte, a variação aleatória nos gráficos. O recurso que permite reduzir a variação aleatória é o ‘alisamento’ das séries temporais. Este termo deriva, por contraste, da percepção de que a variação aleatória representa certa ‘rugosidade’ no delineamento gráfico da série temporal. Isto é, quando a ‘rugosidade’ causada pela variação aleatória é reduzida, tem-se como resultado uma série temporal ‘alisada’. Fórmula 4: Alisamento de séries temporais por médias móveis simples Sendo Y(1), Y(2), Y(3), ..., Y(i), ... Y(n) os valores da série original, Y’(1), Y’(2), Y’(3), ..., Y’(i), ... Y’(n) os valores da série modificada, e 1, 2, 3, ..., i, ... n, os períodos de referência das medidas. Médias móveis de ordem 2: Y’(i) = [Y(i) + Y(i-1)]/2 Médias móveis de ordem 3: Y’(i) = [Y(i) + Y(i-1) + Y’(i-2)]/3 Médias móveis de ordem k: Y’(i) = {Y[i] + Y[i-1] + ... + Y’[i-(k-1)]}/k 41 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Há diferentes métodos para alisar as séries temporais. Esses métodos consistem em substituir a série de valores originais por uma série de valores modificados. As equações da Fórmula 4 sistematizam o método de médias móveis simples, possivelmente o mais fácil de ser executado. A série temporal fica tanto mais alisada, quanto maior a ordem do procedimento de médias móveis. Observa-se, no entanto, que a adoção de uma ordem muito elevada resulta em supressão de variações mais relevantes. Isto é, não apenas a variação aleatória terá sido reduzida, mas também pode se tornar mais difícil a percepção de tendências e de variação cíclica ou sazonal. A Figura 14 mostra um exemplo de aplicação do procedimento de médias móveis de ordem 3 para a disposição gráfica da série temporal da mortalidade por câncer de orofaringe na cidade de São Paulo. Com a redução da variação aleatória, o gráfico coloca em evidência os elementos de maior significado na comparação visual: a tendência crescente em ambos os grupos etários, e o fato de que os idosos apresentaram maior magnitude de mortalidade pela doença e tendência mais elevada (série mais inclinada em direção ao eixo vertical). Figura 14. Médias móveis (ordem 3) da mortalidade (por 100 mil habitantes) por câncer de orofaringe na cidade de São Paulo, 1980-2002. Fonte: Biazevic et al. (2006) Outro exemplo de aplicação pode ser fornecido para o gráfico da mortalidade de idosos por gripe e pneumonia na região Nordeste. A apresentação de dados semanais resultava uma série com rugosidade, isto é, com acentuada variação aleatória. A Figura 15 reproduz a série original dos valores observados e as séries modificadas com os valores obtidos para o alisamento de médias móveis de ordem 3 e 5. Observe como, de fato, houve alisamento progressivo, sem prejuízo da percepção dos demais componentes da série temporal: tendência estacionária na primeira metade e crescente na segunda, variação sazonal em toda a série. 42 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 15. Série temporal da mortalidade semanal de idosos (65 anos ou mais) por gripe e pneumonia na região Nordeste, 1999-2009. Alisamento por médias móveis (de ordem 3 e 5) para redução da variação aleatória. Fonte: Oliveira (2013) 43 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE ATIVIDADE 4 Alisamento de séries temporais Objetivo: ao final dessa atividade, os estudantes serão capazes de elaborar gráficos de séries temporais, empregando o recurso prático do alisamento por médias móveis para aprimorar a visualização das séries temporais. A Figura 4 pôs em evidência a hipótese de associação entre a mortalidade por todas as causas e a temperatura média diária (Gouveia et al., 2003). Com essa ideia em mente, esta atividade visa exercitar as técnicas de construção de gráficos para as séries temporais, explorando o recurso de alisamento para reduzir a variação aleatória e, assim, enfatizar os demais elementos das séries temporais. A tabela 2 informa o total de óbitos de pessoas com 60 anos ou mais, residentes nos Estados do Ceará e do Rio Grande do Sul. Como as variações climáticas entre inverno e verão são mais intensas na região sul que na região nordeste do país, pode-se testar visualmente a hipótese de haver variação sazonal desta medida no Rio Grande do Sul e não haver no Ceará. Copie e cole esses dados no Excel e construa o diagrama de linhas para ambas as séries. Observe a variação aleatória que aparece nas duas séries sob a forma de rugosidade da linha. Para reduzir esse efeito e pôr em evidência a variação sazonal, construa o gráfico das séries modificadas por meio do recurso de alisamento, com médias móveis de ordem 4. Confira se o resultado obtido coincide com a Figura 16, e responda às seguintes perguntas: Por que a magnitude dos valores foi sempre mais elevada no Rio Grande do Sul que no Ceará? Há variação sazonal nos dois Estados? O alisamento por médias móveis favoreceu a percepção visual da comparação das duas séries quanto à variação sazonal? 44 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tabela 2. Número de óbitos por semana, pessoas com 60 anos ou mais, residentes nos Estados do Ceará e Rio Grande do Sul, 2007-2009. Fonte: DATASUS CE 491 434 478 479 439 445 448 458 493 490 477 501 520 533 449 RS 979 810 770 824 839 796 846 799 861 826 817 855 868 822 868 CE 487 515 525 541 492 512 485 516 512 496 519 457 463 439 432 RS 859 818 837 909 1002 1003 1180 1205 1164 1149 1221 1287 1335 1306 1379 CE 452 465 437 463 445 504 467 489 431 435 478 451 441 436 474 RS 1318 1292 1165 1113 1136 1085 1001 953 1002 954 887 913 891 840 914 CE 409 501 436 438 493 477 463 553 463 481 469 527 498 565 530 RS 881 860 913 916 826 817 833 1044 840 781 782 802 849 834 858 CE 632 516 498 529 552 583 568 602 570 521 551 560 529 548 558 RS 889 844 824 847 812 833 895 886 831 966 1074 1010 940 1021 1014 CE 594 522 532 541 501 522 499 515 482 521 516 476 486 517 525 RS 1165 1167 1131 1107 1064 1054 994 999 1114 1055 999 1003 1006 1062 1063 CE 524 523 479 524 492 498 472 457 454 501 485 446 511 488 570 RS 1017 939 1022 999 886 935 925 870 909 924 897 869 985 861 1035 CE 480 437 532 476 482 498 505 540 596 629 679 618 678 644 612 RS 857 858 898 918 953 879 809 901 800 813 877 875 877 906 867 CE 595 652 591 629 565 596 519 525 531 582 532 536 499 533 499 RS 896 941 924 958 987 1015 1137 1207 1170 1177 1170 1174 1202 1425 1415 CE 489 510 516 523 499 502 521 506 499 494 475 465 508 499 469 RS 1242 1165 1063 1069 963 985 932 1004 1096 1014 969 1017 1099 964 892 CE 495 487 494 504 460 531 RS 941 937 884 898 1007 960 45 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Figura 16. Número de óbitos por semana, pessoas com 60 anos ou mais, residentes nos Estados do Ceará e Rio Grande do Sul, 2007-2009: (1) valores observados; (2) série alisada (médias móveis de ordem 4). Fonte: DATASUS 46 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE MÓDULO 3 Séries temporais interrompidas e avaliação das intervenções em saúde 47 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE SÉRIES TEMPORAIS INTERROMPIDAS E AVALIAÇÃO DAS INTERVENÇÕES EM SAÚDE Uma série temporal é uma sequência de valores de uma característica populacional de interesse, sendo esses valores aferidos de forma repetida com uma frequência regular. Diz-se que há interrupção em uma série temporal é possível identificar visualmente (por meio de dispositivos gráficos) ou por meio de cálculo que houve, em algum momento, uma mudança de nível e/ou tendência nos valores observados (Bernal et al., 2017). O conceito de série temporal interrompida é particularmente interessante quando se pretende avaliar se há associação entre essa mudança de nível e/ou tendência e a ocorrência de eventos, como programas de saúde. A análise de séries temporais interrompidas foi considerada o mais efetivo recurso não experimental para avaliar o efeito longitudinal de intervenções em saúde (Penfold et al., 2013). Entretanto, sua aplicação não se restringe a isso, servindo também para testar hipóteses sobre fatores que modificam o comportamento no tempo das medidas de interesse para a saúde. 3.1 Modelos de regressão segmentada Ajustar modelos de regressão segmentada é um recurso analítico para a análise de séries temporais interrompidas. Para esse fim, é preciso segmentar, algébrica e graficamente, a série temporal. O método sintetizado a seguir foi sistematizado por Wagner et al. (2002). Dois parâmetros definem cada segmento da série: nível e tendência. O nível é o valor inicial da série em cada segmento; a tendência é a mudança percentual dos valores ao longo do período compreendido pelo segmento. A ideia é avaliar se, quando ocorre uma intervenção, há impacto imediato (mudança de nível) e/ou impacto progressivo (mudança de tendência) nos valores da série. Para fins práticos, e seguindo uma analogia visual, vamos chamar de ‘degrau’ à mudança de nível (impacto imediato) e de ‘rampa’ à mudança de tendência (impacto progressivo). Esses termos correspondem a mudanças que podem ser percebidas nas representações gráficas das séries temporais. Tomando a Fórmula 1 como referência, a Fórmula 5 sintetiza a análise de regressão segmentada com dois e três segmentos. É possível incluir mais segmentos, se houver interesse e o número de observações permitir. Para esse fim, consideremos que ao menos oito pontos são desejáveis para configurar cada segmento. Também é possível incluir os termos da avaliação de sazonalidade, como indicados na Fórmula 3. 48 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Fórmula 5 Equação de regressão com dois segmentos: Y = b0 + b1*tempo + b2*degrau + b3*rampa Equação de regressão com três segmentos: Y = b0 + b1*tempo + b2*degrau1 + b3*rampa1 + b4*degrau2 + b5*rampa2 A variável ‘degrau’ é construída de modo dicotômico, com valores de 0 (zero) em todos os pontos anteriores à intervenção e valores de 1 (um) na vigência da intervenção, isto é, após o início do segmento. A variável ‘rampa’ mede o tempo após a intervenção, sendo construída com 0 (zero) nos pontos que antecedem a intervenção e valores sequenciais – 1,2,3... – após o início do segmento. O procedimento é análogo quando se utilizam três ou mais segmentos. Em seguida, basta encontrar os coeficientes da regressão Prais-Winsten que ajustam os pontos da série ao degrau e à rampa. Quando se encontra um degrau significantemente diferente de zero, pode-se interpretar que a intervenção teve impacto imediato positivo ou negativo, segundo o sinal do coeficiente de regressão, sobre os valores da série temporal. Quando se encontra uma rampa significantemente diferente de zero, pode-se interpretar, de modo independente ou conjugado à avaliação do degrau (ou impacto imediato), que a intervenção teve impacto progressivo positivo ou negativo sobre os valores da série temporal, também dependendo do sinal do respectivo coeficiente de regressão. Quando nenhuma das duas medidas difere de zero de modo estatisticamente significante, interpreta-se que a intervenção (ou o fator que está sendo testado) não associou com a série temporal. Ou, em outras palavras, não impactou, nem de modo imediato, nem de modo progressivo, nas medidas de interesse para a análise. Exemplificando a aplicação da Fórmula 5, observa-se que a série temporal da mortalidade infantil na cidade de São Paulo (Figura 3) apresenta três segmentos. O primeiro deles durou até 1960, com tendência decrescente e forte variação aleatória. O segundo segmento corresponde à inversão de tendência e crescimento da medida, de 1961 a 1973. O terceiro segmento, subsequente, mostra a retomada do declínio. A análise de regressão (Fórmula 5) forneceu os coeficientes para aplicação na Fórmula 2, permitindo calcular a taxa de mudança anual. No primeiro segmento houve declínio, medido por b1: a cada ano, mudança da mortalidade infantil foi, em média, -1,92% (IC95%: -2,25%;-1,59%); o sinal negativo indicando redução. Por meio de b3, identifica-se que houve incremento progressivo na mortalidade infantil no segundo segmento. Esse incremento foi de 3,96% (IC95%: 1,21%;6,77%) ao ano no. No terceiro segmento, indicado pelo valor de b5, houve retomada do declínio, com maior intensidade: -7,75% (IC95%: 49 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE -10,64%;-4,76%) ao ano. Os coeficientes b2 e b4 não diferiram significantemente de zero (respectivamente, p=0,163 e p=0,488), indicando, respectivamente, que não houve mudança de nível (degrau) na transição do primeiro para o segundo segmento, nem para a transição do segundo para o terceiro segmento. ATIVIDADE 5 Análise de séries temporais interrompidas Objetivo: Ao final dessa atividade, os estudantes serão capazes de avaliar o efeito de intervenções em saúde quanto à possível mudança de nível e de tendência das séries temporais de medidas de interesse para a saúde. A Tabela 3 apresenta a série temporal do número de atendimentos médicos (primeira consulta ambulatorial) por queixa de otite, em crianças de dois a 23 meses de idade, por 100.000, na cidade de Goiânia, em Goiás. O objetivo do estudo (Sartori et al., 2017) que originalmente levantou esses dados junto ao Sistema de Informações Ambulatoriais (SIA-SUS) foi avaliar o possível impacto da introdução da vacina pneumocócica 10-valente em junho de 2010 sobre a incidência de otite média. Para estimar a incidência, foi considerada o número de consultas médicas como medida de interesse. Como primeiro desafio, procure reproduzir a Figura 17, plotando a série temporal do desfecho epidemiológico de interesse. Observe, no gráfico, se há indícios de tendência no número de consultas. Observe se há variação sazonal nessa medida. Por fim, observe se há modificação de nível (degrau) e/ou tendência (rampa) associada à introdução da vacina pneumocócica 10-valente em junho de 2010. Em seguida, procure modelar esses movimentos por meio da análise de regressão de Prais-Winsten, conforme explicado anteriormente. Verifique quais desses movimentos são significantes do ponto de vista estatístico. Para discutir as justificativas conceituais sobre os achados, confira o relatório original da pesquisa que deu origem a esses dados (Sartori et al., 20143). 50 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tabela 3. Taxa de primeiras consultas médicas em crianças de dois a 23 meses de idade (por 100.000) por queixas de otite em Goiânia, de janeiro de 2008 a agosto de 2013. Fonte: DATASUS Ano 2008 2008 2008 2008 2008 2008 2008 2008 2008 2008 2008 2008 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2009 2010 2010 2010 2010 2010 2010 2010 2010 2010 2010 Mês Tempo 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 Otite 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 Seno 21,9302 30,2074 42,6276 42,3286 43,303 50,012 45,8916 34,1154 34,4498 43,4008 34,8002 41,2042 19,1734 19,1821 38,0616 42,2386 38,4161 42,2768 45,8206 39,1093 35,2784 42,995 47,1874 33,0782 26,6673 24,4293 42,449 37,3205 35,4061 40,8965 34,1495 32,231 33,8579 29,0341 51 0,5 0,86603 1 0,86603 0,5 1,2E-16 -0,5 -0,866 -1 -0,866 -0,5 -2E-16 0,5 0,86603 1 0,86603 0,5 3,7E-16 -0,5 -0,866 -1 -0,866 -0,5 -5E-16 0,5 0,86603 1 0,86603 0,5 2,4E-15 -0,5 -0,866 -1 -0,866 Cosseno 0,86603 0,5 6,1E-17 -0,5 -0,86603 -1 -0,86603 -0,5 -1,8E-16 0,5 0,86603 1 0,86603 0,5 1,2E-15 -0,5 -0,86603 -1 -0,86603 -0,5 -4,3E-16 0,5 0,86603 1 0,86603 0,5 5,5E-16 -0,5 -0,86603 -1 -0,86603 -0,5 1,1E-15 0,5 Degrau Rampa 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 2 3 4 5 profePI Ano 2010 2010 2011 2011 2011 2011 2011 2011 2011 2011 2011 2011 2011 2011 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2012 2013 2013 2013 2013 2013 2013 2013 2013 Mês • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Tempo 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 Otite 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 Seno 25,1743 28,4146 22,2897 23,5925 34,2731 25,8781 22,0064 22,0163 19,7588 21,7121 24,6398 24,9753 23,3641 18,5049 17,5389 16,572 24,3816 20,1645 22,1259 27,0189 21,4946 22,1559 23,4698 23,1543 19,9021 16,9734 10,7765 16,0087 20,9188 22,2363 25,8451 18,6562 18,0098 18,0179 Fonte: Sartori et al. (2017) 52 -0,5 -7,4E-16 0,5 0,866025 1 0,866025 0,5 8,58E-16 -0,5 -0,86603 -1 -0,86603 -0,5 -9,8E-16 0,5 0,866025 1 0,866025 0,5 1,1E-15 -0,5 -0,86603 -1 -0,86603 -0,5 -4,8E-15 0,5 0,866025 1 0,866025 0,5 -2,2E-15 -0,5 -0,86603 Cosseno 0,86603 1 0,86603 0,5 2,6E-15 -0,5 -0,866 -1 -0,866 -0,5 8,6E-16 0,5 0,86603 1 0,86603 0,5 2,8E-15 -0,5 -0,866 -1 -0,866 -0,5 -3E-15 0,5 0,86603 1 0,86603 0,5 -5E-16 -0,5 -0,866 -1 -0,866 -0,5 Degrau Rampa 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Quando se ajusta o modelo de regressão com os valores originais da Tabela 3, encontra-se ausência de modificação estatisticamente significante tanto para o nível como para a tendência da série temporal. Esse resultado, contrasta com a percepção visual de mudança na tendência, de estacionária, no período inicial, para decrescente, após o início da vacinação. A elevada variação aleatória da taxa mensal de consultas ambulatoriais parece ter contribuído, ao menos em parte, para esse resultado. O ruído elevado, como dito anteriormente, prejudica a percepção dos demais movimentos da série temporal. Figura 17. Taxa de primeiras consultas médicas em crianças de dois a 23 meses de idade (por 100.000) por queixas de otite em Goiânia, de janeiro de 2008 a agosto de 2013. Fonte: DATASUS Para reduzir a variância global da medida e possibilitar o cálculo da taxa de mudança anual por meio da Fórmula 2, vamos tentar a transformação logarítmica da série temporal. 53 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Confira os valores encontrados após a transformação logarítmica: b1 (tempo) = 1,47*10-4 (-4,40*10-4 a +4,69*10-4), p = 0,949 – indicando que a série temporal é estacionária; b2 (degrau) = -7,29*10-2 (-17,20*10-2 a +2,61*10-2) p = 0.146 – indicando que a vacinação não associou com mudança de nível no número de consultas médicas por otite em crianças; b3 (rampa) = -6,81*10-3 (-12,01*10-3 a -1,31*10-4) p = 0.016 – indicando que a tendência no número de consultas passou a ser decrescente com a vacinação; b4 (seno) = -2,89*10-2 (-6,38*10-2 a +0,60*10-2) p = 0.103 – indicando ausência de associação significante; e b5 (cosseno) = -6,42*10-2 (-9,87*10-2 a -2,96*10-2) p < 0.001 – indicando presença de associação significante. O resultado de ausência de mudança de nível (degrau) e a presença de mudança de tendência (rampa) é compatível com a intervenção em questão. O início da vacinação em junho de 2010 não teve impacto imediato no número de consultas médicas por otite (degrau) porque não é viável esperar uma elevada cobertura vacinal logo no primeiro mês em que a medida foi adotada. A cobertura vacinal foi progressiva; o número de consultas por otite passou a declinar de modo associado com o presumido crescimento mensal da cobertura vacinal. Com isso, os dados analisados indicam favoravelmente quanto à efetividade da vacina antipneumocócica 10-valente para reduzir a incidência de otite média. 54 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Considerações finais Recapitulando o início desse texto, as primeiras frases da Introdução propunham ser a análise de séries temporais uma perspectiva de antevisão do futuro. Retomemos agora essa ideia, para refletir como esta capacidade se realiza. Uma primeira e mais óbvia forma diz respeito à previsão dos valores da série temporal em momentos futuros. Isto pode ser feito por meio da equação de regressão linear, levando em consideração a curva de melhor ajuste de seus pontos. Quando se conhece a tendência, é fácil projetar a série alguns pontos para adiante, baseado na hipótese de que a tendência se mantenha, pelo menos no futuro próximo. A previsão dos valores futuros também pode ser feita por procedimentos estatísticos mais complexos, como a metodologia ARIMA, cuja aplicação demanda treinamento especializado adicional. Esse tipo de previsão é muito utilizado em Econometria, para o planejamento de negócios, para a administração de empresas. Tem relevância também, decerto, para a programação dos serviços de saúde. No contexto da emergência da pandemia de covid-19, por exemplo, foi muito importante prever antecipadamente a demanda por leitos hospitalares em unidades de terapia intensiva. Ressalta-se, contudo, que a imprecisão das estimativas sobre o futuro é tanto maior quanto mais se distancia do presente. Além disso, não é infrequente em atividades humanas que ocorra alguma intercorrência inesperada, o que pode representar fonte de erro adicional não passível de predição. Para variáveis quantitativas, é sempre possível conhecer efetivamente os valores que foram medidos no passado, mas não os que serão medidos no futuro. Afora essa diferença óbvia, nada diferencia, tecnicamente, a previsão do futuro e a previsão do passado. Uma segunda forma de aplicar o instrumental preditivo da análise de séries temporais se refere à previsão do passado. Esse tipo de previsão pode parecer estranho e desnecessário. No entanto, esta análise foi vantajosamente empregada nas séries temporais das figuras 5 e 12, as quais modelaram, com base na tendência e sazonalidade, a previsão de como seria a mortalidade esperada por gripe e pneumonia em idosos, se não houvesse a intercorrência de variação aleatória e de surtos epidêmicos. E, com base nesta previsão do passado, foi possível evidenciar os surtos de gripe manifestados nos momentos em que as medidas observadas ultrapassaram o limiar epidêmico calculado com base na mortalidade estimada, isto é, a previsão sobre o passado. São empregadas as expressões latinas “ex ante” e “ex post” para referir, respectivamente, as modalidades de previsão do futuro e do passado. Do ponto de vista técnico, estas modalidades 55 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE de previsão não são diferentes. Os mesmos instrumentos utilizados para prever valores de variáveis quantitativas no futuro servem para prever os valores do passado. Para exemplificar com um estudo epidemiológico que aplicou as duas modalidades de previsão no mesmo gráfico, a Figura 18 mostra a série temporal da mortalidade por tuberculose na cidade de São Paulo, durante praticamente todo o século XX. Figura 18. Série temporal da mortalidade (por 100 mil habitantes) por tuberculose na cidade de São Paulo, 1900-1997. Fonte: Antunes & Waldman (1999) Até meados do século, houve tendência estacionária com magnitude elevada. Nesse período, a tuberculose foi a causa básica de cerca de 10% de todos os óbitos ocorridos a cada ano (Antunes & Waldman, 1999). A partir de meados do século, a mortalidade por tuberculose declinou na cidade, até o início dos anos 80, quando subitamente inflectiu e assumiu tendência crescente, em função da associação entre a doença e a aids. Além de mostrar a mudança da tendência nesses diferentes períodos, a figura 17 mostra a previsão para o passado, de como a doença teria continuado a decrescer até o início dos anos 90, caso não tivesse havido a emergência da aids. A Figura 18 também mostra a previsão para o futuro, de que a mortalidade por tuberculose voltaria a declinar lentamente a partir de meados dos anos 90, o que de fato ocorreu; de modo possivelmente associado à introdução da terapêutica antirretroviral, que modificou o perfil de mortalidade da aids na cidade de São Paulo. Existe, ainda, uma terceira forma de se pensar na análise de séries temporais como uma modalidade de antever o futuro. Em vez de focalizar os valores que as variáveis quantitativas ordenadas temporalmente assumirão no futuro, esta terceira forma de previsão se refere ao reconhecimento dos padrões de variação da medida. Caso conheçamos esses padrões, compreenderemos o que pode interferir favorável ou desfavoravelmente para o incremento ou decréscimo da medida. 56 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Podemos dizer que antevimos o futuro, que conhecemos como determinado processo se comportará, quando conseguimos caracterizar sua tendência, reconhecer sua variação sazonal e cíclica, quando dimensionamos sua variação aleatória e identificamos os fatores associados que causam impacto significante sobre suas medidas. Este conhecimento sobre a estrutura de variação das séries temporais não deixa de ser uma forma de antever o futuro. Se fosse possível separar estas duas alternativas e escolher entre ter uma boa estimativa do valor exato de uma variável de interesse para a saúde ou de conhecer com precisão os processos que determinam sua variação, possivelmente muitos profissionais de saúde, em várias ocasiões, optariam pela segunda opção. 57 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE GLOSSÁRIO Séries temporais – São sequências de dados quantitativos tomados em momentos específicos e ordenados, que podem ser estudados segundo sua distribuição no tempo. Este módulo descreve a utilidade deste método para os estudos epidemiológicos e sistematiza os procedimentos estatísticos que tornam vantajosa sua aplicação para a saúde coletiva. Tendência – É a variação de longa duração das séries temporais. Diz-se crescente, quando seus valores aumentam de modo estatisticamente significante ao longo do tempo, a despeito de outros componentes de variação (sazonal, cíclica, e aleatória). De modo análogo, diz-se decrescente quando ocorre o inverso. E, de modo complementar, diz-se estacionária quando a magnitude das medidas não muda substancialmente ao longo do tempo. A taxa de crescimento (ou de declínio) médio anual pode ser estimada por meio de análise de regressão linear (modelos de Prais-Winsten). Associação – Parte do estudo das séries temporais que busca a correspondência entre seus valores e fatos ocorridos em momentos específicos. Em particular, é útil aferir a associação da série temporal com outras medidas ordenadas no tempo. A associação pode ser aferida e analisada estatisticamente, com referência concomitante ou com deslocamento no tempo, para favorecer o teste de hipóteses conceituais. A verificação estatística de associações significantes, por si só, não permite sustentar inferências causais. Prais-Winsten – Procedimento estatístico de análise de regressão linear especialmente desenvolvido para estimação de tendência e associação em séries temporais, o qual leva em consideração a relação de dependência entre valores consecutivos da série. Sazonalidade – Componente de variação das series temporais, que reflete a influência de efeitos de algum modo relacionados às estações do ano. Apesar de ser esta a origem do termo, a sazonalidade não reflete apenas aspectos geográficos e climáticos; há fatores socioeconômicos e culturais que também são sazonais e influenciam as medidas de interesse para a saúde. (Veja neste glossário a diferença de definição para o conceito de variação cíclica.) Variação cíclica – São variações em ciclos periódicos e regulares. Conquanto variações sazonais correspondam a repetições ao longo do ano; as variações cíclicas são diferenciadas pela referência a períodos mais prolongados, isto é, dois ou mais anos. (Vide a diferença de definição para o conceito de variação sazonal.) 58 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Previsão – Com base nos valores conhecidos da série temporal, seus valores futuros podem ser estimados levando em consideração seus diferentes componentes de variação (tendência, associação, sazonalidade, variação cíclica e variação aleatória) por meio de diferentes recursos estatísticos, como equações de regressão linear (modelo de Prais-Winsten) ou técnicas mais complexas como o procedimento ARIMA. Também pode ser útil estimar seus valores passados, para comparar os valores estimados com aqueles que foram de fato observados. Quando a previsão se aplica a valores futuros, é denominada previsão ex-ante (antes de acontecer). Quando se aplica a valores passados, é denominada previsão ex-post (após acontecer). Variação aleatória – São flutuações irregulares e erráticas, sem importância em termos de magnitude (quando comparada aos valores aferidos), e que são causadas por fatores que ocorrem ao acaso e não podem ser antecipados, detectados, identificados ou eliminados. Ruído – Forma usual de se referir ao componente de variação aleatória das séries temporais. Rugosidade – Forma usual de se referir ao componente de variação aleatória das séries temporais. A metáfora visual diz respeito ao formato das representações gráficas das séries temporais com forte componente de variação aleatória. Alisamento – Recurso gráfico das séries temporais que consiste em suprimir a variação aleatória (e, portanto, a rugosidade de sua representação gráfica) para evidenciar os demais componentes de sua variação (tendência, sazonalidade e variação cíclica). Série temporal interrompida – Recurso de análise estatística para identificar mudanças de nível e/ou tendência nos valores observados de uma série temporal. Demanda o monitoramento continuado dos valores da série temporal e a comparação estatística dos valores de nível e de tendência antes e depois da possível interrupção. Essa comparação é feita por meio de análise de regressão segmentada. 59 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE REFERÊNCIAS BIBLIOGRÁFICAS Antunes JLF. “Grow and multiply”: social development, birth rates and demographic transition in the Municipality of São Paulo, Brazil, time series for 1901-94. Rev Bras Epidemiol 1998; 1(1): 61-78. Antunes JLF, Waldman EA. Tuberculosis in the twentieth century: time-series mortality in São Paulo, Brazil, 1900-97Cad. Saude Publica 1999; 15(3): 463-476. Antunes JLF, Waldman EA. Trends and spatial distribution of deaths of children aged 12-60 months in São Paulo, Brazil, 1980-98. Bull World Health Organ. 2002; 80(5): 391-8. Antunes JLF, Waldman EA, Borrell C. Is it possible to reduce AIDS deaths without reinforcing socioeconomic inequalities in health? Int J Epidemiol 2005; 34(3): 586-92. Antunes JLF, Waldman EA, Borrell C, Paiva TM. Effectiveness of influenza vaccination and its impact on health inequalities. Int J Epidemiol 2007; 36(6): 1319-26. Bernal JL, Cummins S, Gasparrini A. Interrupted time series regression for the evaluation of public health interventions: a tutorial. Int J Epidemiol 2017; 46(1): 348-55. Biazevic MHG, Castellanos RA, Antunes JLF, Michel-Crosato E. Tendências de mortalidade por câncer de boca e orofaringe no Município de São Paulo, Brasil, 1980/2002. Cad Saude Publica 2006; 22(10): 2105-14. Chow GC. Econometrics. London: McGraw-Hill; 1983. Farias N, Cardoso MRA. Mortalidade por Aids e indicadores sociais no Município de São Paulo, 1994 a 2002. Rev Saude Publica 2005; 39(2): 198-205. Gaynor PE, Kirkpatrick RC. Introduction to time series modeling and forecasting in business and economics. New York: McGraw-Hill; 1994. Gouveia N, Hajat S, Armstrong B. Socioeconomic differentials in the temperature-mortality relationship in São Paulo, Brazil. Int J Epidemiol 2003; 32(3): 390-7. Oliveira JFM, Boing AF, Waldman EA, Antunes JLF. Ecological study on mortality from influenza and pneumonia before and after influenza vaccination in the Northeast and South of Brazil. Cad Saude Publica 2013; 29(12): 2535-45. 60 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Penfold RB, Zhang F. Use of interrupted time series analysis in evaluating health care quality improvements. Acad Pediatr 2013; 13(6Suppl): S38-44. Porta M. A dictionary of epidemiology. 6th Ed. New York: Oxford University Press; 2016. Sartori AL, Minamisava R, Bierrenbach AL, Toscano CM, Afonso ET, Morais-Neto OL, Antunes JLF, Cristo EB, Andrade AL. Reduction in all-cause otitis media-related outpatient visits in children after PCV10 introduction in Brazil. PLoS One 2017; 12(6): e0179222. Serfling RE. Methods for current statistical analysis of excess pneumonia-influenza deaths. Public Health Rep 1963; 78(6): 494-506. van Asten L, van den Wijngaard C, van Pelt W, van de Kassteele J, Meijer A, van der Hoek W, Kretzschmar M, Koopmans M. Mortality attributable to 9 common infections: significant effect of influenza a, respiratory syncytial virus, influenza B, norovirus, and parainfluenza in elderly persons. J Infect Dis 2012; 206(5): 628-39. Wagner AK, Soumerai SB, Zhang F, Ross-Degnan D. Segmented regression analysis of interrupted time series studies in medication use research. J Clin Pharm Ther 2002; 27(4): 299-309. Waldman EA, Rosa TEC. Vigilância em Saúde Pública. Série Saúde & Cidadania. São Paulo: Instituto para o Desenvolvimento da Saúde; Faculdade de Saúde Pública da Universidade de São Paulo; Núcleo de Assistência Médico-Hospitalar; Fundação Itaú Social, 1998. Wiener N. Extrapolation, interpolation and smoothing of stationary time series. Cambridge, MA, USA: The MIT Press, 1966. 61 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE INSTRUMENTO DE CONCLUSÃO 1ª Questão. Tomando a Base de dados 4 (Anexo), faça a transformação logarítmica da série temporal da taxa mensal de primeiras consultas médicas ambulatoriais por queixas relacionadas a otite em crianças de 2 a 23 meses em Goiânia. Faça o gráfico da série temporal resultante e compare com a Figura 17, que mostra a mesma série temporal sem a transformação logarítmica. Explique a diferença entre os dois gráficos. 2ª Questão. Considerando a Base de dados 3 (Anexo), calcule a variação percentual anual (Fórmula 2) para descrever a tendência das duas séries temporais disponíveis: proporção anual de óbitos por causas mal definidas e não indeterminadas em idosos (65 anos ou mais) nas regiões Nordeste e Sul. Compare os valores obtidos e explique a diferença entre as duas regiões. 3ª Questão. Utilizando a Base de dados 2 (Anexo), aplique a Fórmula 3 para modelar a variação sazonal da mortalidade semanal por gripe e pneumonia em idosos (65 anos ou mais) nas regiões Nordeste e Sul no período antes da vacinação contra a gripe (1996-1998). Compare os resultados obtidos para as duas séries temporais e explique a diferença entre elas. 4ª Questão. Faça o gráfico das duas séries temporais mencionadas na questão anterior, com alisamento de médias móveis de ordem 3 (MM3) e 4 (MM4), usando a Fórmula 4. Compare as séries MM3 e MM4 de cada região (Nordeste e Sul) e descreva como diferem entre si e com as séries originais não alisadas. 5ª Questão. Com a Base de dados 1 (Anexo), faça a análise de séries temporais interrompidas para o coeficiente de mortalidade infantil (Fórmula 5) considerando três segmentos, o primeiro de 1900 a 1960, o segundo de 1961 a 1973 e o terceiro de 1974 a 1994. Descreva os resultados obtidos. 62 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE ANEXO: BASES DE DADOS PARA EXERCITAR Base de dados 1. Séries temporais dos indicadores anuais de saúde do Município de São Paulo, 1900-1994. Fonte: Antunes JLF (1998) Ano Coef. SwaroopPadr. Mort. -Uemura Coef. Mort. FecundiInf. dade Nupcialidade Natimortos Esp. Vida ao Nascer 1900 19,5276 12,3752 208,063 161,1289 5,5391 4,7346 46 1901 20,0783 12,0322 235,8209 148,9424 5,5359 5,2128 45,14 1902 21,3114 11,7574 242,9796 147,1934 5,3184 5,6432 43,36 1903 18,1701 13,9245 222,8776 139,0207 5,5943 5,3911 47,1 1904 18,4137 13,2254 231,4516 135,521 5,1247 5,5508 46,46 1905 17,1666 13,7931 215,1039 131,8977 5,375 5,1469 48,25 1906 18,0475 13,9133 230,2703 122,5712 4,9588 5,0928 45,9 1907 14,5727 16,5753 162,861 116,5618 5,4747 6,0764 50,67 1908 15,6553 14,9106 167,313 116,6699 5,8178 5,5139 49,3 1909 15,1494 16,6037 166,2484 114,1682 5,209 5,5447 49,21 1910 15,6457 16,6004 165,8146 118,1606 6,0137 6,1663 48,28 1911 16,5258 15,5902 188,6209 123,3891 6,8816 6,1859 46,79 1912 19,6614 14,5503 199,6984 129,7164 8,0661 6,0782 41,65 1913 20,4978 13,9768 192,5277 142,9959 8,4076 5,7456 40,41 1914 18,0325 14,0398 172,7502 139,1463 7,4351 6,0678 43,98 1915 15,6173 17,7243 151,4135 131,2857 6,3301 5,2279 47,16 1916 16,1869 16,783 155,428 135,8571 6,2522 5,0682 46,05 1917 15,1432 19,2371 148,8237 128,4647 6,8248 5,5192 47,51 1918 27,4618 13,1674 222,7201 125,8122 5,8832 5,475 31,8 1919 17,9442 16,5981 180,3618 115,2316 6,9674 5,7394 42,72 1920 18,42 19,0702 170,3715 129,8819 7,9939 5,3602 41,93 1921 18,5556 19,0718 176,369 125,8076 8,2059 5,4041 41,74 1922 17,9483 15,9766 179,2622 127,6417 8,2365 5,5006 42,9 63 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 1923 18,2901 15,8965 181,6187 129,1568 8,4294 5,5973 42,37 1924 18,6668 17,0391 167,9962 122,473 8,0098 5,6356 41,54 1925 18,6589 16,789 176,4337 120,3608 8,6971 5,319 41,58 1926 18,2688 16,4169 174,3324 125,0114 8,8443 5,7612 42,26 1927 17,5583 17,5583 166,805 127,3151 8,7306 5,3277 43,53 1928 17,663 17,663 160,2383 127,9173 8,3794 5,3582 42,53 1929 168564 22,6387 156,2727 122,2876 8,2079 5,1819 43,87 1930 15,0642 23,1506 152,6284 113,0573 6,6705 5,263 46,75 1931 14,5853 24,1225 160,5215 101,2643 6,8545 5,3015 45,5 1932 13,1468 26,3891 140,7988 94,4097 6,4008 5,2771 50,4 1933 14,5706 25,7155 169,2283 89,2625 8,199 5,1084 47,53 1934 12,7797 28,7089 141,2956 92,2993 8,5404 5,5756 51,19 1935 13,8794 28,454 147,8389 95,0913 9,3647 5,252 48,93 1936 15,282 27,6089 157,8084 94,4818 8,2418 5,0286 46,27 1937 13,5822 30,6412 134,396 88,9158 9,023 5,1278 49,55 1938 14,0467 31,1518 138,1851 89,5613 8,5754 5,069 48,68 1939 14,1388 30,5843 142,6593 87,0901 9,4917 4,8482 48,23 1940 13,0509 32,4782 123,9889 87,9053 7,4336 4,9938 50,37 1941 13,7807 32,9962 135,1186 84,1063 8,572 4,7731 49,32 1942 12,8593 35,0089 121,6268 83,6683 8,0944 4,8161 51,45 1943 11,8525 34,8489 115,3657 78,9965 8,6094 4,944 53,39 1944 11,8586 35,9342 113,4855 81,0919 7,3578 4,7008 53,62 1945 11,3865 38,0411 101,4872 76,0915 8,4375 4,9957 54,84 1946 10,1169 38,5226 79,782 84,1442 8,8931 4,8217 57,56 1947 10,1128 39,4298 80,1158 86,8551 9,7919 4,7028 57,64 1948 10,4381 37,2154 87,8489 92,2595 7,6401 3,6758 56,94 1949 10,2938 38,8858 90,6486 92,9342 9,4637 3,8166 57,32 1950 10,1301 38,1787 89,7089 94,3102 9,5178 3,7152 57,65 1951 10,1086 38,9501 91,4673 98,614 9,9637 3,7733 61 1952 8,9916 42,4607 71,0004 104,5125 8,3711 3,4363 60,33 1953 9,0751 41,297 79,1581 104,3778 9,7617 3,2613 60,15 64 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 1954 9,0704 40,7124 74,7225 113,0301 9,9123 3,2085 60,28 1955 9,3453 39,9741 86,5133 110,3957 10,3685 3,2015 59,64 1956 9,3321 41,6538 86,3783 107,9824 8,2655 2,9916 59,71 1957 8,898 43,3977 75,3803 110,7086 8,9929 2,8431 60,7 1958 8,2079 43,2326 70,2087 110,2539 8,8017 2,7646 62,3 1959 8,2889 44,1599 65,4184 112,5979 9,2531 2,6423 62,16 1960 8,3507 45,2382 62,943 114,6646 7,4603 2,4443 62,01 1961 8,0966 45,7813 60,21 114,4216 8,9449 2,5738 62,54 1962 8,6158 46,2548 64,4162 118,29 8,1696 2,6337 61,34 1963 8,7202 44,5207 69,8961 118,9078 8,3662 2,6091 60,99 1964 8,3707 45,8165 67,7533 118,2673 6,8114 2,5239 61,72 1965 8,1661 45,2932 69,3751 116,6097 6,5282 2,6384 62,16 1966 8,3285 45,6122 73,9086 107,5383 7,1165 2,5497 61,74 1967 8,1606 46,417 74,3915 104,3915 6,6676 2,4893 62,16 1968 8,5454 48,908 76,6141 103,7802 6,3627 2,5518 61,31 1969 8,5671 46,2173 84,4999 103,8444 7,1938 2,4142 61,09 1970 7,6511 48,4252 77,073 106,5811 7,2112 2,3942 63,17 1971 7,9965 46,6138 85,3844 104,3832 7,8179 2,1938 62,79 1972 8,0539 46,17 85,6587 102,6505 7,7456 2,032 63,05 1973 8,3867 45,9196 87,2046 100,9581 8,5069 2,0521 62,66 1974 8,1313 46,109 78,0296 103,3298 8,8977 2,9411 63,54 1975 7,7757 46,4838 79,9575 103,8228 9,0852 1,8211 64,66 1976 7,6308 48,3055 74,8134 102,9957 8,1954 1,7813 65,19 1977 7,1985 48,8034 66,5203 102,2573 8,3233 1,3756 66,51 1978 7,069 50,0507 64,0131 101,9376 8,1733 1,298 67,04 1979 6,8913 51,5775 57,5805 101,986 8,2334 1,2809 67,55 1980 6,7829 53,4413 50,6225 99,7806 7,8313 1,2404 67,84 1981 6,6383 53,4776 49,7652 103,3887 7,9012 1,1671 68,35 1982 6,5281 54,1567 47,518 103,7409 7,9111 1,0715 68,7 1983 6,4945 57,0708 41,8277 95,8035 7,2869 1,0103 68,77 1984 6,7492 55,1971 47,955 88,3729 7,5615 1,0137 68,16 65 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 1985 6,4826 59,196 36,5751 87,3333 7,2926 0,9868 68,94 1986 6,6626 59,1348 36,1689 86,085 7,0455 0,879 68,54 1987 6,5936 60,1401 33,1622 83,4962 6,9028 0,863 68,89 1988 7,0533 60,1799 35,1415 83,4518 6,6729 0,8977 67,96 1989 6,6974 60,3577 31,0221 77,4809 6,2161 0,9112 68,83 1990 6,7721 61,0872 30,8967 71,6039 5,7139 0,8571 68,77 1991 6,522 61,4154 26,0321 69,5628 5,4271 0,8538 69,68 1992 6,4906 62,5564 25,23 68,277 5,0274 0,7784 69,85 1993 6,8207 62,5258 25,672 72,4073 5,0668 0,807 69,02 1994 6,8348 56,9431 23,3885 72,9626 5,0139 0,8106 70,1 Base de dados 2. Séries temporais da mortalidade semanal por gripe e pneumonia em idosos (65 anos ou mais) nas regiões Nordeste e Sul, antes (1996-1998) e depois (1999-2008) do início da vacinação de idosos contra a gripe no Programa Nacional de Imunizações. Fonte: Oliveira JFM et al. (2013). Contagem Semana Reg. Sul depois Reg. NE depois Semana Reg. Sul antes Reg. NE antes 1 1999 2,606274462 1,580025533 1996 3,588084341 1,723315199 2 2 3,503886977 0,921225734 2 4,747792028 1,441454637 3 3 3,483410767 1,308919646 3 2,462005396 1,118469706 4 4 3,837402852 1,133585532 4 2,851658976 1,074243637 5 5 3,413347483 1,535515658 5 2,797405602 0,907168397 6 6 2,213444438 1,353356316 6 3,078630717 1,244655846 7 7 2,056502157 1,35192631 7 2,581541782 1,070590286 8 8 2,387154977 1,527023034 8 3,160637954 0,836486905 9 9 2,72686532 1,581989173 9 4,009908623 1,635342374 10 10 3,712099013 1,6149915 10 3,181923481 0,845242111 11 11 2,383240702 1,645182939 11 3,199696979 1,314218563 12 12 2,683670779 1,132726524 12 3,024647086 1,316036699 13 13 2,794808528 1,783076776 13 4,405477464 1,051169964 14 14 2,531429464 1,868884087 14 4,346125102 1,424249599 15 15 2,459627392 1,755806343 15 2,396306881 1,259458553 66 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 16 16 3,879488481 1,972213728 16 3,732093858 1,286490368 17 17 2,701846225 1,727812739 17 3,892257711 1,656071116 18 18 3,503226855 1,649789449 18 2,871421725 1,912694747 19 19 3,451893815 2,121947522 19 3,348000345 2,162912961 20 20 3,6390164 2,417534489 20 4,836730351 1,93520787 21 21 3,337176675 2,193670113 21 4,806366011 1,570560755 22 22 4,813054888 2,037400545 22 5,779282715 1,93342145 23 23 4,46892831 1,637172405 23 5,253383374 1,264211714 24 24 6,033369113 2,0505415 24 5,308167873 1,733336729 25 25 5,03899634 2,087646398 25 6,103276449 1,851508773 26 26 5,637797286 1,703960377 26 6,918769053 0,878731745 27 27 4,851162798 1,353079112 27 8,989615196 1,266125956 28 28 4,314944559 1,754219863 28 11,52873537 1,084112943 29 29 5,143131528 1,117010549 29 12,14995367 1,510950163 30 30 5,023725857 1,34620085 30 15,02882374 0,959175698 31 31 5,133430514 1,043241987 31 11,83598878 1,26325821 32 32 4,103069809 1,20364015 32 9,346179682 1,323774984 33 33 3,77033225 1,499633548 33 8,164637244 1,566287721 34 34 5,158045836 1,542394286 34 5,648171956 0,900258444 35 35 4,363187182 1,160642207 35 4,168423822 1,722954197 36 36 4,726692755 1,197118433 36 4,608334801 1,437193954 37 37 2,405902502 1,183325913 37 4,498841888 1,099782179 38 38 2,305249201 1,532898894 38 5,522317217 0,82719746 39 39 3,167213686 1,237953582 39 4,987045284 0,95383722 40 40 3,32954752 1,249784247 40 3,102411608 1,110722627 41 41 3,386869898 1,39440946 41 3,919689355 1,150671136 42 42 2,998767554 0,800669372 42 3,981248923 1,129451376 43 43 3,628777447 1,109657308 43 3,671381031 0,939293875 44 44 2,010938514 0,841885517 44 3,358232171 1,019326054 45 45 2,270037111 0,975487774 45 3,750669928 1,252338808 46 46 2,687457688 0,91089516 46 3,427464175 1,248993045 67 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 47 47 3,326165589 1,0680033 47 3,515125467 1,041491991 48 48 2,144772048 0,934150157 48 3,437048562 0,838239575 49 49 2,874765733 1,123800559 49 3,295345863 1,0822213 50 50 2,763148956 1,193209115 50 2,62826195 0,918991726 51 51 2,437111083 0,59804271 51 3,877574358 1,566085601 52 52 3,245869306 1,280747429 52 3,519960194 1,100468659 53 2000 3,334208282 0,984758268 1997 4,443701886 1,347829376 54 2 2,766783248 1,137884191 2 3,930034544 1,516369918 55 3 2,331713085 1,395286921 3 3,787584755 1,698704304 56 4 2,411238285 1,157575045 4 3,693890869 0,865181561 57 5 1,711646505 1,212286791 5 3,614868365 1,393326833 58 6 2,15472003 1,176267833 6 4,056585999 1,071499942 59 7 2,408409658 0,941085707 7 3,18539924 1,227136784 60 8 1,949673501 1,081329073 8 2,474884414 1,223210324 61 9 2,592828328 1,645880643 9 2,712771735 1,221698517 62 10 2,68876294 1,219286251 10 3,909443064 0,840048221 63 11 2,103891418 1,546401348 11 2,744907368 1,212832954 64 12 2,92573812 1,954873949 12 1,708770967 1,229239926 65 13 3,200122367 2,009926355 13 2,437458367 1,01026802 66 14 2,823396213 1,696495707 14 3,880113689 1,530311926 67 15 3,017554295 1,629628422 15 3,170865538 1,161416967 68 16 2,769380855 1,682757365 16 3,640660845 0,998986512 69 17 1,69925947 1,692426422 17 2,963535834 1,470310874 70 18 3,119799906 1,729948851 18 3,413145197 0,954010563 71 19 2,600242455 2,001105994 19 2,425868066 1,332552681 72 20 3,398670698 1,943601313 20 4,250240589 1,68546673 73 21 3,109030744 1,426131317 21 4,105206131 1,433482283 74 22 3,267024384 1,625659414 22 4,900925913 1,051152824 75 23 3,421068902 1,89123231 23 4,087830941 1,433127665 76 24 3,907949466 1,257430406 24 5,951301611 1,480877015 77 25 4,766057177 1,862119104 25 6,653287252 1,576940715 68 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 78 26 3,890808974 1,775764383 26 6,207442285 1,042608952 79 27 4,669061548 1,42844245 27 6,666497421 1,45479401 80 28 3,614136809 1,701099533 28 5,362105698 1,243857052 81 29 4,924162287 1,14792986 29 6,25248211 1,480400669 82 30 6,949103687 1,338186061 30 6,587237741 1,069623514 83 31 5,234594202 1,302732549 31 5,006196646 1,068833925 84 32 6,922425896 1,444004694 32 6,273826879 0,574847385 85 33 5,885965716 1,486247773 33 4,875649384 0,768847973 86 34 4,446812024 1,484829618 34 4,660350279 1,27397221 87 35 4,829458631 0,947786683 35 4,241921411 1,073688041 88 36 3,250213217 1,532314693 36 2,827826904 1,37097764 89 37 3,449989556 1,08332447 37 4,104713794 1,2086364 90 38 4,279093277 1,283330469 38 3,80589535 0,8720461 91 39 3,707186017 0,965419363 39 4,354254445 1,546504015 92 40 3,878327996 1,164771772 40 2,752493185 1,146116016 93 41 3,113306543 1,31155251 41 2,797975559 1,020588525 94 42 3,35400648 1,257254739 42 3,845485025 0,974710155 95 43 1,960789554 1,196014421 43 2,733346739 1,2560993 96 44 2,741155553 1,355434084 44 2,51292647 0,962079893 97 45 1,99044271 0,983110849 45 3,650357304 0,83659139 98 46 1,97113697 0,874917345 46 3,345887338 0,728792594 99 47 2,12185084 0,825647809 47 2,382731862 0,928999268 100 48 1,764751627 1,123736817 48 2,366015619 1,067955543 101 49 2,884779195 0,951648182 49 3,389312681 0,847825025 102 50 2,873077901 1,21388838 50 2,536473595 0,722554751 103 51 2,934027559 1,43759047 51 4,218022871 0,662934571 104 52 2,181232985 1,798433375 52 3,272748317 1,248946128 105 2001 3,986882225 1,36105747 1998 3,254815198 1,337329211 106 2 2,70457452 1,44809503 2 2,76538409 1,643620083 107 3 2,482220493 1,49977778 3 3,311823947 1,297543164 108 4 2,244581539 1,002691144 4 4,031469511 0,82966242 69 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 109 5 2,781959078 1,401705669 5 3,377307404 0,735596713 110 6 2,700077474 1,327979579 6 1,840113349 1,437746514 111 7 2,347188747 1,000577489 7 3,117003643 1,318603399 112 8 2,905519048 1,799854371 8 3,435198518 1,339507438 113 9 2,589136837 1,388175889 9 3,054747891 1,365016436 114 10 2,394293663 1,049171785 10 3,073469253 1,620314241 115 11 2,947437465 1,216567624 11 2,690741237 1,788200297 116 12 2,208272341 1,403624234 12 2,87244718 1,694592174 117 13 2,591540485 1,409491341 13 3,790060893 1,279843124 118 14 3,503713428 1,557852258 14 2,678948924 2,114552619 119 15 3,169494789 1,28166583 15 3,709857388 1,95776054 120 16 2,358974466 1,300222315 16 3,402424759 1,900275545 121 17 2,945523985 0,859606089 17 2,691075894 1,597355828 122 18 2,983567867 1,922329196 18 2,347181422 1,631055602 123 19 3,494333659 1,551963776 19 3,93407092 1,532956896 124 20 3,332894806 1,48835248 20 3,777842155 1,548689909 125 21 3,526202817 2,253299447 21 4,436343637 1,421932976 126 22 3,986995231 1,380117781 22 7,439795371 1,912502283 127 23 3,112757194 1,366445168 23 8,111323624 2,050869793 128 24 3,824533257 1,601832455 24 8,943927419 1,967116654 129 25 3,806986809 1,496149337 25 9,491814088 1,504630854 130 26 4,532982197 1,353140766 26 10,58812196 1,876179636 131 27 4,380510522 1,348784504 27 9,139669535 1,606487339 132 28 4,119668309 1,517035565 28 8,359423612 2,132772408 133 29 4,903733368 1,610966209 29 6,401792656 2,274909158 134 30 4,149738798 1,455102059 30 6,987927205 1,844502781 135 31 4,076911055 1,316947253 31 6,279055352 1,259125777 136 32 3,687813217 1,328687408 32 4,878180222 1,114620508 137 33 3,356175822 1,724460621 33 5,322981005 1,356746544 138 34 4,439237866 1,716425281 34 4,203068335 1,042549235 139 35 4,425556813 1,689079131 35 3,390343125 0,864066647 70 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 140 36 3,796358134 1,06079874 36 3,057104817 1,069107574 141 37 4,002430906 1,460189897 37 3,383735172 1,113567198 142 38 5,055303163 1,312670121 38 3,51618135 1,014172952 143 39 4,013369716 1,457914054 39 4,737200526 1,012749813 144 40 3,098698842 1,112018845 40 3,060339983 1,014496047 145 41 3,222169743 1,253586769 41 3,658237457 0,992415559 146 42 3,370813727 1,76696248 42 2,151004435 1,330071466 147 43 3,067553249 0,997311105 43 2,719529611 1,110745082 148 44 3,338901302 1,425542072 44 3,635396543 1,276115832 149 45 3,227261601 1,459516761 45 3,292361125 1,316892245 150 46 2,818597597 1,438765096 46 1,824373163 1,030622042 151 47 3,299915372 1,898774269 47 2,973910787 1,202492424 152 48 1,808253121 1,370632456 48 3,142265993 1,015861782 153 49 2,420213294 1,31405217 49 3,726092064 0,60394401 154 50 2,271965935 1,4954001 50 2,804309768 0,772268548 155 51 2,826612827 1,536198556 51 2,467237107 0,832040155 156 52 1,743434368 1,409492994 52 2,54652642 1,17396282 157 2002 3,86743285 2,015262041 158 2 2,503601071 1,725500589 159 3 2,795895304 2,042973539 160 4 2,06122118 2,450945819 161 5 2,856460143 1,863198169 162 6 3,236835925 2,158427938 163 7 2,292505881 1,683283616 164 8 2,544913273 2,291905902 165 9 3,256692845 2,003393251 166 10 2,456666794 1,749975408 167 11 3,188104887 1,624994862 168 12 3,302077671 1,401904781 169 13 2,556683929 1,834667803 170 14 3,705198008 1,769988617 71 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 171 15 3,277375402 2,224581967 172 16 2,860418994 1,945120278 173 17 3,39774316 1,864761949 174 18 1,754518716 1,618956884 175 19 2,721858659 1,924789182 176 20 3,069916005 2,027442302 177 21 2,688552785 1,444174417 178 22 2,649895565 1,655817392 179 23 3,465153005 1,208419653 180 24 3,0623749 1,289655777 181 25 3,364196428 1,875153622 182 26 2,906970718 1,53464568 183 27 4,673938488 1,618388476 184 28 4,767641248 1,615963972 185 29 4,871350742 1,667204705 186 30 5,4648997 1,283975276 187 31 3,880494453 1,258215315 188 32 4,199920538 1,525675584 189 33 3,930478496 1,547176214 190 34 4,087591655 1,427382328 191 35 3,377847237 1,199552414 192 36 2,934600906 1,366749179 193 37 4,117530103 1,448842173 194 38 3,635686743 1,197078922 195 39 4,736377724 1,837475565 196 40 4,164399587 1,396919247 197 41 4,160582342 1,474078532 198 42 3,617465018 1,490693548 199 43 3,412309297 1,542260729 200 44 2,913784364 1,747250266 201 45 2,495553285 1,324993836 72 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 202 46 2,266238746 1,423228189 203 47 3,667284584 1,134107319 204 48 2,433907647 1,375819251 205 49 2,454334013 1,504826912 206 50 2,672883157 1,595878782 207 51 2,532900133 1,111978312 208 52 3,337079808 1,515135015 209 2003 3,879874052 1,84893524 210 2 2,596961975 1,737495952 211 3 2,715342633 1,69759681 212 4 2,422292264 1,394981963 213 5 4,100067726 1,648997843 214 6 3,297150325 1,762870277 215 7 3,174375385 1,639755855 216 8 3,004844682 1,54354426 217 9 2,841823065 1,678873371 218 10 3,214634964 1,126318805 219 11 2,235106534 1,368003937 220 12 2,764630268 1,534743474 221 13 2,080291119 2,237021445 222 14 3,103161183 1,994641403 223 15 3,674478734 2,907516447 224 16 2,874786325 2,50792755 225 17 3,508108929 2,169408258 226 18 2,389653749 2,162536608 227 19 4,263316357 2,058703097 228 20 2,980770064 2,229784268 229 21 4,059985315 2,289896898 230 22 3,902796654 1,744923378 231 23 3,150335315 1,46911782 232 24 4,201341687 1,873907762 73 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 233 25 3,209712579 1,952303983 234 26 4,542461754 2,05135397 235 27 4,644551477 1,696715897 236 28 3,820981877 1,926155645 237 29 5,43596065 2,15487443 238 30 4,478991845 1,640116225 239 31 4,082734318 1,506708124 240 32 5,168558524 1,467657042 241 33 3,97776739 1,506195659 242 34 4,051250206 1,259824541 243 35 4,372487345 1,415651311 244 36 4,916233284 1,221264142 245 37 4,420571291 1,293775317 246 38 3,848738748 1,628248435 247 39 4,262705346 1,372302752 248 40 3,222557811 1,533874705 249 41 2,877451998 1,599332655 250 42 3,948679396 1,261772102 251 43 3,064127433 1,267939499 252 44 3,037572499 1,209544809 253 45 3,18261842 1,426857274 254 46 3,590652405 1,454355288 255 47 3,785290213 1,089382873 256 48 3,239451668 1,311043074 257 49 2,65213781 1,614595045 258 50 2,452260174 1,438840034 259 51 3,41997075 1,133270964 260 52 3,039933082 1,898765293 261 2004 2,387856762 1,690805855 262 2 3,405616827 1,218999332 263 3 2,751798888 1,510139307 74 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 264 4 2,641286886 1,106131274 265 5 2,703314113 1,321374495 266 6 2,467445388 2,192206593 267 7 2,380717641 2,04624084 268 8 2,739578791 2,010535643 269 9 3,163206385 4,037419375 270 10 2,556448713 2,663663142 271 11 2,759172217 3,804382894 272 12 3,483452388 3,79758766 273 13 2,417283436 3,148463873 274 14 2,917803805 3,091961572 275 15 3,507162935 2,339962348 276 16 2,832307365 2,142237357 277 17 3,096973547 1,604164614 278 18 3,608740556 1,367219907 279 19 3,715204406 1,621421168 280 20 4,251156917 1,992304359 281 21 5,467935995 1,639840176 282 22 4,784734156 1,554211146 283 23 4,923909776 1,605632907 284 24 6,526305348 1,744723393 285 25 7,303183481 1,599022375 286 26 5,258720773 1,627868614 287 27 4,257125665 1,694772865 288 28 4,562946503 1,893746904 289 29 5,272068014 1,542415628 290 30 5,018200891 2,312291648 291 31 5,650737626 1,732309374 292 32 4,447775167 2,411883346 293 33 3,816700584 1,543947016 294 34 4,831138344 1,536939247 75 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 295 35 4,02345925 1,28616556 296 36 3,993372194 1,830584459 297 37 3,611845352 1,645632328 298 38 3,145163622 1,840234392 299 39 3,855189805 1,648762609 300 40 3,26223548 1,687187751 301 41 4,324549379 1,863589777 302 42 3,422348959 1,178323179 303 43 3,893245219 1,14971895 304 44 3,331222214 1,971649392 305 45 3,852803235 1,892206155 306 46 3,363125165 1,527734762 307 47 2,577789673 1,469861375 308 48 2,53203755 1,237203454 309 49 2,96573806 1,261259926 310 50 2,15329796 1,241357526 311 51 3,389946279 1,411563554 312 52 2,857960723 0,972711014 313 2005 3,191903472 1,870518172 314 2 3,243603417 1,969258771 315 3 3,118590665 1,767693304 316 4 3,119893916 1,925675747 317 5 2,859134088 1,435862529 318 6 2,817810541 1,711737223 319 7 2,647638896 1,384814394 320 8 3,763711871 1,844779583 321 9 3,477412438 2,40870679 322 10 2,555699094 1,999691265 323 11 2,828324701 2,153930904 324 12 2,7551634 1,896197925 325 13 3,106558141 1,710522155 76 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 326 14 2,161902605 1,861587426 327 15 2,63267747 2,422539687 328 16 2,855577947 2,496047683 329 17 2,994756512 2,742026715 330 18 3,667076525 2,62644881 331 19 3,359759371 2,568923065 332 20 3,154448948 2,301408491 333 21 2,985879806 2,389385219 334 22 3,537592932 2,550090174 335 23 3,493124827 2,295594256 336 24 2,999618559 2,947486917 337 25 3,427141236 2,562386942 338 26 4,08535709 2,177804833 339 27 4,39312288 2,452518738 340 28 4,378917307 2,086087896 341 29 5,342482919 2,331890662 342 30 6,059336699 2,205577669 343 31 5,707984455 1,733074372 344 32 4,950071496 1,664294878 345 33 5,193436153 1,488840837 346 34 4,142826756 1,45329718 347 35 5,776597569 1,629699092 348 36 4,932244955 1,462186851 349 37 4,205413484 1,375118102 350 38 5,30172534 1,69343118 351 39 3,6642807 1,729325235 352 40 4,617758239 2,120886295 353 41 4,60005641 2,133388129 354 42 3,930104041 1,587090364 355 43 3,296568521 1,906930365 356 44 2,953606616 1,703173486 77 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 357 45 3,397231832 1,667310532 358 46 4,891165072 1,806069559 359 47 4,486739393 2,054869365 360 48 3,482460222 1,888104891 361 49 3,598163858 1,603197818 362 50 2,773943819 1,54058189 363 51 2,778888175 1,905173808 364 52 2,893589887 1,679835727 365 2006 3,560065757 2,703488949 366 2 5,218491145 2,149065476 367 3 4,792845487 1,93877473 368 4 3,16459173 2,200157389 369 5 3,340541167 1,421816317 370 6 3,382983819 1,922150888 371 7 3,13323431 2,016328754 372 8 2,966209895 2,343901525 373 9 3,433192719 2,685957208 374 10 2,780059969 1,508471566 375 11 3,299267416 1,958716708 376 12 2,860143122 2,183200756 377 13 2,942074058 2,535573442 378 14 3,60163461 2,1284286 379 15 3,228327597 2,799217232 380 16 3,090898909 2,360852529 381 17 4,440681253 2,660518388 382 18 3,571970423 2,673106701 383 19 4,082287174 3,991332292 384 20 3,860496603 3,289978886 385 21 5,047148747 3,945729963 386 22 4,022508343 3,841673557 387 23 4,765920853 3,460422282 78 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 388 24 3,737843785 3,061057668 389 25 4,612241672 3,206626207 390 26 5,261483511 3,378023079 391 27 4,567940389 2,510934367 392 28 5,496964943 3,032690003 393 29 5,524313672 2,52693821 394 30 6,09674534 2,090764361 395 31 5,295547468 2,369034959 396 32 4,025032826 2,573967733 397 33 4,393984323 1,974796861 398 34 5,101243382 2,130597905 399 35 5,073103935 2,125363692 400 36 5,765610324 2,343279472 401 37 5,070099168 2,077106442 402 38 5,366641186 2,20423374 403 39 5,076713377 1,603397373 404 40 4,217334883 1,769608556 405 41 5,016815039 2,191172671 406 42 4,207594271 2,43359453 407 43 3,394071279 1,963768465 408 44 3,362870476 2,306527139 409 45 2,911685454 2,351987481 410 46 3,379742244 1,845091932 411 47 3,540194939 2,136113711 412 48 3,328316323 2,102931207 413 49 4,259723533 1,846143589 414 50 3,74742839 2,258282862 415 51 4,306626094 2,364251421 416 52 2,793171603 1,866622592 417 2007 4,332588735 2,442917848 418 2 3,356982084 2,085780123 79 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 419 3 2,535917543 2,505625725 420 4 3,061836882 2,542862003 421 5 3,025475901 3,205863605 422 6 2,945689726 2,144783146 423 7 2,814488594 2,475207474 424 8 3,415509232 1,789275626 425 9 3,887426141 2,460959708 426 10 2,851443094 2,246845987 427 11 3,499059148 2,762311296 428 12 3,624860216 2,651039413 429 13 4,627142215 2,766282341 430 14 3,122178376 3,37842056 431 15 3,825086543 3,095334836 432 16 3,987330983 3,293635581 433 17 3,461986402 3,182978461 434 18 3,166740994 3,41704953 435 19 3,280841081 3,822620512 436 20 4,154815487 3,663365532 437 21 3,928552377 3,706147148 438 22 4,761394751 3,076233634 439 23 5,89622021 3,0299074 440 24 5,097328497 2,941994807 441 25 6,50537761 3,210912403 442 26 5,780622501 2,768359134 443 27 6,156287338 2,66685056 444 28 6,435369681 2,557503054 445 29 7,945045522 3,040883058 446 30 6,609344566 2,289402863 447 31 6,787544935 2,323816198 448 32 6,177969083 2,941467117 449 33 5,845289371 2,429244879 80 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 450 34 5,113563304 2,658331146 451 35 4,379085979 2,547469324 452 36 5,060104092 2,292423669 453 37 4,697502512 2,296036226 454 38 4,655069132 2,537740361 455 39 3,577884404 2,532165287 456 40 4,727671708 2,43071062 457 41 3,048450878 2,585855405 458 42 4,197403121 2,442405693 459 43 3,701194077 1,861089663 460 44 4,442691203 2,498372601 461 45 3,060896839 2,470030959 462 46 3,564123064 2,121098139 463 47 3,976244174 2,567418721 464 48 3,609923827 1,969851009 465 49 3,564716021 2,178650535 466 50 3,214408437 2,247967305 467 51 3,034642241 2,446817048 468 52 3,833935119 2,029967266 469 2008 4,438015213 2,663157223 470 2 3,45470749 2,589312194 471 3 2,86127378 2,806079772 472 4 3,545202108 2,232630846 473 5 2,7203059 2,296258351 474 6 2,994400938 2,34106788 475 7 3,038127986 2,648048366 476 8 3,430841782 2,392516533 477 9 3,454067238 3,170201348 478 10 2,97331426 2,280957565 479 11 2,129927964 2,563701932 480 12 2,327909933 2,535040538 81 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 481 13 2,714026425 2,484568301 482 14 2,706302879 3,197665745 483 15 2,900010397 2,821478628 484 16 3,881363959 3,27698199 485 17 3,722567983 2,891213146 486 18 3,315262708 3,406859411 487 19 4,553873249 3,001802389 488 20 4,90952582 3,065061585 489 21 4,39571697 3,418358922 490 22 4,727080518 3,061348979 491 23 4,861319937 3,256062757 492 24 3,530811891 2,840071525 493 25 6,287605576 3,665049931 494 26 6,20862411 2,965079992 495 27 5,362454976 3,540484393 496 28 5,549899141 2,638532611 497 29 4,899502037 3,316761273 498 30 5,080209476 2,821252327 499 31 3,963199437 3,037474832 500 32 4,990071849 2,534143311 501 33 4,075546182 3,387522787 502 34 4,357112473 3,631690555 503 35 4,775560938 2,764871521 504 36 4,452718797 2,486186471 505 37 4,523155179 3,028679256 506 38 4,754156147 2,140650528 507 39 4,510109108 3,159202611 508 40 4,187476367 2,48669453 509 41 4,949516273 2,897208385 510 42 3,971187483 3,252789541 511 43 3,218953642 2,925631404 82 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 512 44 4,228252809 2,901473719 513 45 4,175005379 3,019953446 514 46 3,675998077 2,237044608 515 47 3,335410544 2,665363092 516 48 4,598134974 2,624850976 517 49 3,610168052 2,291856386 518 50 3,260335912 2,714904983 519 51 3,971665026 3,041044824 520 52 4,307248992 2,389941234 Base de dados 3. Séries temporais da proporção anual de óbitos por causas mal definidas e não indeterminadas em idosos (65 anos ou mais) nas regiões Nordeste e Sul, 1996-2008. Fonte: Oliveira JFM et al. (2013) Ano Região Nordeste Região Sul 1996 41,06303317 8,598494049 1997 39,63596764 7,652268058 1998 37,91922601 7,469633039 1999 37,40455101 6,785979639 2000 34,60811114 5,783138592 2001 33,36691972 5,577420443 2002 32,45405441 5,483368924 2003 30,90742684 5,589099025 2004 27,38039246 5,018566445 2005 19,54497248 4,621552058 2006 9,786563924 4,42056809 2007 8,08077049 4,101241844 2008 7,821469981 3,77188806 83 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE Base de dados 4. Série temporal da taxa mensal de primeiras consultas médicas ambulatoriais por queixas relacionadas a otite em crianças de 2 a 23 meses de idade, em Goiânia, GO, antes (01/2008 a 05/2010) e depois (06/2010 a 08/2013) do início da vacinação antipneumocócica 10-valente (PVC10) em crianças. Fonte: Sartori AL et al. (2017) Ano Mês Contagem Degrau Rampa Seno Cosseno Consultas por otite 2008 1 1 0 0 0 1 21,93022797 2008 2 2 0 0 0,5 0,866025404 30,20743092 2008 3 3 0 0 0,866025404 0,5 42,62762282 2008 4 4 0 0 1 6,12574E-17 42,32861781 2008 5 5 0 0 0,866025404 -0,5 43,30295015 2008 6 6 0 0 0,5 -0,866025404 50,01201576 2008 7 7 0 0 1,22515E-16 -1 45,89161371 2008 8 8 0 0 -0,5 -0,866025404 34,1154218 2008 9 9 0 0 -0,866025404 -0,5 34,44981177 2008 10 10 0 0 -1 -1,83772E-16 43,40084013 2008 11 11 0 0 -0,866025404 0,5 34,80020933 2008 12 12 0 0 -0,5 0,866025404 41,20417272 2009 1 13 0 0 -2,4503E-16 1 19,17338837 2009 2 14 0 0 0,5 0,866025404 19,18204916 2009 3 15 0 0 0,866025404 0,5 38,06158248 2009 4 16 0 0 1 1,19447E-15 42,23864143 2009 5 17 0 0 0,866025404 -0,5 38,41610999 2009 6 18 0 0 0,5 -0,866025404 42,27680917 2009 7 19 0 0 3,67545E-16 -1 45,8205648 2009 8 20 0 0 -0,5 -0,866025404 39,10932871 2009 9 21 0 0 -0,866025404 -0,5 35,27843788 2009 10 22 0 0 -1 -4,28802E-16 42,99496402 2009 11 23 0 0 -0,866025404 0,5 47,18742259 2009 12 24 0 0 -0,5 0,866025404 33,07823108 2010 1 25 0 0 -4,90059E-16 1 26,66731401 2010 2 26 0 0 0,5 0,866025404 24,42929337 84 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 2010 3 27 0 0 0,866025404 0,5 42,44899125 2010 4 28 0 0 1 5,51317E-16 37,32050936 2010 5 29 0 0 0,866025404 -0,5 35,40612422 2010 6 30 1 1 0,5 -0,866025404 40,89644472 2010 7 31 1 2 2,38893E-15 -1 34,14945912 2010 8 32 1 3 -0,5 -0,866025404 32,23102332 2010 9 33 1 4 -0,866025404 -0,5 33,85786147 2010 10 34 1 5 -1 1,10253E-15 29,03413317 2010 11 35 1 6 -0,866025404 0,5 25,17428172 2010 12 36 1 7 -0,5 0,866025404 28,41458305 2011 1 37 1 8 -7,35089E-16 1 22,28968015 2011 2 38 1 9 0,5 0,866025404 23,59248764 2011 3 39 1 10 0,866025404 0,5 34,27305925 2011 4 40 1 11 1 2,5727E-15 25,87814391 2011 5 41 1 12 0,866025404 -0,5 22,0063583 2011 6 42 1 13 0,5 -0,866025404 22,01629876 2011 7 43 1 14 8,57604E-16 -1 19,75883627 2011 8 44 1 15 -0,5 -0,866025404 21,7121315 2011 9 45 1 16 -0,866025404 -0,5 24,63981147 2011 10 46 1 17 -1 8,57495E-16 24,97529597 2011 11 47 1 18 -0,866025404 0,5 23,3640725 2011 12 48 1 19 -0,5 0,866025404 18,50491245 2012 1 49 1 20 -9,80119E-16 1 17,53888858 2012 2 50 1 21 0,5 0,866025404 16,57198821 2012 3 51 1 22 0,866025404 0,5 24,3815793 2012 4 52 1 23 1 2,81773E-15 20,16454327 2012 5 53 1 24 0,866025404 -0,5 22,12594065 2012 6 54 1 25 0,5 -0,866025404 27,018862 2012 7 55 1 26 1,10263E-15 -1 21,49458312 2012 8 56 1 27 -0,5 -0,866025404 22,15593764 2012 9 57 1 28 -0,866025404 -0,5 23,46982482 85 profePI • curso: ANÁLISE DE SÉRIES TEMPORAIS EM VIGILÂNCIA EM SAÚDE 2012 10 58 1 29 -1 -2,94025E-15 23,15430931 2012 11 59 1 30 -0,866025404 0,5 19,90212489 2012 12 60 1 31 -0,5 0,866025404 16,97340938 2013 1 61 1 32 -4,77786E-15 1 10,77648575 2013 2 62 1 33 0,5 0,866025404 16,00869946 2013 3 63 1 34 0,866025404 0,5 20,91880091 2013 4 64 1 35 1 -4,89951E-16 22,23630673 2013 5 65 1 36 0,866025404 -0,5 25,84507844 2013 6 66 1 37 0,5 -0,866025404 18,65618022 2013 7 67 1 38 -2,20505E-15 -1 18,00975318 2013 8 68 1 39 -0,5 -0,866025404 18,01793639 86