Guideline – Estratégias para lidar e prevenir dados faltantes durante o desenho, planejamento, condução e análise de estudos clínicos



Introdução

A evidência científica é o subsídio fundamental na produção de ciência. E, visando à melhor evidência disponível, é essencial a utilização de metodologias adequadas na busca do conhecimento, sejam elas revisões sistemáticas, estudos experimentais ou pesquisas observacionais.

Em relação à pesquisa clínica, existem diversos mecanismos metodológicos empregados no delineamento de um ensaio clínico que visam proporcionar a maior imparcialidade possível na comparação de diferentes intervenções, como a configuração do estudo clínico (configuração em paralelo, configuração cruzada, ensaios sequentes, etc.), a definição das variáveis; a utilização de grupo controle; a randomização e o mascaramento.

Entretanto, o adequado delineamento de um estudo clínico não é suficiente por si só para garantir total imparcialidade na avaliação de seus resultados. Outro aspecto necessário para garantir essa isenção seria a ausência de interferências ou vieses decorrentes da ausência de dados, bem como a padronização e imparcialidade na obtenção dos dados por parte da equipe do estudo.

Por mais criteriosa que seja a condução das diversas etapas de um ensaio clínico (desenho, planejamento, condução e análise), em Pesquisa Clínica é bastante comum a ocorrência de dados faltantes.

Muitos autores afirmam que a análise da população Intenção-de-Tratar – ITT, ou seja, todos os participantes de pesquisa que administraram ao menos uma dose da medicação do estudo, é considerado o critério mais adequado para a avaliação da utilidade de uma nova terapia. Contudo, quando ocorrem abandonos do estudo (dropout) ou quando, por algum motivo, o participante de pesquisa não comparece às visitas e até mesmo por eventual falha da equipe do estudo na captação de dados, a produção de dados faltantes pode comprometer a análise acerca da relação de causalidade da terapia em estudo.

Little e Rubin, 2002, identificaram três categorias para classificar como os dados faltantes são gerados:

  • Missing Completely at Random (MCAR) – A causa que levou aos dados faltantes é um evento aleatório (Veroneze, 2011), não estando relacionado a quaisquer variáveis observadas ou não observadas. Desta forma, a probabilidade da ausência de dados é igual para qualquer participante do estudo. Exemplo: durante a aferição da temperatura de um participante de pesquisa, o termômetro acidentalmente cai no chão e quebra, impedindo a obtenção do dado.
  • Missing at Random (MAR) – Os dados faltantes são causados por alguma variável observada, disponível para análise e correlacionada com a variável que possui dados faltantes (Veroneze, 2011). Exemplo: Em um determinado estudo clínico foi observado o preenchimento mais efetivo do diário em participantes do sexo feminino, ocorrendo maior incidência de ausência de dados entre os homens, embora as mesmas instruções de preenchimento tenham sido repassadas a ambos os sexos. Ou seja, a ausência de dados é dependente dos dados observados, mas não dos desfechos.
  • Missing Not at Random (MNAR) – A probabilidade de dados faltantes depende dos dados não observados. Esta situação pode acontecer quando a causa dos dados faltantes numa variável é o próprio valor dela (Veroneze R, 2011). Neste caso, não há informação dentro do conjunto de dados que permita modelar e compreender a maneira com que os dados faltantes aconteceram (Graham, 2009; Mcknight et al., 2007). Exemplo: É comum o abandono do estudo em razão da ausência de eficácia de um determinado tratamento. Entretanto, os dados referentes a essa ausência de eficácia podem não ser obtidos naqueles participantes que abandonam o estudo (drop out).
  • A identificação e o entendimento da natureza dos dados faltantes é imprescindível para a análise do potencial impacto nos resultados dos estudos e em suas interpretações (Mcknight et al, 2007), assim como na escolha dos mecanismos e abordagens analíticas para lidar com estes dados ausentes.

    Por muitos anos, foram utilizadas técnicas de análise a partir de deleções ou preenchimento arbitrário de dados faltantes, muito embora estas técnicas sejam propensas ao viés. Felizmente, no último quarto de século, grandes avanços têm sido alcançados no desenvolvimento de técnicas analíticas para avaliar os efeitos causais na ausência de dados, como, por exemplo: ponderação pela probabilidade inversa, imputação múltipla e análise baseada em probabilidade. Ainda assim, é importante entender que estes métodos são apenas ferramentas e não soluções.

    São muitas as incertezas envolvidas com os mecanismos de identificação e avaliação de dados faltantes, por isso o melhor método para lidar com estes dados é a prevenção. O’Neill (2012) descreveu a necessidade de uma mudança cultural focada em estratégias para a prevenção de dados faltantes durante a condução e gestão de pesquisas clínicas.

    Quando planejamos um estudo, conduzimos uma análise ou criticamente revisamos os resultados de pesquisa, é importante contemplar como os dados faltantes são gerados. Existem grupos mais prováveis para apresentar dados faltantes? Existem respostas que podem ser mais facilmente perdidas? Quais estratégias podem ser utilizadas a fim de minimizar a ausência de dados nas diversas etapas de um estudo clínico?

    Com base nestas questões, a equipe da Unidade de Pesquisa Clínica do Centro de Medicina Reprodutiva Dr. Carlos Isaia Filho Ltda. observou a necessidade de elaborar uma Guideline sobre estratégias para prevenção de dados faltantes nas diferentes etapas de um ensaio clínico.

    Guideline: estratégias para prevenção de dados faltantes em estudos clínicos

    Seja no delineamento, no planejamento, na condução ou na análise de um estudo clínico, existem alguns pontos importantes que devem ser previamente discutidos pela equipe responsável e, dentro do possível, adotados, de modo a minimizar a ausência de dados em um estudo clínico:

    Desenho do estudo

  • Abordar populações-alvo com incentivos para permanecer no estudo, utilizando regimes flexíveis de tratamentos que aumentam a aderência e resultados que possam ser apurados/verificados numa grande proporção de participantes;
  • Limitar as responsabilidades dos participantes, reduzindo o número de visitas e a quantidade de dados coletados em cada visita sem perda da qualidade do estudo;
  • Adotar métodos de coleta de dados que não necessitam de visitas presenciais;
  • Utilizar períodos mais curtos de follow-up para resultados primários;
  • Estimar a quantidade de dados faltantes e prováveis razões para isso.

  • A seguir, apresentamos um exemplo de uma falha no desenho de um estudo clínico:
    Num determinado estudo clínico, os participantes de pesquisa receberam um diário no qual deveriam registrar os horários em que a medicação era administrada, bem como realizar avaliações de intensidade da sua dor. A medicação deveria ser administrada de 8h em 8h e a avaliação da dor realizada 1 hora antes, 1 hora depois e 2 horas depois da administração do medicamento.

    Com este delineamento, o participante de pesquisa obrigatoriamente necessitaria acordar ao longo da madrugada para registrar as marcações. Exemplo:
    Caso a primeira dose da medicação seja às 10h, a segunda e a terceira doses seriam, respectivamente, às 18h e às 02h. Neste último caso, além da administração da medicação, o voluntário deveria ainda avaliar a intensidade de sua dor à 01h, às 03h e às 04h.

    Considerando um período de 24 horas, o participante de pesquisa estaria envolvido nas atividades do estudo durante 09 horas.

    Casos como este abrem precedentes à ocorrência de dados faltantes ou, o que seria pior, ao falseamento de dados. Por esta razão, a grande necessidade de serem adotadas configurações metodológicas que minimizem este tipo de possibilidade.

    Planejamento do estudo

  • Selecionar possíveis locais de referência para desenvolver o estudo, recrutar os participantes de pesquisa e realizar as visitas de seguimento e final;
  • Antes do recrutamento, é essencial treinar e certificar a equipe do estudo para a correta execução do protocolo. Exercícios de treinamento do protocolo podem identificar possíveis falhas que contribuem para os dados faltantes;
  • Desenvolver documentação detalhada do estudo, na forma de manual de operações, abordando todos os aspectos do estudo, incluindo os procedimentos de triagem, requisitos de treinamento, métodos de comunicação, entrega do tratamento, horários e janelas para avaliações, coleta de dados, procedimentos de entrada e edição de dados, etc.;
  • Desenvolver um Termo de Consentimento Livre e Esclarecido (TCLE) que distingue a diferença entre a retirada do tratamento e a retirada do estudo;
  • Planejar um orçamento e adotar mecanismos de ressarcimento (passagem e alimentação) que viabilizem a conclusão do estudo.

  • Condução do estudo

  • Utilizar abordagens que mantenham os participantes envolvidos no estudo, incluindo lembretes das visitas, boletins informativos e telefonemas para monitorá-los. Além disso, é fundamental que a equipe do estudo frequentemente demonstre a importância do papel do participante no estudo;
  • Acompanhar possíveis razões para a retirada do estudo ou das intervenções;
  • Identificar e intervir com os participantes que se mostram susceptíveis a abandonar o estudo (dropout);
  • Apresentar no manual de operações um esquema de procedimentos para entrar em contato com participantes que tenham visitas perdidas;
  • Registrar os dados em tempo útil (o mais rápido possível) permite a detecção precoce de problemas com dados faltantes;
  • Implementar um processo de verificação quanto à precisão e discrepâncias resolvidas antes da entrada dos dados;
  • Desenvolver relatórios de acompanhamento para monitorar regularmente os dados faltantes;
  • Elaborar um método eficiente de comunicação com a equipe do estudo para a identificação e resolução de imprevistos que possam surgir durante o estudo (Plano de Gerenciamento da Comunicação);
  • Encontros regulares da equipe do estudo (presenciais ou não) permitem a identificação e oportunidade de resolver possíveis causas da falta de dados.

  • Análise do estudo

    É interessante que o plano estatístico descrito no protocolo do estudo clínico compreenda também metodologias de tratamento e análise de possíveis dados ausentes ao final do estudo, levando-se em conta que:

  • A quantidade de dados faltantes, padrões de dados faltantes e variáveis associadas com a omissão irão definir a técnica metodológica mais adequada a ser utilizada, seja na análise primária ou na análise de sensibilidade;
  • Para análises primárias, devem ser utilizados métodos que façam uso de todos os dados disponíveis, tais como imputações múltiplas e abordagens baseadas em probabilidade;
  • Prevenir o uso de soluções “ad hoc” (por ex: última observação realizada) em análises primárias, pois fazem suposições irrazoáveis sobre os mecanismos que produzem os dados faltantes.


  • REFERÊNCIAS

    Dziura JD, Post LA, Zhao Q, Fu Zhixuan, Peduzzib P. Strategies for dealing with missing data in clinical trials: from design to analysis. Yale J Biol Med. 2013 Sep;86(3):343-358.

    O’Neill RT, Temple R. The prevention and treatment of missing data in clinical trials: an FDA perspective on the importance of dealing with it. Clin Pharmacol Ther. 2012;91(3):550-554.

    Little RJA, Rubin DB. Statistical analysis with missing data. New York: Wiley; 1987. Wisniewski SR, Leon AC, Otto MW, Trivedi MH. Prevention of missing data in clinical research studies. Biol Psychiatry. 2006;59(11):997-1000.

    Veroneze R. Tratamento de dados faltantes empregando biclusterização com imputação múltipla. Campinas. Dissertação de Mestrado da Faculdade de Engenharia Elétrica e de Computação da Universidade Estadual de Campinas; 2011.