INTRODUCCIÓN
El dolor torácico de etiología no identificada representa uno de los motivos de consulta más frecuentes en los servicios de emergencias médicas (SEM), con una tendencia creciente en las últimas décadas. Esta información implica un desafío en términos de realizar un diagnóstico rápido y eficaz por parte del equipo médico, donde muchas veces se debe decidir entre continuar con un estudio más profundo de la patología en el ámbito hospitalario o derivar al paciente para continuar su estudio ambulatorio, decisión que conlleva un alto riesgo, asociado al subdiagnóstico de patologías graves y, en consecuencia, un desenlace clínico ominoso.
Se han analizado múltiples estrategias y algoritmos diagnósticos para disminuir estos riesgos. Las herramientas diagnósticas contemporáneas que se encuentran validadas (como el score HEART) solo consideran de manera parcial los datos relacionados al dolor torácico obtenidos a través de la anamnesis por parte del médico tratante; se presenta así, una amplia dispersión en relación a las interpretaciones médicas frente a un mismo cuadro clínico, basadas en la experiencia del equipo médico interviniente.1,2 Por esa razón, no existe en la actualidad un único método diagnóstico que pueda vincular los datos objetivos de los pacientes con los datos subjetivos derivados de la anamnesis, que sintetice así la información obtenida en un algoritmo predictor de riesgo.
Consideramos que en la era de la tecnología digital, y con el advenimiento de la inteligencia artificial y los algoritmos de machine learning, un clasificador de riesgo que utilice estas tecnologías puede ser una herramienta útil a fin de predecir la ocurrencia de un síndrome coronario agudo (SCA) en los pacientes que concurren de forma espontánea al SEM con dolor torácico de etiología no identificada.
OBJETIVO
Demostrar la capacidad de los clasificadores de machine learning para diagnosticar y predecir un SCA en pacientes que consultan de forma espontánea al SEM con dolor torácico de etiología no identificada, durante un período de seguimiento de 30 días.
MATERIAL Y MÉTODOS
Se realizó un estudio prospectivo, observacional en un centro monovalente de cardiología en la Ciudad Autónoma de Buenos Aires, en el período comprendido entre agosto de 2018 y abril de 2019.
Criterios de exclusión
Pacientes derivados con electrocardiograma (ECG) con presencia de supradesnivel del segmento ST.
Pacientes con inestabilidad hemodinámica cardíacas al momento de la consulta.
Se analizaron los datos obtenidos de una cohorte de 161 pacientes que consultaron al SEM por presentar dolor torácico de etiología no aclarada. Durante la etapa de triage de dolor se registraron, mediante la utilización de un clasificador de machine learning integrado en un dispositivo digital portátil (tablet o smartphone), las variables objetivas y subjetivas del dolor torácico recabadas durante la anamnesis diagnóstica realizada por el médico tratante.
a. Variables objetivas del paciente:
Edad.
Sexo.
Peso.
Altura.
Hipertensión arterial.
Dislipemia.
Diabetes con o sin requerimiento de insulinoterapia.
Tabaquismo (actual o último mes) y ex tabaquismo (más de un mes).
Antecedentes cardiovasculares heredofamiliares.
Presión arterial y diastólica.
Frecuencia cardíaca.
Signos positivos al examen físico cardiovascular: tercer ruido cardíaco, rales crepitantes pulmonares.
b. Variables subjetivas obtenidas:
Característica del dolor: punzante, opresivo, urente, lancinante, transfixiante.
Intensidad del dolor: objetivada a través de una escala visual análoga con un puntaje numérico de 1 a 10 (donde 1 es equivalente a “mínima intensidad”, y 10 a “máxima intensidad” de dolor).
Duración del dolor, y el número de episodios en las últimas 24 horas; aumento o disminución del dolor con el esfuerzo.
Alivio del dolor con nitratos.
Síntomas asociados con el dolor: sudoración, mareos, tenesmo, palpitaciones, náuseas, falta de aire.
Cambios de la intensidad del dolor con el movimiento del torso, movimiento de los brazos, mediante la presión de la zona de dolor, tos, inspiración.
Evaluación de la percepción del dolor mediante una escala visual continua, dato que fue señalado por el paciente en el dispositivo digital con instrucciones por parte del médico tratante.
Localización del sitio de dolor mediante un esquema corporal táctil integrado en el dispositivo digital, dato que fue señalado por el paciente en el dispositivo digital con instrucciones por parte del médico tratante. 3,4,5,6
Se registraron además antecedentes cardiovasculares previos, como angioplastia transluminal coronaria (ATC), cirugía de revascularización miocárdica (CRM) y síndrome coronario agudo (SCA) con y sin elevación del segmento ST.
El sistema clasificador mediante el algoritmo de machine learning utilizado fue desarrollado en colaboración con la empresa Sigmind LAB, quienes desarrollaron e implementaron un sistema de resguardo digital con el objetivo de asegurar la privacidad y la confidencialidad de los datos obtenidos mediante el uso del algoritmo a través de un acceso codificado, solo accesible por parte del equipo de investigadores del estudio.
Como modelo predictivo se utilizó la implementación de Scikit-Learn de Random Forest Classifier de 150 estimadores. 7Random Forest es un clasificador, es decir un algoritmo que predice, a partir de datos de entrada, valores de salida. En este caso, el modelo utilizado predice si un paciente desarrollará o no un evento a partir de los datos ingresados en el dispositivo digital (datos objetivos y subjetivos del paciente). De esta forma, el algoritmo se entrena con datos conocidos, es decir, se lo expone a datos de entrada, y para cada dato de entrada se le enseña el dato de salida o variable a predecir. Mediante este procesamiento de datos, al terminar la etapa de entrenamiento el algoritmo es capaz de generar el conocimiento modelado en datos nunca vistos, o datos de test.
Los algoritmos de machine learning pueden sobreajustar los datos de entrenamiento; para evitarlo, usamos una estrategia descrita ampliamente en la bibliografía: validación cruzada (cross-validation). En este trabajo usamos una validación cruzada de 10 folds. La validación cruzada consiste en separar la muestra de datos conocida (es decir, el conjunto de datos de los pacientes y las variables a predecir) en k-folds. Luego se toma k-1 folds (es decir, el 90% de los pacientes que participaron en el protocolo) y se entrena el algoritmo.
A continuación de la etapa de entrenamiento, se pasa a la etapa de testing y se predice si los pacientes no usados en la etapa de entrenamiento (los del fold restante) generarán un evento o no. Al tener conocimiento, mediante la adjudicacion de los eventos clinicos en el seguimiento, cada paciente del fold usado como test, obteniendo de esta manera, un valor real que se aproxima a cómo se comportaría el algoritmo entrenado en datos de pacientes nuevos. Entonces, se comienza nuevamente, eligiendo otro de los folds como grupo de test y se repite la acción k veces. Recopilamos el resultado tomando la media del desempeño sobre todos los folds. Se adjunta el link de la implementación que fue utilizada, https://scikitlearn.org/stable/modules/generated/sklearn.ensemble. RandomForestClassifier.html
Se realizó un período de seguimiento de 30 días desde el momento de la consulta índice. Se contactó a los pacientes vía telefónica o presencial y se analizó la ocurrencia de eventos.
Se analizaron los siguientes eventos:
Muerte cardiovascular. Muerte por infarto agudo de miocardio (IAM), accidente cerebrovascular (ACV), arritmia ventricular o muerte súbita de causa no aclarada.
IAM no fatal con y sin elevación del segmento ST, definido según la cuarta definición universal de IAM.
Síndrome coronario agudo (SCA). El compuesto de infarto y angina inestable.
Angioplastía transluminal coronaria (ATC).
Cirugía de revascularización miocárdica (CRM).
La adjudicación de los eventos fue realizada de manera presencial o a través de los datos de la historia clínica electrónica (HCE), y de un llamado telefónico por parte de uno de los investigadores del estudio.
Análisis estadístico
Se informó la media para cada medida de performance. Para las variables de valores continuas se analizó la diferencia estadística entre las poblaciones mediante test t de Student, dadas las características de normalidad de las medidas.
Se realizó una etapa inicial de verificación previa a la implementación del uso del algoritmo con el objetivo de evaluar errores evitables del clasificador, la comprensión del modelo y la factibilidad de utilización del sistema digital por parte del equipo médico tratante perteneciente al SEM. Los pacientes analizados durante la etapa inicial de testeo (n = 20) fueron excluidos del análisis posterior.
Consideraciones éticas
Todos los pacientes firmaron su consentimiento informado, que fue aprobado por el comité de ética de la institución.
El estudio se llevó a cabo en cumplimiento con la ley Nacional de Protección de Datos Personales n° 25.326, por lo que la identidad de los pacientes y todos sus datos personales permanecerán de forma anónima, y tienen acceso a estos datos solo los investigadores de ANGINA y miembros del comité de docencia, ética e investigación si así se requiriese. El estudio fue conducido de acuerdo con las normas éticas nacionales (ley CABA n° 3301, ley Nacional de Investigación Clínica en Seres Humanos, declaración de Helsinki y otras).
RESULTADOS
Se analizaron los datos pertenecientes a 161 pacientes que consultaron al servicio de emergencias por dolor torácico de etiología no identificada. La edad promedio de los pacientes fue de 57 ± 12 años, de los cuales el 72,7% era de sexo masculino. El 51,5% presentaba hipertensión arterial, 14,2% diabetes mellitus, 51,5% dislipemia y el 14,3% tabaquismo. Al interrogatorio dirigido, el 18% refirió presentar antecedentes cardiovasculares heredofamiliares y el 17,4% presentó un evento coronario previo (23,6% ATC, 5% CRM) (Tabla 1).
Variable | Valor |
---|---|
Edad - años | 57±12 |
Hipertensión - n | 93 (51,5%) |
Tabaquismo - n | 23 (14,3%) |
Dislipemia - n | 93 (51,5%) |
Antecedentes familiares- n | 29 (18%) |
Sexo masculino - n | 117 (72,7%) |
Diabetes - n | 23 (14,2%) |
Evento coronario previo - n | 28 (17,4%) |
Angioplastía coronaria previa - n | 38 (23,6%) |
CRM previa - n | 8 (5%) |
CRM: Cirugía de revascularización miocárdica. CV: Cardiovascular.
Del total de pacientes analizados, el 57,8% (n = 85 ver Tabla) presentaba un síndrome coronario agudo, con una incidencia de IAM de 29,8% (n = 48), de los cuales requiró revascularización por ATC el 35% (n = 56) y CRM el 9,9% (n = 16). No hubo eventos de muerte en el seguimiento (Tabla 2).
Evento | n (%) |
---|---|
Síndrome coronario agudo | 93 (57,8%) |
IAM | 48 (29,8%) |
ATC | 56 (35%) |
CRM | 16 (9,9%) |
IAM: Infarto agudo de miocardio. ATC: Angioplastía transluminal coronaria. CRM: Cirugía de revascularización miocárdica.
El modelo de machine learning, mediante la utilización de un Random Forest como modelo de clasificación, presentó un área bajo la curva ROC (AUC) de 0,8991, con una sensibilidad de 0,8552, especificidad del 0,8588 y una precisión de 0,8441, considerando como clase positiva los pacientes que presentaron un SCA en el seguimiento (Figura 1).
Las variables predictoras más influyentes para el modelo fueron, en orden de importancia: peso (p = 0,002), edad (p = 5,011e-07), intensidad del dolor (p = 3,0679e-05), y la percepción del dolor mediante una escala visual continua (p = 1,590 e-04). Todas las variables mencionadas presentaron significancia estadística luego de la corrección de Bonferroni por múltiples comparaciones.
DISCUSIÓN
En este estudio se demostró que la utilización de clasificadores de machine learning es una herramienta útil y efectiva para predecir la probabilidad de presentar un síndrome coronario agudo en pacientes que se presentan de forma espontánea al servicio de emergencias médicas con dolor torácico de etiología no identificada.
La tecnología es parte de nuestras vidas, y no solo como facilitador de actividades lúdicas, sino también en lo que respecta al cuidado de la salud y el bienestar. En las últimas décadas se han implementado múltiples estrategias relacionadas con la prevención y el diagnóstico precoz de enfermedades, ejecutadas a través de dispositivos digitales como smartphones, tablets y relojes inteligentes, que se encuentran actualmente ampliamente difundidos, accesibles y utilizados por diversos grupos etarios.
Dentro de este avance se encuentran los métodos fundamentados en los procesos de la inteligencia artificial y machine learning, entendiéndose a éste como la habilidad adquirida de un sistema informático para obtener conocimiento de forma autónoma, mediante la extracción de patrones desde una base de datos con gran volumen de información. 8
Diversos estudios han demostrado el beneficio de los clasificadores de machine learning para predecir la probabilidad de un SCA en pacientes que presentan dolor torácico. En el trabajo realizado por VanHouten y colaboradores se obtuvieron 20.078 variables utilizadas por los algoritmos diagnósticos de SCA convencionales pertenecientes a un registro multicéntrico de pacientes, y se las analizó mediante clasificadores de machine learning utilizando algoritmos de Random Forest y Elastic Net. 9 El clasificador de Random Forest obtuvo un AUC de 0,848, y una AUC de 0,849 en el set de validación; este desempeño fue superior a los scores de estratificación de riesgo comúnmente utilizados, como el score de TIMI o el score GRACE. 10,11
Contrastándolo con nuestro modelo de machine learning podemos evidenciar similar AUC destacándose como principal diferencia en el presente estudio la toma prospectiva de datos.
También se ha demostrado que estos algoritmos son capaces de predecir con gran eficacia eventos cardiovasculares a largo plazo. El estudio llevado a cabo por Weng y colaboradores demostró que los clasificadores de machine learning son ampliamente efectivos en predecir un evento cardiovascular en una población sin antecedentes cardiovasculares conocidos en un período de seguimiento a 10 años, siendo aún más efectivos y precisos que los algoritmos clínicos utilizados de acuerdo con las guías de manejo clínico contemporáneas, identificando de tal forma a los pacientes que pueden beneficiarse de un tratamiento preventivo precoz. 12
Consideramos que la utilización de estos algoritmos de machine learning pueden ser de gran utilidad en nuestro medio, principalmente debido a la gran demanda de personal de salud y a la elevada variabilidad en la presunción diagnóstica interobservador de acuerdo con el entrenamiento médico adquirido, donde los algoritmos de machine learning podrían complementar la atención médica a través de su capacidad de estratificación de riesgo, permitiendo así focalizar mayor tiempo de atención en las patologías que revisten mayor gravedad; como herramienta adicional para la correcta interpretación de los resultados de estudios complementarios solicitados y como factor pronóstico actuando en conjunto con las estrategias contemporáneas convencionales. 13,14,15,16
Los clasificadores de inteligencia artificial basados en algoritmos de machine learning no provienen de un lugar remoto e inaccesible. En la Argentina ya han sido utilizados en el terreno de la salud pública. En el estudio de Scavuzzo y colaboradores se utilizó un algoritmo basado en redes neuronales de machine learning para identificar y predecir las regiones con mayor concentración de huevos del mosquito Aedes aegypti y así implementar estrategias de prevención contra el dengue. 17
Limitaciones
Como limitaciones de nuestro algoritmo predictor podríamos mencionar, en primera instancia, el potencial sesgo en la recolección de datos debido a que los pacientes fueron evaluados en la guardia por cardiólogos en un centro monovalente de cardiología. Sin embargo, la mayoría de los datos documentados tenían respuestas de tipo dicotómicas, lo que debería disminuir este potencial sesgo.
En segunda instancia, existió un gran número de eventos clínicos en nuestro trabajo lo cual implica mayor valor predictivo positivo por sobre el negativo.
Consideramos que podría ser útil una comparación entre el comportamiento de nuestro algoritmo y los clásicamente utilizados como el score HEART, GRACE o TIMI. Estos datos serán analizados en futuros análisis.
Investigaciones futuras
Este trabajo está incluido en un programa que tiene los siguientes pasos preestablecidos:
Validación del algoritmo de machine learning utilizado en otras poblaciones de hospitales públicos y privados, con médicos pertenecientes a los servicios de emergencias médicas de diferentes subespecialidades.
Purificar el algoritmo sobre la base de toda esta información obtenida, con el objetivo de mejorar su capacidad predictiva y pronóstica.
Desarrollar una aplicación para uso público.