SciELO - Scientific Electronic Library Online

 
vol.92 número1Miectomia septal ampliada en la miocardiopatía hipertrófica obstructivaRemodelado del ventrículo izquierdo postinfarto: una mirada desde la perfusión miocárdica gated-SPECT índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

Compartir


Revista argentina de cardiología

versión On-line ISSN 1850-3748

Rev. argent. cardiol. vol.92 no.1 Ciudad Autónoma de Buenos Aires mar. 2024  Epub 28-Feb-2024

http://dx.doi.org/10.7775/rac.es.v92.i1.20723 

ARTÍCULO ORIGINAL

Optimización de la interpretación de ecocardiogramas con la utilización de Machine Learning en el estudio WASE

Juan I Cotella1 
http://orcid.org/0000-0003-4317-8725

Karima Addetia1 
http://orcid.org/0000-0001-6424-7860

Tatsuya Miyoshi2 
http://orcid.org/0000-0002-0597-1776

Kalie Kebed1 

Alexandra Blitz3 

Marcus Schreckenberg3 
http://orcid.org/0000-0003-3698-549X

Niklas Hitschrich3 
http://orcid.org/0000-0001-9002-5997

Aldo D. Prado4 

Eduardo Filipini5  MTSAC

Ricardo Ronderos5 

Victor Mor-Avi1 

Roberto M. Lang1 

Federico M. Asch2 
http://orcid.org/0000-0002-1744-5271

1University of Chicago Medical Center, Chicago, IL

2MedStar Health Research Institute, Washington, DC

3TOMTEC Imaging Systems, Unterschleissheim, Germany

4Centro Privado de Cardiología, Tucumán, Argentina

5Instituto Cardiovascular de Buenos Aires, CABA, Argentina

RESUMEN

Introducción:

El número creciente de estudios ecocardiográficos y la necesidad de cumplir rigurosamente con las recomendaciones de guías internacionales de cuantificación, ha llevado a que los cardiólogos deban realizar tareas sumamente extensas y repetitivas, como parte de la interpretación y análisis de cantidades de información cada vez más abrumadoras. Novedosas técnicas de machine learning (ML), diseñadas para reconocer imágenes y realizar mediciones en las vistas adecuadas, están siendo cada vez más utilizadas para responder a esta necesidad evidente de automatización de procesos.

Objetivos:

Nuestro objetivo fue evaluar un modelo alternativo de interpretación y análisis de estudios ecocardiográficos, basado fundamentalmente en la utilización de software de ML, capaz de identificar y clasificar vistas y realizar mediciones estandarizadas de forma automática.

Material y métodos:

Se utilizaron imágenes obtenidas en 2000 sujetos normales, libres de enfermedad, de los cuales 1800 fueron utilizados para desarrollar los algoritmos de ML y 200 para su validación posterior. Primero, una red neuronal convolucional fue desarrollada para reconocer 18 vistas ecocardiográficas estándar y clasificarlas de acuerdo con 8 grupos (stacks) temáticos. Los resultados de la identificación automática fueron comparados con la clasificación realizada por expertos. Luego, algoritmos de ML fueron desarrollados para medir automáticamente 16 parámetros de eco Doppler de evaluación clínica habitual, los cuales fueron comparados con las mediciones realizadas por un lector experto. Finalmente, comparamos el tiempo necesario para completar el análisis de un estudio ecocardiográfico con la utilización de métodos manuales convencionales, con el tiempo necesario con el empleo del modelo que incorpora ML en la clasificación de imágenes y mediciones ecocardiográficas iniciales. La variabilidad inter e intraobservador también fue analizada.

Resultados:

La clasificación automática de vistas fue posible en menos de 1 segundo por estudio, con una precisión de 90 % en imágenes 2D y de 94 % en imágenes Doppler. La agrupación de imágenes en stacks tuvo una precisión de 91 %, y fue posible completar dichos grupos con las imágenes necesarias en 99% de los casos. La concordancia con expertos fue excelente, con diferencias similares a las observadas entre dos lectores humanos. La incorporación de ML en la clasificación y medición de imágenes ecocardiográficas redujo un 41 % el tiempo de análisis y demostró menor variabilidad que la metodología de interpretación convencional.

Conclusión:

La incorporación de técnicas de ML puede mejorar significativamente la reproducibilidad y eficiencia de las interpretaciones y mediciones ecocardiográficas. La implementación de este tipo de tecnologías en la práctica clínica podría resultar en reducción de costos y aumento en la satisfacción del personal médico.

Palabras clave: Inteligencia artificial; Machine learning; Ecocardiografía

INTRODUCCIÓN

La interpretación típica de un estudio ecocardiográfico completo consiste en la revisión de múltiples grupos y tipos de imágenes, sea cual sea el orden en que hayan sido adquiridas. El ecocardiografista debe clasificar e integrar la información contenida en todas estas imágenes, e interpretarlas para reportar características de la anatomía y/o la función cardiovascular. Por lo tanto, no resulta infrecuente tener que realizar múltiples revisiones de un gran número de imágenes, lo cual puede tornarse un proceso largo y tedioso para el profesional. Además, una vez que las imágenes relevantes son identificadas, deben realizarse un número significativo de mediciones ecocardiográficas siguiendo las recomendaciones de las principales guías de sociedades internacionales. Es importante considerar que dichas mediciones varían significativamente entre distintos lectores. 1), (2), (3), (4), (5), (6), (7), (8 Aunque es difícil determinar con precisión el tiempo exacto que consume este proceso de selección, categorización y cuantificación durante un estudio ecocardiográfico, la posibilidad de acortar la duración de dichas etapas resulta una propuesta sumamente atractiva para optimizar todo el proceso y flujo de trabajo involucrado.

Estudios recientes han demostrado que tanto la clasificación de imágenes como las mediciones ecocardiográficas pueden ser automatizadas mediante la utilización de técnicas de machine learning (ML). 9), (10), (11 Nuestra hipótesis es que mediante estas nuevas herramientas podría optimizarse todo el proceso de interpretación clínica de los estudios ecocardiográficos y completarlo en una forma más rápida y reproducible que las técnicas manuales convencionales, contribuyendo finalmente a una mayor eficiencia y mejoría en el flujo de trabajo del servicio médico en cuestión. Este nuevo abordaje implicaría la incorporación de: (a) identificación automatizada del tipo y vista de la imagen ecocardiográfica, (b) clasificación y agrupación de las imágenes en categorías o grupos (stacks) definidos por estructuras anatómicas predeterminadas, (c) mediciones completamente automatizadas de parámetros estándar de cada estructura, y (d) corrección manual de dichas mediciones automatizadas (en caso de ser considerado necesario) para mejorar su precisión.

Nuestro objetivo fue analizar la factibilidad de este nuevo paradigma de trabajo a través de la evaluación de sus efectos en la eficiencia y reproducibilidad en las interpretaciones humanas.

MATERIAL Y MÉTODOS

Imágenes y población

Utilizamos diferentes estudios ecocardiográficos con el objetivo de intentar representar un espectro amplio de distintos grados de zoom, profundidad, ancho de zona de interés, foco, ganancia y calidad de imagen. Dichos estudios fueron realizados en 2000 individuos sanos, previamente incluidos en el estudio WASE (World Alliance Societies of Echocardiography Normal Values Study). El objetivo de dicho estudio fue determinar valores normales de múltiples parámetros ecocardiográficos cuantificables. 12 Los individuos incluidos, provenientes de 19 centros en 15 países, comprendieron un amplio grupo de adultos de ambos sexos, incluyendo diversas razas, etnias y grupos etarios. Dichos estudios fueron obtenidos utilizando distintos sistemas ecocardiográficos comercialmente disponibles y siguiendo las recientes recomendaciones de la Sociedad Americana de Ecocardiografía (American Society of Echocardiography, ASE). 13 Las imágenes fueron categorizadas por un experto según el tipo de imagen (2D, Doppler pulsado, etc.) y vista ecocardiográfica (apical 4 cámaras, paraesternal en eje largo, etc.). Mediciones habituales fueron realizadas por un experto en ecocardiografía en forma centralizada (core laboratory) siguiendo en forma estricta las más recientes recomendaciones. 14 Para nuestro estudio, utilizamos imágenes pertenecientes a 1800 individuos para el desarrollo y entrenamiento de los algoritmos de ML (grupo entrenamiento), mientras que los 200 restantes fueron utilizados para la evaluación de dichos algoritmos (grupo prueba).

Diseño del estudio

El estudio se dividió en 3 protocolos. El Protocolo 1 fue diseñado con el objeto de desarrollar los algoritmos de ML y evaluar su precisión en la identificación automatizada del tipo de imagen y vista ecocardiográfica, similar al abordaje utilizado en estudios recientes, 9), (10), (11 así como también en la clasificación de dichas imágenes en stacks de acuerdo con ciertas estructuras anatómicas o “eventos fisiológicos” de referencia (p.ej. válvula mitral, función diastólica), que servirán eventualmente como guía en la revisión e interpretación de las imágenes. El Protocolo 2 fue diseñado para desarrollar y evaluar la precisión de ML con el objeto de medir en forma automática parámetros ecocardiográficos convencionales, similar a los utilizados por Zhang et al. 10 Finalmente, el Protocolo 3 fue diseñado para determinar la factibilidad y efectividad resultante de la combinación e integración de dichos protocolos en la lectura de ecocardiogramas, con evaluación de parámetros de eficiencia (ahorro de tiempo) y reproducibilidad (variabilidad de las mediciones), y la comparación de dichos resultados con los métodos actuales de interpretación y medición.

La evaluación del Protocolo 1 consistió en el desarrollo y entrenamiento de una red neuronal convolucional (RNC) a partir de las mediciones provistas por un lector independiente (TM) no familiarizado con el desarrollo del algoritmo de ML. La evaluación del Protocolo 2 fue realizada mediante la comparación de las mediciones obtenidas por el algoritmo de ML con aquellas provistas por un segundo lector (KA) perteneciente a una institución diferente a la del primer lector. Finalmente, en el Protocolo 3 comparamos la performance de 2 lectores (KA y KK) que no participaron en la fase de desarrollo y entrenamiento del algoritmo de ML.

El desarrollo del software de ML, así como el diseño del estudio fueron producto de la colaboración entre los investigadores a cargo (MedStar y Universidad de Chicago) y TOMTEC Imaging Systems (Unterschleissheim, Germany). Los investigadores principales (RML, FMA) tuvieron acceso irrestricto a los datos y llevaron a cabo el análisis de estos en forma independiente de TOMTEC, asumiendo plena responsabilidad de los hallazgos aquí presentados.

Algoritmo de la red neuronal convolucional

El entrenamiento en la detección de cada parámetro de interés, se llevó a cabo a través de una estrategia en cascada que involucró 3 etapas de subdetectores. Esta configuración inicial fue acompañada por un mecanismo de preprocesamiento de las imágenes, con el objetivo de estandarizar la información obtenida de las mismas. Esto incluyó la detección del sector correspondiente al haz de ultrasonido, la eliminación de información adicional insertada en las imágenes ecocardiográficas y la adaptación de la intensidad y color de los archivos DICOM.

Inicialmente, para estimar aproximadamente la posición, tamaño, y orientación espacial de la estructura de interés, cada subdetector de la RNC fue alimentado en forma regresiva con una submuestra de imágenes con una resolución fija de menos del 20 % de número de pixeles de la imagen original. En una segunda etapa, a cada detector le fue presentada la región y estructura de interés de cada imagen con el objeto de reducir los cambios en escala y posición. La resolución de imagen para esta segunda etapa fue estandarizada a la resolución promedio (mm/píxel) de todas las imágenes, compensando la potencial variación de resolución de imágenes individuales. En esta instancia, la identificación de las estructuras de interés fue realizada con una RNC regresiva, al igual que en la primera etapa del proceso. Finalmente, en una tercera etapa utilizamos un grupo de imágenes más refinadas con mejor localización de las estructuras de interés (en comparación con la etapa anterior) a fin de mejorar su localización. Nuevamente, la implementación fue posible mediante una RNC regresiva.

El entrenamiento de cada etapa de subdetectores fue realizada utilizando un subgrupo de mediciones como la verdad absoluta (ground truth). Durante dicho entrenamiento, cada uno de estos detectores pudo analizar el input de información según estas mediciones asumidas como verdad absoluta, junto con 32 versiones aumentadas de dicho input. Dicho aumento fue posible mediante pequeñas rotaciones y cambios en escala de la región de interés para lograr un reconocimiento efectivo de un amplio número de variantes y estructuras.

Protocolo 1: Identificación y agrupamiento (stacking) automatizados de imágenes

La RNC fue entrenada para reconocer 18 vistas ecocardiográficas estándar: 6 correspondientes a ecocardiografía bidimensional (2D) y 12 correspondientes a Doppler tisular (DTI), Doppler pulsado (DP) y Doppler continuo (DC). Las imágenes 2D incluyeron las vistas apicales en 2, 3 y 4 cámaras (A2C, A3C y A4C respectivamente) como así las paraesternales en eje largo y eje corto (ELPE y ECPE respectivamente) y la vista subcostal (SC). Las imágenes de DTI incluyeron muestreos septal y lateral del anillo mitral y de la porción lateral del anillo tricúspideo. Las imágenes correspondientes a DP fueron obtenidas en el tracto de salida del ventrículo izquierdo (TSVI) en una vista apical, el tracto de entrada mitral en 4 cámaras y en tracto de salida del ventrículo derecho (TSVD) en una vista ECPE. Las adquisiciones de DC incluyeron la evaluación del flujo aórtico en una vista apical, como así también del flujo de regurgitación mitral en una vista apical de 4 cámaras, el de insuficiencia tricúspidea en un apical de 4 cámaras y ECPE, y el flujo pulmonar en una vista ECPE. Todas estas imágenes fueron utilizadas como input de la RNC para construir nuestro banco de tipos de imágenes y vistas ecocardiográficas.

Luego, la RNC fue entrenada para identificar las vistas y tipos de imagen en un grupo independiente de imágenes de prueba, para consiguientemente asignar o clasificar cada una de estas imágenes dentro de 8 stacks según la identificación de los siguientes parámetros o estructuras: función sistólica y tamaño ventricular izquierdo (VI), función diastólica del VI, función y tamaño del ventrículo derecho (VD) y aurícula derecha (AD), válvulas (mitral, aortica, tricúspide y pulmonar) y pericardio. La Tabla 1 muestra una lista de las imágenes necesarias para completar cada stack. Finalmente, los resultados de la identificación y clasificación automática de las imágenes fueron comparados con la “verdad absoluta” previamente determinados por el lector experto.

Protocolo 2: Precisión y reproducibilidad del análisis automatizado

Luego que cada imagen fuese automáticamente clasificada según tipo y vista de imagen y que la fase del ciclo cardíaco para realizar las mediciones fuera seleccionada, un algoritmo supervisado de ML fue entrenado para medir 16 parámetros estándar habitualmente cuantificados en la práctica clínica. Estos parámetros incluyeron: grosor del septum interventricular en fin de diástole, diámetro interno del VI en fin de diástole y fin de sístole, grosor de la pared posterior del VI en fin de diástole, diámetro mesosistólico del TSVI, integral velocidad-tiempo (VTI) del TSVI, máximo volumen de la aurícula izquierda (AI) en A2C y A4C, volúmenes del VI en fin de diástole y en fin de sístole, onda E y onda A del flujo de entrada mitral y las velocidades tisulares del anillo lateral y septal mitral. Todos los volúmenes de las cavidades fueron medidos mediante el método de discos de Simpson biplano.

La precisión de dichas mediciones automáticas fue comparada con la de las mediciones manuales obtenidas por un lector experto en el grupo de prueba de 200 sujetos. Además, en un subgrupo de 30 estudios seleccionados aleatoriamente, las diferencias entre las mediciones automáticas del ML y las proporcionadas por el lector experto de referencia, fueron comparadas con la variabilidad humana inter e intraobservador, a través de reiteradas mediciones a ciegas. Para evaluar la variabilidad interobservador, estas mediciones fueron realizadas independientemente por dos cardiólogos expertos en ecocardiografía, con el empleo de métodos convencionales de interpretación y medición. Finalmente, para determinar la variabilidad intraobservador, uno de estos expertos volvió a leer los mismos estudios ecocardiográficos al menos dos semanas después del primer análisis, nuevamente, completamente ciego a las mediciones previas.

Protocolo 3: Eficiencia y reproducibilidad del enfoque con asistencia del ML

En este protocolo, en forma independiente, ambos expertos repitieron la interpretación de estos 30 estudios al menos 2 semanas después, esta vez utilizando la asistencia de ML. En este caso, los expertos podían utilizar los stacks y mediciones determinadas automáticamente por los algoritmos, modificándolas por medio de los ajustes que ellos consideraran necesarios para mejorar la precisión en la identificación y medición de las estructuras o fenómenos de interés. Para ambas sesiones, el tiempo necesario para completar el análisis del estudio ecocardiográfico fue determinado por la estación de trabajo utilizada, y la variabilidad intra e interobservador fue evaluada para todos los parámetros previamente descriptos. Finalmente, los tiempos de análisis con y sin asistencia de ML fueron comparados entre sí.

Análisis estadístico

La precisión del método automático en la identificación del tipo de imagen y vista ecocardiografía y su comparación con los expertos fue cuantificada como el porcentaje de clasificaciones correctas en función del número total de secuencias de imágenes analizadas. Para cada parámetro, la concordancia entre las mediciones del ML y los valores de referencia obtenidos por los expertos fue evaluada mediante métodos de regresión linear y análisis de sesgos y límites de concordancia con el método de Bland-Altman. Para realizar comparaciones entre distintos parámetros, los sesgos fueron expresados como porcentajes del valor promedio de cada parámetro (%Sesgo). La variabilidad intra e interobservador para cada parámetro fue cuantificada utilizando coeficientes de variación, definidos como la diferencia absoluta entre mediciones repetidas y expresadas como porcentajes de la media. La significancia estadística de las diferencias en el tiempo de análisis con y sin asistencia del ML fue determinada utilizando la prueba t de Student utilizando mediciones pareadas a dos colas. Valores de p < 0,05 fueron considerados significativos.

Consideraciones éticas

El estudio fue aprobado por los comités de ética o IRB de cada institución y el consentimiento de los pacientes fue obtenido de acuerdo a las regulaciones locales.

RESULTADOS

Protocolo 1

La clasificación automática de las vistas ecocardiográficas por parte de la RNC se realizó en un promedio de 0,87 segundos por estudio. La RNC fue capaz de identificar los tipos de imagen y vistas ecocardiográficas con una precisión del 90 % para imágenes 2D y 94 % para imágenes Doppler. La Figura 1 muestra los datos correspondientes a la concordancia entre la clasificación obtenida por ML y por la “verdad absoluta” del lector experto, para cada vista ecocardiográfica. Si bien dicha concordancia fue excelente en la gran mayoría de los casos, el mayor número de errores ocurrió en la clasificación de vistas no estándar, subóptimas, erróneamente identificadas como A3C (anotadas como “Otras”). La RNC fue capaz de separar y agrupar las imágenes en stacks con una precisión del 91 %. Al contar el número de vistas requeridas para completar cada stack, ignorando aquellas consideradas innecesarias, la composición final de cada stack de imágenes tuvo una concordancia del 99 % entre ML y los lectores expertos (Tabla 1).

Fig. 1.  Identificación del tipo y vista de imágenes ecocardiográficas: concordancia entre mediciones automatizadas con ML y mediciones manuales por expertos. Cada celda representa el porcentaje de concordancia para cada tipo de imagen y vista evaluados. Las celdas tienen distintos colores según el porcentaje de acuerdo: rojo ( 0%), naranja (0,1%-50 %), amarillo (50,1%-90%) y verde (90,1%-100%) Abreviaturas: A2C, A3C y A4C = apical 2, 3 y 4 cámaras, respectivamente; ELPE, ECPE, SC: paraesternal en eje largo, eje corto y subcostal, respectivamente; AM (l), AM (s), AT (l) = anillo mitral lateral, anillo mitral septal y anillo tricúspideo lateral, respectivamente; Api TSVI = vista apical del tracto de salida del ventrículo izquierdo; Api VA = vista apical de la válvula aortica; TEVM, TEVT, TEVP = tractos de entrada mitral, tricúspideo y pulmonar respectivamente; DC: Doppler continuo; DP: Doppler pulsado 

Tabla 1 Composición de los grupos (stacks) de imágenes ecocardiográficas según el tópico o estructura de interés y porcentaje de clasificaciones automáticas completas mediante machine learning. 

Stack o grupo de interés Tipo y vista de imagen ecocardiográfíca %Stacks completos
Vistas 2D Doppler
Función sistólica y dimensiones del ventrículo izquierdo

  • *Paraesternal eje largo

  • *Paraesternal eje corto - basal

  • *Paraesternal eje corto - medio

  • *Apical 4 cámaras

  • *Apical 2 cámaras

  • *Apical 3 cámaras

99,5 %
*Función diastólica del ventrículo izquierdo

  • *Apical 4 cámaras

  • *Apical 2 cámaras

  • *Subcostal

  • *Apical 4 cámaras V. Mitral

  • *Apical 4 cámaras V. Mitral - medial

  • *Apical 4 cámaras V. Mitral - lateral

  • *Apical 4 cámaras V. Tricúspide

100 %
Función y dimensiones del ventrículo y aurícula derechos

  • *Paraesternal eje largo

  • *Tracto de entrada del ventrículo derecho

  • *Paraesternal eje corto

  • *Apical 4 cámaras

  • *Apical 4 cámaras - foco en ventrículo derecho

  • *Subcostal

99 %
Válvula mitral

  • *Paraesternal eje largo

  • *Paraesternal eje corto - basal

  • *Apical 4 cámaras

  • *Apical 2 cámaras

  • *Apical 3 cámaras

  • *Subcostal

  • *V. mitral en paraesternal eje largo

  • *V. mitral en Apical 4 cámaras

  • *V. mitral en Apical 2 cámaras

  • *V. mitral en Apical 3 cámaras

  • *V. pulmonar en Apical 4 cámaras

  • *V. tricúspide en Apical 4 cámaras

99,8 %
Válvula aórtica

  • *Paraesternal eje largo

  • *Paraesternal eje corto - Válvula Aórtica

  • *Apical 5 cámaras

  • *Apical 3 cámaras

  • *V. aórtica en Apical 5 cámaras

  • *Tracto de salida del ventrículo izquierdo en Apical 5 cámaras

  • *Válvula aórtica en Apical 3 cámaras

  • *Tracto de salida del ventrículo izquierdo en Apical 3 cámaras

96 %
Válvula tricúspide

  • *Tracto de entrada del ventrículo derecho

  • *Válvula aortica en eje corto

  • *Apical 4 cámaras

  • *Apical 4 cámaras - foco en ventrículo derecho

  • *Subcostal

  • *V. tricúspide en tracto de entrada del ventrículo derecho

  • *V. tricúspide en paraesternal eje corto

  • *V. tricúspide en Apical 4 cámaras

99,4 %
Válvula pulmonar

  • *Tracto de salida del ventrículo derecho

  • *Válvula aortica en eje corto

  • *V. Aórtica en paraesternal eje corto

  • *V. Pulmonar en paraesternal eje corto

98,4 %
Pericardio

  • *Paraesternal eje largo

  • *Apical 4 cámaras

  • *Subcostal

100 %

Protocolo 2

Las mediciones automáticas realizadas mediante ML mostraron una concordancia excelente respecto a los valores de referencia obtenidos por los expertos, demostrados por altos valores de índices de correlación, sesgos pequeños y límites de concordancia estrechos para la mayoría de los parámetros analizados (Tabla 2). Los sesgos relativos más grandes fueron para los volúmenes auriculares izquierdos tanto en A4C como A2C (18 % y 25 % de los valores de referencia), seguido por los volúmenes ventriculares izquierdos (6,5 % y 7,8 % de los valores de referencia). Para el resto de los parámetros evaluados, los sesgos relativos fueron mínimos, con valores menores al 3 %. El análisis del subgrupo de 30 estudios demostró que las diferencias entre las mediciones realizadas con ML y las obtenidas por los expertos fueron similares a las diferencias entre mediciones manuales realizadas por dos operadores humanos (Tabla 3).

Tabla 2 Evaluación del algoritmo de machine learning (ML) 

Regresión linear Análisis de Bland Altman
Coeficiente r de Pearson Sesgo ± DE % Sesgo Límite de concordancia inferior Límite de concordancia superior
Grosor SIVd (mm) 0,65 -0,11 ± 1,3 -1,5 -2,7 2,4
Grosor PPd (mm) 0,64 -0,04 ± 1,1 -0,5 -2,2 2,1
DIVIs (mm) 0,78 0,85 ± 2,5 3 -4,2 5,9
DIVId (mm) 0,82 0,65 ± 3,1 1,5 -5,6 6,9
TSVI diam (mm) 0,82 0,85 ± 1,5 4,1 -2,1 3,8
Vol VId (A2C) (ml) 0,91 6,6 ± 12,5 6,5 -18,4 31,6
Vol VId (A4C) (ml) 0,94 7,4 ± 9,5 7,8 -11,5 26,3
Vol VIs (A2C) (ml) 0,87 -0,5 ± 6,2 -1,3 -12,9 11,9
Vol VIs (A4C) (ml) 0,89 0,6 ± 5,6 1,6 -10,7 11,8
Vol AI (A2C) (ml) 0,87 11,8 ± 10,3 25 -8,9 32,5
Vol AI (A4C) (ml) 0,89 8,6 ± 8,5 18 -8,4 25,6
TSVI TVI (cm) 0,91 0,46 ± 1,7 2,2 -2,8 3,8
E Vel (cm/s) 0,96 -0,01 ± 0,05 -1,1 -0,11 0,09
A Vel (cm/s) 0,95 -0,01 ± 0,05 -1,1 -0,11 0,1
E' vel (l) (cm/s) 0,96 -0,03 ± 1,3 -0,2 -2,62 2,56
E' vel (s) (cm/s) 0,96 -0,03 ± 1,21 -0,3 -2,45 2,39

Concordancia entre mediciones y valores de referencia obtenidos en forma automática con ML y en forma manual por expertos en 200 estudios. Se incluye el coeficiente de regresión linear de Pearson (r) y el análisis Bland-Altman de los sesgos y límites de concordancia. Sesgos positivos representan sobreestimación por parte del ML, mientras que sesgos negativos representan subestimación

Abreviaturas: DE= desviación estándar; SIVd = septum interventricular en fin de diástole; PPd = pared posterior en fin de diástole; DIVIs= diámetro interno del ventrículo izquierdo en fin de sístole; DIVId= diámetro interno del ventrículo izquierdo en fin de diástole; TSVI diam= diámetro del tracto de salida del ventrículo izquierdo en mesosístole; Vol VId A2C y A4C= volúmenes de fin de diástole del ventrículo izquierdo en vista apical de 2 y 4 cámaras respectivamente; Vol VIs A2C y A4C= volúmenes de fin de sístole del ventrículo izquierdo en vista apical de 2 y 4 cámaras respectivamente; Vol AI A2C y A4C= volumen máximo de la aurícula izquierda en vista apical de 2 y 4 cámaras respectivamente; TSVI TVI= velocidad intergral tiempo en el tracto de salida del ventrículo izquierdo; E Vel y A Vel= velocidad de ondas temprana (E) y tardía (A) del flujo de entrada mitral, E' vel (l) y E' vel (s)= velocidad tisular a nivel anillo mitral lateral y septal, respectivamente

Tabla 3 Comparación entre valores de referencia obtenidas automáticamente con ML y medidas obtenidas por un lector experto utilizando métodos convencionales de medición, incluyendo variabilidad intra e interobservador de cada uno de estos métodos 

Interpretación convencional manual Interpretación automática solo con ML vs Manual Interpretación con ML + correcciones vs Manual
Variabilidad intraobservador Variabilidad interobservador
Grosor SIVd (mm) 7 ± 5 11 ± 8 14 ± 10 0 ± 1 *
Grosor PPd (mm) 8 ± 7 15 ± 13 17 ± 15 1 ± 3 *
DIVIs (mm) 3 ± 2 8 ± 6 10 ± 10 3 ± 5 *
DIVId (mm) 2 ± 2 4 ± 4 6 ± 5 0 ± 1 *
TSVI diam (mm) 2 ± 3 4 ± 3 5 ± 4 6 ± 14
Vol VId (A2C) (ml) 10 ± 9 20 ± 13 14 ± 10 6 ± 8 *
Vol VId (A4C) (ml) 7 ± 5 22 ± 7 16 ± 8 4 ± 5 *
Vol VIs (A2C) (ml) 11 ± 9 23 ± 14 27 ± 19 3 ± 4 *
Vol VIs (A4C) (ml) 9 ± 7 32 ± 13 35 ± 16 4 ± 5 *
Vol AI (A2C) (ml) 14 ± 9 17 ± 22 14 ± 0 9 ± 9
Vol AI (A4C) (ml) 13 ± 13 18 ± 13 16 ± 8 9 ± 8 *
TSVI TVI (cm) 5 ± 4 7 ± 5 8 ± 7 1 ± 4 *
E Vel (cm/s) 4 ± 4 8 ± 7 6 ± 5 3 ± 16
A Vel (cm/s) 3 ± 3 14 ± 11 14 ± 11 3 ± 16 *
E' vel (l) (cm/s) 7 ± 9 10 ± 0 11 ± 7 2 ± 8
E' vel (s) (cm/s) 4 ± 4 6 ± 8 8 ± 7 0 ± 0 *

Los valores representan coeficientes de variación (ver texto para más detalles). Abreviaturas similares a las presentadas en Tabla 2.

*p < 0,05 para interpretación automatizada con ML.

Protocolo 3

La interpretación convencional de un estudio ecocardiográfico completo requirió un promedio de 11 minutos y 33 segundos (9:29 para el lector #1 y 13:36 para el lector #2). En cambio, al utilizar la asistencia de ML mediante la agrupación en stacks y mediciones automatizadas, el tiempo promedio en completar la evaluación de un estudio fue de 6 minutos y 48 segundos (4:50 para el lector #1 y 8:45 para el lector #2). Es decir, que con el uso de ML es posible reducir en promedio un 40 % el tiempo necesario para interpretar un estudio ecocardiográfico utilizando los métodos convencionales actuales (49 % para el lector #1 y 36 % para el lector #2). Cabe destacar que, en comparación con el método manual, la utilización de ML redujo la variabilidad interobservador en 15 de las 16 mediciones realizadas (Tabla 3), a excepción del diámetro del TSVI, cuya medición, de todas maneras, fue altamente reproducible utilizando ambos métodos.

DISCUSIÓN

En la última década, la utilización de inteligencia artificial en el mundo de las imágenes médicas ha crecido notablemente gracias a su capacidad de asistir en diversas instancias el proceso de interpretación y diagnóstico. 15), (16 Si bien la utilidad de la inteligencia artificial ha sido evaluada principalmente a partir de imágenes estáticas pertenecientes al campo de la radiología, la aplicación de técnicas como el ML en la ecocardiografía ha permanecido relativamente rezagada. Esto podría explicarse, al menos parcialmente, por los desafíos técnicos propios de la ecocardiografía, como ser su menor resolución espacial o calidad de imagen en comparación con otras modalidades como la tomografía computada o la resonancia magnética nuclear, como así también por el aspecto dinámico de las imágenes ecocardiográficas (uso de videos), lo cual exige un análisis de grandes volúmenes de datos e información en un tiempo extremadamente corto. Sin embargo, estudios recientes han superado muchos de estos obstáculos mediante la utilización de nuevas técnicas de ML especialmente diseñadas para la identificación de tipos y vistas ecocardiográficas, 9), (10), (11 o para la medición automatizada de parámetros ecocardiográficos de uso habitual en la práctica clínica. 10), (17), (18 Así, por ejemplo, el uso de inteligencia artificial como guía para la adquisición de imágenes ecocardiográficas ha permitido a usuarios con mínimo entrenamiento en ultrasonido, obtener imágenes de calidad cercana a las de un operario experto. 19 A nuestro entender, nuestro estudio es el primero que ha logrado combinar estas nuevas técnicas de ML para la identificación y clasificación de imágenes de acuerdo con características comunes preestablecidas. Incluso, es el primero en demostrar el potencial impacto de la incorporación de esta nueva herramienta en términos de reducción de los tiempos necesarios para completar el análisis de un ecocardiograma, con la consecuente mejora en la eficiencia del flujo de trabajo dentro del laboratorio de ecocardiografía.

Es cierto que los cardiólogos en general y especialistas en ecocardiografía en particular, se encuentran habituados a identificar, clasificar y analizar grandes cantidades de imágenes, sin necesidad de un proceso previo de agrupación o stacking. Sin embargo, el número creciente de estudios y la necesidad de cumplir estrictamente las recomendaciones de las guías de cuantificación ecocardiográfica han dejado en evidencia una nueva realidad, donde la incorporación de mecanismos de automatización de estas tareas repetitivas resulta cada vez más necesaria. La tecnología basada en procesos de ML resulta especialmente adecuada para resolver este tipo de problemas, gracias a su habilidad única de identificar y clasificar imágenes, 9), (10), (11 e incluso identificar componentes o estructuras específicas dentro de dichas imágenes que requieran ser segmentados y/o medidos. 10 En este estudio, propusimos que la combinación de todas estas capacidades del ML puede contribuir a facilitar la interpretación diagnostica en múltiples instancias del proceso, desde su clasificación hasta la propia realización de las mediciones.

La hipótesis que motivó inicialmente la realización de este estudio fue que implementar una variedad de técnicas de ML podría significar un cambio disruptivo en la manera en que los estudios ecocardiográficos son actualmente leídos e interpretados. En última instancia, nuestro propósito consiste en optimizar el complejo y extenso proceso de interpretación de un estudio ecocardiográfico mediante un aumento en la eficiencia, precisión y reproducibilidad de las lecturas que las herramientas de ML pueden generar.

Al igual que en publicaciones previas, 9), (10), (11 el uso de RNC en nuestro estudio le permitió a una computadora identificar en forma rápida y precisa la gran mayoría de tipos y vistas posibles para una imagen ecocardiográfica. Según esta clasificación, las imágenes fueron organizadas y presentadas a los lectores expertos en stacks temáticos, útiles y prácticos a la hora de responder una determinada pregunta clínica. Es decir, esta herramienta permitió prácticamente eliminar la necesidad de identificar, clasificar y agrupar visualmente, diversas estructuras anatómicas, como así también prescindir (al menos virtualmente) de las mediciones humanas de parámetros ecocardiográficos de uso habitual. De hecho, nuestros resultados demostraron que las diferencias entre las mediciones obtenidas en forma automática y sin ajustes manuales y las obtenidas por un experto no fueron mayores que aquellas diferencias observadas entre dos lectores de igual experiencia y entrenamiento. Así, la asistencia de ML en la interpretación de las imágenes ecocardiográficas permitió reducir a menos de 10 % la variabilidad de las mediciones en la gran mayoría de los parámetros evaluados, lo cual es considerado óptimo para la valoración cualitativa de la función cardiovascular. Además, la combinación de las habilidades de identificación, stacking y medición automática (con corrección manual de ser necesario) de los algoritmos de ML, permitió a los lectores por un lado reducir notablemente su tiempo habitual de análisis, y por otro reducir la variabilidad interobservador en la cuantificación de la mayoría de los parámetros evaluados.

Una ventaja importante del software desarrollado y evaluado en este estudio es su teórica independencia del fabricante (vendor) de sistemas ecocardiográficos, ya que fue diseñado para interpretar imágenes en formato DICOM provenientes de cualquiera de estos, lo cual permitiría su utilización en cualquier laboratorio, independientemente del sistema ecocardiográfico que cada laboratorio o servicio utilicen.

Dentro de las limitaciones de nuestro estudio es menester remarcar que solamente se incluyeron individuos sanos, previamente analizados en el estudio WASE. Sin embargo, otros softwares de ML han sido previamente validados por diversos autores, y en pacientes con un amplio espectro de patologías cardiovasculares. 9), (10), (11), (20), (21 Por lo tanto, realizar nuevamente la validación de dicho software, no era parte de los objetivos de nuestro estudio, el cual estuvo exclusivamente dirigido a evaluar un circuito alternativo en la interpretación de imágenes ecocardiográficas. Así, resulta poco probable que la inclusión de pacientes con patología pueda modificar nuestros hallazgos.

En conclusión, las técnicas de ML tienen el potencial de mejorar significativamente la eficiencia y reproducibilidad de la interpretación de imágenes ecocardiográficas a través del uso de stacks temáticos según estructuras en común y a través de mediciones automatizadas potencialmente corregibles. La implementación de este tipo de tecnologías permitirá ahorrar tiempo y costos, fundamentalmente a partir de una mejora en la eficiencia de los procesos, una mayor satisfacción del equipo médico y un aumento del rendimiento diagnóstico.

Agradecimientos

Este trabajo fue financiado por la American Society of Echocardiography (ASE) Foundation, MedStar Health Research Institute, y University of Chicago, con el apoyo incondicional de TomTec. Queremos agradecer a Ms. Rhonda Price, miembro de ASE, por su apoyo logístico durante todo el estudio. Finalmente, queremos agradecer a todos los investigadores del estudio WASE por permitirnos utilizar las imágenes pertenecientes a dicho estudio.

BIBLIOGRAFÍA

1. Fast J, Jacobs S. Limits of reproducibility of cross-sectional echocardiographic measurements of left ventricular muscle mass. Int J Cardiol. 1991;31:213-6. https://doi.org/10.1016/0167-5273(91)90218-eLinks ]

2. Otterstad JE, Froeland G, St John Sutton M, Holme I. Accuracy and reproducibility of biplane two-dimensional echocardiographic measurements of left ventricular dimensions and function. Eur Heart J. 1997;18:507-13. https://doi.org/10.1093/oxfordjournals.eurheartj.a015273Links ]

3. Jhang JS, Diamond JA, Phillips RA. Interobserver Variability of Left Ventricular Measurements in a Population of Predominantly Obese Hypertensives Using Simultaneously Acquired and Displayed M-Mode and 2-D Cine Echocardiography. Echocardiography. 1997;14:9-14. https://doi.org/10.1111/j.1540-8175.1997.tb00684.xLinks ]

4. Thomson HL, Basmadjian AJ, Rainbird AJ, Razavi M, Avierinos JF, Pellikka PA, et al. Contrast echocardiography improves the accuracy and reproducibility of left ventricular remodeling measurements: a prospective, randomly assigned, blinded study. J Am Coll Cardiol. 2001;38:867-75. https://doi.org/10.1016/s0735-1097(01)01416-4Links ]

5. Baker G, Flack E, Hlavacek A, Chessa K, Fleming D, Scheurer M, et al. Variability and resource utilization of bedside three-dimensional echocardiographic quantitative measurements of left ventricular volume in congenital heart disease. Congenit Heart Dis. 2006;1:309- 14. https://doi.org/10.1111/j.1747-0803.2006.00053.xLinks ]

6. Moura LM, Ramos SF, Pinto FJ, Barros IM, Rocha-Gonçalves F. Analysis of variability and reproducibility of echocardiography measurements in valvular aortic valve stenosis. Rev Port Cardiol. 2011;30:25-33. [ Links ]

7. Colan SD, Shirali G, Margossian R, Gallagher D, Altmann K, Canter C, et al; Pediatric Heart Network Investigators. The ventricular volume variability study of the Pediatric Heart Network: study design and impact of beat averaging and variable type on the reproducibility of echocardiographic measurements in children with chronic dilated cardiomyopathy. J Am Soc Echocardiogr. 2012;25:842-54. https://doi.org/10.1016/j.echo.2012.05.004Links ]

8. Lee CK, Margossian R, Sleeper LA, Canter CE, Chen S, Tani LY, et al; Pediatric Heart Network Investigators. Variability of M-mode versus two-dimensional echocardiography measurements in children with dilated cardiomyopathy. Pediatr Cardiol. 2014;35:658-67. https://doi.org/10.1007/s00246-013-0835-9Links ]

9. Madani A, Arnaout R, Mofrad M, Arnaout R. Fast and accurate view classification of echocardiograms using deep learning. NPJ Digit Med. 2018;1:6. https://doi.org/10.1038/s41746-017-0013-1Links ]

10. Zhang J, Gajjala S, Agrawal P, Tison GH, Hallock LA, Beussink- Nelson L, et al. Fully Automated Echocardiogram Interpretation in Clinical Practice. Circulation. 2018;138:1623-35. https://doi.org/10.1161/CIRCULATIONAHA.118.034338Links ]

11. Howard JP, Tan J, Shun-Shin MJ, Mahdi D, Nowbar AN, Arnold AD, et al. Improving ultrasound video classification: an evaluation of novel deep learning methods in echocardiography. J Med Artif Intell. 2020;3:4. https://doi.org/10.21037/jmai.2019.10.03Links ]

12. Asch FM, Banchs J, Price R, Rigolin V, Thomas JD, Weissman NJ, et al. Need for a Global Definition of Normative Echo Values- Rationale and Design of the World Alliance of Societies of Echocardiography Normal Values Study (WASE). J Am Soc Echocardiogr. 2019;32:157-62. https://doi.org/10.1016/j.echo.2018.10.006Links ]

13. Mitchell C, Rahko PS, Blauwet LA, Canaday B, Finstuen JA, Foster MC, et al. Guidelines for Performing a Comprehensive Transthoracic Echocardiographic Examination in Adults: Recommendations from the American Society of Echocardiography. J Am Soc Echocardiogr. 2019;32:1-64. https://doi.org/10.1016/j.echo.2018.06.004Links ]

14. Lang RM, Badano LP, Mor-Avi V, Afilalo J, Armstrong A, Ernande L, et al. Recommendations for cardiac chamber quantification by echocardiography in adults: an update from the American Society of Echocardiography and the European Association of Cardiovascular Imaging. J Am Soc Echocardiogr. 2015;28:1-39 https://doi.org/10.1016/j.echo.2014.10.003Links ]

15. Nabi W, Bansal A, Xu B. Applications of artificial intelligence and machine learning approaches in echocardiography. Echocardiography. 2021;38:982-92. https://doi.org/10.1111/echo.15048Links ]

16. Gandhi S, Mosleh W, Shen J, Chow CM. Automation, machine learning, and artificial intelligence in echocardiography: A brave new world. Echocardiography. 2018;35:1402-18. https://doi.org/10.1111/echo.14086Links ]

17. Tromp J, Bauer D, Claggett BL, Frost M, Iversen MB, Prasad N, et al. A formal validation of a deep learning-based automated workflow for the interpretation of the echocardiogram. Nat Commun. 2022;13:6776. https://doi.org/10.1038/s41467-022-34245-1Links ]

18. Tromp J, Seekings PJ, Hung CL, Iversen MB, Frost MJ, Ouwerkerk W, et al. Automated interpretation of systolic and diastolic function on the echocardiogram: a multicohort study. Lancet Digit Health. 2022;4:46-54. https://doi.org/10.1016/S2589-7500(21)00235-1Links ]

19. Mor-Avi V, Khandheria B, Klempfner R, Cotella JI, Moreno M, Ignatowski D, et al. Real-Time Artificial Intelligence-Based Guidance of Echocardiographic Imaging by Novices: Image Quality and Suitability for Diagnostic Interpretation and Quantitative Analysis. Circ Cardiovasc Imaging. 2023;16:e015569. https://doi.org/10.1161/CIRCIMAGING.123.015569Links ]

20. Cotella JI, Slivnick JA, Sanderson E, Singulane C, O&apos;Driscoll J, Asch FM, et al. Artificial intelligence based left ventricular ejection fraction and global longitudinal strain in cardiac amyloidosis. Echocardiography. 2023;40:188-95. https://doi.org/10.1111/echo.15516Links ]

21. Gruca MM, Slivnick JA, Singh A, Cotella JI, Subashchandran V, Prabhu D, et al. Noninvasive assessment of left ventricular enddiastolic pressure using machine learning-derived phasic left atrial strain. Eur Heart J Cardiovasc Imaging. 2023;25:18-26. https://doi.org/10.1093/ehjci/jead231Links ]

Apendice

INVESTIGADORES PRINCIPALES DEL ESTUDIO WASE

Ricardo Ronderos, MD, FASE, Instituto Cardiovascular de Buenos Aires, Buenos Aires, Argentina; Gregory Scalia, MD, FASE, GenesisCare, Brisbane, Australia; Ana Clara Tude Rodrigues, MD, Hospital Israelita Albert Einstein, Sao Paulo, Brazil; Wendy Tsang, MD, Toronto General Hospital, University of Toronto, Toronto, ON, Canada; Mei Zhang, PhD, Qilu Hospital of Shandong University, Jinan, China; V. Amuthan, MD, DM, Jeyalakshmi Heart Center, Madurai, India; Ravi Kasliwal, MD, FASE, Medanta Heart Institute, Medanta, India; Anita Sadeghpour, MD, FASE, Rajaie Cardiovascular Medical and Research Center, Tehran, Iran; Eduardo Bossone MD, FASE, University of Salerno, Salerno, Italy; Denisa Muraru, MD, University of Padua, Padua, Italy; Masao Daimon, MD, PhD, The University of Tokyo, Tokyo, Japan; Masaaki Takeuchi, MD, PhD, FASE, University of Occupational and Environmental Health, Kitakyushu, Japan; Pedro Gutierrez-Fajardo, MD, FASE, Hospital Bernardette, Guadalajara, Mexico; Kofo O. Ogunyankin, MD, FASE, First Cardiology Consultants Hospital Ikoyi, Lagos, Nigeria; Edwin S. Tucay, MD, FASE, Philippine Heart Center, Quezon City, Philippines; Seung Woo Park, MD, Samsung Medical Center, Seoul, Korea; Mark J. Monaghan, PhD, King’s College Hospital, United Kingdom; Karima Addetia, MD, University of Chicago, Chicago, IL; James Kirkpatrick, MD, FASE, University of Washington, Seattle, WA.

INVESTIGADORES ADICIONALES DEL ESTUDIO WASE (ordenados alfabéticamente por país)

Argentina : Aldo D. Prado, Centro Privado de Cardiologia, Tucuman; Eduardo Filipini, Instituto Cardiovascular de Buenos Aires, Buenos Aires.

Australia : Agatha Kwon and Samantha Hoschke-Edwards, GenesisCare, Brisbane.

Brazil : Tania Regina Afonso, Hospital Israelita Albert Einstein, Sao Paulo.

Canada : Babitha Thampinathan and Maala Sooriyakanthan, Toronto General Hospital, University of Toronto, Toronto, Ontario.

China : Tiangang Zhu and ZhilongWang, Peking University People’s Hospital, Beijing; Yingbin Wang, Mei Zhang, and Yu Zhang, Qilu Hospital of Shandong University, Jinan; Lixue Yin and Shuang Li, Sichuan Provincial People’s Hospital, Sichuan.

India: R. Alagesan, Madras Medical College, Chennai; S. Balasubramanian, Madurai Medical College, Madurai; R.V.A. Ananth, Jeyalakshmi Heart Center, Madurai; Manish Bansal, Medanta Heart Institute, Medanta, Haryana.

Italia: Luigi P. Badano (currently at the University of Milano-Bicocca and Istituto Auxologico Italiano, IRCCS, Milano) and Chiara Palermo, University of Padua, Padua; Eduardo Bossone (currently at Antonio Cardarelli Hospital, Naples), Davide DiVece, and Michele Bellino, University of Salerno, Salerno.

Japan: Tomoko Nakao, Takayuki Kawata, Megumi Hirokawa, and Naoko Sawada, University of Tokyo, Tokyo; Yousuke Nabeshima, University of Occupational and Environmental Health, Kitakyushu.

Corea: Hye Rim Yun and Ji-won Hwang, Samsung Medical Center, Seoul.

Nigeria: Dolapo Fasawe, First Cardiology Consultants Hospital Ikoyi, Lagos.

Recibido: 25 de Septiembre de 2023; Aprobado: 29 de Noviembre de 2023

Dirección para correspondencia: Federico M Asch, MD - MedStar Health Research Institute y Universidad de Georgetown - 100 Irving St, NW. Washington DC 20010. EEUU - Federico.asch@medstar.net- @FedericoAsch

Nota de los Autores:

Una versión abreviada de esta investigación ha sido publicada anteriormente en el Journal of the American Society of Echocardiography (J Am Soc Echocardiogr 2021;34:443-5)

MTSAC

Miembro Titular de la Sociedad Argentina de Cardiología

Declaración de conflictos de interés

AB, MS y NH son empleados de TOMTEC. KK ha recibido fondos a través del T32 Cardiovascular Sciences Training Grant (5T32HL7381). El resto de los autores, no presenta conflictos de interés que declarar. (Véase formulario de conflicto de intereses del autor en la Web).

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons