Heuristic algorithm for pet images’ segmentation using artificial inteligence techniques

Scarinci, I. E.; Pérez, P.; Valente, M.; Scarinci, I. E.; Pérez, P.; Valente, M.

doi:10.31527/analesafa.2020.31.4.165

Services on Demand

Journal

Article

Indicators

Cited by SciELO

Anales (Asociación Física Argentina)

Print version ISSN 0327-358XOn-line version ISSN 1850-1168

An. AFA vol.31 no.4 Buenos Aires Dec. 2020

http://dx.doi.org/10.31527/analesafa.2020.31.4.165

FÍSICA MÉDICA

Algoritmo heurístico de segmentación de imágenes pet utilizando técnicas de inteligencia artificial

Heuristic algorithm for pet images’ segmentation using artificial inteligence techniques

I. E. Scarinci¹²

P. Pérez¹²

M. Valente^*¹²³

^¹ Instituto de Física Enrique Gaviola, CONICET, FAMAF, UNC, Córdoba, 5000, Argentina.

^² Facultad de Matemática, Astronomía, Física y Computación (FAMAF), Universidad Nacional de Córdoba (UNC), Córdoba, Argentina.

^³ Centro de Física e Ingeniería en Medicina (CFIM) & Departamento de Ciencias Físicas, Universidad de La Frontera Temuco, Chile.

Resumen:

La cantidad de procedimientos de medicina nuclear se ha incrementado notablemente en los últimos años, convirtiendo a éstos en una herramienta cotidiana que alcanza a amplios sectores de la población. En relación al uso terapéutico de la medicina nuclear, la cantidad de nuevas técnicas y el uso de mayor variedad de radioisótopos demandan una cuantificación dosimétrica precisa y de carácter paciente-específico, a los fines de evaluar daños letales al tumor manteniendo niveles aceptables de dosis en tejidos sanos. En el caso particular de los tratamientos teranósticos que permiten la realización conjunta de tratamiento-diagnóstico, se presenta la posibilidad de realizar dosimetría interna guiada por imágenes. En este caso, resulta crítica la segmentación correcta de las imágenes para la identificación de diferentes tejidos y órganos. Por otra parte, las herramientas de la ciencia de datos y la inteligencia artificial se han difundido en varios campos, en particular el procesamiento digital de imágenes. La posibilidad de utilizar modelos de aprendizaje automático para el procesamiento de imágenes digitales surge como una oportunidad promisoria para complementar el análisis clínico por parte de expertos. En este trabajo se presenta un algoritmo heurístico de segmentación no supervisada utilizando conjuntamente técnicas de clustering y aprendizaje automático, basado en la utilización de dos algoritmos: K-Means y HDBSCAN. Los resultados obtenidos muestran la capacidad de segmentado automático de los algoritmos de clustering resultando éstos una herramienta útil para facilitar y acortar los tiempos de segmentación.

Palabras clave: medicina nuclear; dosimetría; teranóstica; inteligencia artificial

Abstract:

The overall quantity of nuclear medicine procedures has increased remarkably in recent years, making them a daily tool capable of reaching wide sectors of the population. Regarding the nuclear medicine therapeutic applications, it is worth noting that there is an increasing demand of novel techniques and greater variety of radioisotopes requiring accurate patient-specific dosimetry aimed at evaluating lethal damage to the tumor while maintaining acceptable dose levels in healthy tissues. Image-guided internal dosimetry appears as particularly suitable for theranostics procedures, which allow the joint implementation of diagnose and treatment. In this case, the correct segmentation of the images is critical for the identification of different tissues and organs. On the other hand, modern tools based on data science and artificial intelligence have spread in several fields, particularly in the digital image processing. The use of machine learning models for digital image processing appears as a promising opportunity to complement clinical analysis by experts. This paper reports about an unsupervised segmentation heuristic algorithm using clustering and machine learning techniques together, based on the use of two algorithms: K-Means and HDBSCAN. The results obtained highlight the capacity of automatic segmentation by means of clustering algorithms, becoming a useful tool to assist clinician experts and shorten the segmentation times.

Keywords: nuclear medicine; dosimetry; theranostics; machine learning

I. INTRODUCCIÓN

Los procedimientos de medicina nuclear tanto de diagnóstico como los utilizados para el tratamiento de diversas enfermedades oncológicas ya se encuentran implementados para el uso diario en clínicas y centros médicos. En particular, aquellos procedimientos teranósticos, capaces de combinar el diagnóstico con el tratamiento, posibilita la opción de tratamiento guiado por imágenes, mejorando así tanto la precisión como la evaluación dosimétrica de los procedimientos.¹^,²

Actualmente, cuantificar la eficacia de un tratamiento demanda un gran esfuerzo, y aún no se dispone de mecanismos estandarizados de planificación para los procedimientos terapéuticos en medicina nuclear, debido a la variabilidad que existe en la absorción y distribución de los radiofármacos dependiendo del paciente. Para ajustar estos tratamientos a la situación particular de cada paciente se requiere de un seguimiento desde el comienzo de la terapia. Se requiere la estimación de la dosis absorbida, no sólo en el tejido a tratar sino también en los órganos considerados radio-sensibles, como es el caso de riñones o médula ósea.³

El cálculo de la dosis absorbida por el paciente puede abordarse por diversos métodos: i) cálculo Monte Carlo de transporte de radiación,⁴^,⁵ ii) convolución de núcleos puntuales de dosis (DPK),⁶ o iii) por el método de valores propuesto por el MIRD.⁷ En todos estos casos es necesaria la evaluación precisa de la actividad presente en cada órgano de interés y su evolución temporal en el paciente. El cálculo de la actividad en cuerpo completo a partir de la diferencia entre actividad administrada y la actividad eliminada por orina o sudor resulta entonces insuficiente para estimar la actividad acumulada en cada uno de los órganos de interés, tanto sanos como en riesgo. La utilización de procedimientos teranósticos permite entonces la cuantificación localizada a partir de imágenes metabólicas de Cámara Gamma, PET o SPECT.⁸

La segmentación precisa de estas imágenes sirve de guía para delimitar las regiones pertenecientes a cada órgano y tejido de interés, pero para realizarse requiere de personal altamente capacitado, y experimentado, y conlleva tiempos no siempre aceptables en la práctica clínica. Existen métodos semi-automáticos basados en técnicas propias de la ciencia de datos y la inteligencia artificial, como la utilización del clustering K-Means⁹ o Fuzzy C-Means.¹⁰ Estas técnicas no supervisadas son capaces de automatizar gran parte del trabajo, pero en ningún caso permiten prescindir del ojo entrenado del experto a los fines de lograr una segmentación óptima, con los tiempos que esto implica.

Asimismo, estas técnicas de aprendizaje automático se encuentran ampliamente difundidas en el campo del procesamiento digital de imágenes. El reconocimiento de objetos y regiones a partir de modelos previamente entrenados es de uso diario en la mayoría de las ramas de la industria, el comercio y la seguridad.

En este trabajo se estudia la posibilidad de generar un método de segmentación automático a los fines de complementar el trabajo del experto y acortar los tiempos necesarios en la actualidad. Se presenta un algoritmo heurístico automático de segmentación por medio de clustering utilizando dos métodos: K-Means y HDBSCAN.¹¹

Los resultados obtenidos muestran la factibilidad de realizar el segmentado de las imágenes PET de forma automática y en tiempos aceptables para las prácticas clínicas. Éstos resultan promisorios para trabajos futuros en el campo de la segmentación automática de imágenes de medicina nuclear.

II. MÉTODOS Y MATERIALES

Imágenes PET/CT

Para el presente trabajo se utilizó un conjunto de imágenes PET/CT anonimizadas, que corresponden a estudios realizados en pacientes del centro médico INTECNUS en la ciudad de San Carlos de Bariloche. En todos los casos se trata de prácticas que han administrado al paciente radiotrazador basado en con actividad por unidad de masa de 0.075 mCi/Kg. La adquisición de las imágenes se realizó utilizando un equipo marca General Electric modelo Discovery 710.

Se concentró la atención en aplicar la metodología propuesta en imágenes de 4 pacientes, denominados 1, 2, 3 y 4 (ver Fig. 1).

FIG. 1: Imágenes paciente-específico utilizadas. Paciente 1 (arriba-izquierda), paciente 2 (arriba-derecha), paciente 3 (abajo-izquierda) y paciente 4 (abajo-derecha).

La Tabla 1 resume las principales características de las imágenes empleadas. El tamaño de voxel para las imágenes PET es de m m 3 y para las CT es de . A modo de ejemplo, la Fig. 1 reporta algunos cortes típicos.

TABLA 1: Características de las imágenes PET y CT utilizadas.

Algoritmos de Clustering

K-Means

El algoritmo de clustering K-Means consiste en encontrar particiones de un conjunto de datos . En el presente caso, el conjunto de datos a particionar está compuesto por el valor de intensidad de cada voxel de la imagen junto a su posición, es decir que cada elemento del conjunto es un vector de 4 dimensiones . Un cluster se define como un subconjunto de vóxeles tales que la distancia entre ellos es menor comparada con la distancia a puntos fuera del cluster. Por tanto, el problema de encontrar los cluster se resume en resolver:

(1)

donde se refiere a la “distancia intercluster".¹²

HDBSCAN

El algoritmo de HDBSCAN¹¹ (agrupación espacial basada en densidad jerárquica de aplicaciones con ruido) es una generalización de DBSCAN (agrupación espacial basada en densidad de aplicaciones con ruido). Ambos algoritmos comienzan buscando la distancia núcleo para cada punto, esta es la distancia entre el punto y un número de vecinos cercanos definidos por el hiperparámetro denominado número mínimo de muestras.

Luego, se forma un dendograma con los posibles clusters. HDBSCAN intenta mantener a los clusters tan grandes como sea posible, por medio del control del hiperparámetro “tamaño mínimo” de cluster.

La búsqueda del valor óptimo para los hiperparámetros que definen el desempeño del algoritmo se realiza maximizando el valor de la validez relativa para una dada configuración de tamaño mínimo de cluster y un número mínimo de muestras.¹³

Flujo de trabajo

En una primera instancia, al contar con la imagen original (cruda) de PET, es necesario descartar aquellos vóxeles que no pertenezcan a zonas de interés (tejidos), para lo cual se propone la implementación del método de clustering K-Means a los fines de segmentar la imagen en dos grandes regiones, pudiendo determinar aquellos vóxeles que pertenezcan a la zona a evaluar.

Una vez obtenida la primera segmentación, logrando separar los vóxeles entre aquellos que pertenecen a zonas con tejido de aquellos que no pertenecen a tejidos, resulta necesario implementar un nuevo criterio de segmentación para separar los vóxeles pertenecientes a zonas del cuerpo del paciente en dos grupos: a) aquellos que más probablemente pertenezcan a zonas activas de interés, y b) aquellos que puedan ser considerados ruido o fondo. A los fines del presente trabajo, y como resultado de pruebas preliminares, se propone utilizar segmentación por umbralamiento a nivel del tercer cuartil sobre la imagen de tejidos.

Una vez delimitados los tejidos de interés sobre los que se desea calcular la actividad acumulada, la imagen se suaviza utilizando un filtro de mediana que permite eliminar ruido. Asimismo, este filtro permite el relleno de posibles vóxeles “faltantes” en algunas zonas debido a incertezas intrínsecas de la técnica de adquisición de la imagen o la inhomogeneidad de la actividad, entre otras causas. Una vez suavizada, la imagen es re-dimensionada y normalizada a valores entre 0 y 1 para su posterior procesamiento y análisis.

La resolución espacial de las imágenes PET y CT suele ser diferente, incluso en equipamiento de imaging dual. Para esto, se recurre al método de resampling y se crean dos imágenes (anatómica y metabólica) de idéntica resolución espacial. A partir de la imagen anatómica, la que identifica aceptablemente las regiones y tejidos, y la metabólica, la que brinda información de la actividad en cada punto, y ambas imágenes en idéntica resolución espacial, es posible entonces incorporarlas como features en el método HDBSCAN. La matriz de features de entrada del algoritmo se construye a partir de las posiciones espaciales x, y y z, la intensidad del voxel de esa posición en la imagen PET y el correspondiente valor de intensidad (índice de Hounsfield) de la imagen anatómica (CT, en este estudio). Finalmente, se aplican diversas operaciones morfológicas a las etiquetas obtenidas de la aplicación del método HDBSCAN.

En la Fig. 2 se muestra el flujo de trabajo del modelo propuesto e implementado en el presente trabajo enfocado en imágenes PET. Como puede apreciarse, se trata de un método de segmentación automatizado, heurístico, que utiliza principalmente el algoritmo HDBSCAN sobre imágenes previamente procesadas por métodos clásicos (umbralamiento y filtro de mediana) y de primeros vecinos (K-Means).

FIG. 2: Flujo de trabajo propuesto e implementado.

III. RESULTADOS

Segmentación por K-Means

Se encuentra que, al realizar el primer paso donde se aplica K-Means sobre las imágenes originales, en todos los casos los resultados arrojan regiones donde se conservan las zonas más activas compuestas mayormente de tejidos activos de interés, descartando aquellas zonas que pueden ser consideradas fondo o ruido.

En la Fig. 3 se muestra el resultado de aplicar el segmentado por K-Means a las imágenes PET originales de los cuatros pacientes. Notar, que para una mejor visualización de los efectos de aplicar este método, en la Fig. 3 se muestran imágenes de los mismos cortes que en las imágenes originales de la Fig. 1.

Segmentación por umbralamiento y filtros

A los fines de realizar la siguiente etapa de segmentación por umbralamiento, resulta crítica la selección del valor de umbral. Con el propósito de proveer un abordaje objetivo, se analizaron los histogramas de las imágenes PET, tal como se muestra en la Fig. 4. Los histogramas de cada paciente resultan comparables entre sí para las imágenes localizadas, por un lado, y las de cuerpo completo, por otro.

FIG. 4: Histograma de imágenes PET para los cuatro pacientes.

En la Fig. 5 se muestran resultados de aplicar distintos valores de umbral para el paciente 1, aplicando 4 valores de percentiles distintos de umbral (25%, 50%, 75% y 85%). Como puede observarse, para el primer y segundo cuartil (imagen superior izquierda y derecha en la Fig. 5; respectivamente) el umbral resulta insuficiente, evidenciándose “rastros” de vóxeles activos que no resultan de interés para el estudio o que representan vóxeles de fondo. En cambio, para un valor de umbral muy alto como el del percentil 85 (imagen inferior derecha) se “pierden” vóxeles pertenecientes a tejidos de interés. El tercer cuartil (imagen inferior izquierda) muestra claramente que los vóxeles de fondo se encuetran eliminados y sólo se conservan aquellos pertenecientes a los tejidos de interés. Por ello, se definió para todos los estudios un valor de umbral igual al tercer cuartil. El valor de umbral utilizado para cada paciente se detalla en la Tabla 2.

FIG. 5: Distintos valores de umbral para la imagen PET del paciente 1 para el mismo corte que se ve en laFig. 3

Finalmente, antes de procesar la imagen con el algoritmo de HDBSCAN, es necesario lograr imágenes más realistas, por lo que se procede a un suavizado y un reescalado. En la Fig. 6 se muestran imágenes resultantes de este procedimiento.

FIG. 6: Imágenes PET/CT de los cuatro pacientes luego de haber sido segmentadas por K-Means, umbraladas y suavizadas

Entrenamiento y segmentación definitiva

Una vez obtenidas las imágenes segmentadas por K-Means, descartados los vóxeles caracterizados como ruido y/o fondo a través del umbralamiento y suavizado de las imágenes, se construye la matriz de features que se utiliza como entrada en el entrenamiento del modelo de clustering HDBSCAN.

La matriz de entrada consiste de 5 características (features) ubicadas en columnas: 3 espaciales (x, y, z), intensidad del voxel de la imagen PET e intensidad de voxel de la imagen CT para cada valor (x, y, z), como se muestra en la Fig. 7. En el caso de estudio, debido a la cantidad de vóxeles de cada imagen, estas matrices tienen entre 60000 y 200000 entradas.

FIG. 7: Matriz de features.

La búsqueda de los valores óptimos para los hiperparámetros del algoritmo HDBSCAN se hizo primeramente sobre el tamaño mínimo de cluster y luego, una vez definido este valor, se busca el valor óptimo para el número mínimo de muestras. En la Tabla 2 se muestran los hiperparámetros óptimos utilizados para el entrenamiento.

TABLA 2: Resumen de hiperparámetros utilizados.

La Fig. 8 muestra los resultados obtenidos a lo largo de todo el procesamiento de las imágenes, en particular para el paciente 1. En la imagen superior izquierda se ve la imagen resultante de aplicar el segmentado por K-Means. Donde son fácilmente reconocibles los siguientes órganos: hígado, bazo, ambos riñones, médula ósea junto al bulk de actividad. La imagen superior derecha es la resultante de aplicar el umbral igual al tercer cuartil y posteriormente re-escalado y suavizado de la imagen. Finalmente, la imagen inferior muestra la segmentación obtenida de aplicar el algoritmo HDBSCAN, en ésta se puede apreciar cómo el método propuesto es capaz de segmentar e instanciar los distintos tejidos de interés en la imagen.

FIG. 8 Resultados logrados aplicando el método propuesto

La Fig. 9 muestra el resultado para los mismos tres cortes para los cuatros pacientes que se presentan en la Fig. 6.

FIG. 9: Segmentación de imágenes PET/CT.

Como puede observarse en los resultados reportados en las Figs. 8 y 9, el modelo propuesto es capaz de segmentar e instanciar los distintos órganos. En el paciente 1 se observa el hígado, el bazo, la médula ósea, los riñones, vejiga; junto al bulk de actividad. En el caso del paciente 2, puede apreciarse que el corazón, el hígado y el riñón izquierdo, los que se segmentan como un sólo órgano, y el riñón derecho. En la figura del paciente 3, se observa el cerebro, el hígado, y la vejiga, entre otros. Para el paciente 4, también se observa el cerebro, el corazón, el hígado, la vejiga, parte de la médula y los riñones. Puede verse que en las imágenes de cuerpo completo la segmentación resulta más compleja, lo que puede asociarse a, al menos, los siguientes motivos: 1) hay un mayor número de tejidos a segmentar y 2) el tamaño de los tejidos a segmentar es muy distinto uno de otro, por ejemplo el cerebro es un tejido que se segmenta mucho más fácil que los riñones o la médula. Esta diferencia en tamaño repercute en la elección del hiperparámetro de tamaño mínimo de cluster. Un valor pequeño de éste ayudará a segmentar mejor la médula o los riñones pero dificultará el segmentado del cerebro o el hígado, caso contrario si se elige un valor muy grande. También puede verse que en la segmentación del hígado y del riñón derecho o del bazo y del riñón izquierdo no siempre se logra una performance óptima.

IV. CONCLUSIONES

El presente trabajo propone, desarrolla e implementa un procedimiento original, y automatizado, para la identificación de tejidos y órganos en imágenes PET-CT. La implementación de la metodología propuesta se realizó por medio de un flujo de trabajo especialmente adaptado. Una vez aplicado a un conjunto de imágenes PET-CT, el flujo de trabajo propuesto mostró ser una herramienta útil para el segmentado automatizado no supervisado de imágenes PET. Así mismo, se verificó la capacidad de HDBSCAN como método de segmentación de imágenes médicas. Dada la capacidad de este algoritmo para procesar grandes cantidades de datos de entrada, se consigue realizar la segmentación en tiempos cortos, esto es un requerimiento importante a la hora de realizar cálculos dosimétricos en ambiente clínico. Sin embargo, el mayor desafío es encontrar los valores de hiperparámetros óptimos que devuelven una segmentación de calidad. ésta es una arista a mejorar en trabajos futuros junto a la optimización del proceso de segmentación en imágenes de cuerpo completo.

AGRADECIMIENTOS

El presente trabajo pudo realizarse gracias al aporte de las imágenes PET/CT provistas por la Mg. Virginia Venier y la Lic. Ana Lucía Poma de la Fundación INTECNUS. El presente trabajo fue parcialmente financiado por el proyecto SeCyT 33620180100366CB de la Universidad Nacional de Córdoba y el proyecto DI18-0106 de la Universidad de La Frontera.

REFERENCIAS

1 [] L. Solnes, R. Werner, K. M. Jones, M. S. Sadaghiani, C. R. Bailey, C. Lapa, M. G. Pomper y S. P. Rowe. Theranostics: Leveraging Molecular Imaging and Therapy to Impact Patient Management and Secure the Future of Nuclear Medicine. J. Nucl. Med. 61, 311-318 (2020). [ Links ]

2 [] T. Langbein, W. A. Weber y M. Eiber. Future of theranostics: an outlook on precision oncology in nuclear medicine. J. Nucl. Med. 60, 13S-19S (2019). [ Links ]

3 [] M. Sandström, U. Garske-Román, D. Granberg, S. Johansson, C. Widström, B. Eriksson, A. Sundin, H. Lundqvist y M. Lubberink. Individualized dosimetry of kidney and bone marrow in patients undergoing 177Lu-DOTAoctreotate treatment. J. Nucl. Med. 54, 33-41 (2013). [ Links ]

4 [] P. Pérez y M. Valente. DOSIS: An integrated computational tool for patient-specific dosimetry in nuclear medicine by Monte Carlo and dose point kernel approaches. Appl. Radiat. Isot. 150, 135-140 (2019). [ Links ]

5 [] A. Gosewisch, H. Ilhan, S. Tattenberg, A. Mairani, K. Parodi, J. Brosch, L. Kaiser, F. J. Gildehaus, A. Todica, S. Ziegler, P. Bartenstein y G. Böning. 3D Monte Carlo bone marrow dosimetry for Lu-177-PSMA therapy with guidance of non-invasive 3D localization of active bone marrow via Tc-99m-anti-granulocyte antibody SPECT/CT. EJNMMI Res. 9, 76 (2019). [ Links ]

6 [] F. Botta, A. Mairani, G. Battistoni, M. Cremonesi, A. Di Dia, A. Fasso, A. Ferrari, M. Ferrari, G. Paganelli, G. Pedroli y col. Calculation of electron and isotopes dose point kernels with FLUKA Monte Carlo code for dosimetry in nuclear medicine therapy. Med. Phys. 38, 3944-3954 (2011). [ Links ]

7 [] W. Snyder, Ford, G. Warner y S. Watson. MIRD pamphlet no. 11: S, absorbed dose per unit cumulated activity for selected radionuclides and organs (New York, NY: Society of Nuclear Medicine, 1975). [ Links ]

8 [] P. A. Jackson, J.-M. Beauregard, M. S. Hofman, T. Kron, A. Hogg y R. J. Hicks. An automated voxelized dosimetry tool for radionuclide therapy based on serial quantitative SPECT/CT imaging. Med. Phys. 40, 112503 (2013). [ Links ]

9 [] D. W. G. Montgomery, A. Amira y H. Zaidi. Fully automated segmentation of oncological PET volumes using a combined multiscale and statistical model. Med. Phys. 34, 722-736 (2007). [ Links ]

10 [] S. Belhassen y H. Zaidi. A novel fuzzy C-means algorithm for unsupervised heterogeneous tumor quantification in PET. Med. Phys. 37, 1309-1324 (2010). [ Links ]

11 [] R. J. Campello, D. Moulavi y J. Sander. Density-based clustering based on hierarchical density estimates en Pacific-Asia conference on knowledge discovery and data mining (2013), 160-172. [ Links ]

12 [] C. M. Bishop. Pattern Recognition and Machine Learning (eds. Jordan, M., Kleinberg, J. y Schölkopf, B.) Information science and statistics 4, 738. ISBN: 9780387310732 (Springer, 2006). [ Links ]

13 [] D. Moulavi, P. A. Jaskowiak, R. J. G. B. Campello, A. Zimek y J. Sander. Density-Based Clustering Validation. en SDM (eds. Zaki, M. J., Obradovic, Z., Tan, P.-N., Banerjee, A., Kamath, C. y Parthasarathy, S.) (SIAM, 2014), 839-847. ISBN: 978-1-61197-344-0. [ Links ]

Recibido: 01 de Mayo de 2020; Aprobado: 19 de Agosto de 2020

^*Autor para correspondencia: email: mauro.valente@gmail.com

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons