Este programa implementa una medida automática y eficiente para detectar nódulos tiroideos, lo que puede reducir la carga de trabajo de los médicos en el futuro. Esta técnica aplica un transformador Swin a una red de detección de nódulos. Los Transformers Swin son efectivos para capturar información de contenido de largo alcance, lo cual es muy útil para mejorar la sensibilidad de la detención de nódulos.
Para comenzar, abra un terminal en la máquina e instale Python 3.8 escribiendo sudo apt-get install python3.8 en la línea de comandos. Para instalar PyTorch 1.7, vaya al sitio web oficial de Miniconda e instálelo. Luego cree un entorno Conda escribiendo el comando que se muestra en la pantalla en la línea de comandos, y actívelo escribiendo conda activate SwinFasterRCNN.
Instale PyTorch escribiendo el comando mostrado en la línea de comandos. Para la instalación de detección de MM, clone desde el repositorio oficial de GitHub y luego instale MM Detection escribiendo el comando pip install v e en la línea de comandos. Abra el schedule_1x.
py en el editor de texto Vim y edite el archivo para establecer los parámetros predeterminados relacionados con el entrenamiento, incluidos el optimizador, la tasa de aprendizaje y la épica. Comience el entrenamiento escribiendo el comando que se muestra en la pantalla. Espere a que la red comience el entrenamiento para 48 epopeyas y a que los pesos entrenados resultantes de la red SwinFasterRCNN se generen en la carpeta de salida.
Guarde los pesos del modelo con la mayor precisión en el conjunto de validación. Después del entrenamiento, seleccione el modelo con el mejor rendimiento en el conjunto de validación para la detección de nódulos tiroideos en las nuevas imágenes. Ejecute el script de prueba para cambiar el tamaño de la imagen a 512 píxeles por 512 píxeles y normalizarla.
Espere a que el script cargue automáticamente los parámetros del modelo entrenado previamente en SwinFasterRCNN y alimente la imagen preprocesada en SwinFasterRCNN para su inferencia. Espere a que SwinFasterRCNN genere el cuadro de predicción para cada imagen. Finalmente, permita que el script realice automáticamente el posprocesamiento NMS en cada imagen para eliminar los cuadros de detección duplicados.
Los resultados de detección de la misma imagen se muestran en una fila determinada. Las columnas son los resultados de detección para SwinFasterRCNN, FasterRCNN, YOLOv3, SSD, RetinaNet y DETR. Las verdades básicas de las regiones están marcadas con cajas rectangulares verdes.
Los resultados de detección están enmarcados por las cajas rectangulares rojas. Es muy importante seleccionar el hiperparámetro apropiado para garantizar que converjan lo que debe determinarse mediante muchos experimentos.