JoVE Logo

Iniciar sesión

En este artículo

  • Resumen
  • Resumen
  • Introducción
  • Protocolo
  • Resultados
  • Discusión
  • Divulgaciones
  • Agradecimientos
  • Materiales
  • Referencias
  • Reimpresiones y Permisos

Resumen

Este artículo describe AMOS, la base de datos de Métodos Analíticos y Espectros Abiertos basada en la web, una aplicación de quimioinformática diseñada para proporcionar a los investigadores un fácil acceso a los métodos analíticos y a los datos espectrales.

Resumen

Los métodos analíticos pueden variar desde documentos regulatorios detallados hasta resúmenes más simples. Los métodos regulatorios pueden incluir información sobre analitos susceptibles, matrices compatibles, reactivos requeridos, rendimiento estadístico, validación entre laboratorios y otros detalles. Los resúmenes suelen proporcionar una descripción general de los reactivos, la instrumentación y, a menudo, una breve lista de analitos. Los métodos analíticos de los organismos gubernamentales de los EE. UU., incluida la Agencia de Protección Ambiental de EE. UU. (USEP), el Servicio Geológico de EE. UU. (USGS), el Departamento de Agricultura de EE. UU. (USDA), la Administración de Alimentos y Medicamentos (FDA) y otros, ofrecen información detallada sobre los procedimientos. Los proveedores de instrumentos como Agilent, Shimadzu, Thermo Fisher Scientific, Sciex y otros también brindan acceso a cientos de notas de aplicación, que pueden considerarse métodos de resumen. Este estudio ha desarrollado una base de datos de métodos habilitada por la quimioinformática en la que los productos químicos se extraen de documentos de métodos, con identificadores (nombres y / o números de registro del Servicio de Resúmenes Químicos (CASRN)) asignados a estructuras químicas. La base de datos resultante, que contiene aproximadamente 7.000 métodos, se puede buscar por identificador, estructura química y similitud estructural, y se complementa con aproximadamente un millón de espectros de dominio público (LC/MS, GC/MS, RMN e IR). La aplicación admite la búsqueda de métodos analíticos y el filtrado en función de los analitos, el uso funcional, las fuentes de los métodos y otros metadatos relacionados.

Introducción

La entrega de datos químicos a la comunidad basada en la web se ejemplifica con aplicaciones como PubChem1, ChemSpider2 y CompTox Chemicals Dashboard (CCD)3. Se han hecho esfuerzos para hacer circular los detalles de los métodos analíticos publicados en artículos de revistas, publicados por los proveedores de instrumentos como notas técnicas de aplicación, proporcionados por agencias gubernamentales como procedimientos operativos estándar o métodos regulatorios, y emitidos por organizaciones de normalización como la Organización Internacional de Normalización (ISO). Decenas de miles de productos químicos han sido estudiados por estas fuentes bajo una amplia gama de condiciones y técnicas analíticas. Este extenso cuerpo de fuentes abarca diversas sustancias e incluye escenarios que van desde la cuantificación de un solo producto químico en una matriz específica (por ejemplo, sangre), hasta mezclas de plaguicidas y sus residuos en cultivos específicos, hasta cientos de productos químicos identificados en el agua potable. Si bien muchos métodos analíticos se pueden descubrir a través de motores de búsqueda públicos, no todos están disponibles de forma gratuita o son de acceso abierto.

Localizar información específica de interés puede ser un desafío. Los motores de búsqueda de propósito general no están optimizados para datos de química, y sus algoritmos de clasificación pueden oscurecer el contenido de alta calidad destinado a audiencias limitadas. Las búsquedas en los sitios web de revistas pueden arrojar resultados más específicos, pero el acceso a menudo es restringido, ya que solo los resúmenes están disponibles públicamente, lo que dificulta la evaluación de la utilidad de un método. Además, los parámetros críticos, como las matrices de muestras, los límites de detección y la cuantificación, a menudo no se almacenan en un formato estructurado. Otro desafío importante radica en la variación e inconsistencia de los identificadores, nombres y sinónimos químicos asociados con un solo producto químico. La falta de datos de métodos estructurados limita el desarrollo de herramientas de software que podrían aprovechar décadas de conocimiento acumulado en química analítica y publicaciones relacionadas.

Como resultado de estos desafíos y limitaciones, existe la necesidad de una aplicación curada y orientada a la química para armonizar y buscar métodos analíticos, una que no se identificó en ningún otro lugar. Para abordar esta brecha, la Agencia de Protección Ambiental de los Estados Unidos (EPA, por sus siglas en inglés) desarrolló AMOS, la base de datos de Métodos Analíticos y Espectros Abiertos y una aplicación basada en la web. En la actualidad, AMOS recopila y organiza tres tipos de registros de datos: métodos analíticos, diversos espectros analíticos y una amplia categoría de documentos complementarios denominados colectivamente hojas informativas. Cada registro está vinculado a los analitos y reactivos químicos objetivo del método. Los datos se pueden buscar de múltiples maneras, incluidas las consultas de texto, la estructura química y la similitud estructural o espectral.

La aplicación AMOS se centra principalmente en la entrega de registros de datos y acceso abiertos. En la medida de lo posible, los registros de la base de datos tienen hipervínculos a sus fuentes originales. Los registros que no están bajo licencia abierta y, por lo tanto, no se almacenan directamente en la base de datos, aún se pueden integrar y acceder a ellos a través de una URL, siempre que estén disponibles de otra manera. Esto se aplica a dos tipos de registros: los métodos analíticos que están detrás de muros de pago, generalmente de revistas u organizaciones de estándares a los que la EPA tiene acceso, y los espectros que están disponibles pero requieren acceso de inicio de sesión.

Las fuentes de datos varían en la forma en que se estructuran los registros, lo que requiere un esfuerzo sustancial de extracción y conservación para ensamblar y armonizar el contenido. La mayoría de los registros proporcionan identificadores de sustancias (por ejemplo, CASRN, DTXSID, InChIKey, nombres comunes) y, en muchos casos, la extracción es sencilla. Sin embargo, hacer coincidir estos identificadores con las estructuras químicas y los detalles de las sustancias puede ser complejo. Algunos identificadores pueden coincidir directamente con las entradas de la base de datos de la EPA Distributed Structure-Searchable Toxicity (DSSTox)4; Cuando no se encuentran coincidencias, los identificadores se vinculan a sustancias existentes o se registran nuevas sustancias. En consecuencia, la iniciativa AMOS ha llevado a la expansión de la base de datos DSSTox, mejorando los datos fundamentales que respaldan otras bases de datos y aplicaciones de la EPA, como CompTox Chemicals Dashboard3.

La curación manual es necesaria para cierta información adicional valiosa. En el caso de los métodos analíticos, los parámetros experimentales, como los límites de detección y cuantificación, la matriz de muestras y la metodología analítica, no están organizados de forma estandarizada, y las herramientas automatizadas no pueden identificar esta información debido a su almacenamiento inconsistente.

Dos elementos de la información de registro, el medio asociado con la muestra y el uso funcional del analito, son muy relevantes para los esfuerzos en curso para monitorear los problemas de peligro y exposición a los contaminantes. Como tal, se prestó considerable atención a la estructuración de estos atributos dentro de los datos de registro. Para este proyecto se desarrolló una ontología de clasificaciones de uso funcional. Esta ontología organiza los usos funcionales de las sustancias en una estructura jerárquica, que va desde los usos "padres" más generales hasta los usos "secundarios" más específicos. La ontología facilita la exploración de sustancias desde una perspectiva de aplicación, apoyando iniciativas de investigación que enfatizan los usos funcionales como un medio para evaluar la exposición y el peligro 5,6. Además, los métodos se etiquetaron de acuerdo con la categoría de medios armonizados de sus muestras, según lo especificado en la base de datos de monitoreo multimedia (MMDB) de la EPA)7. Esta categorización permite la búsqueda de sustancias químicas en función de su presencia en medios específicos, agilizando el desarrollo de soluciones centradas en la detección de sustancias químicas en muestras ambientales o biológicas específicas. Estas anotaciones mejoran la integración de AMOS en los flujos de trabajo orientados a la exposición y los peligros que se están desarrollando dentro de la EPA.

Al ensamblar los espectros, el desafío de procesar varios formatos de archivo, algunos de los cuales solo están nominalmente estandarizados, y analizar los metadatos que los acompañan a menudo requiere un manejo personalizado. En los casos en los que las colecciones espectrales están vinculadas a una publicación, es posible que sea necesario extraer manualmente los detalles documentados en la publicación para la carga de datos. Este esfuerzo ha dado como resultado una base de datos que integra y estructura estos espectros dispares, lo que permite a los investigadores evitar la necesidad de una curación laboriosa en futuros esfuerzos.

A partir de marzo de 2025, la base de datos contiene aproximadamente 935,000 espectros, de los cuales casi el 99% son espectros de masas y colecciones más pequeñas de RMN (~2,000) e IR (~400). Además, hay aproximadamente 770.000 espectros enlazados externamente (conectados a la base de datos SpectraBase8), ~36.000 hojas informativas y ~7.400 métodos analíticos. Las sustancias integradas en la aplicación son un subconjunto de las de la base de datos DSSTox, que está incorporada en el CompTox Chemicals Dashboard (CCD) y contiene más de 1,2 millones de sustancias.

Protocolo

La mayor parte de la funcionalidad de AMOS se puede dividir en tres categorías: búsqueda de registros para sustancias determinadas, búsqueda de ciertas colecciones de sustancias o búsqueda entre categorías de registros. Se puede acceder a todas las páginas individuales de estas funcionalidades desde la barra de navegación en la parte superior de cada página. Actualmente, la aplicación se despliega en https://hcd.rtpnc.epa.gov/#/ a través del módulo AMOS. Las herramientas de software utilizadas en este estudio se enumeran en la Tabla de Materiales.

1. Búsqueda de registros de sustancias específicas

  1. Búsqueda general: Realice una búsqueda general para obtener una lista de todos los tipos de registros asociados con una sola sustancia (véase la Figura 1).
    1. En el campo de texto de la parte superior izquierda de la barra de navegación o en el campo de búsqueda de la página principal, introduzca un nombre de sustancia, CASRN, InChIKey o un identificador de sustancia DSSTox (DTXSID). Presione Enter o haga clic en Buscar para ejecutar la búsqueda.
      NOTA: La barra de búsqueda de la página principal tiene una opción adicional para buscar por subcadena; Consulte la sección sobre la búsqueda de identificadores parciales (paso 2.2) para obtener más información.
    2. Si el identificador buscado se reconoce y coincide con una sola sustancia, el lado izquierdo de la página mostrará información básica sobre la sustancia y una tabla que enumera todos los registros asociados con esa sustancia. Seleccione una fila de esa tabla para mostrar el registro asociado en el lado derecho de la página si está almacenado directamente en la base de datos.
    3. Si el identificador buscado coincide con varias sustancias, por ejemplo, una abreviatura que se utiliza para más de una sustancia, aparecerá un mensaje de desambiguación para que el usuario seleccione qué sustancia desea ver. Seleccione una sustancia de esa lista y una será redirigida a la pantalla de una sustancia reconocida.
    4. Para filtrar la tabla de resultados, haga clic en las pestañas situadas justo encima de la tabla para filtrar por tipo de registro (esto también ocultará y mostrará diferentes columnas), introduzca texto en los campos de la parte superior de la tabla para filtrar otros aspectos de los datos y seleccione las casillas de verificación situadas encima de las pestañas para filtrar las propiedades más amplias de los datos.
  2. Búsqueda por lotes: Realice una búsqueda por lotes para generar y descargar un archivo de hoja de cálculo que enumere información sobre todos los registros de la base de datos que estén asociados a una lista determinada de sustancias. (ver Figura 2).
    1. En el campo de datos de entrada, introduzca una lista de DTXSID en los que se va a buscar, uno por línea. Si los DTXSID no están disponibles, utilice el enlace de la página para navegar a una herramienta CCD que pueda proporcionar DTXSID con otros identificadores.
    2. Utilice las casillas de verificación de Opciones de búsqueda para filtrar los resultados o anexar información adicional a los registros. Las opciones se agrupan en cinco categorías: filtrado por tipos de registro, filtrado por metodologías analíticas, adición de información adicional a nivel de sustancia al archivo de resultados, adición de información adicional a nivel de registro (actualmente solo disponible para espectros de masas) y algunas opciones diversas.
      NOTA: Las opciones con un subrayado discontinuo tienen texto que explica la opción más detalladamente. Coloque el cursor sobre la etiqueta de la opción para verla.
    3. Haga clic en Buscar en la parte inferior de la página para ejecutar la búsqueda.
      NOTA: La hoja de cálculo de salida contiene una lista de asociaciones de registros de sustancias junto con identificadores de sustancias, enlaces de fuentes y otra información básica. Si aparecen varias sustancias buscadas en un registro, el registro aparecerá una vez para cada sustancia.
  3. Búsqueda de similitud estructural: Realice esta búsqueda para obtener listas de métodos y hojas informativas en la base de datos que contengan la sustancia buscada o una con un coeficiente de similitud estructural de Tanimoto suficientemente alto (consulte la Figura 3).
    NOTA: Esta búsqueda puede ser útil en los casos en los que una sustancia de interés no aparece en ningún método, pero los métodos con sustancias muy similares podrían utilizarse como referencia.
    1. Introduzca un DTXSID, InChIKey, CASRN o un nombre de sustancia en el campo de búsqueda y haga clic en Buscar o pulse Intro. La búsqueda puede tardar entre 20 y 30 segundos en completarse.
    2. Una vez completada la búsqueda, aparecerá una tabla con pestañas a continuación. Seleccione una pestaña para ver los resultados de la búsqueda.
      1. Las dos primeras pestañas enumeran los métodos y las hojas de datos que se encontraron. Seleccione uno para que aparezca una vista de ese documento en el lado derecho de la página. Los métodos u hojas informativas que contienen la sustancia buscada están en negrita.
      2. La tercera pestaña enumera sustancias similares que se encontraron en métodos u hojas informativas. Seleccione una fila de la tabla para que aparezca una comparación entre la sustancia buscada y la seleccionada de la tabla. Si la sustancia buscada se encontró en algún documento, estará en negrita.
      3. Utilice el selector Filtrar similitud mínima de sustancias en la parte superior para ocultar los resultados de la búsqueda que carezcan de sustancias por debajo del umbral de similitud seleccionado.

figure-protocol-6210
Figura 1: Resultados de la búsqueda de registros que contengan colesterol. Una búsqueda general de "colesterol" muestra una lista de registros coincidentes en la tabla (izquierda). El espectro de masas de un registro seleccionado se muestra a la derecha. Haga clic aquí para ver una versión más grande de esta figura.

figure-protocol-6826
Figura 2: Interfaz de búsqueda por lotes. El campo de búsqueda contiene dos sustancias identificadas por sus DTXSID. Se seleccionan las opciones de búsqueda predeterminadas para la consulta. Haga clic aquí para ver una versión más grande de esta figura.

figure-protocol-7378
Figura 3: Resultados de la búsqueda de estructuras para 1P-LSD. En la tabla se enumeran los métodos que contienen sustancias estructuralmente similares. A la derecha se muestra un método seleccionado. No hay entradas en negrita en la tabla que 1P-LSD no aparece en ninguno de los métodos enumerados. Haga clic aquí para ver una versión más grande de esta figura.

2. Búsqueda de sustancias

  1. Búsqueda de ClassyFire: Realice esta búsqueda para enumerar todas las sustancias que pertenecen a los primeros cuatro niveles de una clasificación de ClassyFire9 (consulte la Figura 4).
    1. Con los cuatro campos de la parte superior de la página, seleccione los cuatro niveles superiores de la clasificación de uno en uno. Después de seleccionar cada uno de los tres primeros, use el botón debajo de ese campo para obtener la lista de clasificaciones un nivel más abajo. Para el cuarto, el botón de abajo ejecutará la búsqueda.
      NOTA: Una vez completada la búsqueda, la siguiente tabla se completará con una lista de sustancias que existen bajo esa clasificación. La tabla incluye identificadores comunes e información de sustancias, además de recuentos de cuántos registros existen en AMOS.
    2. Utilice los botones entre la selección de clases y la tabla para permitir cuatro bits de funcionalidad:
      1. Haga clic en Copiar clasificación a URL para copiar una URL en el portapapeles, que, si se carga en una nueva pestaña o ventana del navegador, rellenará automáticamente los niveles de clasificación y ejecutará la búsqueda.
      2. Haga clic en Restablecer selección para restablecer las selecciones en los campos de clasificación. No restablece la tabla de sustancias encontradas.
      3. Haga clic en Descargar tabla para solicitar la descarga de un archivo de hoja de cálculo que contenga todos los campos y registros visibles en la tabla, además de las imágenes de la sustancia. Si los filtros de la parte superior de la tabla de resultados están en uso, los resultados descargados también se filtrarán, pero no se incluirá el contenido de los filtros.
      4. Haga clic en Enviar sustancias seleccionadas a la búsqueda por lotes para abrir una nueva pestaña para la búsqueda por lotes con el campo para enumerar los DTXSID precargados con las sustancias seleccionadas de los resultados de búsqueda de ClassyFire. La selección de sustancias individuales se puede realizar con la casilla de verificación en cada fila; La selección o deselección de todas las sustancias se puede realizar haciendo clic en la casilla de verificación en el encabezado de la tabla. Consulte el paso 1.2 para obtener más información sobre la búsqueda por lotes.
  2. Búsqueda parcial de identificadores: Realice esta tarea para encontrar todas las sustancias que coincidan con un identificador no único (véase la figura 5). Las opciones actuales son la subcadena name (que cubre tanto el nombre preferido por la EPA como los sinónimos comunes), el primer bloque InChIKey, la fórmula molecular exacta y un rango de masas monoisotópicas.
    1. En la parte superior de la página, seleccione un identificador e introduzca la información en los campos adyacentes.
    2. Haga clic en Buscar para ejecutar la búsqueda.
    3. Una vez completada la búsqueda, la tabla se completará con una lista de sustancias que coincidan con el identificador parcial, además de información sobre la frecuencia con la que aparecen en la base de datos de AMOS y en otras publicaciones. Utilice los filtros de la parte superior de las columnas de la tabla para refinar aún más los resultados y utilice la casilla de verificación Mostrar sustancias multicomponente para mostrar u ocultar sustancias compuestas por varios compuestos.
      NOTA: Si se ejecutó una búsqueda de subcadena de nombre, aparecerá una columna con los sinónimos encontrados. Si una sustancia solo se encuentra por sinónimos, es decir, si el nombre preferido no contiene la subcadena, el nombre preferido estará en cursiva.

figure-protocol-11989
Figura 4: Resultados de la búsqueda de la clasificación de ClassyFire. Los resultados incluyen información a nivel de sustancia y el número de registros por grupo de clasificación. Haga clic aquí para ver una versión más grande de esta figura.

figure-protocol-12531
Figura 5: Resultados de la búsqueda de identificadores parciales para "trazine". La búsqueda recupera sustancias con nombres preferidos o sinónimos que contienen la subcadena "trazine". Dos de los tres resultados incluyen "trazine" solo en sus sinónimos, no en sus nombres preferidos. Haga clic aquí para ver una versión más grande de esta figura.

3. Búsqueda a través de registros

  1. Hoja informativa y listas de métodos: En estas páginas se enumeran todas las hojas de datos y métodos que se encuentran en la base de datos, con diversas formas de filtrarlos (consulte la figura 6). Dado que la funcionalidad de las dos páginas es en gran medida la misma, se agrupan aquí.
    NOTA: Al navegar a la página, se cargarán las tablas. Esto puede tardar un momento debido a la cantidad de registros presentes.
    1. Una vez cargada una tabla, utilice las entradas de la parte superior de cada columna para filtrar los datos y los distintos campos. Los campos exactos varían de una tabla a otra, pero la mayoría se pueden seleccionar o filtrar.
    2. Utilice el campo Filtro de tabla completa situado encima de la tabla para comprobar todas las columnas de una cadena determinada.
      NOTA: La lista de métodos incluye dos campos que están ocultos de forma predeterminada: autor y editor. El filtro de tabla completa capturará los registros que tengan el término buscado en cualquiera de esos campos.
    3. La lista de hojas informativas permite filtrar los resultados individuales mediante la búsqueda de una sustancia determinada. Introduzca el nombre de una sustancia, CASRN, InChIKey o DTXSID, y pulse buscar para filtrar la tabla. Haga clic en Borrar filtro para borrar el filtro de sustancia.
      NOTA: Ambas tablas tienen los siguientes botones disponibles: Copiar filtros al portapapeles copia una URL en el portapapeles que, cuando se accede a ella mediante un navegador, cargará la lista y rellenará previamente los campos de filtro de la tabla con los valores actuales; Descargar tabla descarga una lista de todos los resultados y filtros visibles en la tabla; Descargar sustancias descarga una lista de todas las sustancias que aparecen en la tabla (filtrada); Restablecer filtros borra todos los filtros de tabla, incluido el filtro de tabla completo.
  2. Búsqueda de espectro de masas: Realice esta búsqueda para recuperar una lista de coincidencias de espectros de masas de la base de datos basada en un espectro proporcionado por el usuario (consulte la Figura 7).
    1. Rellene o ajuste los cuatro campos de entrada obligatorios: un rango de masa para la sustancia objetivo en Daltons, con un margen de error en Daltons o partes por millón (ppm); una metodología, ya sea GC/MS o LC/MS; un espectro de masas, dado como una lista de pares de carga a masa e intensidad; y el tamaño de la ventana de masa para la similitud de picos.
    2. Una vez que se hayan completado esos campos, haga clic en el botón Buscar debajo de ellos.
      NOTA: Cuando se complete la búsqueda, si se encontró algún espectro, aparecerá una tabla en el lado derecho de la página con una lista de espectros que coinciden con la metodología seleccionada de todas las sustancias que coinciden con el rango de masas, ordenados por la similitud de entropía entre el espectro enviado por el usuario y el espectro de la base de datos.
    3. Seleccione una fila de la tabla para que aparezca un gráfico que muestre una comparación del espectro de usuarios con el espectro de la base de datos (respectivamente en la parte superior e inferior del gráfico). Utilice el campo Similitud mínima para mostrar para ocultar los resultados que están por debajo de una similitud de entropía determinada.
  3. Visualización de la clasificación de uso funcional: Esta página visualiza la ontología de uso funcional de AMOS y enlaza con los métodos y las hojas de datos para esas clases de uso. Las clases se representan en un gráfico dirigido, con bordes que van desde las clases primarias más generales hasta las clases secundarias más específicas (consulte la figura 8).
    1. Utilice el campo de búsqueda de la derecha para buscar en la lista de clases de uso funcional. Coloque el cursor sobre el nombre de una clase use para resaltar el nodo correspondiente en el gráfico.
    2. Si examina el gráfico directamente, coloque el cursor sobre un nodo especificado para que aparezca una breve descripción de esa clase, así como para resaltar las clases primarias o secundarias directas de ese nodo.
    3. Haga clic con el botón derecho en el nombre de una clase de la lista en el lado derecho de la página o en un nodo del gráfico para que aparezca un menú con opciones para las listas de métodos y hojas informativas. Seleccione uno de estos y se abrirá una nueva pestaña del navegador en esa lista, con el campo de clase funcional prefiltrado con la clase funcional seleccionada.
  4. Parcela ternaria del suelo: Esta página recrea la clasificación de la textura del suelo del Departamento de Agricultura de EE. UU., lo que permite la búsqueda de los métodos de AMOS por tipo de suelo.
    1. Coloque el cursor sobre la región de la gráfica para ver detalles sobre su composición.
    2. Haga clic en una región de la parcela para abrir una nueva pestaña en la lista de métodos con el campo de la matriz prefiltrado en la clasificación de suelo seleccionada.

figure-protocol-18710
Figura 6: Lista filtrada de métodos analíticos. La tabla se filtra por analito y matriz, mostrando solo los métodos relacionados con las PFAS (sustancias perfluoroalquiladas y polifluoroalquiladas) en el agua. La lista correspondiente de hojas informativas se asemeja mucho a este diseño. Haga clic aquí para ver una versión más grande de esta figura.

figure-protocol-19360
Figura 7: Resultados de la búsqueda de similitud de espectro. Se utiliza como entrada un espectro de cafeína de la base de datos AMOS. Los espectros similares se agrupan por sustancia, con una puntuación máxima de similitud de 1,0. El gráfico reflejado muestra el espectro de entrada (arriba) y un espectro de base de datos seleccionado (abajo). Los picos de color azul claro son exclusivos de la entrada, los picos naranjas de la base de datos coinciden y los picos de color azul oscuro se comparten. Haga clic aquí para ver una versión más grande de esta figura.

figure-protocol-20223
Figura 8: Visualización de la clasificación de uso funcional. La estructura jerárquica se muestra con el cursor sobre el nodo "productos químicos industriales" (delineado en amarillo). Sus clases secundarias están delineadas en verde. Haga clic aquí para ver una versión más grande de esta figura.

figure-protocol-20819
Figura 9: Visualización de parcelas ternarias de suelo. El gráfico muestra los datos de composición de las muestras de suelo. Una información sobre herramientas en la parte superior derecha muestra la composición precisa de la región que se encuentra actualmente bajo el cursor. Haga clic aquí para ver una versión más grande de esta figura.

Resultados

Las capturas de pantalla de AMOS que se muestran arriba muestran los resultados típicos de las búsquedas individuales en la aplicación, incluidas las búsquedas de sustancias de interés y entre espectros, hojas informativas y métodos. La variedad de formas de examinar la base de datos tiene por objeto abarcar los tipos de búsqueda más probables y útiles de manera que permitan una investigación más profunda de los datos y las sustancias con las que se relacionan.

Para ayudar a un usuario en la búsqueda, gran parte de la funcionalidad está interconectada de manera que permita un examen más profundo de los datos disponibles. Como ejemplo de flujo de trabajo, la visualización de la clasificación de uso funcional se vincula a vistas de los métodos y hojas de datos que están relacionados con esa clase funcional, de las que se pueden extraer listas de sustancias e introducirlas en la búsqueda de lotes, o se pueden examinar documentos individuales, y se pueden investigar más a fondo las sustancias individuales de esos documentos. Dado que muchas sustancias en los métodos también tienen espectros de masas experimentales en la base de datos, esto puede permitir a un investigador pasar rápidamente de una categoría de sustancias a un conjunto de métodos y espectros que pueden probar la presencia de una sustancia específica (ver Figura 9).

Dado que los resultados dependerán en gran medida de lo que se busque y de la búsqueda o búsquedas que se ejecuten, es difícil definir los resultados representativos de toda la aplicación. En general, puede ser más preciso describir un "éxito" en términos de experiencia de usuario; En ese caso, se espera que lo siguiente sea generalmente cierto: Que los métodos de búsqueda y filtrado (y la capacidad de moverse entre diferentes búsquedas y filtros) sean efectivos para identificar qué subconjuntos de información desea un usuario; que los resultados que encuentre el usuario sean precisos y útiles. En la figura 10 se muestra un ejemplo de flujo de trabajo que demuestra las funcionalidades de AMOS.

figure-results-2297
Figura 10: Ejemplo de flujo de trabajo que demuestra las funcionalidades de AMOS. El flujo de trabajo comienza con una clasificación de uso funcional (medicamentos respiratorios), filtra los métodos relacionados con los medicamentos respiratorios en la sangre, examina un método específico e identifica los espectros de una sustancia incluida en ese método. Haga clic aquí para ver una versión más grande de esta figura.

Discusión

Si bien muchos proyectos y aplicaciones se centran en recopilar y estandarizar información de un solo tipo de registro, como métodos, hojas informativas o un tipo específico de espectros, AMOS es la primera herramienta identificada que compila e integra grandes volúmenes de información en múltiples tipos de registros. La unificación, armonización y estructuración de los datos de estas diversas fuentes da como resultado una base de datos que puede incorporarse más fácilmente a los flujos de trabajo que requieren acceso a las metodologías de química analítica. La capacidad de buscar en la base de datos de varias maneras complementarias permite una recuperación eficiente de información que, de otro modo, podría requerir un gran esfuerzo manual en múltiples sitios web o herramientas.

Antes de su publicación pública, se demostró la utilidad de AMOS a través de su uso por parte del personal de la EPA para apoyar una amplia gama de proyectos. La EPA tiene un interés sostenido en la aplicación de la espectrometría de masas para el análisis no dirigido10,11, y múltiples iniciativas han aprovechado los espectros de masas experimentales en AMOS para mejorar las búsquedas contra una gran biblioteca espectral in silico generada a partir de productos químicos DSSTox12,13. Otros proyectos han utilizado la búsqueda de similitudes estructurales para identificar puntos de partida para el desarrollo de nuevos métodos, han examinado los métodos existentes para evaluar los límites de detección y cuantificación, y han analizado colecciones de productos químicos vinculados a métodos para evaluar el alcance de la cobertura del espacio químico.

La agregación de datos de entrenamiento potenciales de AMOS apoya aún más el desarrollo de modelos cuantitativos de flexibilidad para los métodos analíticos14, una necesidad fundamental para avanzar en los flujos de trabajo de análisis no dirigido (NTA). Los esfuerzos de curaduría dentro de AMOS también facilitan iniciativas para modelar, explorar y visualizar espacios químicos asociados con la cobertura metodológica14.

Si bien la funcionalidad principal de AMOS está madura, el desarrollo continuo se guía por los comentarios de los usuarios. Las tareas actuales incluyen la incorporación de datos adicionales, la curación de metadatos adicionales para mejorar el filtrado y la expansión de las capacidades de búsqueda. En colaboración con las partes interesadas de la EPA, se están desarrollando interfaces de programación de aplicaciones (API) para permitir el acceso programático, abordando casos de uso en los que la interfaz gráfica de usuario (GUI) puede ser ineficiente. Se ha integrado una página de notas de la versión en la aplicación para realizar un seguimiento y comunicar las actualizaciones de código a lo largo del tiempo.

En la actualidad, se añaden semanalmente nuevos registros de datos y productos químicos; Sin embargo, se anticipa un calendario de lanzamiento más lento después del lanzamiento público. Si bien se realizan esfuerzos significativos para garantizar la exactitud de los registros y los metadatos asociados, gran parte de los datos se originan en bases de datos públicas. Como tal, no es factible la verificación completa de cada registro, y los usuarios deben ser conscientes de que no se puede garantizar la exactitud absoluta de los datos.

Divulgaciones

Este documento no representa necesariamente los puntos de vista o las políticas de la Agencia de Protección Ambiental de los Estados Unidos.

Agradecimientos

Los autores agradecen al equipo de conservación por todo su trabajo de selección de productos químicos para la base de datos, y a Joshua Powell, Asif Rashid y Freddie Valone por el apoyo técnico en la construcción e implementación de AMOS. También agradecemos a Charles Lowe por su revisión del manuscrito.

Materiales

NameCompanyCatalog NumberComments
GitN/Ahttps://git-scm.com/Open-source version control system.
JavaScriptN/Ahttps://ecma-international.org/publications-and-standards/standards/ecma-262/Programming language.  Defined by ECMA International standards.
PostgreSQLPostgreSQL Global Development Grouphttps://postgresql.org/about/licenceOpen-source database management system.
PythonPython Software Foundationhttps://www.python.org/Open-source programming language.

Referencias

Reimpresiones y Permisos

Solicitar permiso para reutilizar el texto o las figuras de este JoVE artículos

Solicitar permiso

Explorar más artículos

Qu micaN mero 220

This article has been published

Video Coming Soon

JoVE Logo

Privacidad

Condiciones de uso

Políticas

Investigación

Educación

ACERCA DE JoVE

Copyright © 2025 MyJoVE Corporation. Todos los derechos reservados