JoVE Logo

Войдите в систему

В этой статье

  • Резюме
  • Аннотация
  • Введение
  • протокол
  • Результаты
  • Обсуждение
  • Раскрытие информации
  • Благодарности
  • Материалы
  • Ссылки
  • Перепечатки и разрешения

Резюме

В этой статье описывается AMOS, веб-база данных Analytical Methods and Open Spectra, приложение для химинформатики, предназначенное для предоставления исследователям легкого доступа к аналитическим методам и спектральным данным.

Аннотация

Аналитические методы могут варьироваться от подробных нормативных документов до более простых резюме. Методы регулирования могут включать информацию о поддающихся аналитах, поддерживаемых матрицах, требуемых реагентах, статистических характеристиках, межлабораторной валидации и других особенностях. Резюме обычно содержат общий обзор реагентов, приборов и часто краткий список аналитов. Аналитические методы, разработанные государственными органами США, включая Агентство по охране окружающей среды США (АООС США), Геологическую службу США (USGS), Министерство сельского хозяйства США (USDA), Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) и другие, предоставляют подробную процедурную информацию. Поставщики приборов, такие как Agilent, Shimadzu, Thermo Fisher Scientific, Sciex и другие, также предоставляют доступ к сотням указаний по применению, которые можно считать краткими методами. В рамках этого исследования была разработана база данных методов с поддержкой химинформатики, в которой химические вещества извлекаются из методических документов, а идентификаторы (названия и/или регистрационные номера Службы химических рефератов (CASRN)) сопоставляются с химическими структурами. Полученная база данных, содержащая около 7000 методов, доступна для поиска по идентификатору, химической структуре и структурному сходству, а также дополнена примерно одним миллионом спектров, находящихся в общественном достоянии (LC/MS, GC/MS, ЯМР и IR). Приложение поддерживает поиск аналитических методов и фильтрацию на основе аналитов, функционального использования, источников методов и других связанных метаданных.

Введение

Веб-доставка химических данных сообществу иллюстрируется такими приложениями, как PubChem1, ChemSpider2 и CompTox Chemicals Dashboard (CCD)3. Были предприняты усилия по распространению информации об аналитических методах, опубликованных в журнальных статьях, выпущенных поставщиками приборов в качестве технических указаний по применению, предоставленных государственными учреждениями в качестве стандартных операционных процедур или методов регулирования, а также выпущенных организациями по стандартизации, такими как Международная организация по стандартизации (ISO). Десятки тысяч химических веществ были изучены этими источниками в широком диапазоне условий и аналитических методов. Этот обширный массив источников охватывает различные вещества и включает в себя сценарии, варьирующиеся от количественной оценки одного химического вещества в конкретной матрице (например, крови) до смесей пестицидов и их остатков в конкретных культурах, до сотен химических веществ, идентифицированных в питьевой воде. Несмотря на то, что многие аналитические методы можно найти с помощью общедоступных поисковых систем, не все из них находятся в свободном доступе или открытом доступе.

Поиск конкретной информации, представляющей интерес, может быть сложной задачей. Поисковые системы общего назначения не оптимизированы для данных по химии, и их алгоритмы ранжирования могут скрывать высококачественный контент, предназначенный для узкой аудитории. Поиск на веб-сайтах журналов может дать более целенаправленные результаты, но доступ к ним часто ограничен, в открытом доступе находятся только рефераты, что затрудняет оценку полезности метода. Кроме того, критические параметры, такие как матрицы образцов, пределы обнаружения и количественная оценка, часто не хранятся в структурированном формате. Еще одна серьезная проблема заключается в вариациях и несогласованности химических идентификаторов, названий и синонимов, связанных с одним и тем же химическим веществом. Отсутствие структурированных данных методов ограничивает разработку программных инструментов, которые могли бы использовать накопленные за десятилетия знания в области аналитической химии и связанные с ними публикации.

В результате этих проблем и ограничений существует потребность в специально отобранном, ориентированном на химию приложении для гармонизации и поиска аналитических методов, которое не было выявлено в других местах. Чтобы восполнить этот пробел, Агентство по охране окружающей среды США разработало AMOS, базу данных аналитических методов и открытых спектров, а также веб-приложение. В настоящее время AMOS собирает и систематизирует три типа записей данных: аналитические методы, различные аналитические спектры и широкую категорию дополнительных документов, которые в совокупности называются фактологическими бюллетенями. Каждая запись связана с целевыми химическими аналитами и реагентами метода. Данные можно искать различными способами, в том числе по текстовым запросам, химической структуре и структурному или спектральному сходству.

Приложение AMOS в первую очередь ориентировано на предоставление открытого доступа и открытых данных. Там, где это возможно, записи в базе данных имеют гиперссылки на их первоисточники. Записи, не находящиеся под открытым лицензированием и, следовательно, не хранящиеся непосредственно в базе данных, по-прежнему могут быть интегрированы и доступны через URL, при условии, что они доступны в противном случае. Это относится к двум типам записей: аналитические методы, которые находятся за платным доступом, обычно из журналов или организаций по стандартизации, к которым EPA имеет доступ, и спектры, которые доступны, но требуют доступа для входа в систему.

Источники данных различаются по структуре записей, что требует значительных усилий по извлечению и курированию для сбора и гармонизации контента. Большинство записей содержат идентификаторы веществ (например, CASRN, DTXSID, InChIKey, общие названия), и во многих случаях извлечение является простым. Однако сопоставление этих идентификаторов с химическими структурами и деталями вещества может быть сложной задачей. Некоторые идентификаторы могут быть непосредственно сопоставлены с записями в базе данных EPA Distributed Structure-Searchable Toxicity (DSSTox)4; Когда совпадения не найдены, идентификаторы привязываются к существующим веществам или регистрируются новые вещества. Инициатива AMOS привела к расширению базы данных DSSTox, улучшив базовые данные, поддерживающие другие базы данных и приложения EPA, такие как CompTox Chemicals Dashboard3.

Для получения определенной ценной дополнительной информации требуется ручное курирование. Для аналитических методов экспериментальные параметры, такие как пределы обнаружения и количественной оценки, матрица образцов и аналитическая методология, не организованы стандартизированным образом, и автоматизированные инструменты не могут идентифицировать эту информацию из-за ее несогласованного хранения.

Два элемента регистрационной информации – среда, связанная с образцом, и функциональное использование аналита – имеют большое значение для текущих усилий по мониторингу опасностей опасности и подверженности воздействию загрязняющих веществ. В связи с этим значительное внимание уделялось структурированию этих атрибутов в рамках данных записи. Для данного проекта была разработана онтология классификаций функционального использования. Эта онтология организует функциональное использование веществ в иерархическую структуру, варьирующуюся от более общего «родительского» использования до более конкретного «дочернего» использования. Онтология облегчает изучение веществ с точки зрения их применения, поддерживая исследовательские инициативы, подчеркивающие функциональное использование в качестве средства оценки воздействия и опасности 5,6. Кроме того, методы были помечены в соответствии с категорией гармонизированных сред образцов, как указано в базе данных мультимедийного мониторинга EPA (MMDB)7. Такая категоризация позволяет искать химические вещества на основе их присутствия в конкретных средах, оптимизируя разработку решений, ориентированных на обнаружение химических веществ в конкретных экологических или биологических образцах. Эти аннотации улучшают интеграцию AMOS в рабочие процессы, ориентированные на воздействие и риски, разрабатываемые в рамках EPA.

При сборке спектров задача обработки различных форматов файлов, некоторые из которых лишь номинально стандартизированы, и разбора сопутствующих метаданных часто требует пользовательской обработки. В случаях, когда спектральные коллекции связаны с публикацией, может потребоваться вручную извлечь детали, задокументированные в публикации, для загрузки данных. Результатом этих усилий стала база данных, которая интегрирует и структурирует эти разрозненные спектры, что позволяет исследователям избежать необходимости трудоемкого курирования в будущих начинаниях.

По состоянию на март 2025 года база данных содержит около 935 000 спектров, из которых почти 99% составляют масс-спектры и меньшие коллекции ЯМР (~2 000) и ИК (~400). Кроме того, существует около 770 000 внешне связанных спектров (подключенных к базе данных SpectraBase8), ~36 000 информационных бюллетеней и ~7 400 аналитических методов. Вещества, интегрированные в приложение, являются подмножеством веществ из базы данных DSSTox, которая включена в CompTox Chemicals Dashboard (CCD) и содержит более 1,2 миллиона веществ.

протокол

Большую часть функционала AMOS можно разделить на три категории: поиск записей по заданным веществам, поиск по определенным коллекциям веществ или поиск среди категорий записей. Доступ к отдельным страницам для этих функций можно получить с панели навигации в верхней части каждой страницы. В настоящее время приложение развернуто в https://hcd.rtpnc.epa.gov/#/ через модуль AMOS. Программные инструменты, использованные в данном исследовании, перечислены в Таблице материалов.

1. Поиск записей по конкретным веществам

  1. Общий поиск: Выполните общий поиск для получения списка всех типов записей, связанных с одним веществом (см. рис. 1).
    1. В текстовом поле в верхнем левом углу панели навигации или в поле поиска на главной странице введите название вещества, CASRN, InChIKey или идентификатор вещества DSSTox (DTXSID). Нажмите Enter или нажмите Search , чтобы выполнить поиск.
      ПРИМЕЧАНИЕ: Строка поиска на главной странице имеет дополнительную возможность поиска по подстроке; Дополнительные сведения см. в разделе Частичный поиск идентификаторов (шаг 2.2).
    2. Если искомый идентификатор распознан и соответствует одному веществу, в левой части страницы отобразится некоторая основная информация о веществе и таблица, в которой перечислены все записи, связанные с этим веществом. Выберите строку в этой таблице, чтобы отобразить связанную запись в правой части страницы, если она хранится непосредственно в базе данных.
    3. Если искомый идентификатор соответствует нескольким веществам (например, аббревиатуре, которая используется для более чем одного вещества), появится запрос на устранение неоднозначности, позволяющий пользователю выбрать, какое вещество он хочет увидеть. Выберите вещество из этого списка, и оно будет перенаправлено на дисплей для распознанного вещества.
    4. Чтобы отфильтровать таблицу результатов, щелкните вкладки прямо над таблицей, чтобы отфильтровать по типу записи (это также скроет и покажет различные столбцы), введите текст в поля в верхней части таблицы, чтобы отфильтровать по другим аспектам данных, и установите флажки над вкладками, чтобы отфильтровать по более широким свойствам данных.
  2. Пакетный поиск: Выполните пакетный поиск для создания и загрузки файла электронной таблицы, в котором перечислена информация обо всех записях в базе данных, связанных с данным списком веществ. (см. Рисунок 2).
    1. В поле входных данных введите список DTXSID для поиска, по одному в строке. Если DTXSID недоступны, используйте ссылку на странице для перехода к инструменту CCD, который может предоставлять DTXSIDs с учетом других идентификаторов.
    2. Используйте флажки в разделе Параметры поиска , чтобы отфильтровать результаты или добавить дополнительную информацию к записям. Опции сгруппированы в пять категорий: фильтрация по типам записей, фильтрация по аналитическим методологиям, добавление дополнительной информации на уровне вещества в файл результатов, добавление дополнительной информации на уровне записей (в настоящее время доступно только для масс-спектров) и некоторые другие опции.
      ПРИМЕЧАНИЕ: Опции с пунктирной линией имеют текст, который более подробно объясняет опцию. Наведите курсор на метку опции, чтобы увидеть ее.
    3. Нажмите на кнопку «Поиск» внизу страницы, чтобы выполнить поиск.
      ПРИМЕЧАНИЕ: Выходная таблица содержит список ассоциаций вещество-запись, а также идентификаторы веществ, ссылки на источники и некоторую другую основную информацию. Если в записи присутствует несколько искомых веществ, запись будет отображаться по одному разу для каждого вещества.
  3. Поиск структурного сходства: Выполните этот поиск для получения списков методов и информационных бюллетеней в базе данных, которые содержат либо искомое вещество, либо вещество с достаточно высоким коэффициентом структурного сходства Танимото (см. Рисунок 3).
    ПРИМЕЧАНИЕ: Этот поиск может быть полезен в тех случаях, когда вещество, представляющее интерес, не фигурирует ни в одном методе, но методы с очень похожими веществами потенциально могут быть использованы в качестве эталона.
    1. Введите DTXSID, InChIKey, CASRN или название вещества в поле поиска и нажмите « Поиск » или нажмите Enter. Поиск может занять 20-30 секунд.
    2. Как только поиск будет завершен, ниже появится таблица с вкладками. Выберите вкладку для просмотра результатов поиска.
      1. На первых двух вкладках перечислены найденные методы и информационные бюллетени. Выберите один из них, чтобы открыть вид этого документа в правой части страницы. Методы или информационные бюллетени, содержащие искомое вещество, выделены жирным шрифтом.
      2. На третьей вкладке перечислены вещества, аналогичные тем, которые были обнаружены в методах или информационных бюллетенях. Выберите строку в таблице, чтобы вызвать сравнение между искомым веществом и выбранным из таблицы. Если само искомое вещество было обнаружено в каких-либо документах, оно будет выделено жирным шрифтом.
      3. Используйте переключатель Фильтровать минимальное сходство веществ вверху, чтобы скрыть результаты поиска, в которых отсутствуют вещества ниже выбранного порога сходства.

figure-protocol-5721
Рисунок 1: Результаты поиска записей, содержащих холестерин. При общем поиске по слову «холестерин» отображается список совпадающих записей в таблице (слева). Масс-спектр выбранной записи показан справа. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-protocol-6299
Рисунок 2: Интерфейс пакетного поиска. Поле поиска содержит два вещества, идентифицированных по их DTXSID. Для запроса выбираются параметры поиска по умолчанию. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-protocol-6834
Рисунок 3: Результаты поиска структуры для 1P-LSD. В таблице перечислены методы, содержащие структурно сходные вещества. Выбранный метод отображается справа. Отсутствие выделенных жирным шрифтом записей в таблице указывает на то, что 1P-LSD не фигурирует ни в одном из перечисленных методов. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

2. Поиск веществ

  1. Поиск ClassyFire: Выполните этот поиск, чтобы получить список всех веществ, которые принадлежат к заданным первым четырем уровням классификации ClassyFire9 (см. Рисунок 4).
    1. Используя четыре поля в верхней части страницы, выберите четыре верхних уровня классификации по одному. Выбрав каждый из первых трех, используйте кнопку под этим полем, чтобы получить список классификаций на один уровень ниже. Для четвертого кнопка ниже запустит поиск.
      ПРИМЕЧАНИЕ: Как только поиск будет завершен, приведенная ниже таблица будет заполнена списком веществ, которые существуют в этой классификации. Таблица включает в себя общие идентификаторы и информацию о веществах, а также подсчет количества записей, существующих в AMOS.
    2. Используйте кнопки между выбором класса и таблицей, чтобы обеспечить четыре части функциональности:
      1. Нажмите « Копировать классификацию по URL », чтобы скопировать URL-адрес в буфер обмена, который, если он загружен в новой вкладке или окне браузера, автоматически заполнит уровни классификации и запустит поиск.
      2. Нажмите « Сбросить выбор», чтобы сбросить выбор в полях классификации. Он не обнуляет таблицу найденных веществ.
      3. Нажмите « Загрузить таблицу », чтобы запросить загрузку файла электронной таблицы, содержащего все видимые поля и записи в таблице, за исключением изображений вещества. Если используются фильтры в верхней части таблицы результатов, загруженные результаты также будут отфильтрованы, но содержимое фильтров не будет включено.
      4. Нажмите « Отправить выбранные вещества в пакетный поиск », чтобы открыть новую вкладку для пакетного поиска с полем для перечисления DTXSIDs, предварительно заполненных веществами, выбранными из результатов поиска ClassyFire. Подбор отдельных веществ может быть осуществлен с помощью флажка в каждой строке; Выбор или отмена выбора всех веществ может быть осуществлена нажатием на флажок в шапке таблицы. Подробнее о пакетном поиске см. в шаге 1.2.
  2. Поиск по частичному идентификатору: Выполните эту функцию, чтобы найти все вещества, которые соответствуют неуникальному идентификатору (см. рисунок 5). В настоящее время доступны следующие варианты: подстрока name (которая охватывает как предпочтительное название EPA, так и распространенные синонимы), первый блок InChIKey, точная молекулярная формула и диапазон моноизотопных масс.
    1. В верхней части страницы выберите идентификатор и введите информацию в соседние поля.
    2. Нажмите « Поиск », чтобы запустить поиск.
    3. Когда поиск будет завершен, таблица будет заполнена списком веществ, которые соответствуют частичному идентификатору, а также информацией о том, как часто они появляются в базе данных AMOS и в другой литературе. Используйте фильтры в верхней части столбцов таблицы для уточнения результатов, а также установите флажок Показать многокомпонентные вещества , чтобы отобразить или скрыть вещества, состоящие из нескольких соединений.
      ПРИМЕЧАНИЕ: Если был выполнен поиск по подстроке имени, появится столбец со списком найденных синонимов. Если вещество обнаруживается только по синонимам, т.е. если предпочитаемое название не содержит подстроки, то предпочитаемое название будет выделено курсивом.

figure-protocol-11073
Рисунок 4: Результаты поиска классификации ClassyFire. Результаты включают информацию об уровне вещества и количество записей по каждой классификационной группе. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-protocol-11609
Рисунок 5: Результаты поиска по частичному идентификатору для слова "trazine". В результате поиска извлекаются вещества с предпочтительными названиями или синонимами, содержащими подстроку «тразин». Два из трех результатов включают слово «тразин» только в синонимах, а не в предпочитаемых названиях. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

3. Поиск по записям

  1. Информационный бюллетень и списки методов: На этих страницах перечислены все информационные бюллетени и методы, которые есть в базе данных, с различными способами их фильтрации (см. рис. 6). Поскольку функциональность этих двух страниц в значительной степени одинакова, они сгруппированы здесь.
    ПРИМЕЧАНИЕ: При переходе на страницу таблицы будет предложено загрузиться. Это может занять некоторое время из-за большого количества присутствующих записей.
    1. После загрузки таблицы используйте входные данные в верхней части каждого столбца для фильтрации данных и различных полей. Точные поля различаются в зависимости от таблицы, но большинство из них можно выбрать или отфильтровать.
    2. Используйте поле «Фильтр всей таблицы » над таблицей, чтобы проверить все столбцы на наличие определенной строки.
      ПРИМЕЧАНИЕ: Список методов включает в себя два поля, которые по умолчанию скрыты - автор и издатель. Фильтр по всей таблице будет отлавливать записи, в которых искомый термин находится в любом из этих полей.
    3. Список фактов позволяет фильтровать отдельные результаты путем поиска по заданному веществу. Введите название вещества, CASRN, InChIKey или DTXSID, и нажмите поиск , чтобы отфильтровать таблицу. Нажмите « Очистить фильтр», чтобы очистить фильтр вещества.
      ПРИМЕЧАНИЕ: Обе таблицы имеют следующие доступные кнопки: Копировать фильтры в буфер обмена копирует URL-адрес в буфер обмена, который при доступе к нему со стороны браузера загрузит список и предварительно заполнит поля фильтров в таблице текущими значениями; Download Table выгружает список всех видимых результатов и фильтров в таблице; Download Substances загружает список всех веществ, которые отображаются в (отфильтрованной) таблице; Функция «Сбросить фильтры » очищает все табличные фильтры, включая фильтр всей таблицы.
  2. Масс-спектральный поиск: Выполните этот поиск, чтобы получить список масс-спектральных совпадений из базы данных на основе спектра, предоставленного пользователем (см. рис. 7).
    1. Заполните или отрегулируйте четыре обязательных поля ввода: диапазон масс для целевого вещества в дальтонах с погрешностью в дальтонах или частях на миллион (ppm); методология, либо GC/MS, либо LC/MS; масс-спектр, представленный в виде перечня пар заряд-масса и интенсивность; и размер окна масс для пикового сходства.
    2. После того, как эти поля будут заполнены, нажмите кнопку «Поиск » под ними.
      ПРИМЕЧАНИЕ: Когда поиск будет завершен, если какие-либо спектры будут найдены, в правой части страницы появится таблица со списком спектров, соответствующих выбранной методологии, из всех веществ, соответствующих диапазону масс, отсортированных по энтропийному сходству между спектром, предоставленным пользователем, и спектром базы данных.
    3. Выберите строку в таблице, чтобы отобразить график, показывающий сравнение пользовательского спектра со спектром базы данных (соответственно в верхней и нижней части графика). Используйте поле Минимальное сходство для отображения , чтобы скрыть результаты, которые находятся ниже заданного энтропийного сходства.
  3. Визуализация классификации функционального использования: На этой странице визуализируется онтология функционального использования AMOS и даются ссылки на методы и информационные бюллетени для этих классов использования. Классы представлены в виде ориентированного графа, ребра которого переходят от более общих родительских классов к более конкретным дочерним классам (см. рис. 8).
    1. Используйте поле поиска справа для поиска по списку классов функционального использования. Наведите указатель мыши на имя класса use, чтобы выделить соответствующий узел на графике.
    2. При непосредственном изучении графа наведите курсор мыши на указанный узел, чтобы получить краткое описание этого класса, а также выделить все прямые родительские или дочерние классы для этого узла.
    3. Щелкните правой кнопкой мыши либо имя класса из списка в правой части страницы, либо узел на графике, чтобы открыть меню с опциями для списка методов и информационных бюллетеней. Выберите один из них, и откроется новая вкладка браузера с этим списком, с полем функционального класса, предварительно отфильтрованным по выбранному функциональному классу.
  4. Тройной участок почвы: На этой странице воссоздана классификация текстуры почвы Министерства сельского хозяйства США, что позволяет осуществлять поиск методов AMOS по типу почвы.
    1. Наведите курсор на область участка, чтобы увидеть подробности о его составе.
    2. Щелкните область графика, чтобы открыть новую вкладку в списке методов с предварительно отфильтрованным полем матрицы по выбранной классификации почвы.

figure-protocol-17499
Рисунок 6: Отфильтрованный список аналитических методов. Таблица отфильтрована по аналиту и матрице, отображая только методы, относящиеся к PFAS (пер- и полифторалкильным веществам) в воде. Соответствующий список информационных бюллетеней очень похож на эту схему. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-protocol-18138
Рисунок 7: Результаты поиска по сходству спектра. В качестве входных данных используется спектр кофеина из базы данных AMOS. Похожие спектры сгруппированы по веществам, с максимальным показателем сходства 1,0. На зеркальном графике показан входной спектр (вверху) и выбранный спектр базы данных (внизу). Светло-голубые пики уникальны для входных данных, оранжевые пики соответствуют базе данных, а темно-синие пики являются общими. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-protocol-18944
Рисунок 8: Визуализация классификации функционального использования. Иерархическая структура отображается с наведением курсора на узел «промышленные химикаты» (обведен желтым цветом). Его дочерние классы обведены зеленым цветом. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

figure-protocol-19547
Рисунок 9: Визуализация почвенного троичного участка. На графике отображаются данные о составе образцов почвы. Всплывающая подсказка в правом верхнем углу показывает точный состав области, находящейся в данный момент под курсором. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

Результаты

На скриншотах AMOS, показанных выше, показаны типичные результаты отдельных поисков в приложении, включая как поиск интересующих веществ, так и среди спектров, информационных бюллетеней и методов. Разнообразие способов опроса базы данных призвано охватить наиболее вероятные и наиболее полезные виды поиска таким образом, чтобы обеспечить более глубокое изучение данных и веществ, к которым они относятся.

Чтобы облегчить пользователю поиск, большая часть функций взаимосвязана таким образом, чтобы способствовать более глубокому изучению доступных данных. В качестве примера рабочего процесса визуализация классификации функционального использования связана с представлениями методов и информационных бюллетеней, относящихся к этому функциональному классу, из которых можно извлечь списки веществ и ввести их в пакетный поиск, или изучить отдельные документы, а также дополнительно исследовать отдельные вещества в этих документах. Поскольку многие вещества в методах также имеют экспериментальные масс-спектры в базе данных, это может позволить исследователю быстро перейти от категории веществ к набору методов и спектров, которые могут проверить наличие конкретного вещества (см. рис. 9).

Поскольку результаты будут в значительной степени зависеть от того, что ищется и какой поиск или поиски выполняются, репрезентативные результаты для всего приложения определить сложно. В целом, возможно, более точным было бы описать «успех» с точки зрения пользовательского опыта; В этом случае можно надеяться, что в целом будет справедливо следующее: что методы поиска и фильтрации (а также возможность переключения между различными поисковыми запросами и фильтрами) эффективны для определения того, какие подмножества информации нужны пользователю; что результаты, которые находит пользователь, являются точными и полезными. На рисунке 10 показан пример рабочего процесса, демонстрирующий функциональные возможности AMOS.

figure-results-2164
Рисунок 10: Пример рабочего процесса, демонстрирующий функциональные возможности AMOS. Рабочий процесс начинается с классификации функционального использования (респираторные препараты), фильтруются методы, связанные с респираторными препаратами в крови, изучается один конкретный метод и определяются спектры вещества, включенного в этот метод. Пожалуйста, нажмите здесь, чтобы просмотреть увеличенную версию этой цифры.

Обсуждение

В то время как многие проекты и приложения сосредоточены на сборе и стандартизации информации из одного типа записей, таких как методы, информационные бюллетени или определенный вид спектров, AMOS является первым инструментом, который компилирует и интегрирует большие объемы информации по нескольким типам записей. Унификация, гармонизация и структурирование данных из этих различных источников приводят к созданию базы данных, которую можно легко включить в рабочие процессы, требующие доступа к методологиям аналитической химии. Возможность поиска в базе данных несколькими взаимодополняющими способами обеспечивает эффективное извлечение информации, которая в противном случае потребовала бы значительных ручных усилий на нескольких веб-сайтах или инструментах.

Перед публичным выпуском полезность AMOS была продемонстрирована на примере его использования сотрудниками EPA для поддержки широкого спектра проектов. EPA проявляет устойчивый интерес к применению масс-спектрометрии для нецелевого анализа10,11, и в рамках многочисленных инициатив экспериментальные масс-спектры в AMOS были использованы для улучшения поиска по большой спектральной библиотеке in silico, созданной из химических веществ DSSTox12,13. В других проектах использовался поиск структурного сходства для определения отправных точек для разработки новых методов, изучались существующие методы для оценки пределов обнаружения и количественной оценки, а также анализировались коллекции химических веществ, связанные с методами оценки степени охвата химического пространства.

Агрегация потенциальных обучающих данных AMOS также поддерживает разработку количественных моделей податливости для аналитических методов14, что является основной потребностью для продвижения рабочих процессов нецелевого анализа (NTA). Усилия по курированию в рамках AMOS также способствуют инициативам по моделированию, исследованию и визуализации химических пространств, связанных с методологическим охватом14.

Несмотря на то, что основная функциональность AMOS является зрелой, текущая разработка основывается на отзывах пользователей. Текущие задачи включают в себя включение дополнительных данных, курирование дополнительных метаданных для улучшенной фильтрации и расширение возможностей поиска. В сотрудничестве с заинтересованными сторонами EPA в настоящее время разрабатываются интерфейсы прикладного программирования (API) для обеспечения программного доступа, устраняя случаи использования, в которых графический пользовательский интерфейс (GUI) может быть неэффективным. В приложение интегрирована страница примечаний к выпуску для отслеживания и информирования об обновлениях кода с течением времени.

Новые записи данных и химических веществ в настоящее время добавляются еженедельно; Тем не менее, ожидается, что после публичного запуска график выпуска будет более медленным. Несмотря на значительные усилия, предпринимаемые для обеспечения точности записей и связанных с ними метаданных, большая часть данных поступает из общедоступных баз данных. Таким образом, полная проверка каждой записи невозможна, и пользователи должны знать, что абсолютная точность данных не может быть гарантирована.

Раскрытие информации

Этот документ не обязательно отражает точку зрения или политику Агентства по охране окружающей среды США.

Благодарности

Авторы благодарят команду кураторов за всю их работу по курированию химических веществ для базы данных, а также Джошуа Пауэлла, Асифа Рашида и Фредди Валоне за техническую поддержку в создании и развертывании AMOS. Мы также благодарим Чарльза Лоу за его рецензию на рукопись.

Материалы

NameCompanyCatalog NumberComments
GitN/Ahttps://git-scm.com/Open-source version control system.
JavaScriptN/Ahttps://ecma-international.org/publications-and-standards/standards/ecma-262/Programming language.  Defined by ECMA International standards.
PostgreSQLPostgreSQL Global Development Grouphttps://postgresql.org/about/licenceOpen-source database management system.
PythonPython Software Foundationhttps://www.python.org/Open-source programming language.

Ссылки

Перепечатки и разрешения

Запросить разрешение на использование текста или рисунков этого JoVE статьи

Запросить разрешение

Смотреть дополнительные статьи

220

This article has been published

Video Coming Soon

JoVE Logo

Исследования

Образование

О JoVE

Авторские права © 2025 MyJoVE Corporation. Все права защищены