JoVE Logo

Sign In

In This Article

  • Summary
  • Abstract
  • Introduction
  • Protocol
  • תוצאות
  • Discussion
  • Disclosures
  • Acknowledgements
  • Materials
  • References
  • Reprints and Permissions

Summary

מאמר זה מתאר את AMOS, מסד הנתונים מבוסס האינטרנט של שיטות אנליטיות וספקטרה פתוחה, יישום כימי שנועד לספק לחוקרים גישה קלה לשיטות אנליטיות ונתונים ספקטרליים.

Abstract

שיטות אנליטיות יכולות לנוע בין מסמכים רגולטוריים מפורטים לסיכומים פשוטים יותר. שיטות רגולטוריות עשויות לכלול מידע על אנליטים מתאימים, מטריצות נתמכות, ריאגנטים נדרשים, ביצועים סטטיסטיים, אימות בין-מעבדתי ופרטים אחרים. סיכומים מספקים בדרך כלל סקירה כללית של ריאגנטים, מכשור, ולעתים קרובות רשימה קצרה של אנליטים. שיטות אנליטיות של גופים ממשלתיים בארה"ב, כולל הסוכנות להגנת הסביבה של ארה"ב (USEPA), הסקר הגיאולוגי של ארה"ב (USGS), משרד החקלאות האמריקני (USDA), מינהל המזון והתרופות (FDA) ואחרים, מציעות מידע פרוצדורלי מפורט. ספקי מכשירים כגון Agilent, Shimadzu, Thermo Fisher Scientific, Sciex ואחרים מספקים גם גישה למאות הערות יישום, שעשויות להיחשב כשיטות סיכום. מחקר זה פיתח מסד נתונים התומך בכימיה של שיטות שבהן כימיקלים מופקים ממסמכי שיטות, עם מזהים (שמות ו/או מספרי רישום של שירות התקצירים הכימיים (CASRN)) הממופים למבנים כימיים. מסד הנתונים המתקבל, המכיל כ-7,000 שיטות, ניתן לחיפוש לפי מזהה, מבנה כימי ודמיון מבני, ומתווסף על ידי כמיליון ספקטרום נחלת הכלל (LC/MS, GC/MS, NMR ו-IR). האפליקציה תומכת בחיפוש שיטות אנליטיות וסינון על סמך אנליטים, שימוש פונקציונלי, מקורות שיטות ומטא נתונים קשורים אחרים.

Introduction

אספקה מבוססת אינטרנט של נתוני כימיה לקהילה מודגמת על ידי יישומים כגון PubChem1, ChemSpider2 ו-CompTox Chemicals Dashboard (CCD)3. נעשו מאמצים להפיץ פרטי שיטות אנליטיות שפורסמו במאמרים בכתבי עת, שפורסמו על ידי ספקי מכשירים כהערות יישום טכניות, שסופקו על ידי סוכנויות ממשלתיות כנהלי הפעלה סטנדרטיים או שיטות רגולטוריות, והונפקו על ידי ארגוני תקינה כגון ארגון התקינה הבינלאומי (ISO). עשרות אלפי כימיקלים נחקרו על ידי מקורות אלה במגוון רחב של תנאים וטכניקות אנליטיות. מאגר מקורות נרחב זה מכסה חומרים מגוונים וכולל תרחישים החל מכימות של כימיקל בודד במטריצה מסוימת (למשל, דם), דרך תערובות של חומרי הדברה ושאריותיהם בגידולים ספציפיים, ועד למאות כימיקלים שזוהו במי השתייה. בעוד שניתן לגלות שיטות אנליטיות רבות באמצעות מנועי חיפוש ציבוריים, לא כולן זמינות באופן חופשי או בגישה פתוחה.

איתור מידע ספציפי מעניין יכול להיות מאתגר. מנועי חיפוש למטרות כלליות אינם מותאמים לנתוני כימיה, ואלגוריתמי הדירוג שלהם עשויים לטשטש תוכן איכותי המיועד לקהלים צרים. חיפושים באתרי כתבי עת יכולים להניב תוצאות ממוקדות יותר, אך הגישה מוגבלת לעתים קרובות, כאשר רק תקצירים זמינים לציבור, מה שמקשה על הערכת התועלת של השיטה. יתר על כן, פרמטרים קריטיים - כגון מטריצות דגימה, גבולות זיהוי וכימות - לרוב אינם מאוחסנים בפורמט מובנה. אתגר משמעותי נוסף טמון בשונות וחוסר העקביות של מזהים כימיים, שמות ומילים נרדפות הקשורים לכימיקל בודד. היעדר נתונים בשיטות מובנות מגביל את הפיתוח של כלי תוכנה שיכולים למנף עשרות שנים של ידע מצטבר בכימיה אנליטית ופרסומים קשורים.

כתוצאה מהאתגרים והמגבלות הללו, יש צורך ביישום אוצר ומכוון כימיה להרמוניה וחיפוש שיטות אנליטיות - כזה שלא זוהה במקומות אחרים. כדי להתמודד עם הפער הזה, הסוכנות להגנת הסביבה של ארה"ב פיתחה את AMOS, מסד הנתונים של שיטות אנליטיות וספקטרה פתוחה ויישום מבוסס אינטרנט. עמוס אוספת ומארגנת כיום שלושה סוגים של רשומות נתונים: שיטות אנליטיות, ספקטרומים אנליטיים שונים וקטגוריה רחבה של מסמכים משלימים המכונים ביחד דפי עובדות. כל רשומה מקושרת לאנליטים ולריאגנטים הכימיים של השיטה. הנתונים ניתנים לחיפוש במספר דרכים, כולל על ידי שאילתות טקסט, מבנה כימי ודמיון מבני או ספקטרלי.

אפליקציית AMOS מתמקדת בעיקר באספקת גישה פתוחה ורשומות נתונים פתוחות. במידת האפשר, רשומות במסד הנתונים מקושרות למקורות המקוריים שלהן. רשומות שאינן ברישיון פתוח ולכן אינן מאוחסנות ישירות במסד הנתונים עדיין ניתנות לשילוב וגישה באמצעות כתובת URL, בתנאי שהן זמינות אחרת. זה חל על שני סוגים של רשומות: שיטות אנליטיות שנמצאות מאחורי חומות תשלום, בדרך כלל מכתבי עת או ארגוני תקנים שאליהם יש ל-EPA גישה, וספקטרום זמין אך דורש גישת כניסה.

מקורות הנתונים משתנים באופן שבו הרשומות בנויות, מה שמחייב מאמץ ניכר בחילוץ ואוצרות כדי להרכיב וליצור הרמוניה של התוכן. רוב הרשומות מספקות מזהי חומרים (למשל, CASRN, DTXSID, InChIKey, שמות נפוצים), ובמקרים רבים, החילוץ הוא פשוט. עם זאת, התאמת מזהים אלה למבנים כימיים ולפרטי חומר יכולה להיות מורכבת. ניתן להתאים מזהים מסוימים ישירות לערכים במסד הנתונים של ה-EPA Distributed Structure-Searchable Toxicity (DSSTox)4; כאשר לא נמצאו התאמות, מזהים מקושרים לחומרים קיימים, או חומרים חדשים נרשמים. יוזמת AMOS הובילה כתוצאה מכך להרחבת מסד הנתונים DSSTox, ושיפר את נתוני היסוד התומכים במסדי נתונים ויישומים אחרים של EPA, כגון CompTox Chemicals Dashboard3.

נדרשת אוצרות ידנית עבור מידע נוסף בעל ערך מסוים. עבור שיטות אנליטיות, פרמטרים ניסיוניים כגון גבולות זיהוי וכימות, מטריצת דגימה ומתודולוגיה אנליטית אינם מאורגנים בצורה סטנדרטית, וכלים אוטומטיים אינם יכולים לזהות מידע זה בשל האחסון הלא עקבי שלו.

שני מרכיבים של מידע רשום, המדיה הקשורה לדגימה והשימוש הפונקציונלי באנליט, רלוונטיים מאוד למאמצים המתמשכים לנטר חששות מסיכון וחשיפה ממזהמים. ככזה, תשומת לב רבה ניתנה למבנה תכונות אלה בתוך נתוני הרשומות. אונטולוגיה של סיווגי שימוש פונקציונלי פותחה עבור פרויקט זה. אונטולוגיה זו מארגנת את השימושים הפונקציונליים של חומרים למבנה היררכי, החל משימושים כלליים יותר של "הורה" ועד לשימושים ספציפיים יותר של "ילדים". האונטולוגיה מקלה על חקר חומרים מנקודת מבט יישומית, ותומכת ביוזמות מחקר המדגישות שימושים פונקציונליים כאמצעי להערכת חשיפה וסכנה 5,6. בנוסף, השיטות סומנו בהתאם לקטגוריית המדיה ההרמונית של הדגימות שלהן, כמפורט במסד הנתונים לניטור מולטימדיה (MMDB) של ה-EPA. סיווג זה מאפשר חיפוש כימיקלים על סמך הופעתם במדיה ספציפית, ומייעל את הפיתוח של פתרונות המתמקדים בגילוי כימיקלים בדגימות סביבתיות או ביולוגיות ספציפיות. הערות אלה משפרות את השילוב של AMOS בתהליכי עבודה מוכווני חשיפה וסיכונים הנמצאים בפיתוח במסגרת ה-EPA.

בהרכבת הספקטרום, האתגר של עיבוד פורמטים שונים של קבצים - שחלקם סטנדרטיים רק באופן נומינלי - וניתוח מטא נתונים נלווים דורש לעתים קרובות טיפול מותאם אישית. במקרים שבהם אוספים ספקטרליים מקושרים לפרסום, ייתכן שיהיה צורך לחלץ פרטים המתועדים בתוך הפרסום באופן ידני לצורך טעינת נתונים. מאמץ זה הביא למסד נתונים המשלב ובונה את הספקטרום השונה הזה, ומאפשר לחוקרים להימנע מהצורך באוצרות מייגעת במאמצים עתידיים.

נכון למרץ 2025, מסד הנתונים מכיל כ-935,000 ספקטרום, כאשר כמעט 99% הם ספקטרום מסה ואוספים קטנים יותר של NMR (~2,000) ו-IR (~400). בנוסף, ישנם כ-770,000 ספקטרומים מקושרים חיצונית (המחוברים למסד הנתונים של SpectraBase8), ~36,000 דפי עובדות ו~7,400 שיטות אנליטיות. החומרים המשולבים באפליקציה הם תת-קבוצה של אלה ממסד הנתונים של DSSTox, המשולב בלוח המחוונים של CompTox Chemicals (CCD) ומכיל למעלה מ-1.2 מיליון חומרים.

Protocol

ניתן לחלק את רוב הפונקציונליות של עמוס לשלוש קטגוריות: חיפוש רשומות עבור חומרים מסוימים, חיפוש אוספים מסוימים של חומרים או חיפוש בין קטגוריות של רשומות. ניתן לגשת לדפים הבודדים עבור פונקציות אלה מסרגל הניווט בראש כל עמוד. האפליקציה נפרסת כעת ב-https://hcd.rtpnc.epa.gov/#/ באמצעות מודול עמוס. כלי התוכנה המשמשים במחקר זה מפורטים בטבלת החומרים.

1. חיפוש רשומות לחומרים ספציפיים

  1. חיפוש כללי: בצע חיפוש כללי כדי לקבל רשימה של כל סוגי הרשומות הקשורות לחומר יחיד (ראה איור 1).
    1. בשדה הטקסט בפינה השמאלית העליונה של סרגל הניווט או בשדה החיפוש בעמוד הראשי, הזן שם חומר, CASRN, InChIKey או מזהה חומר DSSTox (DTXSID). לחץ על Enter או לחץ על חיפוש כדי לבצע את החיפוש.
      הערה: בסרגל החיפוש בעמוד הראשי יש אפשרות נוספת לחיפוש לפי מחרוזת משנה; עיין בסעיף על חיפוש מזהה חלקי (שלב 2.2) לקבלת מידע נוסף.
    2. אם המזהה שחיפשת מזוהה ותואם לחומר יחיד, הצד השמאלי של הדף יציג מידע בסיסי על החומר וטבלה המפרטת את כל הרשומות הקשורות לחומר זה. בחר שורה בטבלה זו כדי להציג את הרשומה המשויכת בצד ימין של העמוד, אם היא מאוחסנת ישירות במסד הנתונים.
    3. אם המזהה שחיפשת תואם למספר חומרים - למשל, קיצור המשמש ליותר מחומר אחד - תופיע הנחיית הבהרה שתאפשר למשתמש לבחור איזה חומר הוא רוצה לראות. בחר חומר מרשימה זו, ואחד יופנה לתצוגה עבור חומר מזוהה.
    4. כדי לסנן את טבלת התוצאות, לחץ על הכרטיסיות שמעל הטבלה כדי לסנן לפי סוג רשומה (פעולה זו גם תסתיר ותבטל הסתרה של עמודות שונות), הזן טקסט בשדות בחלק העליון של הטבלה כדי לסנן לפי היבטים אחרים של הנתונים, ובחר את תיבות הסימון מעל הכרטיסיות כדי לסנן לפי מאפיינים רחבים יותר של הנתונים.
  2. חיפוש אצווה: בצע חיפוש אצווה כדי ליצור ולהוריד קובץ גיליון אלקטרוני המפרט מידע על כל הרשומות במסד הנתונים המשויכות לרשימה נתונה של חומרים. (ראה איור 2).
    1. בשדה נתוני הקלט, הזן רשימה של מזהי DTXSID לחיפוש, אחד בכל שורה. אם DTXSIDs אינם זמינים, השתמש בקישור בדף כדי לנווט לכלי CCD שיכול לספק DTXSIDs בהינתן מזהים אחרים.
    2. השתמש בתיבות הסימון תחת אפשרויות חיפוש כדי לסנן תוצאות או להוסיף מידע נוסף לרשומות. האפשרויות מקובצות לחמש קטגוריות: סינון לפי סוגי רשומות, סינון לפי מתודולוגיות אנליטיות, הוספת מידע נוסף ברמת החומר לקובץ התוצאות, הוספת מידע נוסף ברמת הרשומה (כרגע זמין רק עבור ספקטרום מסה), וכמה אפשרויות שונות.
      הערה: אפשרויות עם קו תחתון מקווקו כוללות טקסט המסביר את האפשרות בצורה יסודית יותר. רחף עם הסמן מעל תווית האפשרות כדי לראות אותה.
    3. לחץ על חיפוש בתחתית הדף כדי לבצע את החיפוש.
      הערה: גיליון הפלט מכיל רשימה של שיוכי רשומות חומרים, יחד עם מזהי חומרים, קישורי מקור ומידע בסיסי אחר. אם מופיעים ברשומה חומרים מרובים שחיפשו, הרשומה תופיע פעם אחת עבור כל חומר.
  3. חיפוש דמיון מבני: בצע חיפוש זה כדי לקבל רשימות של שיטות ודפי עובדות במסד הנתונים המכילים את החומר שחיפשו או אחד עם מקדם דמיון מבני גבוה מספיק של טנימוטו (ראה איור 3).
    הערה: חיפוש זה יכול להיות שימושי במקרים שבהם חומר מעניין אינו מופיע באף שיטה, אך שיטות עם חומרים דומים מאוד יכולות לשמש כהתייחסות.
    1. הזן שם DTXSID, InChIKey, CASRN או חומר בשדה החיפוש ולחץ על חיפוש או לחץ על Enter. החיפוש עשוי להימשך 20-30 שניות.
    2. לאחר השלמת החיפוש, טבלה עם כרטיסיות תופיע למטה. בחר כרטיסיה כדי לעיין בתוצאות החיפוש.
      1. שתי הכרטיסיות הראשונות מפרטות את השיטות ודפי העובדות שנמצאו. בחר אחד מהם כדי להציג תצוגה של מסמך זה בצד שמאל של העמוד. שיטות או דפי עובדות המכילים את החומר שחיפשו הם בגופן מודגש.
      2. הכרטיסייה השלישית מפרטת חומרים דומים שנמצאו מופיעים בשיטות או בדפי עובדות. בחר שורה בטבלה כדי להציג השוואה בין החומר שחיפשת לבין החומר שנבחר מהטבלה. אם החומר המבוקש עצמו נמצא במסמכים כלשהם, הוא יהיה בגופן מודגש.
      3. השתמש בבורר סנן דמיון מינימלי של חומרים בחלק העליון כדי להסתיר תוצאות מהחיפוש שחסרים בהן חומרים מתחת לסף הדמיון שנבחר.

figure-protocol-4189
איור 1: תוצאות חיפוש עבור רשומות המכילות כולסטרול. חיפוש כללי של "כולסטרול" מציג רשימה של רשומות תואמות בטבלה (משמאל). ספקטרום המסה של רשומה שנבחרה מוצג מימין. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-protocol-4695
איור 2: ממשק חיפוש אצווה. שדה החיפוש מכיל שני חומרים המזוהים על ידי ה-DTXSID שלהם. אפשרויות חיפוש המוגדרות כברירת מחדל נבחרות עבור השאילתה. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-protocol-5181
איור 3: מבנה תוצאות חיפוש עבור 1P-LSD. הטבלה מפרטת שיטות המכילות חומרים דומים מבחינה מבנית. שיטה שנבחרה מוצגת מימין. אין ערכים מודגשים בטבלה המציינים ש-1P-LSD אינו מופיע באף שיטה רשומה. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

2. חיפוש חומרים

  1. חיפוש ClassyFire: בצע חיפוש זה כדי לרשום את כל החומרים השייכים לארבע הרמות הראשונות הנתונות של סיווג ClassyFire9 (ראה איור 4).
    1. באמצעות ארבעת השדות בחלק העליון של הדף, בחר את ארבע הרמות העליונות של הסיווג אחת בכל פעם. לאחר בחירת כל אחד משלושת הסיווגים הראשונים, השתמש בלחצן מתחת לשדה זה כדי להוריד את רשימת הסיווגים רמה אחת למטה. עבור הרביעי, הכפתור למטה יפעיל את החיפוש.
      הערה: לאחר השלמת החיפוש, הטבלה שלהלן תאוכלס ברשימה של חומרים הקיימים תחת סיווג זה. הטבלה כוללת מזהים נפוצים ומידע מהותי, בתוספת ספירות של מספר הרשומות הקיימות ב-AMOS.
    2. השתמש בלחצנים בין בחירת המחלקה לטבלה כדי לאפשר ארבעה סיביות של פונקציונליות:
      1. לחץ על העתק סיווג לכתובת URL כדי להעתיק כתובת אתר ללוח, שאם נטען בכרטיסייה או בחלון דפדפן חדש, יאכלס אוטומטית את רמות הסיווג ויפעיל את החיפוש.
      2. לחץ על אפס בחירה כדי לאפס את הבחירות בשדות הסיווג. זה לא מאפס את טבלת החומרים שנמצאו.
      3. לחץ על הורד טבלה כדי לבקש הורדה של קובץ גיליון אלקטרוני המכיל את כל השדות והרשומות הגלויים בטבלה, מלבד תמונות החומר. אם המסננים בחלק העליון של טבלת התוצאות נמצאים בשימוש, התוצאות שהורדת יסוננו גם כן, אך תוכן המסננים לא ייכלל.
      4. לחץ על שלח חומרים נבחרים לחיפוש אצווה כדי לפתוח כרטיסייה חדשה לחיפוש האצווה עם השדה לרישום DTXSIDs המאוכלסים מראש בחומרים שנבחרו מתוצאות החיפוש של ClassyFire. בחירת חומרים בודדים יכולה להיעשות באמצעות תיבת הסימון בכל שורה; בחירה או ביטול בחירה של כל החומרים יכולה להיעשות על ידי לחיצה על תיבת הסימון בכותרת הטבלה. ראה שלב 1.2 לפרטים על חיפוש האצווה.
  2. חיפוש מזהה חלקי: בצע פעולה זו כדי למצוא את כל החומרים התואמים למזהה לא ייחודי (ראה איור 5). האפשרויות הנוכחיות הן תת-מחרוזת שם (המכסה הן את השם המועדף על ה-EPA והן מילים נרדפות נפוצות), הבלוק הראשון של InChIKey, הנוסחה המולקולרית המדויקת וטווח של מסות מונואיזוטופיות.
    1. בחלק העליון של הדף, בחר מזהה והזן את המידע בשדות הסמוכים.
    2. לחץ על חיפוש כדי להריץ את החיפוש.
    3. בסיום החיפוש, הטבלה תאוכלס ברשימת חומרים התואמים את המזהה החלקי, בתוספת מידע על תדירות הופעתם במאגר הנתונים של עמוס ובספרות אחרת. השתמש במסננים בחלק העליון של עמודות הטבלה כדי למקד עוד יותר את התוצאות, והשתמש בתיבת הסימון הצג חומרים מרובי רכיבים כדי להציג או להסתיר חומרים המורכבים מתרכובות מרובות.
      הערה: אם הופעל חיפוש של מחרוזת משנה של שם, תופיע עמודה המפרטת את המילים הנרדפות שנמצאו. אם חומר נמצא רק על ידי מילים נרדפות - כלומר, אם השם המועדף אינו מכיל את מחרוזת המשנה - השם המועדף יהיה נטוי.

figure-protocol-8441
איור 4: תוצאות חיפוש סיווג ClassyFire. התוצאות כוללות מידע ברמת החומר ומספר הרשומות לכל קבוצת סיווג. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-protocol-8888
איור 5: תוצאות חיפוש חלקיות של מזהה עבור "טרזין". החיפוש מוצא חומרים עם שמות מועדפים או מילים נרדפות המכילות את מחרוזת המשנה "טרזין". שתיים מתוך שלוש התוצאות כוללות "טרזין" רק במילים הנרדפות שלהן, ולא בשמות המועדפים עליהן. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

3. חיפוש ברשומות

  1. גיליון עובדות ורשימות שיטות: דפים אלה מפרטים את כל דפי העובדות והשיטות שנמצאים במסד הנתונים, עם דרכים שונות לסנן אותם (ראה איור 6). מכיוון שהפונקציונליות של שני הדפים זהה במידה רבה, הם מקובצים כאן יחד.
    הערה: ניווט לדף יבקש מהטבלאות להיטען. זה עשוי לקחת רגע בגלל מספר הרשומות הקיימות.
    1. לאחר טעינת טבלה, השתמש בקלט בראש כל עמודה כדי לסנן את הנתונים והשדות השונים. השדות המדויקים משתנים בין טבלאות, אך ניתן לבחור או לסנן את רובם.
    2. השתמש בשדה מסנן טבלה מלא מעל הטבלה כדי לבדוק אם יש מחרוזת מסוימת בכל העמודות.
      הערה: רשימת השיטות כוללת שני שדות המוסתרים כברירת מחדל - מחבר ומפרסם. מסנן הטבלה המלאה יתפוס רשומות הכוללות את המונח שחיפשת בכל אחד מהשדות הללו.
    3. רשימת גיליון העובדות מאפשרת סינון תוצאות בודדות על ידי חיפוש חומר נתון. הזן שם חומר, CASRN, InChIKey או DTXSID, ולחץ על חיפוש כדי לסנן את הטבלה. לחץ על נקה מסנן כדי לנקות את מסנן החומר.
      הערה: בשתי הטבלאות יש את הלחצנים הבאים זמינים: העתק מסננים ללוח מעתיק כתובת URL ללוח, שכאשר דפדפן ניגש אליה, תטען את הרשימה ותאכלס מראש את שדות המסנן בטבלה בערכים הנוכחיים; Download Table מוריד רשימה של כל התוצאות והמסננים הגלויים בטבלה; הורדת חומרים מורידה רשימה של כל החומרים המופיעים בטבלה (המסוננת); איפוס מסננים מנקה את כל מסנני הטבלה, כולל מסנן הטבלה המלא.
  2. חיפוש ספקטרום מסה: בצע חיפוש זה כדי לאחזר רשימה של התאמות ספקטרליות מסה ממסד הנתונים בהתבסס על ספקטרום שסופק על ידי המשתמש (ראה איור 7).
    1. מלא או התאם את ארבעת שדות הקלט הנדרשים: טווח מסה לחומר המטרה בדלטון, עם מרווח טעות בדלטון או חלקים למיליון (ppm); מתודולוגיה, GC/MS או LC/MS; ספקטרום מסה, הניתן כרשימה של זוגות מטען למסה ועוצמה; וגודל חלון המסה לדמיון שיא.
    2. לאחר מילוי השדות הללו, לחץ על כפתור החיפוש שמתחתיהם.
      הערה: לאחר השלמת החיפוש, אם נמצא ספקטרום כלשהו, תופיע בצד ימין של הדף טבלה המפרטת את הספקטרום התואם את המתודולוגיה שנבחרה מכל החומרים התואמים את טווח המסה, ממוין לפי דמיון האנטרופיה בין הספקטרום שנשלח על ידי המשתמש לספקטרום מסד הנתונים.
    3. בחר שורה בטבלה כדי להציג תרשים המציג השוואה של ספקטרום המשתמשים עם ספקטרום מסד הנתונים (בהתאמה בחלק העליון והתחתון של העלילה). השתמש בשדה דמיון מינימלי כדי להציג כדי להסתיר תוצאות שנמצאות מתחת לדמיון אנטרופיה נתון.
  3. ויזואליזציה של סיווג שימוש פונקציונלי: דף זה מציג את אונטולוגיה של השימוש הפונקציונלי של עמוס וקישורים לשיטות ודפי העובדות עבור מחלקות שימוש אלה. המחלקות מיוצגות בגרף מכוון, כאשר הקצוות עוברים ממחלקות אב כלליות יותר למחלקות בנים ספציפיות יותר (ראה איור 8).
    1. השתמש בשדה החיפוש בצד ימין כדי לחפש ברשימת מחלקות השימוש הפונקציונלי. העבר את העכבר מעל שם מחלקת שימוש כדי להדגיש את הצומת המתאים בגרף.
    2. אם בוחנים את הגרף ישירות, רחף מעל צומת מוגדר כדי להעלות תיאור קצר של אותה מחלקה, כמו גם להדגיש כל מחלקות הורה או צאצא ישירות עבור אותו צומת.
    3. לחץ לחיצה ימנית על שם מחלקה מהרשימה בצד ימין של הדף או על צומת בגרף כדי להעלות תפריט עם אפשרויות לרשימות השיטה וגיליון העובדות. בחר אחד מאלה, וכרטיסיית דפדפן חדשה תיפתח לרשימה זו, כאשר שדה המחלקה הפונקציונלית מסונן מראש עם המחלקה הפונקציונלית שנבחרה.
  4. חלקה משולשת קרקע: דף זה משחזר את סיווג מרקם הקרקע של משרד החקלאות האמריקאי, ומאפשר חיפוש בשיטות של עמוס לפי סוג קרקע.
    1. העבר את העכבר מעל אזור העלילה כדי לראות פרטים על הרכבה.
    2. לחץ על אזור בתרשים כדי לפתוח כרטיסייה חדשה לרשימת השיטות עם שדה המטריצה מסונן מראש בסיווג הקרקע שנבחר.

figure-protocol-13257
איור 6: רשימה מסוננת של שיטות אנליטיות. הטבלה מסוננת על ידי אנליט ומטריצה, ומציגה רק שיטות הקשורות ל-PFAS (חומרים פר-ופוליפלואורואלקיל) במים. הרשימה המקבילה של דפי העובדות דומה מאוד לפריסה זו. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-protocol-13796
איור 7: תוצאות חיפוש של דמיון ספקטרום. ספקטרום קפאין ממסד הנתונים של AMOS משמש כקלט. ספקטרום דומה מקובץ לפי מהות, עם ציון דמיון מקסימלי של 1.0. התרשים המשקף מציג את ספקטרום הקלט (למעלה) וספקטרום מסד נתונים שנבחר (למטה). פסגות כחולות בהירות ייחודיות לקלט, פסגות כתומות להתאמה למסד הנתונים ופסגות כחולות כהות משותפות. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-protocol-14458
איור 8: ויזואליזציה של סיווג שימוש פונקציונלי. המבנה ההיררכי מוצג כאשר הסמן מרחף מעל צומת "כימיקלים תעשייתיים" (מסומן בצהוב). כיתות הילדים שלה מתוארות בירוק. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

figure-protocol-14962
איור 9: הדמיה של חלקה משולשת בקרקע. החלקה מציגה נתוני הרכב עבור דגימות קרקע. תיאור כלי בפינה הימנית העליונה מציג את ההרכב המדויק של האזור שנמצא כעת מתחת לסמן. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

תוצאות

צילומי המסך של עמוס המוצגים לעיל מציגים תוצאות אופייניות מהחיפושים הבודדים באפליקציה, כולל חיפושים אחר חומרים מעניינים ובין ספקטרום, דפי עובדות ושיטות. מגוון הדרכים לחקירת מסד הנתונים נועד לכסות את סוגי החיפושים הסבירים והשימושיים ביותר בדרכים המאפשרות חקירה מעמיקה יותר של הנתונים והחומרים אליהם הם מתייחסים.

כדי לסייע לחיפוש של המשתמש, חלק גדול מהפונקציונליות מחובר בדרכים שנועדו לתמוך בבחינה מעמיקה יותר של הנתונים הזמינים. כדוגמה לזרימת עבודה, הדמיית סיווג השימוש הפונקציונלי מקשרת לתצוגות של השיטות ודפי העובדות הקשורים לאותה מחלקה פונקציונלית, שמהן ניתן לחלץ רשימות של חומרים ולהזין אותם לחיפוש האצווה, או לבחון מסמכים בודדים, ולחקור חומרים בודדים במסמכים אלה. מכיוון שלחומרים רבים בשיטות יש גם ספקטרום מסה ניסיוני במסד הנתונים, זה יכול לאפשר לחוקר לעבור במהירות מקטגוריה של חומרים לקבוצה של שיטות וספקטרום שיכולים לבדוק נוכחות של חומר ספציפי (ראה איור 9).

מכיוון שהתוצאות יהיו תלויות במידה רבה במה שמחפשים ואילו חיפוש או חיפושים מופעלים, קשה להגדיר תוצאות מייצגות עבור היישום כולו. באופן כללי, ייתכן שיהיה מדויק יותר לתאר "הצלחה" במונחים של חווית משתמש; במקרה כזה, יש לקוות שהדברים הבאים יתקיימו בדרך כלל: ששיטות החיפוש והסינון (והיכולת לעבור בין חיפושים ומסננים שונים) יעילות בזיהוי תת-קבוצות המידע שהמשתמש רוצה; שהתוצאות שהמשתמש מוצא מדויקות ושימושיות. איור 10 מתאר זרימת עבודה לדוגמה המדגימה פונקציונליות של AMOS.

figure-results-1570
איור 10: זרימת עבודה לדוגמה המדגימה פונקציות של AMOS. זרימת העבודה מתחילה בסיווג שימוש פונקציונלי (תרופות נשימתיות), מסננת שיטות הקשורות לתרופות נשימה בדם, בוחנת שיטה ספציפית אחת ומזהה ספקטרום לחומר הכלול בשיטה זו. אנא לחץ כאן לצפייה בגרסה גדולה יותר של איור זה.

Discussion

בעוד שפרויקטים ויישומים רבים מתמקדים באיסוף וסטנדרטיזציה של מידע מסוג יחיד של רשומה, כגון שיטות, דפי עובדות או סוג מסוים של ספקטרום, AMOS הוא הכלי הראשון שזוהה שאוסף ומשלב כמויות גדולות של מידע על פני סוגי רשומות מרובים. האיחוד, ההרמוניה והבנייה של נתונים ממקורות מגוונים אלה מביאים למסד נתונים שניתן לשלב בקלות רבה יותר בתהליכי עבודה הדורשים גישה למתודולוגיות כימיה אנליטית. היכולת לחפש במסד הנתונים במספר דרכים משלימות מאפשרת אחזור יעיל של מידע שאחרת עשוי לדרוש מאמץ ידני נרחב על פני מספר אתרים או כלים.

לפני הפרסום הציבורי, התועלת של AMOS הודגמה באמצעות השימוש בו על ידי צוות ה-EPA לתמיכה במגוון רחב של פרויקטים. ל-EPA יש עניין מתמשך ביישום ספקטרומטריית מסה לניתוח לא ממוקד10,11, ויוזמות מרובות מינפו את ספקטרום המסה הניסיוני ב-AMOS כדי לשפר את החיפושים מול ספרייה ספקטרלית גדולה בסיליקו שנוצרה מכימיקלים DSSTox12,13. פרויקטים אחרים השתמשו בחיפוש דמיון מבני כדי לזהות נקודות התחלה לפיתוח שיטות חדשות, בחנו שיטות קיימות להערכת מגבלות גילוי וכימות, וניתחו אוספים של כימיקלים הקשורים לשיטות להערכת היקף כיסוי החלל הכימי.

צבירת נתוני האימון הפוטנציאליים על ידי עמוס תומכת עוד יותר בפיתוח מודלים כמותיים של התאמה לשיטות אנליטיות14, צורך ליבה לקידום זרימות עבודה של ניתוח לא ממוקד (NTA). מאמצי האוצרות בתוך עמוס מסייעים גם ליוזמות למידול, חקירה והדמיה של מרחבים כימיים הקשורים לכיסוי מתודולוגי14.

בעוד שפונקציונליות הליבה של עמוס בשלה, הפיתוח המתמשך מונחה על ידי משוב המשתמשים. המשימות הנוכחיות כוללות שילוב של נתונים נוספים, אוצרות של מטא נתונים נוספים לסינון משופר והרחבת יכולות החיפוש. בשיתוף עם בעלי עניין ב- EPA, ממשקי תכנות יישומים (API) נמצאים בפיתוח כדי לאפשר גישה פרוגרמטית, תוך התייחסות למקרי שימוש שבהם ממשק המשתמש הגרפי (GUI) עשוי להיות לא יעיל. דף הערות שחרור שולב ביישום כדי לעקוב אחר עדכוני קוד ולהעביר אותם לאורך זמן.

רשומות נתונים וכימיקלים חדשים מתווספים כעת על בסיס שבועי; עם זאת, לוח זמנים איטי יותר צפוי לאחר ההשקה הציבורית. בעוד שנעשה מאמץ משמעותי להבטיח את דיוק הרשומות והמטא-נתונים המשויכים, חלק גדול מהנתונים מקורם במאגרי מידע ציבוריים. ככזה, אימות מלא של כל רשומה אינו אפשרי, והמשתמשים צריכים להיות מודעים לכך שלא ניתן להבטיח דיוק נתונים מוחלט.

Disclosures

מסמך זה אינו מייצג בהכרח את ההשקפות או המדיניות של הסוכנות להגנת הסביבה האמריקאית.

Acknowledgements

המחברים מודים לצוות האוצרות על כל עבודתם באוצרות כימיקלים עבור מסד הנתונים, ולג'ושוע פאוול, אסיף ראשיד ופרדי ואלון על התמיכה הטכנית בבנייה ובפריסה של עמוס. אנו מודים גם לצ'ארלס לואו על סקירת כתב היד.

Materials

NameCompanyCatalog NumberComments
GitN/Ahttps://git-scm.com/Open-source version control system.
JavaScriptN/Ahttps://ecma-international.org/publications-and-standards/standards/ecma-262/Programming language.  Defined by ECMA International standards.
PostgreSQLPostgreSQL Global Development Grouphttps://postgresql.org/about/licenceOpen-source database management system.
PythonPython Software Foundationhttps://www.python.org/Open-source programming language.

References

Reprints and Permissions

Request permission to reuse the text or figures of this JoVE article

Request Permission

Explore More Articles

220

This article has been published

Video Coming Soon

JoVE Logo

Privacy

Terms of Use

Policies

Research

Education

ABOUT JoVE

Copyright © 2025 MyJoVE Corporation. All rights reserved