פרוטוקול אנליטי זה מאפשר מחקר של אוכלוסיות פתוגניות של חיידקים, בקנה מידה גדול. זה חשוב מאוד כי זה משפר את האופן שבו ניתן לבצע חקירות אקולוגיות ואפידמיולוגיות. אבל כדי שזה יקרה, מה שאנחנו צריכים זה כלי אוטומטי וניתן להרחבה, או פלטפורמה חישובית שמאפשרת לנתח אלפים רבים של רצפי גנום בבת אחת.
ProkEvo מתאים לנישה זו, והוא מאפשר ניתוח אוכלוסין חיידקי מעשי בקנה מידה גדול, תוך מיפוי תוכן פאן-גנומי, הסוקר גנוטיפים ותכונות ייחודיות על אותם גנוטיפים לצורך חקירה אקולוגית ואפידמיולוגית. היתרון העיקרי של פרוטוקול זה הוא השימוש בפלטפורמות חישוביות חזקות, אוטומטיות וניתנות להרחבה, כגון ProkEvo לביצוע כרייה היוריסטית של גנוטיפים היררכיים באוכלוסיות חיידקים. לפרוטוקול האנליטי המוצג כאן היום יש כמה השלכות מעשיות.
אחד מהם הוא להקל על האבחון במובן שיאפשר למפות ולעקוב אחר גנוטיפים חיידקיים בזמן אמת, באופן מדרגי, המאפשר להבחין ולהגדיר שושלות פתוגניות של פתוגנים כדי לעקוב ולמפות את הפתוגנים האלה במסגרות שונות. יישום נוסף הוא להגביר את המעקב השגרתי אחר מעבדות בריאות הציבור וסוכנויות רגולטוריות, אשר נעשה כדי להקל על מעקב אחר פתוגנים במסגרות מסחריות שונות. הפרוטוקול המוצג כאן מספק הדרכה מעשית למיקרוביולוגים, אקולוגים, אפידמיולוגים וכל מי שמתעניין בגנומיקה של אוכלוסיית חיידקים.
ProkEvo היא פלטפורמת קוד פתוח וזמינה לציבור, ודף GitHub שלה מספק הוראות שימוש מפורטות. את הפרוטוקול המוסבר כאן ניתן למצוא גם ב-GitHub. עם ההוראות שסופקו, אנו רוצים להפוך את ProkEvo ואת הפרוטוקול הזה לקלים לשימוש ולהיות מנוצלים על ידי חוקרים מתחילים ומתקדמים.
התחילו לערוך את הניתוחים באמצעות עץ ג'יג'י כדי לשרטט עץ פילוגנטי יחד עם מידע גנוטיפי. לשם כך, מטב את גודל הדמות של עץ ה-Gigi, כולל הקוטר והרוחב של הטבעות על-ידי שינוי הערכים המספריים בתוך מפת החום x-lim ו-G. בעת התוויית שכבות מרובות של נתונים עם העץ הפילוגנטי, צבר את כל המטה-נתונים למספר הנמוך ביותר האפשרי של קטגוריות כדי להקל על בחירת לוח הצביעה.
נהל את צבירת הנתונים על סמך שאלת העניין והידע בתחום. לאחר שתסיים, השתמש בעלילת סרגל כדי להעריך את התדרים היחסיים על ידי צבירת נתונים עבור סוג הרצף או שושלות ST, והקלדת רצף רב-לוקוס של גנום הליבה או וריאנטים של cgMLST כדי להקל על הדמיות. בחר סף אמפירי או סטטיסטי המשמש לצבירת נתונים.
ניתן להשתמש בקוד לדוגמה כדי לבדוק את התפלגות התדרים של שושלות ST ולקבוע את הניתוק. הקוד לדוגמה מראה כיצד מצטברים STs משניים או בתדר נמוך. ניתן לקבץ את ה- STs שאינם ממוספרים כ- STs אחרים.
השתמש בקוד דומה עבור גרסאות cgMLST. השתמש בגישה המקוננת כדי לחשב את היחסיות של כל שושלת ST בתוך כל תת-קבוצה של BAPS1 כדי לזהות את ה- STs השייכים לאותה תת-חבורה BAPS1. הקוד מדגים כיצד ניתן לחשב את הפרופורציה מבוססת ST על פני תת-הקבוצות BAPS1.
כדי להתוות את ההתפלגות של עמידות מיקרוביאלית או מוקדי AMR על פני שושלות ST, השתמש בסף אמפירי או סטטיסטי כדי לסנן את מוקדי ה- AMR החשובים ביותר כדי להקל על הדמיות. ספק גלם. קובץ csv המכיל את הפרופורציות המחושבות של כל מוקדי AMR בכל שושלות ST.
לאחר מכן חשב את פרופורציית ה- AMR עבור כל ST באמצעות הקוד. לאחר ביצוע החישובים עבור כל ה- STs, שלב את ערכות הנתונים כמסגרת נתונים אחת באמצעות הקוד ולאחר מכן ייצא את קובץ ה- csv המכיל את הפרופורציות המחושבות עם הקוד. לפני שמתווים את ההתפלגות מבוססת AMR על פני שושלות ST, סנן את הנתונים על סמך סף כדי להקל על תצוגות חזותיות.
לאחר מכן, שרטט את הפילוגנזה של הגנום המרכזי יחד עם הסיווגים הגנוטיפיים ההיררכיים בנתוני AMR בחלקה אחת באמצעות עץ Gigi. לאחר מכן מטב את גודל הדמות בתוך עץ Gigi באמצעות הפרמטרים שהוזכרו קודם לכן. מטב את ההדמיות על ידי צבירת המשתנים או שימוש בסיווג בינארי, כגון נוכחות הגנים או היעדרם.
נבחן מבנה האוכלוסייה ההיררכי של שושלת סלמונלה אנטריקה בהקשר של פילוגנזה של גנום ליבה. התדרים היחסיים של כל הגנוטיפים ההיררכיים שימשו אז להערכת ההתפלגות הכוללת והסיווגים הנצפים ביותר. שושלות ST פחות שכיחות נצברו כ-STs אחרים כדי להקל על הדמיית נתונים.
באופן דומה, גרסאות cgMLST פחות שכיחות נצברו כמו cgMLSTs אחרים. היחסים הקדומים בין ה-STs נבחנו באמצעות גישה מקוננת על ידי הערכת התדירות היחסית של שושלות ST על ידי תת-הקבוצות BAPS1 או ההפלוטיפים. התדירות היחסית של שושלת ST המבדילה בין מוקדי AMR הוערכה כדי לזהות חתימות גנומיות ייחודיות הקשורות למבנה האוכלוסייה של סרובר ניופורט.
בתוצאות, נראה כי לוקי MDFA ו-AAC6IAA נרכשו באופן קדום על ידי אוכלוסיית סרובר ניופורט, בעוד ש-ST45 צפוי להיות עמיד לתרופות מרובות. בהשוואה ל-ST45, שושלות ST הגדולות האחרות, כגון ST5 ו-ST118, נוטות יותר להיות רגישות לתרופות מרובות. בנוסף, נעשה שימוש בהדמיה מעוגנת פילוגנית כדי לשלב את נתוני מבנה האוכלוסייה ההיררכיים באופן שיטתי.
פרוטוקול אנליטי זה מציג בסיס לכריית נתונים של אוכלוסיות חיידקים בקנה מידה גדול. מה שהיא מאפשרת הוא למפות ולעקוב אחר גנוטיפים בקנה מידה גדול באמצעות ProkEvo, אך ניתן להרחיב אותה גם כדי לענות על שאלות אחרות, כגון חקירת התפלגות המסלולים המטבוליים וגורמי האלימות הקשורים למידע גנוטיפי. כלומר, אנו יכולים לחזות את הפנוטיפים הקשורים לגנוטיפים ספציפיים של עניין.
הפרוטוקול המתואר כאן בהחלט סולל את הדרך לחוקרים לחקור שאלות חדשות בתחום הגנומיקה של האוכלוסייה ולהסיק דפוסים אבולוציוניים ואקולוגיים עבור מיני חיידקים פתוגניים כמו גם לא פתוגניים.