Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
Робота присвячена розвитку методів цифрової обробки геномних сигналів, які представляють собою дані щодо будови ДНК, з метою використання методів обробки сигналів до задачі аналізу геномних даних. За фрагментами послідовностей нуклеотидів змодельовано сигнали іонного струму крізь біологічну нанопору...
Main Authors: | , , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Igor Sikorsky Kyiv Polytechnic Institute
2021-04-01
|
Series: | Mìkrosistemi, Elektronìka ta Akustika |
Subjects: | |
Online Access: | http://elc.kpi.ua/article/view/217265 |
_version_ | 1818787731513278464 |
---|---|
author | Iryna M. Ievdoshchenko Kateryna Olehivna Ivanko Nataliia Heorhiivna Ivanushkina Vishwesh Kulkarni |
author_facet | Iryna M. Ievdoshchenko Kateryna Olehivna Ivanko Nataliia Heorhiivna Ivanushkina Vishwesh Kulkarni |
author_sort | Iryna M. Ievdoshchenko |
collection | DOAJ |
description | Робота присвячена розвитку методів цифрової обробки геномних сигналів, які представляють собою дані щодо будови ДНК, з метою використання методів обробки сигналів до задачі аналізу геномних даних. За фрагментами послідовностей нуклеотидів змодельовано сигнали іонного струму крізь біологічну нанопору при секвенції ДНК для випадків норми, точкових мутацій, вставки та видалення ділянки ДНК. Модельні сигнали іонного струму у білковій нанопорі отримано на основі реальних послідовностей нуклеотидів з атласів ракового геному. В роботі використано кореляційний аналіз для визначення подібності сигналів нанопорового секвенування ДНК за допомогою функції взаємної кореляції між двома сигналами іонного струму крізь білкову нанопору, зокрема між сигналами у нормі та з наявністю мутації. За розташуванням максимуму взаємної кореляційної функції визначається тип мутації (інсерція або делеція), а також проводиться вирівнювання однакових нуклеотидних послідовностей за допомогою визначеного зсуву сигналу.
Проаналізовано застосування методів машинного навчання до класифікації геномних сигналів нанопорового секвенування ДНК. Для визначення найкращих моделей класифікації застосовано алгоритми на основі дерев рішень, дискримінантного аналізу, методу опорних векторів, логістичної регресії, методу k-найближчих сусідів та ансамблевого навчання. Для різних методів машинного навчання визначено та порівняно точність класифікації на 4 класи: норма, точкова мутація (місенс або нонсенс), мутація делеції та інсерції декількох нуклеотидів. Показано, що результати застосування методів машинного навчання до проблеми класифікації сигналів нанопорового секвенування ДНК суттєво залежать від рівня шуму у зареєстрованих сигналах іонного струму крізь білкову нанопору та типу мутації. Найкращі результати класифікації отримано для методу опорних векторів. Застосування лінійної, квадратичної та кубічної функцій ядра показало високу точність вірно класифікованих сигналів – від 93 до 100%. |
first_indexed | 2024-12-18T14:12:26Z |
format | Article |
id | doaj.art-b093d14b728e4603a88c3773c3fe8a2c |
institution | Directory Open Access Journal |
issn | 2523-4447 2523-4455 |
language | English |
last_indexed | 2024-12-18T14:12:26Z |
publishDate | 2021-04-01 |
publisher | Igor Sikorsky Kyiv Polytechnic Institute |
record_format | Article |
series | Mìkrosistemi, Elektronìka ta Akustika |
spelling | doaj.art-b093d14b728e4603a88c3773c3fe8a2c2022-12-21T21:05:06ZengIgor Sikorsky Kyiv Polytechnic InstituteMìkrosistemi, Elektronìka ta Akustika2523-44472523-44552021-04-0126110.20535/2523-4455.mea.217265Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутаційIryna M. Ievdoshchenko0Kateryna Olehivna Ivanko1Nataliia Heorhiivna Ivanushkina2Vishwesh Kulkarni3Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського»Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського»Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського»Інженерна школа, Університет ВорикаРобота присвячена розвитку методів цифрової обробки геномних сигналів, які представляють собою дані щодо будови ДНК, з метою використання методів обробки сигналів до задачі аналізу геномних даних. За фрагментами послідовностей нуклеотидів змодельовано сигнали іонного струму крізь біологічну нанопору при секвенції ДНК для випадків норми, точкових мутацій, вставки та видалення ділянки ДНК. Модельні сигнали іонного струму у білковій нанопорі отримано на основі реальних послідовностей нуклеотидів з атласів ракового геному. В роботі використано кореляційний аналіз для визначення подібності сигналів нанопорового секвенування ДНК за допомогою функції взаємної кореляції між двома сигналами іонного струму крізь білкову нанопору, зокрема між сигналами у нормі та з наявністю мутації. За розташуванням максимуму взаємної кореляційної функції визначається тип мутації (інсерція або делеція), а також проводиться вирівнювання однакових нуклеотидних послідовностей за допомогою визначеного зсуву сигналу. Проаналізовано застосування методів машинного навчання до класифікації геномних сигналів нанопорового секвенування ДНК. Для визначення найкращих моделей класифікації застосовано алгоритми на основі дерев рішень, дискримінантного аналізу, методу опорних векторів, логістичної регресії, методу k-найближчих сусідів та ансамблевого навчання. Для різних методів машинного навчання визначено та порівняно точність класифікації на 4 класи: норма, точкова мутація (місенс або нонсенс), мутація делеції та інсерції декількох нуклеотидів. Показано, що результати застосування методів машинного навчання до проблеми класифікації сигналів нанопорового секвенування ДНК суттєво залежать від рівня шуму у зареєстрованих сигналах іонного струму крізь білкову нанопору та типу мутації. Найкращі результати класифікації отримано для методу опорних векторів. Застосування лінійної, квадратичної та кубічної функцій ядра показало високу точність вірно класифікованих сигналів – від 93 до 100%.http://elc.kpi.ua/article/view/217265секвенація ДНКбілкова нанопорамутаціїобробка геномних сигналівкласифікаціямашинне навчання |
spellingShingle | Iryna M. Ievdoshchenko Kateryna Olehivna Ivanko Nataliia Heorhiivna Ivanushkina Vishwesh Kulkarni Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій Mìkrosistemi, Elektronìka ta Akustika секвенація ДНК білкова нанопора мутації обробка геномних сигналів класифікація машинне навчання |
title | Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій |
title_full | Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій |
title_fullStr | Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій |
title_full_unstemmed | Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій |
title_short | Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій |
title_sort | моделювання та аналіз сигналів біонанопорового секвенування днк для виявлення генетичних мутацій |
topic | секвенація ДНК білкова нанопора мутації обробка геномних сигналів класифікація машинне навчання |
url | http://elc.kpi.ua/article/view/217265 |
work_keys_str_mv | AT irynamievdoshchenko modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj AT katerynaolehivnaivanko modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj AT nataliiaheorhiivnaivanushkina modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj AT vishweshkulkarni modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj |