Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій

Робота присвячена розвитку методів цифрової обробки геномних сигналів, які представляють собою дані щодо будови ДНК, з метою використання методів обробки сигналів до задачі аналізу геномних даних. За фрагментами послідовностей нуклеотидів змодельовано сигнали іонного струму крізь біологічну нанопору...

Full description

Bibliographic Details
Main Authors: Iryna M. Ievdoshchenko, Kateryna Olehivna Ivanko, Nataliia Heorhiivna Ivanushkina, Vishwesh Kulkarni
Format: Article
Language:English
Published: Igor Sikorsky Kyiv Polytechnic Institute 2021-04-01
Series:Mìkrosistemi, Elektronìka ta Akustika
Subjects:
Online Access:http://elc.kpi.ua/article/view/217265
_version_ 1818787731513278464
author Iryna M. Ievdoshchenko
Kateryna Olehivna Ivanko
Nataliia Heorhiivna Ivanushkina
Vishwesh Kulkarni
author_facet Iryna M. Ievdoshchenko
Kateryna Olehivna Ivanko
Nataliia Heorhiivna Ivanushkina
Vishwesh Kulkarni
author_sort Iryna M. Ievdoshchenko
collection DOAJ
description Робота присвячена розвитку методів цифрової обробки геномних сигналів, які представляють собою дані щодо будови ДНК, з метою використання методів обробки сигналів до задачі аналізу геномних даних. За фрагментами послідовностей нуклеотидів змодельовано сигнали іонного струму крізь біологічну нанопору при секвенції ДНК для випадків норми, точкових мутацій, вставки та видалення ділянки ДНК. Модельні сигнали іонного струму у білковій нанопорі отримано на основі реальних послідовностей нуклеотидів з атласів ракового геному. В роботі використано кореляційний аналіз для визначення подібності сигналів нанопорового секвенування ДНК за допомогою функції взаємної кореляції між двома сигналами іонного струму крізь білкову нанопору, зокрема між сигналами у нормі та з наявністю мутації. За розташуванням максимуму взаємної кореляційної функції визначається тип мутації (інсерція або делеція), а також проводиться вирівнювання однакових нуклеотидних послідовностей за допомогою визначеного зсуву сигналу. Проаналізовано застосування методів машинного навчання до класифікації геномних сигналів нанопорового секвенування ДНК.  Для визначення найкращих моделей класифікації застосовано алгоритми на основі дерев рішень, дискримінантного аналізу, методу опорних векторів, логістичної регресії, методу k-найближчих сусідів та ансамблевого навчання. Для різних методів машинного навчання визначено та порівняно точність класифікації на 4 класи: норма, точкова мутація (місенс або нонсенс), мутація делеції та інсерції декількох нуклеотидів. Показано, що результати застосування методів машинного навчання до проблеми класифікації сигналів нанопорового секвенування ДНК суттєво залежать від рівня шуму у зареєстрованих сигналах іонного струму крізь білкову нанопору та типу мутації. Найкращі результати класифікації отримано для методу опорних векторів. Застосування лінійної, квадратичної та кубічної функцій ядра показало високу точність вірно класифікованих сигналів – від 93 до 100%.
first_indexed 2024-12-18T14:12:26Z
format Article
id doaj.art-b093d14b728e4603a88c3773c3fe8a2c
institution Directory Open Access Journal
issn 2523-4447
2523-4455
language English
last_indexed 2024-12-18T14:12:26Z
publishDate 2021-04-01
publisher Igor Sikorsky Kyiv Polytechnic Institute
record_format Article
series Mìkrosistemi, Elektronìka ta Akustika
spelling doaj.art-b093d14b728e4603a88c3773c3fe8a2c2022-12-21T21:05:06ZengIgor Sikorsky Kyiv Polytechnic InstituteMìkrosistemi, Elektronìka ta Akustika2523-44472523-44552021-04-0126110.20535/2523-4455.mea.217265Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутаційIryna M. Ievdoshchenko0Kateryna Olehivna Ivanko1Nataliia Heorhiivna Ivanushkina2Vishwesh Kulkarni3Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського»Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського»Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського»Інженерна школа, Університет ВорикаРобота присвячена розвитку методів цифрової обробки геномних сигналів, які представляють собою дані щодо будови ДНК, з метою використання методів обробки сигналів до задачі аналізу геномних даних. За фрагментами послідовностей нуклеотидів змодельовано сигнали іонного струму крізь біологічну нанопору при секвенції ДНК для випадків норми, точкових мутацій, вставки та видалення ділянки ДНК. Модельні сигнали іонного струму у білковій нанопорі отримано на основі реальних послідовностей нуклеотидів з атласів ракового геному. В роботі використано кореляційний аналіз для визначення подібності сигналів нанопорового секвенування ДНК за допомогою функції взаємної кореляції між двома сигналами іонного струму крізь білкову нанопору, зокрема між сигналами у нормі та з наявністю мутації. За розташуванням максимуму взаємної кореляційної функції визначається тип мутації (інсерція або делеція), а також проводиться вирівнювання однакових нуклеотидних послідовностей за допомогою визначеного зсуву сигналу. Проаналізовано застосування методів машинного навчання до класифікації геномних сигналів нанопорового секвенування ДНК.  Для визначення найкращих моделей класифікації застосовано алгоритми на основі дерев рішень, дискримінантного аналізу, методу опорних векторів, логістичної регресії, методу k-найближчих сусідів та ансамблевого навчання. Для різних методів машинного навчання визначено та порівняно точність класифікації на 4 класи: норма, точкова мутація (місенс або нонсенс), мутація делеції та інсерції декількох нуклеотидів. Показано, що результати застосування методів машинного навчання до проблеми класифікації сигналів нанопорового секвенування ДНК суттєво залежать від рівня шуму у зареєстрованих сигналах іонного струму крізь білкову нанопору та типу мутації. Найкращі результати класифікації отримано для методу опорних векторів. Застосування лінійної, квадратичної та кубічної функцій ядра показало високу точність вірно класифікованих сигналів – від 93 до 100%.http://elc.kpi.ua/article/view/217265секвенація ДНКбілкова нанопорамутаціїобробка геномних сигналівкласифікаціямашинне навчання
spellingShingle Iryna M. Ievdoshchenko
Kateryna Olehivna Ivanko
Nataliia Heorhiivna Ivanushkina
Vishwesh Kulkarni
Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
Mìkrosistemi, Elektronìka ta Akustika
секвенація ДНК
білкова нанопора
мутації
обробка геномних сигналів
класифікація
машинне навчання
title Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
title_full Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
title_fullStr Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
title_full_unstemmed Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
title_short Моделювання та аналіз сигналів біонанопорового секвенування ДНК для виявлення генетичних мутацій
title_sort моделювання та аналіз сигналів біонанопорового секвенування днк для виявлення генетичних мутацій
topic секвенація ДНК
білкова нанопора
мутації
обробка геномних сигналів
класифікація
машинне навчання
url http://elc.kpi.ua/article/view/217265
work_keys_str_mv AT irynamievdoshchenko modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj
AT katerynaolehivnaivanko modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj
AT nataliiaheorhiivnaivanushkina modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj
AT vishweshkulkarni modelûvannâtaanalízsignalívbíonanoporovogosekvenuvannâdnkdlâviâvlennâgenetičnihmutacíj