A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
近年来,机器学习等人工智能技术被应用于蛋白质工程,其在蛋白质结构、功能预测、催化活性等研究中具有独特优势。在未知蛋白质结构的情况下,将蛋白质序列和功能特性与机器学习相结合,基于序列-活性关系(innovative sequence-activity relationship,ISAR)算法,将蛋白质氨基酸序列数字化,用快速傅里叶变换(fast four transform,FFT)进行预处理,再进行偏最小二乘回归建模,可在数据集较少情况下拟合得到最佳模型。通过机器学习对紫色球杆菌视紫红质(gloeobacter violaceus rhodopsin,GR)的突变体蛋白质氨基酸序列与光谱最大吸...
Main Authors: | , |
---|---|
Format: | Article |
Language: | zho |
Published: |
Zhejiang University Press
2022-05-01
|
Series: | Zhejiang Daxue xuebao. Lixue ban |
Subjects: | |
Online Access: | https://doi.org/10.3785/j.issn.1008-9497.2022.03.003 |
_version_ | 1797235743305760768 |
---|---|
author | JIALili(郏丽丽) SUNTingting(孙婷婷) |
author_facet | JIALili(郏丽丽) SUNTingting(孙婷婷) |
author_sort | JIALili(郏丽丽) |
collection | DOAJ |
description | 近年来,机器学习等人工智能技术被应用于蛋白质工程,其在蛋白质结构、功能预测、催化活性等研究中具有独特优势。在未知蛋白质结构的情况下,将蛋白质序列和功能特性与机器学习相结合,基于序列-活性关系(innovative sequence-activity relationship,ISAR)算法,将蛋白质氨基酸序列数字化,用快速傅里叶变换(fast four transform,FFT)进行预处理,再进行偏最小二乘回归建模,可在数据集较少情况下拟合得到最佳模型。通过机器学习对紫色球杆菌视紫红质(gloeobacter violaceus rhodopsin,GR)的突变体蛋白质氨基酸序列与光谱最大吸收波长进行建模,获得了最佳模型。用最佳索引LEVM760106建模得到的确定系数R2为0.944,均方误差E为11.64。用小波变换进行的预处理,其R2虽也约为0.944,但E大于11.64,不及FFT进行的预处理。方法较好地解决了蛋白质序列与功能特性之间的数学建模问题,在蛋白质工程中可为预测更优的突变体提供支持。 |
first_indexed | 2024-04-24T16:52:48Z |
format | Article |
id | doaj.art-ebf6ca159cc54f5fab4beb843df72e16 |
institution | Directory Open Access Journal |
issn | 1008-9497 |
language | zho |
last_indexed | 2024-04-24T16:52:48Z |
publishDate | 2022-05-01 |
publisher | Zhejiang University Press |
record_format | Article |
series | Zhejiang Daxue xuebao. Lixue ban |
spelling | doaj.art-ebf6ca159cc54f5fab4beb843df72e162024-03-29T01:58:40ZzhoZhejiang University PressZhejiang Daxue xuebao. Lixue ban1008-94972022-05-0149328028610.3785/j.issn.1008-9497.2022.03.003A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)JIALili(郏丽丽)0https://orcid.org/0000-0002-3215-5627SUNTingting(孙婷婷)https://orcid.org/0000-0003-1388-3458School of Sciences College, Zhejiang University of Science and Technology, Hangzhou 310023, China(浙江科技学院 理学院,浙江 杭州 310023)近年来,机器学习等人工智能技术被应用于蛋白质工程,其在蛋白质结构、功能预测、催化活性等研究中具有独特优势。在未知蛋白质结构的情况下,将蛋白质序列和功能特性与机器学习相结合,基于序列-活性关系(innovative sequence-activity relationship,ISAR)算法,将蛋白质氨基酸序列数字化,用快速傅里叶变换(fast four transform,FFT)进行预处理,再进行偏最小二乘回归建模,可在数据集较少情况下拟合得到最佳模型。通过机器学习对紫色球杆菌视紫红质(gloeobacter violaceus rhodopsin,GR)的突变体蛋白质氨基酸序列与光谱最大吸收波长进行建模,获得了最佳模型。用最佳索引LEVM760106建模得到的确定系数R2为0.944,均方误差E为11.64。用小波变换进行的预处理,其R2虽也约为0.944,但E大于11.64,不及FFT进行的预处理。方法较好地解决了蛋白质序列与功能特性之间的数学建模问题,在蛋白质工程中可为预测更优的突变体提供支持。https://doi.org/10.3785/j.issn.1008-9497.2022.03.003机器学习数字信号处理光谱特性 |
spellingShingle | JIALili(郏丽丽) SUNTingting(孙婷婷) A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究) Zhejiang Daxue xuebao. Lixue ban 机器学习 数字信号处理 光谱特性 |
title | A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究) |
title_full | A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究) |
title_fullStr | A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究) |
title_full_unstemmed | A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究) |
title_short | A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究) |
title_sort | machine learning study on gloeobacter violaceus rhodopsin spectral properties 紫色球杆菌视紫红质光谱特性的机器学习研究 |
topic | 机器学习 数字信号处理 光谱特性 |
url | https://doi.org/10.3785/j.issn.1008-9497.2022.03.003 |
work_keys_str_mv | AT jialilijiálìlì amachinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū AT suntingtingsūntíngtíng amachinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū AT jialilijiálìlì machinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū AT suntingtingsūntíngtíng machinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū |