A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)

近年来,机器学习等人工智能技术被应用于蛋白质工程,其在蛋白质结构、功能预测、催化活性等研究中具有独特优势。在未知蛋白质结构的情况下,将蛋白质序列和功能特性与机器学习相结合,基于序列-活性关系(innovative sequence-activity relationship,ISAR)算法,将蛋白质氨基酸序列数字化,用快速傅里叶变换(fast four transform,FFT)进行预处理,再进行偏最小二乘回归建模,可在数据集较少情况下拟合得到最佳模型。通过机器学习对紫色球杆菌视紫红质(gloeobacter violaceus rhodopsin,GR)的突变体蛋白质氨基酸序列与光谱最大吸...

Full description

Bibliographic Details
Main Authors: JIALili(郏丽丽), SUNTingting(孙婷婷)
Format: Article
Language:zho
Published: Zhejiang University Press 2022-05-01
Series:Zhejiang Daxue xuebao. Lixue ban
Subjects:
Online Access:https://doi.org/10.3785/j.issn.1008-9497.2022.03.003
_version_ 1797235743305760768
author JIALili(郏丽丽)
SUNTingting(孙婷婷)
author_facet JIALili(郏丽丽)
SUNTingting(孙婷婷)
author_sort JIALili(郏丽丽)
collection DOAJ
description 近年来,机器学习等人工智能技术被应用于蛋白质工程,其在蛋白质结构、功能预测、催化活性等研究中具有独特优势。在未知蛋白质结构的情况下,将蛋白质序列和功能特性与机器学习相结合,基于序列-活性关系(innovative sequence-activity relationship,ISAR)算法,将蛋白质氨基酸序列数字化,用快速傅里叶变换(fast four transform,FFT)进行预处理,再进行偏最小二乘回归建模,可在数据集较少情况下拟合得到最佳模型。通过机器学习对紫色球杆菌视紫红质(gloeobacter violaceus rhodopsin,GR)的突变体蛋白质氨基酸序列与光谱最大吸收波长进行建模,获得了最佳模型。用最佳索引LEVM760106建模得到的确定系数R2为0.944,均方误差E为11.64。用小波变换进行的预处理,其R2虽也约为0.944,但E大于11.64,不及FFT进行的预处理。方法较好地解决了蛋白质序列与功能特性之间的数学建模问题,在蛋白质工程中可为预测更优的突变体提供支持。
first_indexed 2024-04-24T16:52:48Z
format Article
id doaj.art-ebf6ca159cc54f5fab4beb843df72e16
institution Directory Open Access Journal
issn 1008-9497
language zho
last_indexed 2024-04-24T16:52:48Z
publishDate 2022-05-01
publisher Zhejiang University Press
record_format Article
series Zhejiang Daxue xuebao. Lixue ban
spelling doaj.art-ebf6ca159cc54f5fab4beb843df72e162024-03-29T01:58:40ZzhoZhejiang University PressZhejiang Daxue xuebao. Lixue ban1008-94972022-05-0149328028610.3785/j.issn.1008-9497.2022.03.003A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)JIALili(郏丽丽)0https://orcid.org/0000-0002-3215-5627SUNTingting(孙婷婷)https://orcid.org/0000-0003-1388-3458School of Sciences College, Zhejiang University of Science and Technology, Hangzhou 310023, China(浙江科技学院 理学院,浙江 杭州 310023)近年来,机器学习等人工智能技术被应用于蛋白质工程,其在蛋白质结构、功能预测、催化活性等研究中具有独特优势。在未知蛋白质结构的情况下,将蛋白质序列和功能特性与机器学习相结合,基于序列-活性关系(innovative sequence-activity relationship,ISAR)算法,将蛋白质氨基酸序列数字化,用快速傅里叶变换(fast four transform,FFT)进行预处理,再进行偏最小二乘回归建模,可在数据集较少情况下拟合得到最佳模型。通过机器学习对紫色球杆菌视紫红质(gloeobacter violaceus rhodopsin,GR)的突变体蛋白质氨基酸序列与光谱最大吸收波长进行建模,获得了最佳模型。用最佳索引LEVM760106建模得到的确定系数R2为0.944,均方误差E为11.64。用小波变换进行的预处理,其R2虽也约为0.944,但E大于11.64,不及FFT进行的预处理。方法较好地解决了蛋白质序列与功能特性之间的数学建模问题,在蛋白质工程中可为预测更优的突变体提供支持。https://doi.org/10.3785/j.issn.1008-9497.2022.03.003机器学习数字信号处理光谱特性
spellingShingle JIALili(郏丽丽)
SUNTingting(孙婷婷)
A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
Zhejiang Daxue xuebao. Lixue ban
机器学习
数字信号处理
光谱特性
title A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
title_full A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
title_fullStr A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
title_full_unstemmed A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
title_short A machine learning study on gloeobacter violaceus rhodopsin spectral properties(紫色球杆菌视紫红质光谱特性的机器学习研究)
title_sort machine learning study on gloeobacter violaceus rhodopsin spectral properties 紫色球杆菌视紫红质光谱特性的机器学习研究
topic 机器学习
数字信号处理
光谱特性
url https://doi.org/10.3785/j.issn.1008-9497.2022.03.003
work_keys_str_mv AT jialilijiálìlì amachinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū
AT suntingtingsūntíngtíng amachinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū
AT jialilijiálìlì machinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū
AT suntingtingsūntíngtíng machinelearningstudyongloeobacterviolaceusrhodopsinspectralpropertieszǐsèqiúgānjūnshìzǐhóngzhìguāngpǔtèxìngdejīqìxuéxíyánjiū