Predicción de la estructura secundaria de proteínas usando Máquinas de soporte Vectorial

<!--[if gte mso 9]><xml> <w:WordDocument> <w:View>Normal</w:View> <w:Zoom>0</w:Zoom> <w:TrackMoves /> <w:TrackFormatting /> <w:HyphenationZone>21</w:HyphenationZone> <w:PunctuationKerning /> <w:ValidateAgainstSchemas /> &l...

Full description

Bibliographic Details
Main Authors: Darío José Delgado, Henry Arguello Fuentes, Rodrigo Gonzalo Torres
Format: Article
Language:Spanish
Published: Universidad Nacional de Colombia 2012-04-01
Series:Revista Colombiana de Biotecnología
Subjects:
Online Access:http://www.revistas.unal.edu.co/index.php/biotecnologia/article/view/32885
Description
Summary:<!--[if gte mso 9]><xml> <w:WordDocument> <w:View>Normal</w:View> <w:Zoom>0</w:Zoom> <w:TrackMoves /> <w:TrackFormatting /> <w:HyphenationZone>21</w:HyphenationZone> <w:PunctuationKerning /> <w:ValidateAgainstSchemas /> <w:SaveIfXMLInvalid>false</w:SaveIfXMLInvalid> <w:IgnoreMixedContent>false</w:IgnoreMixedContent> <w:AlwaysShowPlaceholderText>false</w:AlwaysShowPlaceholderText> <w:DoNotPromoteQF /> <w:LidThemeOther>ES-CO</w:LidThemeOther> <w:LidThemeAsian>X-NONE</w:LidThemeAsian> <w:LidThemeComplexScript>X-NONE</w:LidThemeComplexScript> <w:Compatibility> <w:BreakWrappedTables /> <w:SnapToGridInCell /> <w:WrapTextWithPunct /> <w:UseAsianBreakRules /> <w:DontGrowAutofit /> <w:SplitPgBreakAndParaMark /> <w:DontVertAlignCellWithSp /> <w:DontBreakConstrainedForcedTables /> <w:DontVertAlignInTxbx /> <w:Word11KerningPairs /> <w:CachedColBalance /> </w:Compatibility> <w:BrowserLevel>MicrosoftInternetExplorer4</w:BrowserLevel> <m:mathPr> <m:mathFont m:val="Cambria Math" /> <m:brkBin m:val="before" /> <m:brkBinSub m:val=" " /> <m:smallFrac m:val="off" /> <m:dispDef /> <m:lMargin m:val="0" /> <m:rMargin m:val="0" /> <m:defJc m:val="centerGroup" /> <m:wrapIndent m:val="1440" /> <m:intLim m:val="subSup" /> <m:naryLim m:val="undOvr" /> </m:mathPr></w:WordDocument> </xml><![endif]--><strong style="mso-bidi-font-weight: normal;"><span style="mso-ansi-language: EN-US;" lang="EN-US">Título en ingles: Protein secondary structure prediction    using  support vector machines</span></strong> <p class="MsoNormal" style="text-align: justify; tab-stops: 28.0pt 56.0pt 84.0pt 112.0pt 140.0pt 168.0pt 196.0pt 224.0pt 252.0pt 280.0pt 308.0pt 336.0pt;"><strong style="mso-bidi-font-weight: normal;"><span style="color: black; mso-themecolor: text1; mso-ansi-language: EN-US;" lang="EN-US">Abstract : </span></strong><span style="color: black; mso-themecolor: text1; mso-ansi-language: EN-US;" lang="EN-US">Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from its primary amino acid sequence using Support Vector Machines. As inputs, in the proposed methodology, features are used from different structural motifs or text strings associated with the primary structure which represents the secondary structure, such as R-group and the probability that the amino acid at position adopts a central particular secondary structure. For feature extraction method is used coding of sequences in which each symbol in the primary structure is associated with each symbol in the secondary structure. The use of this encoding method reduces the dimensionality of the data of thousands of characteristics only 220 of these. The results obtained are comparable to those reported in the literature, taking about 70% accuracy. Furthermore, it is possible to reduce computational cost in the construction of classifiers because this work models the problem of multi classification as a group of binary classifiers.</span><strong style="mso-bidi-font-weight: normal;"></strong></p> <p class="First-line-indent" style="text-indent: 0cm; line-height: normal;"><strong style="mso-bidi-font-weight: normal;"><span style="font-size: 10.0pt; color: black; mso-themecolor: text1;" lang="EN-US">Key words: </span></strong><span style="font-size: 10.0pt; color: black; mso-themecolor: text1;" lang="EN-US">coding methodology; support vector machines; prediction of protein secondary structure.</span></p> <p class="Text-body" style="line-height: normal;"><span class="textbf"><span style="font-size: 10.0pt; color: black; mso-themecolor: text1; mso-ansi-language: ES-CO;"><strong>Resumen</strong>: </span></span><span style="font-size: 10.0pt; color: black; mso-themecolor: text1; mso-ansi-language: ES-CO;">Entre los métodos computacionales utilizados para la predicción de la estructura secundaria de proteínas, se destaca el uso de máquinas de soporte vectorial. Este trabajo de investigación presenta la predicción de la estructura secundaria de proteínas desde su secuencia primaria de aminoácidos usando Máquinas de Soporte Vectorial. Como entradas, en la metodología propuesta, se utilizan características de los diferentes motivos estructurales o cadenas de texto asociadas a la estructura primaria que representa la estructura secundaria, tales como el R-grupo y la probabilidad de que el aminoácido en la posición central adopte una determinada estructura secundaria. Para la extracción de características se utiliza un método de codificación de secuencias en el que cada símbolo en la estructura primaria se relaciona con cada símbolo en la estructura secundaria. El uso de este método de codificación permite reducir la dimensionalidad de los datos de miles de características a sólo 220 de estas. Los resultados obtenidos son comparables a los registrados en la literatura, teniendo cerca de un 70% de precisión. Además, se logra reducir los costos computacionales en la construcción de los clasificadores debido a que este trabajo modela el problema de multi-clasificación como un grupo de clasificadores binarios.</span></p> <p class="Text-body" style="line-height: normal;"><span class="textbf"><span style="font-size: 10.0pt; color: black; mso-themecolor: text1; mso-ansi-language: ES-CO;"><strong>Palabras clave</strong>: </span></span><span class="textit"><span style="font-size: 10.0pt; color: black; mso-themecolor: text1; mso-ansi-language: ES-CO; font-style: normal;">máquinas de soporte vectorial; metodología de codificación; predicción de la estructura secundaria de proteínas.</span></span></p>
ISSN:0123-3475
1909-8758