O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution

RESUMO: A presente pesquisa tem como objetivo principal o desenvolvimento de um modelo computacional com uso de técnicas de Mineração de Textos para a tarefa de correção de questões dissertativas em ambientes online, possibilitando, por sua vez, a diminuição da subjetividade na avaliação das questõe...

Full description

Bibliographic Details
Main Authors: Leonard Barreto Moreira, Annabell Del Real Tamariz, Joyce Vieira Fettermann
Format: Article
Language:English
Published: Universidade Federal de Minas Gerais 2018-12-01
Series:Texto Livre: Linguagem e Tecnologia
Subjects:
Online Access:http://www.periodicos.letras.ufmg.br/index.php/textolivre/article/view/13809
_version_ 1818718527868108800
author Leonard Barreto Moreira
Annabell Del Real Tamariz
Joyce Vieira Fettermann
author_facet Leonard Barreto Moreira
Annabell Del Real Tamariz
Joyce Vieira Fettermann
author_sort Leonard Barreto Moreira
collection DOAJ
description RESUMO: A presente pesquisa tem como objetivo principal o desenvolvimento de um modelo computacional com uso de técnicas de Mineração de Textos para a tarefa de correção de questões dissertativas em ambientes online, possibilitando, por sua vez, a diminuição da subjetividade na avaliação das questões discursivas dos discentes. O conjunto de dados utilizados para os experimentos baseia-se em 15 questões discursivas de computação pertencentes ao ciclo básico de cursos da área das Engenharias. A metodologia proposta é apoiada em três grandes fases: 1) Aplicação de técnicas de pré-processamento de textos e representação dos documentos segundo a abordagem “Saco de palavras”, com esquema de ponderação term-frequency; 2) Realização do processamento dos textos por meio da comparação dos termos contidos nas respostas com os do gabarito por intermédio de medidas baseadas em termos e edição; 3) Confrontação dos resultados numéricos obtidos com as notas da correção do avaliador, ao investigar a hipótese de que as médias das notas reais e estimadas são iguais por meio do Teste T, assim como análise do erro médio absoluto percentual (MAPE) entre tais subconjuntos. Os resultados obtidos indicaram uma alta aderência à hipótese de que as médias dos dados reais vs estimados são iguais, principalmente para as medidas baseadas em tokens. A acurácia foi da ordem de 84,2% para Coseno no modelo bigram. Assim, o principal resultado deste trabalho é a concepção de um modelo de MT para o apoio ao processo avaliativo de questões discursivas em ambiente EaD. PALAVRAS-CHAVE: aprendizado de máquina; mineração de texto; sistemas de ensino inteligentes.   ABSTRACT: The present research has as main objective the computational development with the use of techniques of Texts Mining for the task of correcting the dissertative questions online, making it possible to provide the diminution of the subjectivity in the evaluation of the discursive questions of the students. The set of data used for the experiments is based on 15 discursive computational questions belonging to the basic course cycle of the Engineering area. The proposed methodology is supported by three major phases: 1) Application of pre-processing techniques and representation of documents according to the “Bag of words” approach, with term-frequency weighting scheme; 2) Carrying out the processing of texts by comparing the terms contained in the answers with those of the template by means of measures based on terms and editing; 3) Confrontation of the numerical results obtained with the evaluator's correction notes, investigating the hypothesis that the means of the real and estimated scores are equal by means of the T-Test, as well as analysis of the percentage absolute mean error (MAPE, in Portuguese) between such subsets. The results obtained indicated a high adherence to the hypothesis that the averages of the actual vs. estimated data are the same, especially for the tokens-based measurements. The accuracy was of the order of 84.2% for Cosine in the bigram model. Thus, the main result of this work is the design of a TM model to support the evaluation process of discursive issues in the distance learning environment. KEYWORDS: machine learning; text mining; smart education systems.
first_indexed 2024-12-17T19:52:28Z
format Article
id doaj.art-74afbaaaaa0d45c4aac9423e17ab914b
institution Directory Open Access Journal
issn 1983-3652
language English
last_indexed 2024-12-17T19:52:28Z
publishDate 2018-12-01
publisher Universidade Federal de Minas Gerais
record_format Article
series Texto Livre: Linguagem e Tecnologia
spelling doaj.art-74afbaaaaa0d45c4aac9423e17ab914b2022-12-21T21:34:42ZengUniversidade Federal de Minas GeraisTexto Livre: Linguagem e Tecnologia1983-36522018-12-0111321322710.17851/1983-3652.11.3.213-2279971O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institutionLeonard Barreto Moreira0Annabell Del Real Tamariz1Joyce Vieira Fettermann2Universidade Estadual do Norte FluminenseUniversidade Estadual do Norte FluminenseUniversidade Estadual do Norte FluminenseRESUMO: A presente pesquisa tem como objetivo principal o desenvolvimento de um modelo computacional com uso de técnicas de Mineração de Textos para a tarefa de correção de questões dissertativas em ambientes online, possibilitando, por sua vez, a diminuição da subjetividade na avaliação das questões discursivas dos discentes. O conjunto de dados utilizados para os experimentos baseia-se em 15 questões discursivas de computação pertencentes ao ciclo básico de cursos da área das Engenharias. A metodologia proposta é apoiada em três grandes fases: 1) Aplicação de técnicas de pré-processamento de textos e representação dos documentos segundo a abordagem “Saco de palavras”, com esquema de ponderação term-frequency; 2) Realização do processamento dos textos por meio da comparação dos termos contidos nas respostas com os do gabarito por intermédio de medidas baseadas em termos e edição; 3) Confrontação dos resultados numéricos obtidos com as notas da correção do avaliador, ao investigar a hipótese de que as médias das notas reais e estimadas são iguais por meio do Teste T, assim como análise do erro médio absoluto percentual (MAPE) entre tais subconjuntos. Os resultados obtidos indicaram uma alta aderência à hipótese de que as médias dos dados reais vs estimados são iguais, principalmente para as medidas baseadas em tokens. A acurácia foi da ordem de 84,2% para Coseno no modelo bigram. Assim, o principal resultado deste trabalho é a concepção de um modelo de MT para o apoio ao processo avaliativo de questões discursivas em ambiente EaD. PALAVRAS-CHAVE: aprendizado de máquina; mineração de texto; sistemas de ensino inteligentes.   ABSTRACT: The present research has as main objective the computational development with the use of techniques of Texts Mining for the task of correcting the dissertative questions online, making it possible to provide the diminution of the subjectivity in the evaluation of the discursive questions of the students. The set of data used for the experiments is based on 15 discursive computational questions belonging to the basic course cycle of the Engineering area. The proposed methodology is supported by three major phases: 1) Application of pre-processing techniques and representation of documents according to the “Bag of words” approach, with term-frequency weighting scheme; 2) Carrying out the processing of texts by comparing the terms contained in the answers with those of the template by means of measures based on terms and editing; 3) Confrontation of the numerical results obtained with the evaluator's correction notes, investigating the hypothesis that the means of the real and estimated scores are equal by means of the T-Test, as well as analysis of the percentage absolute mean error (MAPE, in Portuguese) between such subsets. The results obtained indicated a high adherence to the hypothesis that the averages of the actual vs. estimated data are the same, especially for the tokens-based measurements. The accuracy was of the order of 84.2% for Cosine in the bigram model. Thus, the main result of this work is the design of a TM model to support the evaluation process of discursive issues in the distance learning environment. KEYWORDS: machine learning; text mining; smart education systems.http://www.periodicos.letras.ufmg.br/index.php/textolivre/article/view/13809aprendizado de máquinamineração de textosistemas de ensino inteligentes.
spellingShingle Leonard Barreto Moreira
Annabell Del Real Tamariz
Joyce Vieira Fettermann
O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution
Texto Livre: Linguagem e Tecnologia
aprendizado de máquina
mineração de texto
sistemas de ensino inteligentes.
title O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution
title_full O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution
title_fullStr O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution
title_full_unstemmed O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution
title_short O uso da mineração de textos no suporte a correções de questões discursivas em uma instituição de educação superior / The use of texts mining in the support to corrections of discursive questions in a higher education institution
title_sort o uso da mineracao de textos no suporte a correcoes de questoes discursivas em uma instituicao de educacao superior the use of texts mining in the support to corrections of discursive questions in a higher education institution
topic aprendizado de máquina
mineração de texto
sistemas de ensino inteligentes.
url http://www.periodicos.letras.ufmg.br/index.php/textolivre/article/view/13809
work_keys_str_mv AT leonardbarretomoreira ousodamineracaodetextosnosuporteacorrecoesdequestoesdiscursivasemumainstituicaodeeducacaosuperiortheuseoftextsmininginthesupporttocorrectionsofdiscursivequestionsinahighereducationinstitution
AT annabelldelrealtamariz ousodamineracaodetextosnosuporteacorrecoesdequestoesdiscursivasemumainstituicaodeeducacaosuperiortheuseoftextsmininginthesupporttocorrectionsofdiscursivequestionsinahighereducationinstitution
AT joycevieirafettermann ousodamineracaodetextosnosuporteacorrecoesdequestoesdiscursivasemumainstituicaodeeducacaosuperiortheuseoftextsmininginthesupporttocorrectionsofdiscursivequestionsinahighereducationinstitution