Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos

O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e...

Full description

Bibliographic Details
Main Authors: Lucas Maciel Peixoto, Luiz Fernando Afra Brito
Format: Article
Language:English
Published: Programa de Pós-Graduação em Estudos Linguísticos 2015-07-01
Series:Domínios de Lingu@gem
Subjects:
Online Access:http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266
_version_ 1797936486933331968
author Lucas Maciel Peixoto
Luiz Fernando Afra Brito
author_facet Lucas Maciel Peixoto
Luiz Fernando Afra Brito
author_sort Lucas Maciel Peixoto
collection DOAJ
description O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.
first_indexed 2024-04-10T18:31:26Z
format Article
id doaj.art-d8d771bd2d8e4118929d290d1920c316
institution Directory Open Access Journal
issn 1980-5799
language English
last_indexed 2024-04-10T18:31:26Z
publishDate 2015-07-01
publisher Programa de Pós-Graduação em Estudos Linguísticos
record_format Article
series Domínios de Lingu@gem
spelling doaj.art-d8d771bd2d8e4118929d290d1920c3162023-02-02T04:13:35ZengPrograma de Pós-Graduação em Estudos LinguísticosDomínios de Lingu@gem1980-57992015-07-019327529910.14393/DL19-v9n3a2015-1515895Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language VideosLucas Maciel Peixoto0Luiz Fernando Afra Brito1Universidade Federal de UberlândiaUniversidade Federal de UberlândiaO Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266Linguística ComputacionalLinguística de CorpusEnsino de línguas baseado em corporaCompilação de corpusFerramentas de corpora on-line
spellingShingle Lucas Maciel Peixoto
Luiz Fernando Afra Brito
Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
Domínios de Lingu@gem
Linguística Computacional
Linguística de Corpus
Ensino de línguas baseado em corpora
Compilação de corpus
Ferramentas de corpora on-line
title Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_full Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_fullStr Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_full_unstemmed Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_short Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
title_sort procedimentos para compilacao de um corpus composto por legendas e construcao de uma ferramenta de corpus on line o corpus of english language videos
topic Linguística Computacional
Linguística de Corpus
Ensino de línguas baseado em corpora
Compilação de corpus
Ferramentas de corpora on-line
url http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266
work_keys_str_mv AT lucasmacielpeixoto procedimentosparacompilacaodeumcorpuscompostoporlegendaseconstrucaodeumaferramentadecorpusonlineocorpusofenglishlanguagevideos
AT luizfernandoafrabrito procedimentosparacompilacaodeumcorpuscompostoporlegendaseconstrucaodeumaferramentadecorpusonlineocorpusofenglishlanguagevideos