Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos
O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Programa de Pós-Graduação em Estudos Linguísticos
2015-07-01
|
Series: | Domínios de Lingu@gem |
Subjects: | |
Online Access: | http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266 |
_version_ | 1797936486933331968 |
---|---|
author | Lucas Maciel Peixoto Luiz Fernando Afra Brito |
author_facet | Lucas Maciel Peixoto Luiz Fernando Afra Brito |
author_sort | Lucas Maciel Peixoto |
collection | DOAJ |
description | O Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores. |
first_indexed | 2024-04-10T18:31:26Z |
format | Article |
id | doaj.art-d8d771bd2d8e4118929d290d1920c316 |
institution | Directory Open Access Journal |
issn | 1980-5799 |
language | English |
last_indexed | 2024-04-10T18:31:26Z |
publishDate | 2015-07-01 |
publisher | Programa de Pós-Graduação em Estudos Linguísticos |
record_format | Article |
series | Domínios de Lingu@gem |
spelling | doaj.art-d8d771bd2d8e4118929d290d1920c3162023-02-02T04:13:35ZengPrograma de Pós-Graduação em Estudos LinguísticosDomínios de Lingu@gem1980-57992015-07-019327529910.14393/DL19-v9n3a2015-1515895Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language VideosLucas Maciel Peixoto0Luiz Fernando Afra Brito1Universidade Federal de UberlândiaUniversidade Federal de UberlândiaO Corpus of English Language Videos (CELV) é composto por legendas de vídeos em inglês do YouTube, e tem como objetivo servir como recurso didático para o ensino e aprendizagem da língua por meio de uma ferramenta de busca disponibilizada on-line. Este texto apresenta os procedimentos linguísticos e computacionais que foram realizados para o desenvolvimento do CELV, desde a coleta de textos até a construção da ferramenta. Buscou-se embasamento teórico-metodológico na Linguística Computacional e áreas relacionadas, como a Linguística de Corpus, o Processamento de Linguagem Natural e a Recuperação de Informação. Espera-se que a metodologia exposta no texto possua detalhes suficientes para demonstrar as etapas mais importantes na construção desse tipo de sistema, permitindo a replicação do processo por outros pesquisadores.http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266Linguística ComputacionalLinguística de CorpusEnsino de línguas baseado em corporaCompilação de corpusFerramentas de corpora on-line |
spellingShingle | Lucas Maciel Peixoto Luiz Fernando Afra Brito Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos Domínios de Lingu@gem Linguística Computacional Linguística de Corpus Ensino de línguas baseado em corpora Compilação de corpus Ferramentas de corpora on-line |
title | Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos |
title_full | Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos |
title_fullStr | Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos |
title_full_unstemmed | Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos |
title_short | Procedimentos para compilação de um corpus composto por legendas e construção de uma ferramenta de corpus on-line: o Corpus of English Language Videos |
title_sort | procedimentos para compilacao de um corpus composto por legendas e construcao de uma ferramenta de corpus on line o corpus of english language videos |
topic | Linguística Computacional Linguística de Corpus Ensino de línguas baseado em corpora Compilação de corpus Ferramentas de corpora on-line |
url | http://www.seer.ufu.br/index.php/dominiosdelinguagem/article/view/29266 |
work_keys_str_mv | AT lucasmacielpeixoto procedimentosparacompilacaodeumcorpuscompostoporlegendaseconstrucaodeumaferramentadecorpusonlineocorpusofenglishlanguagevideos AT luizfernandoafrabrito procedimentosparacompilacaodeumcorpuscompostoporlegendaseconstrucaodeumaferramentadecorpusonlineocorpusofenglishlanguagevideos |