Holistic corpus-based dialectology Dialetologia holística baseada em corpus

This paper is concerned with sketching future directions for corpus-based dialectology. We advocate a holistic approach to the study of geographically conditioned linguistic variability, and we present a suitable methodology, 'corpusbased dialectometry', in exactly this spirit. Specificall...

Full description

Bibliographic Details
Main Authors: Benedikt Szmrecsanyi, Christoph Wolk
Format: Article
Language:English
Published: Universidade Federal de Minas Gerais 2011-01-01
Series:Revista Brasileira de Linguística Aplicada
Subjects:
Online Access:http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1984-63982011000200011
_version_ 1818129279961006080
author Benedikt Szmrecsanyi
Christoph Wolk
author_facet Benedikt Szmrecsanyi
Christoph Wolk
author_sort Benedikt Szmrecsanyi
collection DOAJ
description This paper is concerned with sketching future directions for corpus-based dialectology. We advocate a holistic approach to the study of geographically conditioned linguistic variability, and we present a suitable methodology, 'corpusbased dialectometry', in exactly this spirit. Specifically, we argue that in order to live up to the potential of the corpus-based method, practitioners need to (i) abandon their exclusive focus on individual linguistic features in favor of the study of feature aggregates, (ii) draw on computationally advanced multivariate analysis techniques (such as multidimensional scaling, cluster analysis, and principal component analysis), and (iii) aid interpretation of empirical results by marshalling state-of-the-art data visualization techniques. To exemplify this line of analysis, we present a case study which explores joint frequency variability of 57 morphosyntax features in 34 dialects all over Great Britain.<br>Este artigo debruça-se sobre o esboço propositivo de futuras direções para a dialetologia baseada em corpus. Defendemos uma abordagem holística para o estudo da variabilidade linguística geograficamente condicionada, e apresentamos uma metodologia adequada para tal - a dialetometria baseada em corpus. Mais especificamente, defendemos que para que se obtenham todos os resultados esperados da metodologia de corpus, pesquisadores devem: (i) abandonar seu foco exclusivo em traços linguísticos individuais em favor do estudo dos agregados de traços, (ii) amparar-se em métodos computacionais avançados de técnicas de análise multivariada (tais como escalagem multidimensional, análise de clusters, e análise de componente principal), e (iii) auxiliar a interpretação de resultados empíricos através da utilização do estado da arte em técnicas de visualização. A fim de exemplificarmos essa linha de análise, apresentamos um estudo de caso que explora a variabilidade da frequência agregada de 57 traços morfossintáticos de 34 dialetos da Grã-Bretanha.
first_indexed 2024-12-11T07:46:38Z
format Article
id doaj.art-06c420f4653a42179fa857efef5b4f38
institution Directory Open Access Journal
issn 1676-0786
1984-6398
language English
last_indexed 2024-12-11T07:46:38Z
publishDate 2011-01-01
publisher Universidade Federal de Minas Gerais
record_format Article
series Revista Brasileira de Linguística Aplicada
spelling doaj.art-06c420f4653a42179fa857efef5b4f382022-12-22T01:15:26ZengUniversidade Federal de Minas GeraisRevista Brasileira de Linguística Aplicada1676-07861984-63982011-01-0111256159210.1590/S1984-63982011000200011Holistic corpus-based dialectology Dialetologia holística baseada em corpusBenedikt SzmrecsanyiChristoph WolkThis paper is concerned with sketching future directions for corpus-based dialectology. We advocate a holistic approach to the study of geographically conditioned linguistic variability, and we present a suitable methodology, 'corpusbased dialectometry', in exactly this spirit. Specifically, we argue that in order to live up to the potential of the corpus-based method, practitioners need to (i) abandon their exclusive focus on individual linguistic features in favor of the study of feature aggregates, (ii) draw on computationally advanced multivariate analysis techniques (such as multidimensional scaling, cluster analysis, and principal component analysis), and (iii) aid interpretation of empirical results by marshalling state-of-the-art data visualization techniques. To exemplify this line of analysis, we present a case study which explores joint frequency variability of 57 morphosyntax features in 34 dialects all over Great Britain.<br>Este artigo debruça-se sobre o esboço propositivo de futuras direções para a dialetologia baseada em corpus. Defendemos uma abordagem holística para o estudo da variabilidade linguística geograficamente condicionada, e apresentamos uma metodologia adequada para tal - a dialetometria baseada em corpus. Mais especificamente, defendemos que para que se obtenham todos os resultados esperados da metodologia de corpus, pesquisadores devem: (i) abandonar seu foco exclusivo em traços linguísticos individuais em favor do estudo dos agregados de traços, (ii) amparar-se em métodos computacionais avançados de técnicas de análise multivariada (tais como escalagem multidimensional, análise de clusters, e análise de componente principal), e (iii) auxiliar a interpretação de resultados empíricos através da utilização do estado da arte em técnicas de visualização. A fim de exemplificarmos essa linha de análise, apresentamos um estudo de caso que explora a variabilidade da frequência agregada de 57 traços morfossintáticos de 34 dialetos da Grã-Bretanha.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1984-63982011000200011dialetologia baseada em corpusabordagem holísticadialetometria baseada em corpusagregados de traçosanálise multivariadatécnicas de visualizaçãocorpus-based dialectologyholistic approachcorpus-based dialectometryfeature aggregatesmultivariate analysisvisualization techniques
spellingShingle Benedikt Szmrecsanyi
Christoph Wolk
Holistic corpus-based dialectology Dialetologia holística baseada em corpus
Revista Brasileira de Linguística Aplicada
dialetologia baseada em corpus
abordagem holística
dialetometria baseada em corpus
agregados de traços
análise multivariada
técnicas de visualização
corpus-based dialectology
holistic approach
corpus-based dialectometry
feature aggregates
multivariate analysis
visualization techniques
title Holistic corpus-based dialectology Dialetologia holística baseada em corpus
title_full Holistic corpus-based dialectology Dialetologia holística baseada em corpus
title_fullStr Holistic corpus-based dialectology Dialetologia holística baseada em corpus
title_full_unstemmed Holistic corpus-based dialectology Dialetologia holística baseada em corpus
title_short Holistic corpus-based dialectology Dialetologia holística baseada em corpus
title_sort holistic corpus based dialectology dialetologia holistica baseada em corpus
topic dialetologia baseada em corpus
abordagem holística
dialetometria baseada em corpus
agregados de traços
análise multivariada
técnicas de visualização
corpus-based dialectology
holistic approach
corpus-based dialectometry
feature aggregates
multivariate analysis
visualization techniques
url http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1984-63982011000200011
work_keys_str_mv AT benediktszmrecsanyi holisticcorpusbaseddialectologydialetologiaholisticabaseadaemcorpus
AT christophwolk holisticcorpusbaseddialectologydialetologiaholisticabaseadaemcorpus