Holistic corpus-based dialectology Dialetologia holística baseada em corpus
This paper is concerned with sketching future directions for corpus-based dialectology. We advocate a holistic approach to the study of geographically conditioned linguistic variability, and we present a suitable methodology, 'corpusbased dialectometry', in exactly this spirit. Specificall...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidade Federal de Minas Gerais
2011-01-01
|
Series: | Revista Brasileira de Linguística Aplicada |
Subjects: | |
Online Access: | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1984-63982011000200011 |
_version_ | 1818129279961006080 |
---|---|
author | Benedikt Szmrecsanyi Christoph Wolk |
author_facet | Benedikt Szmrecsanyi Christoph Wolk |
author_sort | Benedikt Szmrecsanyi |
collection | DOAJ |
description | This paper is concerned with sketching future directions for corpus-based dialectology. We advocate a holistic approach to the study of geographically conditioned linguistic variability, and we present a suitable methodology, 'corpusbased dialectometry', in exactly this spirit. Specifically, we argue that in order to live up to the potential of the corpus-based method, practitioners need to (i) abandon their exclusive focus on individual linguistic features in favor of the study of feature aggregates, (ii) draw on computationally advanced multivariate analysis techniques (such as multidimensional scaling, cluster analysis, and principal component analysis), and (iii) aid interpretation of empirical results by marshalling state-of-the-art data visualization techniques. To exemplify this line of analysis, we present a case study which explores joint frequency variability of 57 morphosyntax features in 34 dialects all over Great Britain.<br>Este artigo debruça-se sobre o esboço propositivo de futuras direções para a dialetologia baseada em corpus. Defendemos uma abordagem holística para o estudo da variabilidade linguística geograficamente condicionada, e apresentamos uma metodologia adequada para tal - a dialetometria baseada em corpus. Mais especificamente, defendemos que para que se obtenham todos os resultados esperados da metodologia de corpus, pesquisadores devem: (i) abandonar seu foco exclusivo em traços linguísticos individuais em favor do estudo dos agregados de traços, (ii) amparar-se em métodos computacionais avançados de técnicas de análise multivariada (tais como escalagem multidimensional, análise de clusters, e análise de componente principal), e (iii) auxiliar a interpretação de resultados empíricos através da utilização do estado da arte em técnicas de visualização. A fim de exemplificarmos essa linha de análise, apresentamos um estudo de caso que explora a variabilidade da frequência agregada de 57 traços morfossintáticos de 34 dialetos da Grã-Bretanha. |
first_indexed | 2024-12-11T07:46:38Z |
format | Article |
id | doaj.art-06c420f4653a42179fa857efef5b4f38 |
institution | Directory Open Access Journal |
issn | 1676-0786 1984-6398 |
language | English |
last_indexed | 2024-12-11T07:46:38Z |
publishDate | 2011-01-01 |
publisher | Universidade Federal de Minas Gerais |
record_format | Article |
series | Revista Brasileira de Linguística Aplicada |
spelling | doaj.art-06c420f4653a42179fa857efef5b4f382022-12-22T01:15:26ZengUniversidade Federal de Minas GeraisRevista Brasileira de Linguística Aplicada1676-07861984-63982011-01-0111256159210.1590/S1984-63982011000200011Holistic corpus-based dialectology Dialetologia holística baseada em corpusBenedikt SzmrecsanyiChristoph WolkThis paper is concerned with sketching future directions for corpus-based dialectology. We advocate a holistic approach to the study of geographically conditioned linguistic variability, and we present a suitable methodology, 'corpusbased dialectometry', in exactly this spirit. Specifically, we argue that in order to live up to the potential of the corpus-based method, practitioners need to (i) abandon their exclusive focus on individual linguistic features in favor of the study of feature aggregates, (ii) draw on computationally advanced multivariate analysis techniques (such as multidimensional scaling, cluster analysis, and principal component analysis), and (iii) aid interpretation of empirical results by marshalling state-of-the-art data visualization techniques. To exemplify this line of analysis, we present a case study which explores joint frequency variability of 57 morphosyntax features in 34 dialects all over Great Britain.<br>Este artigo debruça-se sobre o esboço propositivo de futuras direções para a dialetologia baseada em corpus. Defendemos uma abordagem holística para o estudo da variabilidade linguística geograficamente condicionada, e apresentamos uma metodologia adequada para tal - a dialetometria baseada em corpus. Mais especificamente, defendemos que para que se obtenham todos os resultados esperados da metodologia de corpus, pesquisadores devem: (i) abandonar seu foco exclusivo em traços linguísticos individuais em favor do estudo dos agregados de traços, (ii) amparar-se em métodos computacionais avançados de técnicas de análise multivariada (tais como escalagem multidimensional, análise de clusters, e análise de componente principal), e (iii) auxiliar a interpretação de resultados empíricos através da utilização do estado da arte em técnicas de visualização. A fim de exemplificarmos essa linha de análise, apresentamos um estudo de caso que explora a variabilidade da frequência agregada de 57 traços morfossintáticos de 34 dialetos da Grã-Bretanha.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1984-63982011000200011dialetologia baseada em corpusabordagem holísticadialetometria baseada em corpusagregados de traçosanálise multivariadatécnicas de visualizaçãocorpus-based dialectologyholistic approachcorpus-based dialectometryfeature aggregatesmultivariate analysisvisualization techniques |
spellingShingle | Benedikt Szmrecsanyi Christoph Wolk Holistic corpus-based dialectology Dialetologia holística baseada em corpus Revista Brasileira de Linguística Aplicada dialetologia baseada em corpus abordagem holística dialetometria baseada em corpus agregados de traços análise multivariada técnicas de visualização corpus-based dialectology holistic approach corpus-based dialectometry feature aggregates multivariate analysis visualization techniques |
title | Holistic corpus-based dialectology Dialetologia holística baseada em corpus |
title_full | Holistic corpus-based dialectology Dialetologia holística baseada em corpus |
title_fullStr | Holistic corpus-based dialectology Dialetologia holística baseada em corpus |
title_full_unstemmed | Holistic corpus-based dialectology Dialetologia holística baseada em corpus |
title_short | Holistic corpus-based dialectology Dialetologia holística baseada em corpus |
title_sort | holistic corpus based dialectology dialetologia holistica baseada em corpus |
topic | dialetologia baseada em corpus abordagem holística dialetometria baseada em corpus agregados de traços análise multivariada técnicas de visualização corpus-based dialectology holistic approach corpus-based dialectometry feature aggregates multivariate analysis visualization techniques |
url | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S1984-63982011000200011 |
work_keys_str_mv | AT benediktszmrecsanyi holisticcorpusbaseddialectologydialetologiaholisticabaseadaemcorpus AT christophwolk holisticcorpusbaseddialectologydialetologiaholisticabaseadaemcorpus |