Summary: | Одним із новітніх напрямів прикладного мовознавства є корпусна лінгвістика, яка займається побудовою, обробленням та експлуатацією текстових корпусів. На сьогодні якісний аналіз величезних масивів емпіричного мовного матеріалу, що надає в розпорядження лінгвіста корпус, неможливо здійснити без залучення комп’ютерних технологій і відповідних статистичних методів. Відтак навчання майбутніх філологів ефективно застосовувати прикладні статистичні програми є важливим етапом наукової підготовки спеціалістів цього напряму. Запропонована стаття розкриває можливості використання однієї з найпоширеніших у західній лінгвістиці, але маловідомої в Україні, статистичної системи аналізу даних – програмного комплексу R – у дослідженнях майбутніх філологів. У роботі розкриваються переваги й недоліки цього продукту порівняно з іншими подібними програмними пакетами (SPSS і Statistica), а також надаються посилання на матеріали в мережі Internet для самостійного опанування зазначеним програмним засобом. Гнучкість й ефективність застосування програмного комплексу R для розв’язання мовознавчих завдань продемонстровано на прикладі статистичного аналізу вживання маркерів зменшення категоричності у корпусі американського академічного мовлення. Для правильного розуміння філологами-початківцями особливостей проведення лінгвостатистичного експерименту в R наведено детальний опис кожного етапу здійсненого дослідження. Статистична верифікація вживання маркерів зменшення категоричності висловлення в мовленні студентів і викладачів була здійснена з використанням таких статистичних методів як -критерій Колмогорова-Смірнова та U-критерій Манна-Уітні. У статті наводяться розроблені алгоритми для проведення розрахунків за допомогою зазначених критеріїв із використанням вбудованих команд і різних спеціалізованих бібліотечних функцій R, створених співтовариством користувачів для розширення функціональності зазначеного програмного комплексу. Кожен скрипт, написаний на R для проведення статистичних розрахунків, супроводжується детальним описом та характеристикою отриманих результатів обчислень. Серед перспектив подальших досліджень з окресленої проблематики необхідно звернути увагу на реалізацію низки заходів, спрямованих на підвищення обізнаності майбутніх спеціалістів із статистичною системою аналізу даних і навчання їх роботи з R, що є важливим для фахового зростання майбутнього науковця-філолога.
|