بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی

سالانه، پژوهشگران در حوزه‌های گوناگون علمی یافته‌های پژوهش‌های خود را به‌صورت گزارش‌های فنی یا مقاله‌هایی در مجموعه‌مقالات یا مجله‌ها چاپ می‌کنند. گردآوری این نوع داده توسط موتورهای جست‌وجو و کتابخانه‌های دیجیتال، برای جست‌وجو و دسترسی به نشریه‌های پژوهشی به کار گرفته می‌شود که معمولاً مقاله‌های مرت...

Full description

Bibliographic Details
Main Authors: مریم موسویان, مسعود قیومی
Format: Article
Language:fas
Published: Alzahra University 2024-01-01
Series:زبان پژوهی
Subjects:
Online Access:https://zabanpazhuhi.alzahra.ac.ir/article_7480_ec7601ceb78709f5555ea32a13a9180e.pdf
_version_ 1827341821920935936
author مریم موسویان
مسعود قیومی
author_facet مریم موسویان
مسعود قیومی
author_sort مریم موسویان
collection DOAJ
description سالانه، پژوهشگران در حوزه‌های گوناگون علمی یافته‌های پژوهش‌های خود را به‌صورت گزارش‌های فنی یا مقاله‌هایی در مجموعه‌مقالات یا مجله‌ها چاپ می‌کنند. گردآوری این نوع داده توسط موتورهای جست‌وجو و کتابخانه‌های دیجیتال، برای جست‌وجو و دسترسی به نشریه‌های پژوهشی به کار گرفته می‌شود که معمولاً مقاله‌های مرتبط بر اساس کلیدواژه‌های پرسمان به‌جای موضوعات مقاله بازیابی می‌گردد. در نتیجه، دسته‌بندی دقیق مقاله‌های علمی می‌تواند کیفیت جست‌وجوی کاربران را هنگام جست‌وجوی یک سند علمی در پایگاه‌های اطلاعاتی افزایش دهد. هدف اصلی این مقاله، ارائه یک مدل دسته‌بندی برای تعیین موضوع مقاله‌های علمی است. به این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنی‌شده مقاله‌های فارسی مبتنی‌بر معناشناسی توزیعی بهره می‌برد. بر این اساس، شناسایی حوزۀ خاص هر سند و تعیین دامنۀ آن توسط دانش غنی‌شدة برجسته، دقت دسته‌بندی مقاله‌های علمی را افزایش می‌دهد. برای دست‌یابی به هدف، ما مدل‌های درونه‌یابی بافتی، اعم از ParsBERT  یا XLM-RoBERTa را با موضوع‌های پنهان در مقاله‌ها را برای آموزش یک مدل پرسپترون چندلایه غنی می‌کنیم. بر اساس یافته‌های تجربی، عملکرد کلیParsBERT-NMF-1HT  72/37 درصد (ماکرو) و 75/21 درصد (میکرو) بر اساس معیار-اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<0/05) بود.
first_indexed 2024-03-07T21:55:35Z
format Article
id doaj.art-c1e4cda5e8c042419c6b7d7d6d02ebf6
institution Directory Open Access Journal
issn 2008-8833
2538-1989
language fas
last_indexed 2024-03-07T21:55:35Z
publishDate 2024-01-01
publisher Alzahra University
record_format Article
series زبان پژوهی
spelling doaj.art-c1e4cda5e8c042419c6b7d7d6d02ebf62024-02-24T13:47:41ZfasAlzahra Universityزبان پژوهی2008-88332538-19892024-01-011549316010.22051/jlr.2023.44640.23317480بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمیمریم موسویان0مسعود قیومی1گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه صنعتی امیرکبیر، تهران، ایرانپژوهشکده زبان‌شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایرانسالانه، پژوهشگران در حوزه‌های گوناگون علمی یافته‌های پژوهش‌های خود را به‌صورت گزارش‌های فنی یا مقاله‌هایی در مجموعه‌مقالات یا مجله‌ها چاپ می‌کنند. گردآوری این نوع داده توسط موتورهای جست‌وجو و کتابخانه‌های دیجیتال، برای جست‌وجو و دسترسی به نشریه‌های پژوهشی به کار گرفته می‌شود که معمولاً مقاله‌های مرتبط بر اساس کلیدواژه‌های پرسمان به‌جای موضوعات مقاله بازیابی می‌گردد. در نتیجه، دسته‌بندی دقیق مقاله‌های علمی می‌تواند کیفیت جست‌وجوی کاربران را هنگام جست‌وجوی یک سند علمی در پایگاه‌های اطلاعاتی افزایش دهد. هدف اصلی این مقاله، ارائه یک مدل دسته‌بندی برای تعیین موضوع مقاله‌های علمی است. به این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنی‌شده مقاله‌های فارسی مبتنی‌بر معناشناسی توزیعی بهره می‌برد. بر این اساس، شناسایی حوزۀ خاص هر سند و تعیین دامنۀ آن توسط دانش غنی‌شدة برجسته، دقت دسته‌بندی مقاله‌های علمی را افزایش می‌دهد. برای دست‌یابی به هدف، ما مدل‌های درونه‌یابی بافتی، اعم از ParsBERT  یا XLM-RoBERTa را با موضوع‌های پنهان در مقاله‌ها را برای آموزش یک مدل پرسپترون چندلایه غنی می‌کنیم. بر اساس یافته‌های تجربی، عملکرد کلیParsBERT-NMF-1HT  72/37 درصد (ماکرو) و 75/21 درصد (میکرو) بر اساس معیار-اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<0/05) بود.https://zabanpazhuhi.alzahra.ac.ir/article_7480_ec7601ceb78709f5555ea32a13a9180e.pdfتحلیل محتوایی مقالهبازنمایی بافتیمعناشناسی توزیعیشبکۀ عصبیدسته‌بندی مقالۀ علمیمدل‌سازی موضوع
spellingShingle مریم موسویان
مسعود قیومی
بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
زبان پژوهی
تحلیل محتوایی مقاله
بازنمایی بافتی
معناشناسی توزیعی
شبکۀ عصبی
دسته‌بندی مقالۀ علمی
مدل‌سازی موضوع
title بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
title_full بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
title_fullStr بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
title_full_unstemmed بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
title_short بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
title_sort بازنمایی متن مبتنی‌ بر بافت با استفاده از موضوعات پنهان برای دسته‌بندی مقالات علمی
topic تحلیل محتوایی مقاله
بازنمایی بافتی
معناشناسی توزیعی
شبکۀ عصبی
دسته‌بندی مقالۀ علمی
مدل‌سازی موضوع
url https://zabanpazhuhi.alzahra.ac.ir/article_7480_ec7601ceb78709f5555ea32a13a9180e.pdf
work_keys_str_mv AT mrymmwswyạn bạznmạyymtnmbtnybrbạftbạạstfạdhạzmwḍwʿạtpnhạnbrạydsthbndymqạlạtʿlmy
AT msʿwdqywmy bạznmạyymtnmbtnybrbạftbạạstfạdhạzmwḍwʿạtpnhạnbrạydsthbndymqạlạtʿlmy