بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی
سالانه، پژوهشگران در حوزههای گوناگون علمی یافتههای پژوهشهای خود را بهصورت گزارشهای فنی یا مقالههایی در مجموعهمقالات یا مجلهها چاپ میکنند. گردآوری این نوع داده توسط موتورهای جستوجو و کتابخانههای دیجیتال، برای جستوجو و دسترسی به نشریههای پژوهشی به کار گرفته میشود که معمولاً مقالههای مرت...
Main Authors: | , |
---|---|
Format: | Article |
Language: | fas |
Published: |
Alzahra University
2024-01-01
|
Series: | زبان پژوهی |
Subjects: | |
Online Access: | https://zabanpazhuhi.alzahra.ac.ir/article_7480_ec7601ceb78709f5555ea32a13a9180e.pdf |
_version_ | 1827341821920935936 |
---|---|
author | مریم موسویان مسعود قیومی |
author_facet | مریم موسویان مسعود قیومی |
author_sort | مریم موسویان |
collection | DOAJ |
description | سالانه، پژوهشگران در حوزههای گوناگون علمی یافتههای پژوهشهای خود را بهصورت گزارشهای فنی یا مقالههایی در مجموعهمقالات یا مجلهها چاپ میکنند. گردآوری این نوع داده توسط موتورهای جستوجو و کتابخانههای دیجیتال، برای جستوجو و دسترسی به نشریههای پژوهشی به کار گرفته میشود که معمولاً مقالههای مرتبط بر اساس کلیدواژههای پرسمان بهجای موضوعات مقاله بازیابی میگردد. در نتیجه، دستهبندی دقیق مقالههای علمی میتواند کیفیت جستوجوی کاربران را هنگام جستوجوی یک سند علمی در پایگاههای اطلاعاتی افزایش دهد. هدف اصلی این مقاله، ارائه یک مدل دستهبندی برای تعیین موضوع مقالههای علمی است. به این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنیشده مقالههای فارسی مبتنیبر معناشناسی توزیعی بهره میبرد. بر این اساس، شناسایی حوزۀ خاص هر سند و تعیین دامنۀ آن توسط دانش غنیشدة برجسته، دقت دستهبندی مقالههای علمی را افزایش میدهد. برای دستیابی به هدف، ما مدلهای درونهیابی بافتی، اعم از ParsBERT یا XLM-RoBERTa را با موضوعهای پنهان در مقالهها را برای آموزش یک مدل پرسپترون چندلایه غنی میکنیم. بر اساس یافتههای تجربی، عملکرد کلیParsBERT-NMF-1HT 72/37 درصد (ماکرو) و 75/21 درصد (میکرو) بر اساس معیار-اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<0/05) بود. |
first_indexed | 2024-03-07T21:55:35Z |
format | Article |
id | doaj.art-c1e4cda5e8c042419c6b7d7d6d02ebf6 |
institution | Directory Open Access Journal |
issn | 2008-8833 2538-1989 |
language | fas |
last_indexed | 2024-03-07T21:55:35Z |
publishDate | 2024-01-01 |
publisher | Alzahra University |
record_format | Article |
series | زبان پژوهی |
spelling | doaj.art-c1e4cda5e8c042419c6b7d7d6d02ebf62024-02-24T13:47:41ZfasAlzahra Universityزبان پژوهی2008-88332538-19892024-01-011549316010.22051/jlr.2023.44640.23317480بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمیمریم موسویان0مسعود قیومی1گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه صنعتی امیرکبیر، تهران، ایرانپژوهشکده زبانشناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی، تهران، ایرانسالانه، پژوهشگران در حوزههای گوناگون علمی یافتههای پژوهشهای خود را بهصورت گزارشهای فنی یا مقالههایی در مجموعهمقالات یا مجلهها چاپ میکنند. گردآوری این نوع داده توسط موتورهای جستوجو و کتابخانههای دیجیتال، برای جستوجو و دسترسی به نشریههای پژوهشی به کار گرفته میشود که معمولاً مقالههای مرتبط بر اساس کلیدواژههای پرسمان بهجای موضوعات مقاله بازیابی میگردد. در نتیجه، دستهبندی دقیق مقالههای علمی میتواند کیفیت جستوجوی کاربران را هنگام جستوجوی یک سند علمی در پایگاههای اطلاعاتی افزایش دهد. هدف اصلی این مقاله، ارائه یک مدل دستهبندی برای تعیین موضوع مقالههای علمی است. به این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنیشده مقالههای فارسی مبتنیبر معناشناسی توزیعی بهره میبرد. بر این اساس، شناسایی حوزۀ خاص هر سند و تعیین دامنۀ آن توسط دانش غنیشدة برجسته، دقت دستهبندی مقالههای علمی را افزایش میدهد. برای دستیابی به هدف، ما مدلهای درونهیابی بافتی، اعم از ParsBERT یا XLM-RoBERTa را با موضوعهای پنهان در مقالهها را برای آموزش یک مدل پرسپترون چندلایه غنی میکنیم. بر اساس یافتههای تجربی، عملکرد کلیParsBERT-NMF-1HT 72/37 درصد (ماکرو) و 75/21 درصد (میکرو) بر اساس معیار-اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<0/05) بود.https://zabanpazhuhi.alzahra.ac.ir/article_7480_ec7601ceb78709f5555ea32a13a9180e.pdfتحلیل محتوایی مقالهبازنمایی بافتیمعناشناسی توزیعیشبکۀ عصبیدستهبندی مقالۀ علمیمدلسازی موضوع |
spellingShingle | مریم موسویان مسعود قیومی بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی زبان پژوهی تحلیل محتوایی مقاله بازنمایی بافتی معناشناسی توزیعی شبکۀ عصبی دستهبندی مقالۀ علمی مدلسازی موضوع |
title | بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی |
title_full | بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی |
title_fullStr | بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی |
title_full_unstemmed | بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی |
title_short | بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی |
title_sort | بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دستهبندی مقالات علمی |
topic | تحلیل محتوایی مقاله بازنمایی بافتی معناشناسی توزیعی شبکۀ عصبی دستهبندی مقالۀ علمی مدلسازی موضوع |
url | https://zabanpazhuhi.alzahra.ac.ir/article_7480_ec7601ceb78709f5555ea32a13a9180e.pdf |
work_keys_str_mv | AT mrymmwswyạn bạznmạyymtnmbtnybrbạftbạạstfạdhạzmwḍwʿạtpnhạnbrạydsthbndymqạlạtʿlmy AT msʿwdqywmy bạznmạyymtnmbtnybrbạftbạạstfạdhạzmwḍwʿạtpnhạnbrạydsthbndymqạlạtʿlmy |