معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی

شناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP < /span>) به ویژه در زبان‌‌های کم‌منبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی م...

Full description

Bibliographic Details
Main Authors: زینب رحیمی, مهرنوش شمس فرد
Format: Article
Language:fas
Published: Iranian Research Institute for Information and Technology 2022-12-01
Series:Iranian Journal of Information Processing & Management
Subjects:
Online Access:https://jipm.irandoc.ac.ir/article_698606_4c58053c3d35e58b97f33743b4410d44.pdf
_version_ 1811164679400062976
author زینب رحیمی
مهرنوش شمس فرد
author_facet زینب رحیمی
مهرنوش شمس فرد
author_sort زینب رحیمی
collection DOAJ
description شناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP < /span>) به ویژه در زبان‌‌های کم‌منبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی معرفی می‌شود. این مجموعه شامل 4446 جمله (مستخرج از پیکره بیجن خان و متن یکسری کتاب) و 5128 رابطه علّی است و در صورت وجود، سه برچسب علت، معلول و نشانه علّی برای هر رابطه مشخص شده است. ما از این پیکره برای آموزش سیستمی برای تشخیص مرزهای عناصر علّی استفاده کردیم. همچنین، یک بستر آزمون شناسایی علّیت را با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه می‌کنیم. ارزیابی‌های عملکرد نشان می‌دهد که بهترین نتیجه کلی از طریق طبقه‌بندی کننده CRF به دست می‌آید که معیار F برابر 76% را ارائه می‌کند. علاوه بر این، بهترین صحت (91.4٪) در روش یادگیری عمیق BiLSTM-CRF به دست آمده است. به نظر می‌رسد وجود CRF به دلیل مدلسازی بافتار منجر به بهبود دقت سیستم می‌شود.
first_indexed 2024-04-10T15:25:20Z
format Article
id doaj.art-ec324891040d43bbbf91790089f8f97a
institution Directory Open Access Journal
issn 2251-8223
2251-8231
language fas
last_indexed 2024-04-10T15:25:20Z
publishDate 2022-12-01
publisher Iranian Research Institute for Information and Technology
record_format Article
series Iranian Journal of Information Processing & Management
spelling doaj.art-ec324891040d43bbbf91790089f8f97a2023-02-14T09:29:55ZfasIranian Research Institute for Information and TechnologyIranian Journal of Information Processing & Management2251-82232251-82312022-12-0138227330310.35050/JIPM010.2022.036698606معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسیزینب رحیمی0مهرنوش شمس فرد1آزمایشگاه پردازش زبان طبیعی، دانشگاه شهید بهشتی، تهران، ایرانآزمایشگاه پردازش زبان طبیعی، دانشگاه شهید بهشتی، تهران، ایرانشناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP < /span>) به ویژه در زبان‌‌های کم‌منبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی معرفی می‌شود. این مجموعه شامل 4446 جمله (مستخرج از پیکره بیجن خان و متن یکسری کتاب) و 5128 رابطه علّی است و در صورت وجود، سه برچسب علت، معلول و نشانه علّی برای هر رابطه مشخص شده است. ما از این پیکره برای آموزش سیستمی برای تشخیص مرزهای عناصر علّی استفاده کردیم. همچنین، یک بستر آزمون شناسایی علّیت را با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه می‌کنیم. ارزیابی‌های عملکرد نشان می‌دهد که بهترین نتیجه کلی از طریق طبقه‌بندی کننده CRF به دست می‌آید که معیار F برابر 76% را ارائه می‌کند. علاوه بر این، بهترین صحت (91.4٪) در روش یادگیری عمیق BiLSTM-CRF به دست آمده است. به نظر می‌رسد وجود CRF به دلیل مدلسازی بافتار منجر به بهبود دقت سیستم می‌شود.https://jipm.irandoc.ac.ir/article_698606_4c58053c3d35e58b97f33743b4410d44.pdfpercauseشناسایی عبارات عّلیcrfیادگیری عمیق
spellingShingle زینب رحیمی
مهرنوش شمس فرد
معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
Iranian Journal of Information Processing & Management
percause
شناسایی عبارات عّلی
crf
یادگیری عمیق
title معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
title_full معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
title_fullStr معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
title_full_unstemmed معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
title_short معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
title_sort معرفی و آزمون پیکره علیت percause برای شناسایی روابط علّی فارسی
topic percause
شناسایی عبارات عّلی
crf
یادگیری عمیق
url https://jipm.irandoc.ac.ir/article_698606_4c58053c3d35e58b97f33743b4410d44.pdf
work_keys_str_mv AT zynbrḥymy mʿrfywậzmwnpyḵrhʿlytpercausebrạysẖnạsạyyrwạbṭʿlyfạrsy
AT mhrnwsẖsẖmsfrd mʿrfywậzmwnpyḵrhʿlytpercausebrạysẖnạsạyyrwạbṭʿlyfạrsy