معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی
شناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP < /span>) به ویژه در زبانهای کممنبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی م...
Main Authors: | , |
---|---|
Format: | Article |
Language: | fas |
Published: |
Iranian Research Institute for Information and Technology
2022-12-01
|
Series: | Iranian Journal of Information Processing & Management |
Subjects: | |
Online Access: | https://jipm.irandoc.ac.ir/article_698606_4c58053c3d35e58b97f33743b4410d44.pdf |
_version_ | 1811164679400062976 |
---|---|
author | زینب رحیمی مهرنوش شمس فرد |
author_facet | زینب رحیمی مهرنوش شمس فرد |
author_sort | زینب رحیمی |
collection | DOAJ |
description | شناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP < /span>) به ویژه در زبانهای کممنبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی معرفی میشود. این مجموعه شامل 4446 جمله (مستخرج از پیکره بیجن خان و متن یکسری کتاب) و 5128 رابطه علّی است و در صورت وجود، سه برچسب علت، معلول و نشانه علّی برای هر رابطه مشخص شده است. ما از این پیکره برای آموزش سیستمی برای تشخیص مرزهای عناصر علّی استفاده کردیم. همچنین، یک بستر آزمون شناسایی علّیت را با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه میکنیم. ارزیابیهای عملکرد نشان میدهد که بهترین نتیجه کلی از طریق طبقهبندی کننده CRF به دست میآید که معیار F برابر 76% را ارائه میکند. علاوه بر این، بهترین صحت (91.4٪) در روش یادگیری عمیق BiLSTM-CRF به دست آمده است. به نظر میرسد وجود CRF به دلیل مدلسازی بافتار منجر به بهبود دقت سیستم میشود. |
first_indexed | 2024-04-10T15:25:20Z |
format | Article |
id | doaj.art-ec324891040d43bbbf91790089f8f97a |
institution | Directory Open Access Journal |
issn | 2251-8223 2251-8231 |
language | fas |
last_indexed | 2024-04-10T15:25:20Z |
publishDate | 2022-12-01 |
publisher | Iranian Research Institute for Information and Technology |
record_format | Article |
series | Iranian Journal of Information Processing & Management |
spelling | doaj.art-ec324891040d43bbbf91790089f8f97a2023-02-14T09:29:55ZfasIranian Research Institute for Information and TechnologyIranian Journal of Information Processing & Management2251-82232251-82312022-12-0138227330310.35050/JIPM010.2022.036698606معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسیزینب رحیمی0مهرنوش شمس فرد1آزمایشگاه پردازش زبان طبیعی، دانشگاه شهید بهشتی، تهران، ایرانآزمایشگاه پردازش زبان طبیعی، دانشگاه شهید بهشتی، تهران، ایرانشناسایی روابط علّی و همچنین تعیین مرز عناصر علّی در متن، از جمله مسائل چالش برانگیز در پردازش زبان طبیعی (NLP < /span>) به ویژه در زبانهای کممنبع مانند فارسی است. در این پژوهش، در راستای آموزش سیستمی برای شناسایی روابط علّی و مرز عناصر آن، یک پیکره علّیت برچسب خورده انسانی برای زبان فارسی معرفی میشود. این مجموعه شامل 4446 جمله (مستخرج از پیکره بیجن خان و متن یکسری کتاب) و 5128 رابطه علّی است و در صورت وجود، سه برچسب علت، معلول و نشانه علّی برای هر رابطه مشخص شده است. ما از این پیکره برای آموزش سیستمی برای تشخیص مرزهای عناصر علّی استفاده کردیم. همچنین، یک بستر آزمون شناسایی علّیت را با سه روش یادگیری ماشین و دو سیستم یادگیری عمیق مبتنی بر این پیکره ارائه میکنیم. ارزیابیهای عملکرد نشان میدهد که بهترین نتیجه کلی از طریق طبقهبندی کننده CRF به دست میآید که معیار F برابر 76% را ارائه میکند. علاوه بر این، بهترین صحت (91.4٪) در روش یادگیری عمیق BiLSTM-CRF به دست آمده است. به نظر میرسد وجود CRF به دلیل مدلسازی بافتار منجر به بهبود دقت سیستم میشود.https://jipm.irandoc.ac.ir/article_698606_4c58053c3d35e58b97f33743b4410d44.pdfpercauseشناسایی عبارات عّلیcrfیادگیری عمیق |
spellingShingle | زینب رحیمی مهرنوش شمس فرد معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی Iranian Journal of Information Processing & Management percause شناسایی عبارات عّلی crf یادگیری عمیق |
title | معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی |
title_full | معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی |
title_fullStr | معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی |
title_full_unstemmed | معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی |
title_short | معرفی و آزمون پیکره علیت PerCause برای شناسایی روابط علّی فارسی |
title_sort | معرفی و آزمون پیکره علیت percause برای شناسایی روابط علّی فارسی |
topic | percause شناسایی عبارات عّلی crf یادگیری عمیق |
url | https://jipm.irandoc.ac.ir/article_698606_4c58053c3d35e58b97f33743b4410d44.pdf |
work_keys_str_mv | AT zynbrḥymy mʿrfywậzmwnpyḵrhʿlytpercausebrạysẖnạsạyyrwạbṭʿlyfạrsy AT mhrnwsẖsẖmsfrd mʿrfywậzmwnpyḵrhʿlytpercausebrạysẖnạsạyyrwạbṭʿlyfạrsy |