ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
هدف: هدف پژوهش حاضر اختصاص یکی از کلاسهای جعل و واقعی به متنهای آزاد میباشد. شبکههای عصبی کانولوشنی به عنوان یکی از مهمترین مدلهای یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد...
Main Authors: | , , , |
---|---|
Format: | Article |
Language: | fas |
Published: |
University of Qom
2021-12-01
|
Series: | علوم و فنون مدیریت اطلاعات |
Subjects: | |
Online Access: | https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdf |
_version_ | 1797945603252027392 |
---|---|
author | وحید متقی مهدی اسماعیلی قاسمعلی بازایی محمدعلی افشارکاظمی |
author_facet | وحید متقی مهدی اسماعیلی قاسمعلی بازایی محمدعلی افشارکاظمی |
author_sort | وحید متقی |
collection | DOAJ |
description | هدف: هدف پژوهش حاضر اختصاص یکی از کلاسهای جعل و واقعی به متنهای آزاد میباشد. شبکههای عصبی کانولوشنی به عنوان یکی از مهمترین مدلهای یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪای از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎی ﺑﺮداری ﺑﻪ ﻣﺎﺗﺮﯾﺲﻫﺎی دو ﺑﻌﺪی ﺗﺒﺪﯾﻞ ﻣﯽﺷود. یکی از محدودیتهای شبکههای کانولوشن این است که در سطح کلمه کار کرده و نمیتواند رابطه و فاصله بین جملات را در نظر بگیرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشکل اساسی در این تحقیق میباشد. در این پژوهش یک مدل پایهای مبتنی بر شبکههای کانولوشنی پیشنهاد شده که در آن اسناد به صورت تنسورهای سه بعدی به شبکه داده میشوند تا بتواند مشکل مذکور را مرتفع نماید. در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم میآورد و به نتایج دقیقتری در تشخیص اخبار جعل دست مییابد.روششناسی: پژوهش حاضر مطالعهای کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمعآوری شده و با عمل پیشپردازش، دادههای اضافی و غیر مفید حذف و پس از برچسب زدن متون پاکسازی شده، متن اخبار جهت رویکرد پیشنهادی با استفاده از نرمافزار پایتون پردازش شدهاند.یافتهها: برخی از الگوریتمهای یادگیری ماشین دارای قدرت بیشتری در مسائل طبقهبندی بودند، ولی با تغییراتی که در ساختار الگوریتم شبکه کانولوشن صورت گرفت، نتایج بهتری نسبت به الگوریتمهای یادگیری ماشین و سایر الگوریتمهای مشابه حاصل شد.نتیجهگیری: در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم میآورد و این مدل پیشنهادی در مقایسه با رویکردهای پیشنهادی در ادبیات، دقت قابل توجهی را بدست آورده است. مدل پیشنهادی بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگیها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحّت بیش از 94 درصد دست یابد. |
first_indexed | 2024-04-10T20:57:45Z |
format | Article |
id | doaj.art-65be7198c32b4c848a8fc250e48a05f4 |
institution | Directory Open Access Journal |
issn | 2476-6658 2476-6534 |
language | fas |
last_indexed | 2024-04-10T20:57:45Z |
publishDate | 2021-12-01 |
publisher | University of Qom |
record_format | Article |
series | علوم و فنون مدیریت اطلاعات |
spelling | doaj.art-65be7198c32b4c848a8fc250e48a05f42023-01-22T18:59:14ZfasUniversity of Qomعلوم و فنون مدیریت اطلاعات2476-66582476-65342021-12-017422125010.22091/stim.2021.7014.15921928ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروسوحید متقی0مهدی اسماعیلی1قاسمعلی بازایی2محمدعلی افشارکاظمی3دانشجوی دکتری، گروه مدیریت فناوری اطلاعات، واحد قشم، دانشگاه آزاد اسلامی، قشم، ایران.استادیار، گروه علوم کامپیوتر، واحد کاشان، دانشگاه آزاد اسلامی، کاشان، ایراناستادیار، گروه مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.دانشیار، گروه مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.هدف: هدف پژوهش حاضر اختصاص یکی از کلاسهای جعل و واقعی به متنهای آزاد میباشد. شبکههای عصبی کانولوشنی به عنوان یکی از مهمترین مدلهای یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪای از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎی ﺑﺮداری ﺑﻪ ﻣﺎﺗﺮﯾﺲﻫﺎی دو ﺑﻌﺪی ﺗﺒﺪﯾﻞ ﻣﯽﺷود. یکی از محدودیتهای شبکههای کانولوشن این است که در سطح کلمه کار کرده و نمیتواند رابطه و فاصله بین جملات را در نظر بگیرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشکل اساسی در این تحقیق میباشد. در این پژوهش یک مدل پایهای مبتنی بر شبکههای کانولوشنی پیشنهاد شده که در آن اسناد به صورت تنسورهای سه بعدی به شبکه داده میشوند تا بتواند مشکل مذکور را مرتفع نماید. در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم میآورد و به نتایج دقیقتری در تشخیص اخبار جعل دست مییابد.روششناسی: پژوهش حاضر مطالعهای کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمعآوری شده و با عمل پیشپردازش، دادههای اضافی و غیر مفید حذف و پس از برچسب زدن متون پاکسازی شده، متن اخبار جهت رویکرد پیشنهادی با استفاده از نرمافزار پایتون پردازش شدهاند.یافتهها: برخی از الگوریتمهای یادگیری ماشین دارای قدرت بیشتری در مسائل طبقهبندی بودند، ولی با تغییراتی که در ساختار الگوریتم شبکه کانولوشن صورت گرفت، نتایج بهتری نسبت به الگوریتمهای یادگیری ماشین و سایر الگوریتمهای مشابه حاصل شد.نتیجهگیری: در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم میآورد و این مدل پیشنهادی در مقایسه با رویکردهای پیشنهادی در ادبیات، دقت قابل توجهی را بدست آورده است. مدل پیشنهادی بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگیها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحّت بیش از 94 درصد دست یابد.https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdfپردازش زبان طبیعیطبقهبندی متنشبکههای عصبی کانولوشنیتنسور سه بعدیاخبار جعلیاخبار فارسیکرونا ویروس |
spellingShingle | وحید متقی مهدی اسماعیلی قاسمعلی بازایی محمدعلی افشارکاظمی ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس علوم و فنون مدیریت اطلاعات پردازش زبان طبیعی طبقهبندی متن شبکههای عصبی کانولوشنی تنسور سه بعدی اخبار جعلی اخبار فارسی کرونا ویروس |
title | ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس |
title_full | ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس |
title_fullStr | ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس |
title_full_unstemmed | ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس |
title_short | ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس |
title_sort | ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی مطالعه موردی اخبار فارسی در حوزه کرونا ویروس |
topic | پردازش زبان طبیعی طبقهبندی متن شبکههای عصبی کانولوشنی تنسور سه بعدی اخبار جعلی اخبار فارسی کرونا ویروس |
url | https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdf |
work_keys_str_mv | AT wḥydmtqy ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws AT mhdyạsmạʿyly ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws AT qạsmʿlybạzạyy ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws AT mḥmdʿlyạfsẖạrḵạẓmy ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws |