ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس

هدف: هدف پژوهش حاضر اختصاص یکی از کلاس‌‌های جعل و واقعی به متن‌‌های آزاد می‌باشد. شبکه‌‌های عصبی کانولوشنی به عنوان یکی از مهم‌‌ترین مدل‌‌های یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد...

Full description

Bibliographic Details
Main Authors:	وحید متقی, مهدی اسماعیلی, قاسمعلی بازایی, محمدعلی افشارکاظمی
Format:	Article
Language:	fas
Published:	University of Qom 2021-12-01
Series:	علوم و فنون مدیریت اطلاعات
Subjects:	پردازش زبان طبیعی طبقه‌بندی متن شبکه‌های عصبی کانولوشنی تنسور سه بعدی اخبار جعلی اخبار فارسی کرونا ویروس
Online Access:	https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdf

_version_	1797945603252027392
author	وحید متقی مهدی اسماعیلی قاسمعلی بازایی محمدعلی افشارکاظمی
author_facet	وحید متقی مهدی اسماعیلی قاسمعلی بازایی محمدعلی افشارکاظمی
author_sort	وحید متقی
collection	DOAJ
description	هدف: هدف پژوهش حاضر اختصاص یکی از کلاس‌‌های جعل و واقعی به متن‌‌های آزاد می‌باشد. شبکه‌‌های عصبی کانولوشنی به عنوان یکی از مهم‌‌ترین مدل‌‌های یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪ‌‌ﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪ‌‌ای از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽ‌‌ﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎی ﺑﺮداری ﺑﻪ ﻣﺎﺗﺮﯾﺲ‌‌ﻫﺎی دو ﺑﻌﺪی ﺗﺒﺪﯾﻞ ﻣﯽ‌‌ﺷود. یکی از محدودیت‌‌های شبکه‌‌های کانولوشن این است که در سطح کلمه کار کرده و نمی‌‌تواند رابطه و فاصله بین جملات را در نظر بگیرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشکل اساسی در این تحقیق می‌‌باشد. در این پژوهش یک مدل پایه‌‌ای مبتنی بر شبکه‌‌های کانولوشنی پیشنهاد شده که در آن اسناد به صورت تنسورهای سه بعدی به شبکه داده می‌‌شوند تا بتواند مشکل مذکور را مرتفع نماید. در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم می‌‌آورد و به نتایج دقیق‌تری در تشخیص اخبار جعل دست می‌یابد.روش‌‌شناسی: پژوهش حاضر مطالعه‌ای کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمع‌‌آوری شده و با عمل پیش‌پردازش، داده‌های اضافی و غیر مفید حذف و پس از برچسب زدن متون پاک‌سازی شده، متن اخبار جهت رویکرد پیشنهادی با استفاده از نرم‌افزار پایتون پردازش شده‌اند.یافته‌‌ها: برخی از الگوریتم‌‌های یادگیری ماشین دارای قدرت بیشتری در مسائل طبقه‌‌بندی بودند، ولی با تغییراتی که در ساختار الگوریتم شبکه کانولوشن صورت گرفت، نتایج بهتری نسبت به الگوریتم‌‌های یادگیری ماشین و سایر الگوریتم‌‌های مشابه حاصل شد.نتیجه‌‌گیری: در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم می‌آورد و این مدل پیشنهادی در مقایسه با رویکردهای پیشنهادی در ادبیات، دقت قابل توجهی را بدست آورده است. مدل پیشنهادی بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگی‌ها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحّت بیش از 94 درصد دست یابد.
first_indexed	2024-04-10T20:57:45Z
format	Article
id	doaj.art-65be7198c32b4c848a8fc250e48a05f4
institution	Directory Open Access Journal
issn	2476-6658 2476-6534
language	fas
last_indexed	2024-04-10T20:57:45Z
publishDate	2021-12-01
publisher	University of Qom
record_format	Article
series	علوم و فنون مدیریت اطلاعات
spelling	doaj.art-65be7198c32b4c848a8fc250e48a05f42023-01-22T18:59:14ZfasUniversity of Qomعلوم و فنون مدیریت اطلاعات2476-66582476-65342021-12-017422125010.22091/stim.2021.7014.15921928ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروسوحید متقی0مهدی اسماعیلی1قاسمعلی بازایی2محمدعلی افشارکاظمی3دانشجوی دکتری، گروه مدیریت فناوری اطلاعات، واحد قشم، دانشگاه آزاد اسلامی، قشم، ایران.استادیار، گروه علوم کامپیوتر، واحد کاشان، دانشگاه آزاد اسلامی، کاشان، ایراناستادیار، گروه مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.دانشیار، گروه مدیریت، واحد تهران مرکزی، دانشگاه آزاد اسلامی، تهران، ایران.هدف: هدف پژوهش حاضر اختصاص یکی از کلاس‌‌های جعل و واقعی به متن‌‌های آزاد می‌باشد. شبکه‌‌های عصبی کانولوشنی به عنوان یکی از مهم‌‌ترین مدل‌‌های یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪ‌‌ﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪ‌‌ای از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽ‌‌ﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎی ﺑﺮداری ﺑﻪ ﻣﺎﺗﺮﯾﺲ‌‌ﻫﺎی دو ﺑﻌﺪی ﺗﺒﺪﯾﻞ ﻣﯽ‌‌ﺷود. یکی از محدودیت‌‌های شبکه‌‌های کانولوشن این است که در سطح کلمه کار کرده و نمی‌‌تواند رابطه و فاصله بین جملات را در نظر بگیرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشکل اساسی در این تحقیق می‌‌باشد. در این پژوهش یک مدل پایه‌‌ای مبتنی بر شبکه‌‌های کانولوشنی پیشنهاد شده که در آن اسناد به صورت تنسورهای سه بعدی به شبکه داده می‌‌شوند تا بتواند مشکل مذکور را مرتفع نماید. در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم می‌‌آورد و به نتایج دقیق‌تری در تشخیص اخبار جعل دست می‌یابد.روش‌‌شناسی: پژوهش حاضر مطالعه‌ای کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمع‌‌آوری شده و با عمل پیش‌پردازش، داده‌های اضافی و غیر مفید حذف و پس از برچسب زدن متون پاک‌سازی شده، متن اخبار جهت رویکرد پیشنهادی با استفاده از نرم‌افزار پایتون پردازش شده‌اند.یافته‌‌ها: برخی از الگوریتم‌‌های یادگیری ماشین دارای قدرت بیشتری در مسائل طبقه‌‌بندی بودند، ولی با تغییراتی که در ساختار الگوریتم شبکه کانولوشن صورت گرفت، نتایج بهتری نسبت به الگوریتم‌‌های یادگیری ماشین و سایر الگوریتم‌‌های مشابه حاصل شد.نتیجه‌‌گیری: در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم می‌آورد و این مدل پیشنهادی در مقایسه با رویکردهای پیشنهادی در ادبیات، دقت قابل توجهی را بدست آورده است. مدل پیشنهادی بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگی‌ها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحّت بیش از 94 درصد دست یابد.https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdfپردازش زبان طبیعیطبقه‌بندی متنشبکه‌های عصبی کانولوشنیتنسور سه بعدیاخبار جعلیاخبار فارسیکرونا ویروس
spellingShingle	وحید متقی مهدی اسماعیلی قاسمعلی بازایی محمدعلی افشارکاظمی ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس علوم و فنون مدیریت اطلاعات پردازش زبان طبیعی طبقه‌بندی متن شبکه‌های عصبی کانولوشنی تنسور سه بعدی اخبار جعلی اخبار فارسی کرونا ویروس
title	ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
title_full	ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
title_fullStr	ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
title_full_unstemmed	ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
title_short	ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
title_sort	ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
topic	پردازش زبان طبیعی طبقه‌بندی متن شبکه‌های عصبی کانولوشنی تنسور سه بعدی اخبار جعلی اخبار فارسی کرونا ویروس
url	https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdf
work_keys_str_mv	AT wḥydmtqy ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws AT mhdyạsmạʿyly ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws AT qạsmʿlybạzạyy ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws AT mḥmdʿlyạfsẖạrḵạẓmy ạrạỷhrwyḵrdtnswrshbʿdybrạyṭbqhbndywtsẖkẖyṣạkẖbạrjʿlymṭạlʿhmwrdyạkẖbạrfạrsydrḥwzhḵrwnạwyrws

ارائه رویکرد تنسور سه بعدی برای طبقه‌بندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس

Similar Items