ارائه رویکرد تنسور سه بعدی برای طبقهبندی و تشخیص اخبار جعلی: مطالعه موردی اخبار فارسی در حوزه کرونا ویروس
هدف: هدف پژوهش حاضر اختصاص یکی از کلاسهای جعل و واقعی به متنهای آزاد میباشد. شبکههای عصبی کانولوشنی به عنوان یکی از مهمترین مدلهای یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد...
Main Authors: | , , , |
---|---|
Format: | Article |
Language: | fas |
Published: |
University of Qom
2021-12-01
|
Series: | علوم و فنون مدیریت اطلاعات |
Subjects: | |
Online Access: | https://stim.qom.ac.ir/article_1928_3d6c3dd48e9500555f0d3314ce5f6e3c.pdf |
Summary: | هدف: هدف پژوهش حاضر اختصاص یکی از کلاسهای جعل و واقعی به متنهای آزاد میباشد. شبکههای عصبی کانولوشنی به عنوان یکی از مهمترین مدلهای یادگیری عمیق، دقت بالایی را بر روی این مسائل بدست آورده است. در این تحقیق آنالیز متن در سطح جمله و بهبود عملکرد شبکه عصبی کانولوشنی جهت تشخیص اخبار جعلی مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪای از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎی ﺑﺮداری ﺑﻪ ﻣﺎﺗﺮﯾﺲﻫﺎی دو ﺑﻌﺪی ﺗﺒﺪﯾﻞ ﻣﯽﺷود. یکی از محدودیتهای شبکههای کانولوشن این است که در سطح کلمه کار کرده و نمیتواند رابطه و فاصله بین جملات را در نظر بگیرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشکل اساسی در این تحقیق میباشد. در این پژوهش یک مدل پایهای مبتنی بر شبکههای کانولوشنی پیشنهاد شده که در آن اسناد به صورت تنسورهای سه بعدی به شبکه داده میشوند تا بتواند مشکل مذکور را مرتفع نماید. در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم میآورد و به نتایج دقیقتری در تشخیص اخبار جعل دست مییابد.روششناسی: پژوهش حاضر مطالعهای کاربردی بوده که در آن حدود 42000 اخبار فارسی از شهرهای مختلف ایران از توییتر جمعآوری شده و با عمل پیشپردازش، دادههای اضافی و غیر مفید حذف و پس از برچسب زدن متون پاکسازی شده، متن اخبار جهت رویکرد پیشنهادی با استفاده از نرمافزار پایتون پردازش شدهاند.یافتهها: برخی از الگوریتمهای یادگیری ماشین دارای قدرت بیشتری در مسائل طبقهبندی بودند، ولی با تغییراتی که در ساختار الگوریتم شبکه کانولوشن صورت گرفت، نتایج بهتری نسبت به الگوریتمهای یادگیری ماشین و سایر الگوریتمهای مشابه حاصل شد.نتیجهگیری: در نظر گرفتن تنسورهای سه بعدی امکان یادگیری موقعیت کلمات در جمله را برای مدل فراهم میآورد و این مدل پیشنهادی در مقایسه با رویکردهای پیشنهادی در ادبیات، دقت قابل توجهی را بدست آورده است. مدل پیشنهادی بدون اضافه کردن سربار اضافی از لحاظ تعداد ویژگیها و عمق شبکه، با تغییر در ورودی توانسته است به نتایج بهتر و قابل قبول از سایر رویکردهای موجود در ادبیات دست یافته و به دقت و صحّت بیش از 94 درصد دست یابد. |
---|---|
ISSN: | 2476-6658 2476-6534 |