基于多级注意力融合机制的藏文实体关系抽取

与中英文相比,藏文实体关系训练语料规模较小,传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题,利用远程监督方法将知识库与文本对齐,构建藏文实体关系抽取的数据集,提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征,在句子级别引入注意力机制为每个实例分配权重,从而充分利用包含信息的句子,减少噪声实例的权重。同时引入联合评分函数,修正远程监督的错误标签,并将神经网络与支持向量机结合,实现藏文实体关系分类。实验结果表明,提出的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。...

Full description

Bibliographic Details
Main Authors: 王丽客, 孙媛, 刘思思
Format: Article
Language:zho
Published: POSTS&TELECOM PRESS Co., LTD 2021-12-01
Series:智能科学与技术学报
Subjects:
Online Access:http://www.infocomm-journal.com/znkx/CN/abstract/abstract172026.shtml
_version_ 1797951398497746944
author 王丽客
孙媛
刘思思
author_facet 王丽客
孙媛
刘思思
author_sort 王丽客
collection DOAJ
description 与中英文相比,藏文实体关系训练语料规模较小,传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题,利用远程监督方法将知识库与文本对齐,构建藏文实体关系抽取的数据集,提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征,在句子级别引入注意力机制为每个实例分配权重,从而充分利用包含信息的句子,减少噪声实例的权重。同时引入联合评分函数,修正远程监督的错误标签,并将神经网络与支持向量机结合,实现藏文实体关系分类。实验结果表明,提出的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
first_indexed 2024-04-10T22:30:00Z
format Article
id doaj.art-b548719258c9483782048d35cd8778f7
institution Directory Open Access Journal
issn 2096-6652
language zho
last_indexed 2024-04-10T22:30:00Z
publishDate 2021-12-01
publisher POSTS&TELECOM PRESS Co., LTD
record_format Article
series 智能科学与技术学报
spelling doaj.art-b548719258c9483782048d35cd8778f72023-01-17T07:19:14ZzhoPOSTS&TELECOM PRESS Co., LTD智能科学与技术学报2096-66522021-12-0134466473基于多级注意力融合机制的藏文实体关系抽取王丽客0孙媛1刘思思2中央民族大学信息工程学院; 中央民族大学国家语言资源监测与研究少数民族语言中心中央民族大学信息工程学院; 中央民族大学国家语言资源监测与研究少数民族语言中心中央民族大学信息工程学院; 中央民族大学国家语言资源监测与研究少数民族语言中心与中英文相比,藏文实体关系训练语料规模较小,传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题,利用远程监督方法将知识库与文本对齐,构建藏文实体关系抽取的数据集,提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征,在句子级别引入注意力机制为每个实例分配权重,从而充分利用包含信息的句子,减少噪声实例的权重。同时引入联合评分函数,修正远程监督的错误标签,并将神经网络与支持向量机结合,实现藏文实体关系分类。实验结果表明,提出的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。http://www.infocomm-journal.com/znkx/CN/abstract/abstract172026.shtml藏文实体关系抽取多级注意力融合机制支持向量机
spellingShingle 王丽客
孙媛
刘思思
基于多级注意力融合机制的藏文实体关系抽取
智能科学与技术学报
藏文
实体关系抽取
多级注意力融合机制
支持向量机
title 基于多级注意力融合机制的藏文实体关系抽取
title_full 基于多级注意力融合机制的藏文实体关系抽取
title_fullStr 基于多级注意力融合机制的藏文实体关系抽取
title_full_unstemmed 基于多级注意力融合机制的藏文实体关系抽取
title_short 基于多级注意力融合机制的藏文实体关系抽取
title_sort 基于多级注意力融合机制的藏文实体关系抽取
topic 藏文
实体关系抽取
多级注意力融合机制
支持向量机
url http://www.infocomm-journal.com/znkx/CN/abstract/abstract172026.shtml
work_keys_str_mv AT wánglìkè jīyúduōjízhùyìlìrónghéjīzhìdezàngwénshítǐguānxìchōuqǔ
AT sūnyuàn jīyúduōjízhùyìlìrónghéjīzhìdezàngwénshítǐguānxìchōuqǔ
AT liúsīsī jīyúduōjízhùyìlìrónghéjīzhìdezàngwénshítǐguānxìchōuqǔ