命名实体识别基础

ryluo 2020-06-14 01:29:22
自然语言处理

命名实体识别的一些基本概念及方法

命名实体识别(Named Entity Recognition,NER)是信息提取、问答系统、句法分析及机器翻译等NLP任务的重要基础,实体识别指的是将句子中的实体类型重新表示出来,以便后续任务的使用。

实体:指某一个概念的实例。

例子:“人名”是一种概念,“周杰伦”就是“人名”的实体


命名实体识别的数据标注

NER是一种序列标注问题,遵循序列标注的基本原则主要是BIO和BIOES。本质上来讲NER的过程就是预测出其标注序列的过程。


常用方法


开源包