终其一生,我们只不过在寻找自己

0%

CS224n-10 问答系统QA介绍

这一节主要在介绍数据集和task。对于模型没太深究。

  • 问答系统QA

一般的project组成部分,很容易理解,不解释了。

动机

搜索引擎,语言助手比如siri,经常需要回答人类的问题。
可以分成两部分:

  1. 从很多的文档中找到对应的文档。
  2. 对于一个文档和一个问题,判断是否文档可以回答这个问题,答案是什么。类似于阅读理解。本节课主要讲这个。

例子如图:

数据集介绍SQuAD

Stanford Question Answering Dataset SQuAD是斯坦福搞的数据集,表现良好。
举例:

对于任何一段话,一个问题一般有三个答案,如果预测回答的答案对了,那就得一分。然后会比较准确率,回撤率,F1值等指标。主要看F1.
对于第一版的数据可以看出,经过几年的发展,bert已经表现比人还好。

对于SQuAD 2.0的改进,主要是数据集添加了<该问题无答案>的label,也更符合人类的场景,增加了难度。如图:

增加难度之后,bert表现依然不错。排名靠前的都是bert。

SQuAD的缺陷

问题还是太简单,只需要找到实体,不能解释原因。
不需要提前的额外知识,答案就在一个很小的段落里。

一些方案介绍

Stanford Attentive Reader

这个方案是2017年的cs224N的TA做的。思路很简单,用lstm扫描问题,用Attention扫描文章,然后用一个矩阵乘起来,通过softmax得到概率。

最后表现还不错。

Stanford Attentive Reader++

改进版的TA方案是对于文章也用BLSTM*3层,然后输入的时候也输入词性。

好多细节,也没听懂,之后看代码吧。

BiDAF

另一个经典的网络。

最后都是讲具体的模型,太细节了,讲的又快,还是到时候挑几个看代码吧。

-------------    你的留言  是我更新的动力😊    -------------