aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

开放域对话系统主要包括单轮对话和多轮对话这两种设定。相较于单轮对话,多轮对话更加符合实际应用场景,即需要对历史信息进行建模,利用其中的相关内容,从而生成有效的回复。对话历史信息有如下的特点:

  1. 词到句,句到片段的层次性结构;
  2. 很多冗余内容与当前回复无关;
  3. 词或句存在远距离依赖关系;
  4. 内容的变换或语义关系的转移。
    基于以上特点,近期不少的研究工作相继展开。本次分享将带大家梳理和回顾在多轮对话历史信息建模和回复生成方面的主要工作
阅读全文 »

余弦距离

简单来说,余弦相似度,就是计算两个向量间的夹角的余弦值

余弦距离就是用1减去这个获得的余弦相似度。

余弦距离取值范围
由上面的余弦距离可以知道,余弦距离的取值范围为[0, 2] ,这就满足了非负性的性质。

阅读全文 »

《SFFAI38期-网络结构搜索-单目标跟踪》讲者之一方杰民本次报告介绍、讨论了最近NAS的一些进展和闪光点,并分享他们在NAS领域所做的相关工作。主要内容包括:

  1. NAS算法的发展与创新;
  2. NAS的加速方法;
  3. 搜索空间的探索和进展。
阅读全文 »

《SFFAI38-网络结构搜索-单目标跟踪》分享会上讲者张志鹏首先回顾了Siamese跟踪的几篇经典论文;然后介绍了他们在CVPR2019的工作:Deeper and Wider Siamese Networks for Real-Time Visual Tracking;最后分享了关于Siamese跟踪的感悟。

阅读全文 »

基于双向编码的BERT在11项自然语言理解任务上取得了惊人的效果,而目前主流的自然语言生成任务(包括机器翻译,自动摘要等)仍然采用单向解码,即从左到右依次产生目标文本。基于此,我们实现了两大突破:(1)编码器-解码器框架:从双向编码到双向解码。(2)序列生成:从两端到中间。

阅读全文 »

本次分享会上:

  1. 首先对基于自注意力机制的神经网络机器翻译框架和多语言翻译进行了回顾;
  2. 介绍了多语言翻译的主流方法和近期的相关工作;
  3. 分享我们录用在ACL 2019上的工作A Compact and Language-Sensitive Multilingual Translation Method。
阅读全文 »

目前的深度神经网络模型依旧存在很多局限性,例如无法自动地设计网络结构、无法有效地学习无标签数据的特征、很难处理嵌入在非欧几里得空间的数据和无标签的数据等等。为此,我们通过建模深度神经网络中变量之间的关系来解决以上问题并提升深度神经网络的性能

阅读全文 »

首先介绍了弱监督图节点分类的任务和存在的挑战
接着分享了一些相关的经典论文
最后介绍了我们最新的IJCAI 2019的工作H-GCN:通过引入粗化和还原操作,设计了层次化的对称图神经网络,分别用9层和11层的网络取得了SOTA的结果。当训练数据极少时,相比之前方法至少有6个百分点的精度提升。

阅读全文 »

本次分享中,我们介绍一下近期的工作,分别以缓解上述三个问题为出发点,提出的三种方法:

  1. 我们在基于RNN的编码器上层引入关系网络层,增强模型对源语言的表示学习能力;
  2. 我们将立方体剪枝算法应用于NMT解码器中,在达到相同甚至更好翻译性能的情况下,比传统柱搜索算法提升了搜索效率。
阅读全文 »