对话系统论文研究点整理

3个回答默认排序

默认排序

按时间排序

五堂宅修

已采纳

过去20多年，互联网及移动互联网将人类带到了一个全新的时代，如果用一个词来总结和概括这个时代的话，“连接”这个词再合适不过了。这个时代主要建立了四种连接：人和商品的连接；人和人的连接；人和信息的连接；人和设备的连接。在自然语言处理（NLP）任务中，有很多关于对话系统研究的任务，包括语音识别（ASR）、自然语言理解（NLU）、自然语言生成（NLG）等等，这些模块我们经常在一些论文和博客中看到。实际上，这些技术可以看成是智能对话交互框架的部分组件。那么，智能对话这么大的一个题目究竟涉及到哪些方面？如图所示的框架中，对话系统最关键的两部分就是自然语言理解和对话状态管理两个部分。实际上人机交互的任务有很多，所以这两部分的框架并不唯一。一般地，我们将对话系统分为聊天型对话、任务型对话和问答型对话。这其中聊天型对话、任务型对话的多轮任务是个大难题（指的是对话的记忆性），问答型往往只需要一问一答的单轮形式即可，但需要利用知识库对答案进行精准定位。现在市面上的对话系统（如下图所示）功能并不唯一,例如我们最常见的SIRI就有聊天和部分定向式的功能（例如查询天气、日期等）。我们可以再举一个比较实际的例子：这张图描述的是阿里巴巴的对话系统架构，也许有很多的人听说过阿里开源Opendia，从这个图就可以看出，一套完整的人际交互系统应该包含的部分。 NLP中的分词、词性标注、实体识别等内容往往是其他任务的地基，当然这其中还包含词向量和语言模型。在这里，分词、词向量、词性标注如今都有比较好的工具可以利用，比如jieba、Hanlp。实体识别技术在人机交互中是自然语言理解部分的一个子模块，但个人建议自己搭一个框架比较好。在我看来实体识别、分词、词性标注都属于序列标注问题，至少在Deep Learning上都可以用一种模型，当然分词实际上要复杂的多。这些我的前面的博客都有介绍欢迎打call。从这个图我们可以看到无论是任务型的对话还是QA问答，一旦涉及到精准回答都需要一个知识库，如今知识图谱是一个比较热门的方向，相关的知识体系我们在下一节构建基于知识库问答系统会进行简单的介绍。实际上从Slot到Sql的映射并不是一件简单的事情。KBQA 是基于知识库的问答，DBQA 是基于文档的问答。换言之，KBQA 利用的是结构化的知识，而 DBQA 所利用的是非结构化的文本。数据源的不同决定了他们不同的擅长领域，KBQA 更适合回答 what，when 等事实性问题；DBQA 更适合回答 why，how 等解释性、述性问题。传统的 KBQA 系统根据其框架共同特征，都可以大概分为四个模块。这四个模块形成的整体框架，可以视为一个粗糙而通用的 pipeline。四个模块为：问题分析（Question Analysis）、短语映射（Phrase Mapping）、消歧（Disambiguation）和查询构建（Query Construction）。现如今深度学习、强化学习等机器学习技术在人机交互中的应用非常广泛，一些比较成熟的框架例如Seq2Seq等在工程上已落地，但是人机交互还有许许多多的难点，例如如何在多轮对话中记住上下文的信息，如何处理语言的多样性等等问题，这些问题在工程上大多基于模板的方式进行实现，实际上，基于模板的背后也有一套强大的模板逻辑，在下一篇文章中我们将手动实现第一个对话系统——基于电影知识图谱和AIML的问答系统，其中包括聊天与电影相关内容的查询的技术实现。

261 评论 1小时前发布

贪吃的双鱼宝宝

论文：题目：《Leveraging Historical Interaction Data for Improving Conversational Recommender System 》地址：这是我第一次将美团发表的论文写在这上面，该论文是人大跟美团这边合作在CIKM上面的一篇短论文，研究的是如何利用历史交互的数据来进行对话式的推荐。最近，对话推荐系统（CRS）已成为一个新兴且实用的研究主题。现有的大多数CRS方法都专注于仅从对话数据中为用户学习有效的偏好表示。然而，本论文从新的视角来利用历史交互数据来改善CRS。为此，这篇论文提出了一种新颖的预训练方法，以通过预训练方法集成基于物品的偏好序列（来自历史交互数据）和基于属性的偏好序列（来自对话数据）。随着电子商务平台中智能代理的快速发展，对话推荐系统（CRS）已成为寻求通过对话向用户提供高质量推荐的新兴研究主题。通常，CRS由对话模块和推荐模块组成。对话模块侧重于通过多回合互动获取用户的偏好，推荐模块侧重于如何利用推断出的偏好信息为用户推荐合适的商品。现有的大多数CRS都以“系统要求用户响应”模式设计的。在每轮对话中，CRS都会发出有关用户偏爱的问题，并且用户会使用个性化反馈对系统进行回复。通常，系统会根据商品的某些属性（例如，你最喜欢的电影类型是什么）来生成系统查询，并且用户反馈会反映用户对该属性的特定偏爱（例如，我喜欢动作电影）。主流方法是构造一种跟踪模块，该模块可以从这种多轮对话中推断出用户的基于属性的偏好。以此方式，可以将所推断的偏好呈现为所推断属性的序列（例如，电影CRS中的“流派＝动作→导演＝詹姆斯·卡梅隆”。有了这个序列后，我们就可以用一些方法来进行推荐来，比如可以采用知识图谱来进行推荐。但是，这些现有的CRS研究存在两个主要问题。首先，对话本身的信息非常有限。许多CRS得到了进一步优化，以减少系统与用户交互的回合数。因此，在基于属性的推断偏好中，可能会丢失一些有用的属性。其次，仅利用基于属性的偏好来进行推荐可能还不够。例如，即使在过滤了几个属性之后，候选项目集仍可能很大。现在要解决以上提到的两个问题，我们就需要把基于item的方式和基于属性的方式进行结合。其中，基于历史交互item的方式反映的是用户的长期兴趣，基于会话属性的方式反映的是用户当前的兴趣，也就是短期兴趣，这是一个典型的长短期兴趣结合的任务。 A：之前说了，在CRS系统中，一个用户进行多轮对话后，会有一个item属性的集合，A就是这个集合 = ,其中属于A，是item的属性，n是属性序列的长度 ,其中是用户在对话前第k步与之交互的item :我们进一步假设每个项目ik也与一组属性值相关联，用Aik表示，它是整个属性集A的子集。任务的定义：根据CRS模块，首先收集到基于属性的序列，然后利用点击序列进行推荐。关于这个任务的定义，深入理解应该是这样：我们是先有属性序列，然后主要根据点击序列进行推荐，属性序列的建模是子模块任务，序列推荐是主任务，序列推荐任务在属性序列更新后可以反复利用这个信息，只要属性序列更新。论文的base model是用Transformer做的，输入部分是embedding层，这部分除了有item id的embedding矩阵，还有属性的embedding矩阵，输入还有个P，这个就不说了，位置向量。中间的运算就是Transformer的过程了，self-attention 跟ffn，这里不懂transformer结构的可以看一下论文。输出部分是预测候选item i的概率：其中ei是i的原始embedding向量，W是映射矩阵，两个s是item和属性经过transformer结构出来的最后一个向量。熟悉bert的都知道mask language model，把item序列中的item 用mask替代，然后预测这些被mask掉的item。其中fik是item transformer结构出来的位置k出来的向量，SA是熟悉结构出来的Aik的位置出来的向量，W是映射矩阵，eik是原始的item embedding。为了更好的让item based的信息跟attribute based的信息进行融合，论文也采取了一种另类的mask方法，用随机负采样的属性来替代Aik，其中fik是被替换的那个item经过trm出来的向量，W是映射矩阵，faj是属性trm出来的向量，预测的概率是aj是否是被替换过。在LTR里面，如果采用的是pairwise的优化方式，那么负采样的技术就至为关键了，而且优化了正样本的概率大于负样本的能力，所以需要选取一种负采样的方法来给我们整个模型的优化带来提升。 MIP里面负采样的方式用的是 IR-GAN 和 ELECT这两篇论文所采用的方式。改论文选择了SASRec作为第一个阶段的pairwise ranking的模型，这个模型也是论文中用来sample 负样本的模型。负采样是这么做的：我们先用pairwise ranking的方式训练一个模型作为生成器，得到了候选item的概率分布，有了这个概率分布我们就可以拿来负采样了，因为排序高的items跟真实的很接近。至于为什么选择这个模型，论文里面说是因为这个论文在序列推荐任务中的表示特别好，也就是它作为ranking的模型效果还不错。请注意，尽管可以像标准GAN中那样更新生成器，但是我们只训练它的参数一次。根据经验，我们发现迭代更新带来的改进是有限的。整个训练分成两个阶段，第一个是预训练阶段，就是训练两个表示学习模型，第二个是微调阶段，学习的是rank loss：

135 评论 8小时前发布

mini灵灵

此前整理过KDD21上工业界文章，本文主要整理和分类了Recsys 2021的Research Papers和Reproducibility papers。按照推荐系统的研究方向和使用的推荐技术来分类，方便大家快速检索自己感兴趣的文章。个人认为Recsys这个会议重点不在于”技术味多浓”或者”技术多先进”，而在于经常会涌现很多新的观点以及有意思的研究点，涵盖推荐系统的各个方面，例如，Recsys 2021涵盖的一些很有意思的研究点包括：

还有些研究点也是值得一读的，比如推荐系统中的冷启动，偏差与纠偏，序列推荐，可解释性，隐私保护等，这些研究很有意思和启发性，有助于开拓大家的研究思路**。

下面主要根据自己读题目或者摘要时的一些判断做的归类，按照推荐系统研究方向分类、推荐技术分类以及专门实验性质的可复现型文章分类，可能存在漏归和错归的情况，请大家多多指正。

信息茧房/回音室(echo chamber)/过滤气泡(filter bubble) ，这3个概念类似，在国内外有不同的说法。大致是指使用社交媒体以及带有算法推荐功能的资讯类APP，可能会导致我们只看得到自己感兴趣的、认同的内容，进而让大家都活在自己的小世界里，彼此之间难以认同和沟通。关于这部分的概念可参见知乎文章：。有四篇文章探讨了这样的问题。

此次大会在探索与利用上也有很多探讨，例如多臂老虎机、谷歌的新工作，即：用户侧的探索等。

涉及排序学习的纠偏、用户的偏差探索等。

Debiased Explainable Pairwise Ranking from Implicit Feedback

Khalil Damak, Sami Khenissi, and Olfa Nasraoui

Mitigating Confounding Bias in Recommendation via Information Bottleneck

Dugang Liu, Pengxiang Cheng, Hong Zhu, Zhenhua Dong, Xiuqiang He, Weike Pan, and Zhong Ming

User Bias in Beyond-Accuracy Measurement of Recommendation Algorithms

Ningxia Wang, and Li Chen

利用图学习、表征学习等做冷启动。

Cold Start Similar Artists Ranking with Gravity-Inspired Graph Autoencoders

Guillaume Salha-Galvan, Romain Hennequin, Benjamin Chapus, Viet-Anh Tran, and Michalis Vazirgiannis

Shared Neural Item Representations for Completely Cold Start Problem

Ramin Raziperchikolaei, Guannan Liang, and Young-joo Chung

涉及离线或在线评估方法，准确性和多样性等统一指标的设计等。

Evaluating Off-Policy Evaluation: Sensitivity and Robustness

Yuta Saito, Takuma Udagawa, Haruka Kiyohara, Kazuki Mogi, Yusuke Narita, and Kei Tateno

Fast Multi-Step Critiquing for VAE-based Recommender Systems

Diego Antognini and Boi Faltings

Online Evaluation Methods for the Causal Effect of Recommendations

Masahiro Sato

Towards Unified Metrics for Accuracy and Diversity for Recommender Systems

Javier Parapar and Filip Radlinski

涉及session维度的短序列推荐；使用NLP中常用的Transformers做序列推荐的鸿沟探讨和解决，这个工作本人还挺感兴趣的，后续会精读下！

结合联邦学习做隐私保护等。

Black-Box Attacks on Sequential Recommenders via Data-Free Model Extraction

Zhenrui Yue, Zhankui He, Huimin Zeng, and Julian McAuley

Large-scale Interactive Conversational Recommendation System

Ali Montazeralghaem, James Allan, and Philip S. Thomas

EX3: Explainable Attribute-aware Item-set Recommendations

Yikun Xian, Tong Zhao, Jin Li, Jim Chan, Andrey Kan, Jun Ma, Xin Luna Dong, Christos Faloutsos, George Karypis, S. Muthukrishnan, and Yongfeng Zhang

Towards Source-Aligned Variational Models for Cross-Domain Recommendation

Aghiles Salah, Thanh Binh Tran, and Hady Lauw

利用视觉信息做推荐。

Ambareesh Revanur, Vijay Kumar, and Deepthi Sharma

Huiyuan Chen, Yusan Lin, Fei Wang, and Hao Yang

探讨了美食场景下，多用户意图的推荐系统的交互设计。

“Serving Each User”: Supporting Different Eating Goals Through a Multi-List Recommender Interface

Alain Starke, Edis Asotic, and Christoph Trattner

涉及传统协同过滤、度量学习的迭代；新兴的图学习技术、联邦学习技术、强化学习技术等的探索。

Matrix Factorization for Collaborative Filtering Is Just Solving an Adjoint Latent Dirichlet Allocation Model After All

Florian Wilhelm

Negative Interactions for Improved Collaborative-Filtering: Don’t go Deeper, go Higher Harald Steck and Dawen Liang

ProtoCF: Prototypical Collaborative Filtering for Few-shot Item Recommendation

Aravind Sankar, Junting Wang, Adit Krishnan, and Hari Sundaram

知识图谱的应用以及图嵌入技术和上下文感知的表征技术的融合，这两个工作个人都挺感兴趣。

Antonio Ferrara, Vito Walter Anelli, Tommaso Di Noia, and Alberto Carlo Maria Mancino

Marco Polignano, Cataldo Musto, Marco de Gemmis, Pasquale Lops, and Giovanni Semeraro

涉及训练、优化、检索、实时流等。

Jeremie Rappaz, Julian McAuley, and Karl Aberer

Reproducibility papers可复现实验性质的文章，共3篇。分别探索了：序列推荐中的采样评估策略；对话推荐系统中生成式和检索式的方法对比；神经网络推荐系统和矩阵分解推荐系统的对比。

通过论文的整理和分类，笔者也发现了一些自己感兴趣的研究点，比如：推荐系统的回音室效应探讨文章；Transformers在序列推荐和NLP序列表征中的鸿沟和解决文章：Transformers4Rec；图嵌入表征和上下文感知表征的融合文章；NCF和MF的实验对比文章；

197 评论 8小时前发布

对话系统论文研究点整理

3个回答 默认排序 默认排序 按时间排序

相关问答

期刊论文

向你推荐

热门问题

3个回答默认排序

默认排序

按时间排序