高瓴人工智能学院师生论文被国际学术会议_必一体育app官方网页版登录-必一体育app下载

必一体育app下载 contact us

手机：18991830957
座机：029-89353355
Q Q：359316042
邮箱：info@kssfl.com
地址：西安市雁塔区雁塔西路158号双鱼大厦A座13层

企业公众号

产品推荐 Related

当前位置 > 首页 > 产品中心 > 数据采集器

产品名称：
必一体育app官方.高瓴人工智能学院师生论文被国际学术会议
发布时间：2024-02-14 05:32:25 来源：必一体育app网页版登录作者：必一体育app下载

产品简介：
　　1月23日, 国际学术会议WWW 2024论文接收结果公布。高瓴人工智能学院师生有16篇论文被录用。WWW 2024（The Web Conference)是中国计算机学会（CCF）推荐的A类国际学术会议。本年度会议将于2024年5月

分享到：

订购热线：18991830957

咨询/订购

产品介绍

必一体育app官方

　　1月23日, 国际学术会议WWW 2024论文接收结果公布。高瓴人工智能学院师生有16篇论文被录用。WWW 2024（The Web Conference)是中国计算机学会（CCF）推荐的A类国际学术会议。本年度会议将于2024年5月在新加坡举行。

　　论文概述：提出多轮澄清问题已应用于各种对话式搜索系统中，以帮助向用户推荐人物、商品和图像。然而，它的重要性在Web搜索中仍然没有被强调。在本文中，我们首次尝试将多轮澄清生成扩展到Web搜索，以澄清用户模糊或多方面的意图。与其他对话式搜索场景相比，Web搜索查询更加复杂，因此应该生成澄清面板而不是现有研究中普遍应用的选择选择澄清面板。为此，我们首先定义了多轮Web搜索澄清的整个过程，包括澄清候选生成、最佳澄清选择和文档检索。由于缺乏多轮开放域澄清数据，我们首先设计一种简单而有效的基于规则的方法来适应上述三个组成部分。之后，我们利用大语言模型（LLM）的上下文学习和零样本教学能力，通过提示LLM进行少量的演示和声明来实现澄清生成和选择，进一步提高澄清效果。为了评估我们提出的方法，我们首先应用Qulac数据集来衡量我们的方法是否可以提高检索文档的能力。我们使用MIMICS数据集进一步评估生成的方面项的质量。实验结果表明，与现有的单轮Web搜索澄清方法相比，我们提出的框架更适合开放域Web搜索系统中提出多轮澄清问题以澄清用户模糊或多方面的意图。

　　论文概述：在自然语言处理领域，检索增强型语言模型是解决幻觉问题的的关键技术。传统方法主要基于单次检索，最新的研究趋势已经转向利用多次检索来处理复杂的多跳推理任务。然而，即便这些方法取得了一定进步，现有的策略仍受限于预设的推理步骤，这可能会导致在生成回应时出现不准确。本文介绍了一种创新方法——元认知检索增强生成框架（MetaRAG）。该框架将检索增强生成过程与认知心理学中人类元认知过程相结合。元认知使得人们能够自我反思，并且批判性地评估自身的认知过程。通过融入这一理念，MetaRAG赋予了模型监控、评估及规划响应策略的能力，从而加强了其内省推理能力。通过一个包含三个步骤的元认知调节流程，模型不仅能评估其答案的适当性，还能识别潜在不足的原因，并制定出改进方案。在多跳问答数据集上的实证评估表明，MetaRAG在性能上显著超越了现有方法。

　　论文概述：传统的搜索引擎通常向所有用户展示相同的搜索结果，这种做法忽视了个人的搜索偏好。为了解决这一问题，研究者们开发出了个性化搜索技术，该技术能够根据用户的查询日志分析出个人偏好，并据此调整搜索结果的排序。虽然基于深度学习的个性化搜索方法展现出巨大潜力，但它们高度依赖大量的训练数据，因此面临数据稀缺的挑战。本文提出了一种新型的认知个性化搜索（CoPS）模型，该模型将强大的大型语言模型与人类认知的认知记忆机制相结合。CoPS利用大型语言模型来构建用户画像，从而提升了用户的搜索体验。这一认知记忆机制包括：用于迅速感知反应的感知记忆，用于处理复杂认知任务的工作记忆，以及用于储存海量历史互动数据的长期记忆。CoPS通过三个步骤高效处理新的查询请求：首先识别用户的重复查找行为，然后构建包含相关历史信息的用户画像，最后根据个性化的查询意图对搜索结果进行排序。实验结果显示，CoPS模型在零样本测试场景中表现优于基线模型。

　　论文概述：在对话式搜索中，查询澄清技术通过向用户提问一个澄清式问题并提供可选择的澄清候选项来更好地澄清用户的查询子意图。然而，用户除了这种澄清需求，还可能有一些探索性需求。例如一个搜索“卡地亚女士手表”的用户可能还想通过搜索“劳力士女士手表”或者“卡地亚女士项链”来探索一些跟当前查询平行的探索式查询。这种探索性的信息需求在用户搜索行为中很常见，但却难以被查询澄清技术满足。本文聚焦于挖掘并向用户推荐这种探索式的查询来更好地满足用户在对话式搜索中的探索性信息需求。为此，我们首先设计了一个基于规则的模型来根据查询搜索结果中的结构化信息生成探索式查询。其次，我们提出使用弱监督数据并结合多任务学习训练生成模型，从而对基于规则的模型进行泛化。最后，我们利用大模型的情境学习能力并结合提示工程技术来生成探索式查询。我们基于人工标注构建了我们这个任务的评测集并进行了一系列的实验。实验结果证明了我们提出的模型的有效性，同时也证明了使用搜索结果中的结构化信息生成探索式查询的可行性。

　　论文概述：异构图神经网络（HGNNs）在各种异构图学习任务中获得了显著的成功。然而，大多数现有的HGNNs依赖于空域的方法来聚合信息，往往手动选择元路径或使用一些启发式模块，缺乏理论保证。此外，这些方法无法在频谱域内学习任意有效的异构图过滤器，这限制了它们的表达能力。为了解决这些问题，我们提出了一种通过正的非交换多项式实现的频谱异构图卷积。基于该图卷积，我们提出了PSHGCN，一种新颖的异构图卷积网络。PSHGCN提供了一种简单而有效的方法来学习有效的异构图滤波器。此外，我们在图优化框架中表明了PSHGCN的合理性。我们进行了广泛的实验研究，证明了 PSHGCN可以学习多样的异构图滤波器，并在真实数据上超越了现有方法。

　　论文概述：这篇论文揭示了在直推式节点分类设置下，图神经网络（GNNs）存在幂律缩放，其中指数大小意味着不令人满意的样本效率。受到现有研究中报告的具有相似聚合特征的节点性能相关性的启发，本文提出利用直推式设置来修剪具有与测试节点不同的聚合特征的节点。大型图上的实证结果证实了这种修剪策略的有效性，并且本文放宽了先前理论分析中的一个假设。

　　论文概述：为了追求公平和平衡的发展，推荐系统（RS）通常优先考虑群体公平，确保特定群体在一定时期内保持最低曝光水平。例如，RS平台通常需要确保新提供者或特定类别的物品根据它们的需求获得足够的曝光。现代工业RS通常采用两阶段流程：第一阶段（retrieval阶段）从分布在各种服务器上的数百万个物品中检索候选项，第二阶段（rank阶段）专注于从第一阶段选择的物品中呈现小而准确的选择。现有的确保分摊群体曝光的工作通常集中在第二阶段，然而，第一阶段对于任务也是至关重要的。没有高质量的候选项集，第二阶段的ranker无法确保群体的所需曝光。为确保分布检索过程中的群体曝光，我们引入了一个名为FairSync的模型，将问题转化为受约束的分布式优化问题。具体来说，FairSync通过将问题移至对偶空间来解决问题，在这个空间中，中央节点将历史公平数据聚合成一个向量并将其分发到所有服务器。为了在效率和准确性之间权衡，我们使用梯度下降技术周期性更新对偶向量的参数。我们的实证实验证明，我们的方法在满足公平要求的同时，在各种条件下甚至在极端情况下都能实现更好的检索准确性。

　　论文概述：大语言模型强大的决策能力展现了作为人类代理的潜力。然而现有工作关注于模拟人类对话，而人类非语言行为的模拟，例如推荐系统中的物品点击，尽管可以隐式的展现用户偏好以及增强用户建模，尚没有被深入探索。我们认为主要原因在于语言建模和行为建模的差异以及大语言模型对用户-物品关系缺乏理解。为了解决这个问题，我们提出了AgentCF，通过基于智能体的协同过滤来模拟推荐系统中的用户-物品交互行为。我们将用户和物品都模拟为智能体，并利用协同学习的方式同时对二者进行优化。具体来说，在每个时间步，我们首先提示用户和物品智能体进行自主交互。然后，基于智能体交互决策和真实世界交互记录的差异，我们提示智能体协同地反思和调节错误的模拟偏好信息，从而学习和建模用户和物品之间的关系。在后续交互过程中，这些智能体进一步将习得的偏好传播给其余的智能体，隐式的建模了协同过滤。基于这个框架，我们模拟了多样化的用户-物品交互形式，结果表明这些智能体可以展示类人的行为。

　　论文概述：视频到文本生成模型已经取得了显著的成功，但它们大多关注在如何理解视频内容，忽略了如何捕捉人类个性化的偏好。对于构建一个的有吸引力的多模态聊天机器人，这是非常需要的。在本工作中，我们定义了个性化视频评论生成的任务，并设计了一个端到端的个性化框架来解决该任务。具体而言，我们认为视频评论生成的个性化可以体现在两个方面，(1)对于同一段视频，不同的用户可能会对不同的片段进行评论;(2)对于同一段视频，不同的人也可能会以不同的评论风格表达不同的观点。因此我们设计了两个模块——视频帧选择模块和个性化生成模块。视频帧选择模块负责预测用户可能在视频中感兴趣的位置，个性化文本生成模块根据上述预测的片段和用户的偏好生成评论。在我们的框架中，这两个组件以端到端方式进行优化以相互增强，同时我们设计了基于置信度感知的计划采样和迭代生成策略，以解决在推理阶段缺乏真实片段的问题。由于缺乏个性化的视频到文本数据集，我们收集并发布了一个新的数据集来研究这个问题，同时我们进行了大量的实验来证明我们模型的有效性。

　　论文概述：知识图谱的表示是一个关键技术，它的目的是将知识图谱中的元素转化为连续空间中的向量形式，从而为结构化数据提供强大的表示能力。目前，使用双曲空间或欧几里得空间来表达知识图谱已成为研究领域的常用方法。然而，知识图谱通常包含多种几何数据结构，例如链状和层次状结构，这些复杂的结构特性往往超出了单一空间表示法的有效范围。为此，我们创新性地提出了一种名为UniGE的表示方法，旨在应对知识图谱中不同几何结构的数据表示挑战。UniGE是首个结合双曲空间和欧几里得空间表示法的方法，采用了最优传输理论和Wasserstein重心的思想，引入了一种创新的表示对齐和融合策略。我们还提供了全面的理论分析，确立了更加稳健的误差边界，从而证明了我们方法的优势。在三个主要的基准数据集上进行的实验表明，UniGE在有效性方面表现出色，且与理论分析得出的结论相一致。

　　论文概述：面对日益复杂的信息需求，用户往往通过一系列交互式查询和操作来实现最终的检索任务，这一过程被称为会话搜索（session search）。当前策略通常考虑优化序列建模方法以实现更好的语义理解，但忽视了交互中的图结构对理解用户意图的帮助。一些方法专注于捕捉结构化行为数据，但它们使用泛化的文档表示，忽略了词级别细粒度的语义交互。在本文中，我们提出了基于符号图（Symbolic Graph）的会话搜索模型，旨在利用大语言模型的优势，实现文本语义和图结构的结合。具体来说，我们首先提出了自定义符号图的文法，使用符号语法规则将图结构数据转换为文本。这使得集成会话搜索历史、交互过程和任务描述为语言模型的输入成为可能。鉴于自定义的符号语言理解同大语言模型预训练任务的差距，为此我们引入了一系列自监督符号学习任务，包括链接预测、节点内容生成和基于文本生成方法的图对比学习，使大语言模型能够从粗粒度到细粒度捕捉拓扑信息。在AOL和Tiangong-ST两个基准数据集上的实验结果证实了我们方法的优越性。我们的范式还提供了一种新颖有效的方，弥合了传统搜索方法与现代大语言模型之间的差距。

　　论文概述：开放域问答（ODQA）是网络挖掘领域的一个关键研究热点。现有的 ODQA 方法遵循两种主要范式来收集证据：1）retrieve-then-read范式从外部语料库中检索相关文档； 2) generate-then-read范式采用大型语言模型 (LLM) 来生成相关文档。尽管两种范式都有各自的优点，但单一范式无法兼顾多方面的证据需求。为此，我们提出了一个通用框架LLMQA，将ODQA过程制定为三个基本步骤：查询扩展、文档选择和答案生成，作为一种结合基于检索和生成的证据优势的新颖范式。现有研究已证实LLM展现其出色的角色扮演能力来完成各种类型的任务。因此，与之前利用专门的模型来完成ODQA的各个模块不同，我们指导LLM在我们的统一框架中分别扮演生成器、重排序器和评估器的多重角色，并将它们集成起来相互协。

上一篇：7B开源数学模型干翻千亿GPT- 下一篇：多通道温湿度数据采集仪 PT10