Réinventer la recherche : Une méthode économique face à l'IA

在人工智能时代，彻底改变搜索引擎已成为一项重大挑战。一支创新团队揭示了一种可能重新定义这一重要领域的经济方法。*准确评估搜索结果的相关性* 在面对日益增长的人工智能用户需求时变得尤为重要。
这项新方法，称为 eRAG，承诺 *转变搜索引擎的运作方式*，使其能够适应语言模型的特定需求。 这一技术进步回应了当前人类搜索与人工智能期望之间的错位。 *预测新趋势* 为企业和消费者提供了迷人的前景，呼吁他们重新评估与信息搜索的关系。

一种创新的方法：eRAG

马萨诸塞州阿默斯特大学的研究团队最近提出了一种革命性的方法，名为 eRAG。该系统能够评估由人工智能生成的搜索的可靠性。这种方法的发布出现在 第47届国际ACM SIGIR信息检索研究与发展会议的论文集中。

搜索引擎重新定义的需求

传统上，搜索引擎是为了满足人类的需求而设计的。研究的主要作者阿里雷扎·萨莱米指出，当请求者是个人时，这些工具的表现令人满意。然而，大型语言模型(LLM)的出现，如ChatGPT，正在改变这种动态。这种变化要求对搜索引擎进行全面重构，以适应LLM的需求。

LLM面临的挑战

人类和LLM在信息需求上存在根本性的差异。例如，当寻找一本书时，个人可以通过广泛的术语来细化搜索，直到找到所需的作品。相比之下，由于受到特定数据集的限制，LLM无法访问其数据库中不存在的信息。这一局限性使得模糊查询变得特别棘手。

RAG解决方案

为了解决这些挑战，研究人员提出了一种称为 检索增强生成（RAG）的概念。该方法允许LLM借助搜索引擎提供的结果来丰富自身，从而更轻松地获取相关信息。问题是：如何评估这些结果对LLM的有用性？

现有的评估方法

研究人员有三种主要的评估方式。第一种是咨询一个人类小组来判断相关性。尽管这种方法经典，但成本高且对于理解LLM对信息的敏感性效率较低。

另一种选择是让LLM生成相关性判断。这种技术更加经济，但如果不使用最强大的模型，精确度可能受到影响。最后，黄金标准方法涉及评估由检索增强的LLM的端到端性能，但仍然代价高昂且不透明。

eRAG的优势

基于这一观察，萨莱米和他的同事哈米德·扎马尼设计了eRAG，这是一种类似黄金标准的方法，但显著更经济。eRAG的运行速度快至三倍，并且所需的GPU功率少至五十分之一，同时保持了类似的可靠性水平。

该过程开始于人类用户与基于LLM的AI代理的互动，以完成一项任务。代理向搜索引擎提交请求，搜索引擎返回约五十条结果。接下来，eRAG评估这些条目，以确定哪些对生成适当答案有利。

对搜索引擎未来的影响

迄今为止，没有一个搜索引擎能与所有已开发的LLM实现广泛兼容。尽管如此，准确性、经济性和eRAG的易实施性构成了朝着在搜索引擎中广泛集成AI的一大步。

该研究在2024年SIGIR会议上获得了最佳短篇论文奖。包含eRAG代码的公共Python包可在以下网址下载：GitHub。

常见问题解答

什么是eRAG方法，它是如何工作的？
eRAG是一种创新的方法，旨在评估搜索引擎在语言模型AI上的可靠性。它使AI和搜索引擎之间相互作用，从而评估为AI模型生成的搜索结果的质量。
在人工智能时代，重新思考搜索引擎为何必要？
传统搜索引擎是为人类设计的，而语言模型AI（如LLM）有着不同的信息需求。重新设计是必要的，以满足这些新需求并提高AI进行的搜索的效率。
与传统评估方法相比，eRAG方法的优势是什么？
eRAG方法的速度快至三倍，使用的GPU功率比传统方法少50倍，同时提供可靠的评估。它优于其他可能昂贵且精度较低的方法。
eRAG如何帮助改善搜索引擎与AI之间的关系？
eRAG促进了AI与搜索引擎之间的对话，从而使每个实体能够相互学习。这导致AI生成的搜索得到优化，使结果更具相关性。
eRAG的研究得到了什么认可？
开发eRAG方法的研究在2024年SIGIR会议上获得了计算机协会的奖项，强调了其在人工智能时代信息检索领域的重大影响。
eRAG如何促进向基于AI的搜索引擎的过渡？
eRAG为基于AI的搜索引擎提供了可靠的评估方法，从而促进AI在搜索系统中的集成，以提升用户体验和结果的相关性。
eRAG相比于以前的评估系统克服了什么挑战？
eRAG克服了以前方法的高成本和缺乏透明度的问题，提供了一种评估搜索结果性能的解决方案，而不带有传统方法的缺点。

Une équipe dévoile une méthode经济为重新思考搜索引擎在AI时代的使用

一种创新的方法：eRAG

搜索引擎重新定义的需求

LLM面临的挑战

RAG解决方案

现有的评估方法

eRAG的优势

对搜索引擎未来的影响

常见问题解答

Apple 似乎打算让 Anthropic 和 OpenAI 为 Siri 提供动力

一個不存在的樂隊在 Spotify 上大受歡迎的現象：對於平台挑戰的反思

利用人工智能加速科学发现

Bilan des fusions-acquisitions en cybersécurité : 人工智能的进步推动了六月份的活动

大考口試的考驗在ChatGPT时代：对知识深度和论证的反思

人工智能對我們日常生活影響的發現

Une équipe dévoile une méthode经济为重新思考搜索引擎在AI时代的使用

一种创新的方法：eRAG

搜索引擎重新定义的需求

LLM面临的挑战

RAG解决方案

现有的评估方法

eRAG的优势

对搜索引擎未来的影响

常见问题解答

.tdi_114{z-index:84546!important}一個不存在的樂隊在 Spotify 上大受歡迎的現象：對於平台挑戰的反思

.tdi_133{z-index:84546!important}利用人工智能加速科学发现

.tdi_152{z-index:84546!important}Bilan des fusions-acquisitions en cybersécurité : 人工智能的进步推动了六月份的活动

.tdi_171{z-index:84546!important}大考口試的考驗在ChatGPT时代：对知识深度和论证的反思

.tdi_190{z-index:84546!important}人工智能對我們日常生活影響的發現

一個不存在的樂隊在 Spotify 上大受歡迎的現象：對於平台挑戰的反思

利用人工智能加速科学发现

Bilan des fusions-acquisitions en cybersécurité : 人工智能的进步推动了六月份的活动

大考口試的考驗在ChatGPT时代：对知识深度和论证的反思

人工智能對我們日常生活影響的發現