每一家大模型公司都是一家搜索公司：LLM检索系统的未来

5/10/2024

www.linkedin.com

https://www.chatbro.cn/news/663da0f991eb398ed9dcb074

本文强调了大型语言模型（LLM）公司在技术上面临的搜索挑战，并预测了检索系统的未来发展趋势。

在计算机科学中，搜索被认为是最困难的技术问题之一，仅有少数产品如Google、Amazon和Instagram能够实现良好的搜索功能。随着大型语言模型（LLM）和支持它们的检索系统的爆炸性增长，每家LLM公司都需要内置世界级搜索功能，以确保其产品的正常运作。检索增强生成（RAG）系统通过向LLM提供相关信息来帮助其回应查询，这使得LLM的回答更加基于现实和相关的信息。即使新的LLM具有更长的上下文窗口，允许一次处理更大的输入，但检索系统在大多数应用中仍然不可或缺，因为它们能够处理多个文档版本、实现基于角色和上下文的访问控制，以及避免不必要的计算成本和延迟。

文章指出，语义相似性搜索虽然简单易于构建，但结果普遍中等，因为它可能会遗漏与查询语义不同但实际有用的内容，对嵌入模型敏感，对输入数据的处理方式敏感，并且计算成本高昂。优秀的搜索系统不仅仅是返回与查询最相似的结果，而是要返回最佳的结果，这可能包括视频推荐、历史购买记录等多种因素。

未来的检索系统将更加复杂，类似于当前的生产搜索或推荐系统，它们将对LLM应用的有效内存、响应质量、可靠性和性能/延迟产生显著影响。大多数公司将内部构建这些检索系统作为核心竞争力，并依赖新的基础设施来构建特定于应用的检索系统。这些系统将需要更好的工具来创建、操作和使用不同类型的向量，以及更有效地处理不同类型的输入数据，并在近实时的时间内执行检索系统。

尽管大多数公司将自行构建检索系统，但基础设施提供商可能会扩展其服务范围，覆盖更广泛的基础设施堆栈，或者可能会出现针对特定应用或模态的产品化“检索即服务”（Retrieval as a Service）解决方案。

要点

检索是LLM系统的关键组成部分，不会消失：即使LLM的上下文窗口变长，检索系统仍然是确保LLM提供准确和相关回答的重要部分。
语义相似性搜索是不足的：虽然语义相似性搜索是一个起点，但它不能解决所有的搜索问题，因为它可能会错过一些有用的内容，并且对嵌入模型和输入数据处理方式非常敏感。
搜索的未来是复杂的：未来的检索系统将更加复杂，需要结合多种信号（如推荐或行为向量），并且能够处理多种类型的输入数据。
大多数公司将自行构建检索系统：作为核心竞争力，大多数公司将选择自行构建检索系统，而不是依赖外部解决方案。
检索系统的基础设施需要发展：为了支持这些新的检索系统，需要开发新的基础设施工具，以便更有效地处理和监控检索过程。
检索系统将对LLM应用产生深远影响：检索系统的性能将对LLM应用的有效性、质量和可靠性产生显著影响。
可能出现检索即服务的解决方案：尽管大多数公司可能会自行构建检索系统，但仍有可能出现针对特定应用或模态的检索即服务解决方案。