logo好方法网

一种构建图索引的方法、装置、电子设备及存储介质


技术摘要:
本申请实施例提供了一种构建图索引的方法、装置、电子设备及存储介质,涉及计算机应用技术领域。该方法包括:将在线缓存区中的在线缓存数据和待更新数据存入离线缓存区,得到离线缓存数据;对离线缓存区中的离线缓存数据构建图索引,生成离线缓存数据相应的图索引数据  全部
背景技术:
目前,工业界主流的向量召回系统基本采用召回率比较高的图索引算法,例HNSW (Hierarchcal  Navigable  Small  World  graphs)算法。如图1所示,根据HNSW算法构建图索 引的过程如下: 假设A、B、C、D、E、F这七个二维点分别代表7个数据,在对这7个数据进行图索引操 作时,假设用户设置在插入每个点时,都需要确定与该点相邻的3个最近的点,既紧邻友点。 首先,初始点是随机选取的A点,此时A点没有友点;然后插入B点,则A点为B点的友点,因此 连接BA,此为第1次构造;然后,插入F点,F点的友点为A和B,因此连接FA,FB,此为第2次构 造;然后插入了C点,C点的友点为A,B,F,因此连接CA,CB,CF,此为第3次构造;然后插入E点, E的友点为A,B,F,C,但由于之前设置仅需要确定相邻的且距离最近的3个紧邻友点,因此需 要从A,B,C,F任意一点出发,计算出发点与E的距离和出发点的所有友点和E的距离,从中选 出最近3个近点为紧邻友点。因此连接EA,EC,EF,此为第四次构造。按照该方式可完成所有 数据的图索引操作。 上述过程中当需要在已有数据中插入新数据还是比较容易实现的,但由于各个数 据之间的牵连比较复杂,图索引一但建立,若涉及到图结构的修改,即在对图索引数据进行 使用的过程中,如果对已有数据进行更新,例如删除操作时整个图索引结构发生改变,将会 导致引用图索引数据发生错误。
技术实现要素:
本申请提供了一种构建图索引的方法、装置、电子设备及存储介质,可以解决对在 线缓存区中的已有数据进行更新操作时,因整个图索引结构及数据发生改变而导致引用已 有数据发生错误的问题。所述技术方案如下: 第一方面,提供了一种构建图索引的方法,该方法包括: 将在线缓存区中的在线缓存数据和待更新数据存入离线缓存区,得到离线缓存数 据; 对离线缓存区中的离线缓存数据构建图索引,生成离线缓存数据相应的图索引数 据; 在每次接收到针对在线缓存区的数据访问请求时,基于离线缓存区中存储的离线 缓存数据及相应的图索引数据,确定数据访问请求的响应数据。 第二方面,提供了一种构建图索引的装置,该装置包括: 存储单元,用于将在线缓存区中的在线缓存数据和待更新数据存入离线缓存区, 得到离线缓存数据; 4 CN 111597403 A 说 明 书 2/9 页 生成单元,用于对离线缓存区中的离线缓存数据构建图索引,生成离线缓存数据 相应的图索引数据; 确定单元,用于在每次接收到针对在线缓存区的数据访问请求时,基于离线缓存 区中存储的离线缓存数据及相应的图索引数据,确定数据访问请求的响应数据。 第三方面,提供了一种电子设备,该电子设备包括: 一个或多个处理器; 存储器; 一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由 一个或多个处理器执行,一个或多个程序配置用于:执行上述的构建图索引方法。 第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处 理器执行时实现上述的构建图索引方法。 本申请提供的技术方案带来的有益效果是: 本申请根据在线缓存区中的在线缓存数据和待更新数据得到离线缓存数据,并对 该离线缓存数据构建图索引,生成离线缓存数据相应的图索引数据,当接收到访问在线缓 存区域的数据访问请求时,可根据离线缓存中的数据对访问请求作出响应。可见,这一过程 可在离线缓存中实现对数据更新的操作,该过程的优点在于:当需要对当前在线缓存区中 的数据进行访问时,不会因为数据更新、图索引结构发生改变而导致访问出错。 附图说明 结合附图并参考以下
分享到:
收藏