A Learned Index for Exact Similarity Search in Metric Spaces

搜索引擎索引 计算机科学 最近邻搜索 数据挖掘 聚类分析 公制(单位) 度量空间 数据库索引 相似性(几何) 索引(排版) 范围查询(数据库) 情报检索 人工智能 搜索引擎 Web搜索查询 数学 Web查询分类 数学分析 图像(数学) 万维网 经济 运营管理
作者
Yao Tian,Tingyun Yan,Xi Zhao,Kai Huang,Xiaofang Zhou
出处
期刊:IEEE Transactions on Knowledge and Data Engineering [Institute of Electrical and Electronics Engineers]
卷期号:: 1-14 被引量:9
标识
DOI:10.1109/tkde.2022.3206441
摘要

Indexing is an effective way to support efficient query processing in large databases. Recently the concept of learned index , which replaces or complements traditional index structures with machine learning models, has been actively explored to reduce storage and search costs. However, accurate and efficient similarity query processing in high-dimensional metric spaces remains to be an open challenge. In this paper, we propose a novel indexing approach called LIMS that uses data clustering, pivot-based data transformation techniques and learned indexes to support efficient similarity query processing in metric spaces. In LIMS, the underlying data is partitioned into clusters such that each cluster follows a relatively uniform data distribution. Data redistribution is achieved by utilizing a small number of pivots for each cluster. Similar data are mapped into compact regions and the mapped values are totally ordinal. Machine learning models are developed to approximate the position of each data record on disk. Efficient algorithms are designed for processing range queries and nearest neighbor queries based on LIMS, and for index maintenance with dynamic updates. Extensive experiments on real-world and synthetic datasets demonstrate the superiority of LIMS compared with traditional indexes and state-of-the-art learned indexes.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
zaiyi完成签到 ,获得积分10
刚刚
liuchao完成签到,获得积分10
1秒前
skyleon完成签到,获得积分10
2秒前
薄荷草莓糖完成签到,获得积分10
3秒前
等待念之完成签到,获得积分10
4秒前
Shaynin完成签到,获得积分10
4秒前
脑洞疼应助小新采纳,获得10
8秒前
诚心的哈密瓜完成签到 ,获得积分10
9秒前
JamesPei应助是阿龙呀采纳,获得10
12秒前
tangyangzju完成签到,获得积分10
13秒前
泠漓完成签到 ,获得积分10
13秒前
nglmy77完成签到 ,获得积分0
15秒前
高贵觅山完成签到,获得积分10
15秒前
小蘑菇完成签到,获得积分10
16秒前
贤惠的豌豆完成签到,获得积分10
16秒前
dengqr5完成签到,获得积分10
16秒前
贪玩初彤完成签到 ,获得积分10
17秒前
游艺完成签到 ,获得积分10
17秒前
花花2024完成签到 ,获得积分10
17秒前
smile完成签到,获得积分10
18秒前
19秒前
LmyHusband完成签到,获得积分10
19秒前
小唐完成签到,获得积分10
19秒前
Lychee完成签到,获得积分10
20秒前
懒癌晚期完成签到,获得积分10
21秒前
jingchengke完成签到,获得积分10
21秒前
22秒前
漂亮的元芹完成签到,获得积分10
23秒前
23秒前
tian发布了新的文献求助10
24秒前
曹广秀完成签到,获得积分10
25秒前
25秒前
查不到我就吃饭完成签到 ,获得积分10
25秒前
轩轩轩轩完成签到 ,获得积分10
26秒前
Accpted河豚完成签到,获得积分10
26秒前
路先生完成签到,获得积分10
28秒前
赵小麦完成签到 ,获得积分10
28秒前
蔺铁身发布了新的文献求助20
28秒前
卡牌大师完成签到,获得积分10
30秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Modern Epidemiology, Fourth Edition 5000
Kinesiophobia : a new view of chronic pain behavior 5000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 3000
Digital Twins of Advanced Materials Processing 2000
Propeller Design 2000
Weaponeering, Fourth Edition – Two Volume SET 2000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 化学工程 生物化学 物理 计算机科学 内科学 复合材料 催化作用 物理化学 光电子学 电极 冶金 细胞生物学 基因
热门帖子
关注 科研通微信公众号,转发送积分 6013415
求助须知:如何正确求助?哪些是违规求助? 7582549
关于积分的说明 16140608
捐赠科研通 5160724
什么是DOI,文献DOI怎么找? 2763435
邀请新用户注册赠送积分活动 1743491
关于科研通互助平台的介绍 1634346