A Learned Index for Exact Similarity Search in Metric Spaces

搜索引擎索引 计算机科学 最近邻搜索 数据挖掘 聚类分析 公制(单位) 度量空间 数据库索引 相似性(几何) 索引(排版) 范围查询(数据库) 情报检索 人工智能 搜索引擎 Web搜索查询 数学 Web查询分类 数学分析 运营管理 万维网 经济 图像(数学)
作者
Yao Tian,Tingyun Yan,Xi Zhao,Kai Huang,Xiaofang Zhou
出处
期刊:IEEE Transactions on Knowledge and Data Engineering [IEEE Computer Society]
卷期号:: 1-14 被引量:9
标识
DOI:10.1109/tkde.2022.3206441
摘要

Indexing is an effective way to support efficient query processing in large databases. Recently the concept of learned index , which replaces or complements traditional index structures with machine learning models, has been actively explored to reduce storage and search costs. However, accurate and efficient similarity query processing in high-dimensional metric spaces remains to be an open challenge. In this paper, we propose a novel indexing approach called LIMS that uses data clustering, pivot-based data transformation techniques and learned indexes to support efficient similarity query processing in metric spaces. In LIMS, the underlying data is partitioned into clusters such that each cluster follows a relatively uniform data distribution. Data redistribution is achieved by utilizing a small number of pivots for each cluster. Similar data are mapped into compact regions and the mapped values are totally ordinal. Machine learning models are developed to approximate the position of each data record on disk. Efficient algorithms are designed for processing range queries and nearest neighbor queries based on LIMS, and for index maintenance with dynamic updates. Extensive experiments on real-world and synthetic datasets demonstrate the superiority of LIMS compared with traditional indexes and state-of-the-art learned indexes.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
4秒前
666完成签到,获得积分10
6秒前
无花果应助大侦探皮卡丘采纳,获得10
6秒前
Bake完成签到,获得积分10
9秒前
科研通AI2S应助阿邱采纳,获得10
11秒前
英姑应助猪猪侠采纳,获得10
13秒前
科研通AI5应助gs采纳,获得10
15秒前
17秒前
畅快的如松完成签到,获得积分10
17秒前
18秒前
19秒前
20秒前
21秒前
24秒前
25秒前
psm完成签到 ,获得积分10
25秒前
gs发布了新的文献求助10
26秒前
阿邱发布了新的文献求助10
28秒前
30秒前
星辰大海应助yjy采纳,获得10
30秒前
共享精神应助gs采纳,获得10
32秒前
大侦探皮卡丘完成签到,获得积分10
33秒前
大连最后的矜持完成签到,获得积分10
34秒前
严逍遥完成签到 ,获得积分10
34秒前
35秒前
千空发布了新的文献求助10
36秒前
42秒前
ele_yuki完成签到,获得积分10
44秒前
45秒前
阮大帅气完成签到,获得积分10
45秒前
君寻完成签到 ,获得积分10
47秒前
49秒前
我是老大应助hanruiLi采纳,获得30
55秒前
55秒前
子凡应助负责的妙松采纳,获得10
55秒前
57秒前
57秒前
YSY发布了新的文献求助10
58秒前
Orange应助逃亡的小狗采纳,获得10
58秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778731
求助须知:如何正确求助?哪些是违规求助? 3324256
关于积分的说明 10217657
捐赠科研通 3039405
什么是DOI,文献DOI怎么找? 1668081
邀请新用户注册赠送积分活动 798513
科研通“疑难数据库(出版商)”最低求助积分说明 758401