Locality Sensitive Hash Aggregated Nonlinear Neighborhood Matrix Factorization for Online Sparse Big Data Analysis

计算机科学 稀疏矩阵 协同过滤 局部敏感散列 架空(工程) 大数据 推荐系统 散列函数 矩阵分解 核(代数) 非负矩阵分解 理论计算机科学 数据挖掘 机器学习 哈希表 特征向量 数学 操作系统 组合数学 物理 量子力学 高斯分布 计算机安全
作者
Zixuan Li,Hao Li,Kenli Li,Fan Wu,Lydia Y. Chen,Keqin Li
出处
期刊:ACM/IMS transactions on data science [Association for Computing Machinery]
卷期号:2 (4): 1-27 被引量:1
标识
DOI:10.1145/3497749
摘要

Matrix factorization (MF) can extract the low-rank features and integrate the information of the data manifold distribution from high-dimensional data, which can consider the nonlinear neighborhood information. Thus, MF has drawn wide attention for low-rank analysis of sparse big data, e.g., Collaborative Filtering (CF) Recommender Systems, Social Networks, and Quality of Service. However, the following two problems exist: (1) huge computational overhead for the construction of the Graph Similarity Matrix (GSM) and (2) huge memory overhead for the intermediate GSM. Therefore, GSM-based MF, e.g., kernel MF, graph regularized MF, and so on, cannot be directly applied to the low-rank analysis of sparse big data on cloud and edge platforms. To solve this intractable problem for sparse big data analysis, we propose Locality Sensitive Hashing (LSH) aggregated MF (LSH-MF), which can solve the following problems: (1) The proposed probabilistic projection strategy of LSH-MF can avoid the construction of the GSM. Furthermore, LSH-MF can satisfy the requirement for the accurate projection of sparse big data. (2) To run LSH-MF for fine-grained parallelization and online learning on GPUs, we also propose CULSH-MF, which works on CUDA parallelization. Experimental results show that CULSH-MF can not only reduce the computational time and memory overhead but also obtain higher accuracy. Compared with deep learning models, CULSH-MF can not only save training time but also achieve the same accuracy performance.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
勾勾1991发布了新的文献求助10
1秒前
魔幻小白菜完成签到,获得积分10
1秒前
2秒前
Hello应助lllm采纳,获得10
2秒前
Yen发布了新的文献求助10
2秒前
2秒前
Nina完成签到,获得积分10
4秒前
哆啦的空间站应助大闪电采纳,获得10
4秒前
cheiree完成签到,获得积分10
5秒前
5秒前
5秒前
chuting发布了新的文献求助10
5秒前
cici发布了新的文献求助10
5秒前
褚广山完成签到,获得积分10
6秒前
yi417发布了新的文献求助10
7秒前
7秒前
CipherSage应助Brain采纳,获得10
8秒前
8秒前
散漫在野完成签到,获得积分10
8秒前
9秒前
李俊枫完成签到,获得积分10
9秒前
9秒前
9秒前
英俊的铭应助凌乱采纳,获得10
10秒前
10秒前
明亮的海莲完成签到,获得积分10
10秒前
txxxx完成签到,获得积分10
10秒前
阔达宝莹发布了新的文献求助10
11秒前
xixi发布了新的文献求助10
11秒前
wjx发布了新的文献求助10
11秒前
cheers发布了新的文献求助10
12秒前
12秒前
浮游应助蓝莓西西果冻采纳,获得10
12秒前
香蕉觅云应助fananan采纳,获得10
12秒前
李俊枫发布了新的文献求助10
12秒前
12秒前
陈花蕾完成签到 ,获得积分10
13秒前
14秒前
14秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zeolites: From Fundamentals to Emerging Applications 1500
Architectural Corrosion and Critical Infrastructure 1000
Early Devonian echinoderms from Victoria (Rhombifera, Blastoidea and Ophiocistioidea) 1000
Hidden Generalizations Phonological Opacity in Optimality Theory 1000
Energy-Size Reduction Relationships In Comminution 500
Principles Of Comminution, I-Size Distribution And Surface Calculations 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4939624
求助须知:如何正确求助?哪些是违规求助? 4206076
关于积分的说明 13072741
捐赠科研通 3984470
什么是DOI,文献DOI怎么找? 2181728
邀请新用户注册赠送积分活动 1197448
关于科研通互助平台的介绍 1109668