Discovering trends in text databases

短语 计算机科学 时间戳 子序列 名词短语 情报检索 领域(数学分析) 词(群论) 数据库 期限(时间) 自然语言处理 语言学 数学 量子力学 物理 名词 数学分析 计算机安全 哲学 有界函数
作者
Brian Lent,Rakesh Agrawal,Ramakrishnan Srikant
出处
期刊:Knowledge Discovery and Data Mining 卷期号:: 227-230 被引量:211
链接
摘要

We address the problem of discovering trends in text databases. Trends can be used, for example, to discover that a company is shifting interests from one domain to another. We are given a database V of documents. Each document consists of one or more text fields and a timestamp. The unit of text is a word and a phrase is a list of words. (We defer the discussion of more complex structures till the “Methodology” secl-inn Ao.aw.;,tc.rl ..r;th r...rh nhrano ;a s h;rtmw nf the YAVU., ~uu”~Icu”n,L& ““lull \.uIUIA yuLCll”U I” Lo ,YYUY”~ y “I Yll” frequency of occurrence of the phrase, obtained by partitioning the documents based upon their timestamps. The frequency of occurrence in a particular time period is the number of documents that contain the phrase. (Other measures of frequency are possible, e.g. counting each occurrence of the phrase in a document.) A trend is a specific subsequence of the history of a phrase that satisfies the users’ query over the histories. For example, the user may specify a “spike” query to finds those phrases whose frequency of occurrence increased and then decreased.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
生动梦松发布了新的文献求助400
4秒前
ybheart完成签到,获得积分0
7秒前
吉吉完成签到,获得积分10
11秒前
风吹而过完成签到 ,获得积分10
14秒前
凡凡完成签到,获得积分10
17秒前
橙子发布了新的文献求助30
17秒前
聪明的二休完成签到,获得积分10
22秒前
穿山的百足公主完成签到 ,获得积分10
29秒前
邓佳鑫Alan应助钢铁侠2采纳,获得10
31秒前
穆奕完成签到 ,获得积分10
34秒前
aeolianbells完成签到 ,获得积分10
34秒前
我不是哪吒完成签到 ,获得积分10
35秒前
记忆过去完成签到 ,获得积分10
35秒前
阳光的Kelly完成签到 ,获得积分10
36秒前
液晶屏99完成签到,获得积分10
36秒前
ElaineXU完成签到 ,获得积分10
36秒前
吴谷杂粮完成签到 ,获得积分10
40秒前
40秒前
星沉静默发布了新的文献求助10
43秒前
鲁卓林完成签到,获得积分10
45秒前
多少完成签到,获得积分10
47秒前
黑大侠完成签到 ,获得积分0
47秒前
超越俗尘完成签到,获得积分10
49秒前
默默莫莫完成签到 ,获得积分10
50秒前
sadh2完成签到 ,获得积分10
55秒前
冷静的小虾米完成签到 ,获得积分10
57秒前
钢铁侠2完成签到,获得积分10
1分钟前
赤子心i完成签到 ,获得积分10
1分钟前
沙脑完成签到 ,获得积分10
1分钟前
ymxlcfc完成签到 ,获得积分10
1分钟前
健壮可冥完成签到 ,获得积分10
1分钟前
Akim应助科研通管家采纳,获得10
1分钟前
隐形曼青应助科研通管家采纳,获得10
1分钟前
CipherSage应助科研通管家采纳,获得10
1分钟前
爆米花应助科研通管家采纳,获得10
1分钟前
今后应助科研通管家采纳,获得10
1分钟前
1分钟前
molihuakai应助科研通管家采纳,获得10
1分钟前
丘比特应助科研通管家采纳,获得10
1分钟前
小马甲应助科研通管家采纳,获得10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6399425
求助须知:如何正确求助?哪些是违规求助? 8216040
关于积分的说明 17407956
捐赠科研通 5452750
什么是DOI,文献DOI怎么找? 2881908
邀请新用户注册赠送积分活动 1858331
关于科研通互助平台的介绍 1700339