摘要
10 亿美元 [4] , 所以当下有迫切的需 求通过花费少量时间与金钱去开发新的药物. 面对这些挑战, 药物重定位 [5] 成为如今开发新药的重要方法之一, 它是一种发现现有药物新的临 床适应症的策略, 它可以大大降低新药开发的风险和成本, 并且缩短药物发现和临床可用性之间的时 间周期 [6] .在 2013 年新上市的 84 个药物中有 20% 是重定位的药物 [7] , 药物重定位在新药发现和精 准医疗中起到了关键的作用.然而, 早期药物新适应症的发现往往是偶然的, 比如砷作用于急性早幼 粒细胞白血病 [8] 、醋酸锌作用于威尔逊氏病 [9] 等, 都是通过临床实验偶尔发现的, 伴随着基因组学、 生命科学、计算生物学的飞速发展以及各学科之间的融合交叉, 药物重定位正从依靠临床偶然发现慢 慢转化为通过分析大规模生物数据进行精准的预测, 利用不同的数学模型以及计算的方法来提高预测 药物与疾病之间关系的准确性.随着生物领域技术的不断发展, 近几年来, 高通量基因测序技术的出现为研究人类基因组的秘密 提供了强有力的帮助, 同时带来了许多有价值的基因表达数据, 比如药物作用于不同组织细胞系上的 基因表达数据 [10] 、不同癌症组织中的基因表达数据 [11] 、正常组织中的基因表达数据 [12] 、疾病状态下 的基因突变数据 [12] 等.众多类型的生物数据为药物重定位的研究提供了良好的基础, 而且药物重定 位研究不仅仅局限于研究药物与药物之间的关系, 还可以研究药物与靶标基因、药物与疾病、药物与 生物路径之间的关系等 [13] .根据不同的理论假设与数据, 研究人员提出了各种各样的方法来进行药物重定位研究, 主要的方 法包括基于网络模型 [14∼20] 、基于药物的药理信息 [21∼26] 、基于化合物的化学结构 [27,28] 、基于药物的 副作用 [29∼32] 、基于药物的靶标 [33,34] 等, 这些方法利用不同类型的数据以及策略进行药物重定位研 究, 使得研究人员能够在大大减少时间和金钱的情况下准确预测潜在的药物与疾病之间的关系.另一方面, 组织特异性方面的研究也飞速发展.组织特异性是由于某些组织特异表达基因的调控 作用, 使得具有相同基因的细胞在不同的组织中往往呈现出差异较大的功能.研究人员发现, 理解组 织特异表达基因的功能和不同组织细胞系的作用, 对于疾病诊断和治疗以及复杂疾病的研究有很大帮 助.Chen [35] 等从 TCGA (the cancer genome atlas) [11] 数据库中下载了 200 个肝癌组织的基因表达谱, 从 CCLE (cancer cell line encyclopedia) [36] 数据库中下载了超过 1000 个癌症细胞系的基因表达谱数 据, 其中包含 25 个肝癌细胞系的基因表达谱数据.通过研究发现, 肝癌组织的基因表达水平与肝癌细 胞系中的基因表达水平很相近.Kosti 等 [37] 分析了来自 14 个不同组织类型中的 16561 个基因的表达 水平, 以及与其对应的蛋白质功能, 发现相对于正常组织某些癌症致病基因与癌症组织之间的相关性 更强.Guan 等 [38] 整合了基因组数据和组织特异性的基因表达数据, 构建了 107 个组织特异性的功能 关系网络, 之后利用这些组织特异性的网络预测基因对应的表型, 并且证明了整合组织特异性可以提 高预测的准确率.目前全基因组关联研究已经确定了成千上万个常见疾病的致病基因, 但是, 大多数的复杂疾病的 致病机制仍然是比较模糊的.Lonsdale 等 [39] 为了深入了解不同疾病的发病机理, 建立了一个数据 库 GTEx (genotype-tissue expression) 专门研究人类不同组织中的遗传变异和基因表达之间的关系.