药物发现过程中的组合化学(五):化合物库的设计
子炎译
从理论上看,可以合成的类药物分子的数量预计从10e50到10e不等。当我们考虑到材料的可用性(可观测宇宙的总质量约为10e52千克)或所需时间(地球寿命只有10e17秒)时,结果很明显,不可能实现这样一个目标。化合物库设计的主要目的是从大量可能的化合物中选择一个子集,其中的化合物可以高效地合成,并且有很高的概率产生新的先导化合物或者对已有先导化合物的性质进行改进。文献中描述的设计方法学十分宽泛,这表明这一问题其实没有明确的解决方案。一些试图解决该问题软件已经商业化,相关的一些综述已经出版。
下面描述的一些技术虽然超出了当前讨论的范围,但是其已应用于化合物筛选(单独的或化合物库),以增加现有筛选集合。此外,当筛选能力小于可用化合物的数量时,这些方法可以选择整个集合中具有代表性或带有一定方向性的子集用于筛选。
在大多数情况下,化合物库设计的出发点是一个虚拟的化合物库,这个化合物库定义了所有可以通过特定合成途径获得的化合物。通常,虚拟化合物库被定义为一个固定的模板(骨架,核心结构)和许多可变(多样性)的位点。每个位点的可能取代基(R-基团、片段)的集合,来自于多种试剂,而这些试剂的应用范围,可以通过其对特定的合成路线的可用性和适用性来确定。虚拟化合物库也可以定义为应用于单体集的一系列变换(反应)。这种转化方法对药物化学家来说更为直观,并且可以表示某些反应的产物,例如Diels–Alder反应,因此,其比模板-取代基方法更令人满意。然而,后者的计算效率更高,因此最为常见。
对于方法学,文献中主要强调的是选择可以用于修饰模板的多样化试剂。在这方面,一个无法避免的概念是多样性,其有许多定义。化合物的多样性子集被认为其可以代表完整虚拟化合物库所占据的化学空间。定义化学空间,从而测量多样性,需要以计算机友好格式(数字、矩阵或位串)表示化合物性质的描述符。已经有大量描述符(示例见表1)被报道,并且经常组合使用,形成一个多维的化学空间。富有想象力的图像展示,如花卉图,可用于同时可视化许多属性。然而,当数据集较大时,通常通过主成分分析等技术来降低维数,对计算过程和结果的可视化进行简化。
表1化合物库设计的描述符
转载请注明:http://www.jinyawz.com/zflyy/9891.html