基于大脑情感网络模型与PSO-AGA算法对抗乳腺癌候选药物ERα的研究

发布日期:2023年3月31日
基于大脑情感网络模型与PSO-AGA算法对抗乳腺癌候选药物ERα的研究 基于大脑情感网络模型与PSO-AGA算法对抗乳腺癌候选药物ERα的研究

本内容试读结束

下载后可阅读完整内容,立即下载

乳腺癌是目前世界上最常见,致死率较高的癌症之一。有研究发现,能够拮抗ERα活性的化合物可能是治疗乳腺癌的候选药物,具有重要的研究价值。本文从理想到实际,首先使用模型对数据进行清洗和筛选,之后基于大脑情感网络模型和PSO-AGA算法对ERα生物活性进行预测,再使用多元线性回归模型、支持向量机、随机森林模型和梯度提升树回归模型进行预测模型构建并求解,并对五种模型的预测效果进行分析。

乳腺癌是目前世界上最常见,致死率较高的癌症之一。乳腺癌的发展与雌激素受体密切相关,有研究发现,雌激素受体α 亚型(Estrogen Receptors alpha, ERα)在不超过10%的正常乳腺上皮细胞中表达,但大约在50%~80%的乳腺肿瘤细胞中表达;而对ERα 基因缺失小鼠的实验结果表明,ERα 确实在乳腺发育过程中扮演了十分重要的角色。目前,抗激素治疗常用于ERα 表达的乳腺癌患者,其通过调节雌激素受体活性来控制体内雌激素水平。因此,ERα 被认为是治疗乳腺癌的重要靶标,能够拮抗ERα 活性的化合物可能是治疗乳腺癌的候选药物。比如,临床治疗乳腺癌的经典药物他莫昔芬和雷诺昔芬就是ERα 拮抗剂。目前,在药物研发中,为了节约时间和成本,通常采用建立化合物活性预测模型的方法来筛选潜在活性化合物。具体做法是:针对与疾病相关的某个靶标(此处为ERα),收集一系列作用于该靶标的化合物及其生物活性数据,然后以一系列分子结构描述符作为自变量,化合物的生物活性值作为因变量, 构建化合物的定量结构–活性关系(Quantitative Structure-Activity Relationship, QSAR)模型, 然后使用该模型预测具有更好生物活性的新化合物分子,或者指导已有活性化合物的结构优化。

2. 数据来源 本文使用的数据集来自“中国研究生创新实践系列大赛”平台举办的“华为杯”第十八届中国研究生数学建模竞赛D 题,数据包括1974 个化合物的生物活性值所对应的729 个分子结构描述符和化合物对ERα 生物活性影响的情况,如表1、表2 所示。

Table 1. 729 molecular structure descriptors for 1974 compounds 表1. 1974 个化合物对应的729 个分子结构描述符 SMILES nAcid ALogP … nH … Zagreb Oc1ccc2O[C@H]([C@H](Sc2c1)C3CCCC3)c4ccc(OCCN5CCCCC5)cc4 0 −0.286 … 33 … 166 … … … … … … … Oc1ccc(cc1)C2=Cc3cc(O)ccc3C24C(=O)c5ccc(OCCN6CCCCC6)cc5C4=O 0 0.0755 … 27 … 204 … … … … … … … COc1cc(OC)cc(C=Cc2ccc(OS(=O)(=O)[C@H]3C[C@H]4O[C@@H]3C(=C4c5ccc(O)cc5)c6ccc(O)cc6)cc2)c1 0 1.8193 … 30 … 236



相关标签