项目实训–生物信息深度学习平台 个人总结1

2021SC@SDUSC

项目简介

  1. DNA、RNA、多肽链等生物大分子的结构与生命特性,直接关系到各种各样的生物性状,因此一直都是生物界研究的重中之重。
    生物大分子带来多彩世界的同时,其极度复杂的排列顺序、空间折叠结构一直是生物学界研究的难点。我们团队将尝试利用已有大分子数据,训练构建AI模型,预测输入大分子的种种特性
  2. 多种多样的疾病、以及复杂的药物-疾病关系困扰着广大患者。因为专业知识的缺失,患者往往很难根据自身的疾病查找到可以治疗该疾病的药物及相关联药物。
    一个药物预测的公众平台对于患者、普通社区医生至关重要。我们将利用web前后端技术尝试构建便于基层医生、普通老百姓易用的药物推荐平台
  3. 本平台打算实现前端,后端,高性能服务器的调用,其工程量远在普通项目之上,在可行性方面,已经规划好具体实施方案,有较强的可行性。

项目模块划分

1. 药物预测模块

模块目标

利用现有药物及关系构建多个异构网络和数以百万计的知识图,提供平台在线服务,快速推荐针对特定疾病或目标的潜在可用药物

模块功能划分

  1. 药物-药物
    通过药物检索到具有相似功能性的药物
  2. 疾病-药物
    通过疾病查找有极大可能性具有治疗作用的药物信息
  3. 数据检索
    可视化药物结构与分子结构信息的检索
  4. 结构可视化
    通过知识图谱可视化药物-疾病、基因,疾病-基因的关系

    模块设计(预计)

  5. 使用神经网络模型与知识图谱,对各种药物进行药物相关度匹配,后将预测的信息持久化存入数据库
  6. 通过数据库中持久化的药物信息,根据用户输入药物进行模糊搜索,返回可视化的药物关系图谱,以供科研类与医学类人员使用。

    2. 生物分子信息挖掘预测

    模块目标

    基于人工智能模型,训练构建预测与分析系统,使用已经由生物学界明确特性的蛋白质空间结构/多肽链序列等等复杂的数据训练有针对性的AI模型,供科研人员与医疗人员搜索,或提供算力与数据输入接口,允许用户训练自己的大分子信息挖掘模型,并使用模型对后续未知的大分子序列/空间结构进行分析

    模块功能划分

  7. DNA
    有效信息提取,对基因位点分析量化;AI合理预测展现特性
  8. RNA
    结构与性质分析,包含特征计算/提取、聚类、分类模型和RNA序列可视化
  9. 蛋白质/氨基酸
    通过氨基酸序列信息,提供其预测的性质

    模块设计

  10. 前端采用成熟的React+npm技术,使用Ant Design或Material UI作为组件库
  11. 后端使用SpringBoot技术实现数据的传输,并完成与Python AI模型程序的对接
  12. Python训练AI模型,将训练数据集尽可能全部利用,实现尽可能高的命中率

    项目分工

    个人在项目中承担前端编写工作,与组内队友蒋一一起工作完成前端框架、项目结构、与后端API对接等工作,后端由郭常瑞编写,Python模型部分由组内成员共同完成,由金俊儒牵头完成。

发表评论