《化学信息处理》PPT课件

《化学信息处理》PPT课件

ID:38696270

大小:6.01 MB

页数:35页

时间:2019-06-17

《化学信息处理》PPT课件_第1页
《化学信息处理》PPT课件_第2页
《化学信息处理》PPT课件_第3页
《化学信息处理》PPT课件_第4页
《化学信息处理》PPT课件_第5页
资源描述:

《《化学信息处理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二节 化学信息处理化学信息学产生的背景组合化学和高通量筛选,出现了巨大的信息,需要快速收集、存储、分析和处理,随着信息技术向化学领域的渗透,形成了新的交叉学科——化学信息学。研究内容化合物信息在计算机中的表示化合物数据库的建立、使用和管理化合物相似性、多样性及分子类药性分析化合物定量构效关系化学信息学Chemoinformatics,chemicalinformatics, Cheminformatics,chemi-informatics利用计算机信息处理技术对化学分子结构和相关信息进行管理的一种综

2、合性技术和学科应用化学信息学可促进化学信息的获取、转化与共享一、化学信息的表示方法化学分子一维结构:化合物名称(俗名);线性符号表示法。二维结构:原子用元素符号,键用短线,即化合物结构式。为平面结构。三维结构:原子的空间位置、相互间距离、键角和二面角等。分子表面:建立在三维结构基础上,能与分子的三维结构一一对应。一维结构NC(Cc1ccccc1)C(O)=O(SMILES编码)三维结构二维结构分子表面苯丙氨酸分子结构表征层次(一)一维结构表示SMILES(简化分子线性输入系统) 编码的基本原则原子通常以

3、大写元素符号表示(省略氢原子),芳香结构原子则以小写表示。相邻原子依次排放在一起,单键通常省略,双键和三键分别以“=”和“#”表示,芳香键以“:”表示,也可省略。分支部分放在括号内,环则打开,并赋予断开键两端的原子以相同的数值。双键“/”表示顺式,“”表示反式。原子顺时针排列用@表示,逆时针排列用@@表示。甲烷CH4C乙醇C2H5OHCCO氰化氢HCNC#N环已烷C6H12C1CCCCC1吡啶C5H5Nn1ccccc1异丁酸(CH3)2CHCO2HCC(C)C(=O)O反式二溴甲烷Br/C=C/Br或

4、BrC=CBr顺式二溴甲烷BrC=C/Br或Br/C=CBrL-丙氨酸N[C@@H](C)C(=O)OD-丙氨酸N[C@H](C)C(=O)O举例说明苯丙氨酸NC(Cc1ccccc1)C(O)=OC/C=CC=[C@@H](O)C#NSMILES编码的立体化学信息表示SLN编码(Sybyl线性标记法)的规则原子以其元素符号表示,氢原子也要显示;单键省略,双键、三键和芳香键分别以“=”“#”和“:”表示;分支也采用括号表示;环也打开,依靠环上一个预先定义好的具有唯一编号的原子及@符号来识别,如

5、环己烷表示为C[15]H2CH2CH2CH2CH2CH2@15;原子和键的属性(如电荷、立体化学性质等)可通过方括号[]或尖括号<>在该原子后标记出;对大分子的原子,可使用缩写,如氨基酸可以用其三个字母缩写形式表示。(二)二维结构表示1、图论基础和图的矩阵表示一个简单的图由顶点(V)和边(E)组成,因此图被定义为一个三元组,φ为映射函数。在下面一个简单的无向图中,V={1,2,3,4},E={e1,e2,e3,e4,e5,e6}。1423e1e2e4e3e5e6图也可用矩阵表示:设G=

6、,E>为无向图,令mij等于顶点vi与边ej的关联次数,则称(mij)n*m为G的关联矩阵,记为M(G)。M(G)=110000111100000111001011423e1e2e4e3e5e6CCCHCCCCNHCCOOH用图表示苯丙氨酸的结构2、化合物结构的矩阵表示(1)邻接矩阵(以乙醛为例)(2)距离矩阵:表示了相应原子之间的距离:几何距离(用Å表示),拓扑距离(两原子之间连接的键的个数)(3)键矩阵:矩阵元素为相连接的两个原子之间的键级。双键:2,三键:3。(4)关联矩阵:是一个n×m的矩阵。顶

7、点(原子)作为列(n),边(化学键)作为行(m),如果边在顶点内,则相应的元素置为1。3、连接表20世纪80年代开始,成为化合物在计算机中表示的最主要方法。首先对每个原子进行编号并列表然后在另一表格中列出键的信息,键级用整数表示,1表示单键,2表示双键。(三)三维结构表示1、直接坐标法用迪卡尔坐标直接存储每个原子的三维坐标(x,y,z)2、内坐标法每个原子位置以与其他原子间的3个相对位置关系表示——相对距离、键角、二面角(四)分子存储格式及其相互转换文件格式扩展名特点Molfile*.molMDL公司提

8、出的分子文件格式,应用最广泛的连接表格式Mol2file*.2molTripos公司推出,包含一个或多个化合物。目前药物设计领域最流行的格式Maestro*.maeSchodinger公司推出的一种文件格式,包含一个或多个化合物。SDfile*.sdf结构数据文件,MDLMolfile的扩展,包含一个或多个化合物。RDfile*.rdf反应数据文件,MDLMolfile的扩展,包含一个或多个反应。SMILES*.smi应用最广泛的线性编码和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。