论道医药专利 | 医药化工领域利用化学结构检索专利的技巧

2019-11-01 10:58:02
为化学结构检索医药化工专利提供帮助和参考
Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2abhXpFdPnhebYqa62tcDw3BfIaRhgruCaXgsXjBQB8h3VfQh9ibcgDXw.gif

摘要:在进行专利信息的检索和调研的过程中,化学结构式的数字化检索是医药化工领域专利信息检索重要手段。由于具有化学结构检索的商业数据库价格较高,使得许多企业不能及时有效地进行化学结构的专利检索。本文筛选出几种具有化学结构检索功能的免费数据库,为采用化学结构检索医药化工专利提供帮助和参考。


关键词:化学结构;专利检索;数据库;免费

Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aLf46Ssvtln8b6MV3mr3yMXT90ZKspyhLnb1ial4M0RuLzQpz3CPY4kQ.gif


01

化学结构信息检索的重要性


专利信息的检索和利用在医药化工领域技术调研、新产品开发和实施专利保护中有着重要的作用;医药化学领域行业,对专利信息的检索和利用已关乎到企业发展的战略层面。在进行专利信息的检索和调研的过程中,一般领域专利检索常采用关键词和分类号进行检索,而医药化工领域的专利检索除了采用关键词和分类号进行检索,还可以采用化学结构信息进行专利的检索。化学结构式的电子化检索逐渐成为医药化工领域专利信息检索的重要手段。


随着化学专利数量不断增加且化学物质的命名不唯一,而且很多新合成或者新发现的化学物质必须以化学结构的方式进行描述,再加之专利撰写过程中语言表达的多样性和复杂性,因此在检索的过程中很难用关键词进行充分描述。而化学结构信息作为化学物质结构组成的特有表现形式,化学结构与化学物质具有唯一的对应性,采用化学结构式进行检索可以大大提高检索的准确性和检索效率。因此,化学结构信息在医药化工领域专利检索中表现出尤为特殊的重要性。


02

化学结构式检索的困境


化学结构式是一种特殊图形信息,采用化学物质的结构进行信息检索,是以化学结构图形进行匹配检索。需要检索系统对化学结构信息作深加工处理,才能实现以化学结构式进行专利检索,一般的检索系统往往难以实现化学结构的检索。当然,现有的数据库也已经能对结构式进行检索,例如Scifinder、ISI chemserver等,但是这些数据对专利的检索功能较差。对于专利数据来说,现有的部分商业专利数据库已经实现了化学结构的检索(例如DWPI等)。


由于具有化学结构检索的专利数据库往往需要较高的开发费用,具有化学结构检索的商业数据库价格较高,大大增加了国内企业的检索和研发成本,使得很多资金薄弱的初创企业对价格高昂的检索数据库望而却步。而一般免费专利数据库,由于没有对复杂化学结构信息进行处理的手段,往往无法采用化学结构信息进行专利检索。使得检索人员渴望进行化学结构检索时,往往没有合适、免费的检索工具。如何利用免费数据库,实现医药化工专利的化学结构检索成为了检索人员的困境。


笔者通过对大量免费数据库的筛选,选择出几种具有化学结构检索的免费数据库,并对数据库功能进行介绍和说明,希望为检索人员采用化学结构检索医药化工专利提供一定的参考和帮助。


03

检索化学结构的免费专利数据库


3.1  PATENTSCOPE数据库


世界知识产权组织的PATENTSCOPE数据库可以对《专利合作条约》和部分国家和地区专利局的专利文献进行检索,检索字段包括关键字检索、号码检索、名称检索和分类检索等。2016年10月PATENTSCOPE推出了化学结构检索功能,为用户提供了在PATENTSCOPE中对专利文件中的化学结构信息进行检索的途径。PATENTSCOPE结构式检索目前可用于英文和德文(自1978年起)公布的PCT申请和美国(自1979年起)的数据库。


(1)PATENTSCOPE化学结构检索


登录PATENTSCOPE后点选“Chemical compounds”模块进行化学结构的检索,具体见下图。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2a4mibMj7KnUoIjrFm1quyAwAkvialIoYRK083wqicvSOicRwaibkQZkibMc8Q.png


采用PATENTSCOPE进行化学结构式检索时,具有2种方式:


(1)可以通过上传结构式进行检索,接受的格式包括结构式文件(文件类型MOL)或者图片格式(文件类型png、gif、tiff和jpeg等);具体如下图所示:


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2a2nWfOuhLgQGIrIvYoBedsibOoMafLGUO5F7rxgSDm3BMsl7Q3StaDZg.png


(2)采用结构编辑器绘制或编辑结构,以非常直观的方式绘制化学结构、反应和片段;具体如下图所示:


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aJNzCHGJryZblNrFM7cZSjYagbmA8icNUOicU1OiauHODbojvhyd3mLhMg.png


除此之外,近期PATENTSCOPE数据库对化学结构检索进行了进一步的优化,检索人员可以进行化学亚结构检索,并在大约1000万个结构中查找含有某个特定片段的结构。此前的化学品检索功能只能通过名称或完整结构图进行检索,而新工具使研究人员得以查看更大范围的结果,使得检索人员更容易查到哪些分子含有其寻求的片段。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aGV3uJ6tZhIm0es4GFhm21UmAJGuIibvOWjP2D0zFqkzmP4lhEgIS6QA.png


例如,在检索模块中输入阿托品化合物某种亚结构,以阿托品化合物某种亚结构进行检索,检索结果如上图所示。含有亚结构的相关内容都会在检索结果中输出,同时还以特殊的颜色进行标注,大大提高了检索人员的阅读效率。


3.2  国家知识产权局专利检索系统


国家知识产权局专利检索系统于2011年4月26日上线,收录了103个国家、地区和组织的专利数据,其中包括文摘数据、全文数据、引文及法律状态数据等,文献数量达1亿3000万条;具有常规检索、表格检索、概要浏览、详细浏览、批量下载等功能。随着国家知识产权局对专利检索系统的不断优化,并且增加了化学结构检索模块。


在登录国家知识产权局专利检索系统时,检索人员可以通过国家知识产权局进入检索系统;进入检索系统后,可以点击“药物检索”进入药物检索界面,具体界面如下图所示:


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aJTIu4Y4hX1pdgegWZJHb9Jj4ibn37f4biaTlnCL3icYNdLyc9qlXe9aQQ.png


而后在药物检索界面中选择“结构式检索”,并在其中输入化学结构式即可进行化学结构信息的检索,而且在输入结构式的过程中检索系统提供了结构式的核查功能,检索人员可以对结构式进行校核。绘制结构式后再生成检索式即可进行专利检索。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2ayEvtFltUiaMEYzLgcFPibhDEDsKF7nvorW7G5CEHqxtQcJFVWHXhiaNOA.png


采用该检索系统进行化学结构检索的过程中,检索人员可以根据需要进行精确结构、子结构和相似性检索(相似性系数范围为0.4~0.99),从而可以根据检索需要选择不同的检索模式。


3.3  北京市知识产权公共信息服务平台


北京市知识产权公共信息服务平台涵盖103个国家和地区的文献数据近1亿条,该平台除了包括智能检索、关键字检索、号码检索、分类检索、同义词检索和企业关联检索;而且也开发了化学结构式检索,可以通过检索界面中的“化学结构式检索”进入。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aVRpAZC5n6YEpwzIQm1BJOCDSBt7R4oEuQxSIwaCYe3lQWjgawYTTXw.png


北京市知识产权公共信息服务平台在进行相似结构检索时,可以选定检索的相似度;输入的化学结构可以与其他34个字段进行组配检索,例如可以在下图的空白区域中绘制化学结构式,从而进行化学结构式检索;化学结构检索可以进行化学结构的准确结构检索、子结构检索,还可以进行相似结构的检索。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aU17kGKtuhRL47qGJ65htXYibVuwJVXBY1vgd7MU0yeDJEbTK9PYJERg.png


北京市知识产权公共信息服务平台利用化学结构检索可以在一定程度上解决现有检索系统在检索化学、药物专利时难以检全、检准的问题。不足之处在于:该平台的化学结构式检索还处于试用阶段,化学结构数据仅1万条左右。


3.4  PubChem数据库


PubChem是世界上免费获取的化学信息的最大集合,是一种化学模组的数据库,其是美国国家健康研究院( US National Institutes of Health,NIH)的开放数据库,并由美国国家生物技术信息中心负责维护。PubChem自2004年开放以来,已成为科研工作者、学生和公众的重要化学信息资源。检索的过程中,PubChem可以按名称、分子式、结构和其他标识符进行化学物质的检索和搜索。值得说明的是,PubChem可以查找化学和物理性质、生物活性、安全性和毒性信息;而且PubChem数据库还与专利、论文数据库相关联,进而实现利用化学结构检索相关专利。进入PubChem数据库后的界面如下图所示:


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2anK1rNFvehV5GwzKDukcXIBZub1Ke2QIEUgFeic6wcU8Ts0KL8ib4hTeQ.png


进入PubChem数据库后,点击绘制结构后即可进入化学结构编辑界面,如下图所示;并可以在绘制框中绘制出所需的化学结构图。检索的过程中可以对相似结构、子结构进行检索。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aPdDAGnrNVd1ianBMw1o11ibwPSWQYr3Zl3wjQx2APl5qibxtePJe7TaYA.png


最重要的是PubChem数据库与专利数据库相关联,可以通过化学结构的信息检索到相应的或者相关的专利,并且可以直接链接到相应的专利数据库。从而提高检索人员的检索效率。如下图所示。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aib3YkvDiaicdJiaEeGT94iakkFFic1vWXAbibiabzTNsiaRwcU9WoGu6aOUDGvQ.png


此外,值得称赞的是PubChem数据库还对检索得到的相关专利的IPC分类进行了加工、标引和排序,使得检索人员对检索得到的相关专利的IPC进行快速、有效地梳理。


Czvmf1mAIdQpBqzzqEGInUT1vibZHJic2aCOJ2CEFJzXjMacPeoUyLvfkddvxstSlzwp8uVPAmIibicQmrjvhNOibiaw.png


04

结束语


由于医药化工领域专利检索的特殊性,在进行医药化工领域的专利检索时,务必重视化学结构信息的利用。本文为基于化学结构信息进行专利检索提供了部分解决途径,上述数据库化学结构检索的准确性和全面性可能与商业数据库还有一定的差距,但是在一定程度解决了利用化学结构进行专利检索的困境,扩展了检索人员的检索途径,为企业及时、准确掌握国内外相关专利的保护情况和新产品的发展动态提供了支持。


参考文献:


[1] 化学结构检索[EB/OL]. https://www.wipo.int/patentscope/zh/news/pctdb/2016/news_0008.html,访问时间2019-10-21


[2]PATENTSCOP新动向:化学亚结构检索[EB/OL].https://www.wipo.int/portal/zh/news/2019/article_0032.html,访问时间2019-10-21


[3]化学结构专利信息检索相关技巧[EB/OL].https://www.mysipo.com/article-5018-1.html,访问时间2019-10-21


[4] 专利检索及分析系统全新改版上线运行[EB/OL].http://www.sipo.gov.cn/zscqgz/1100813.htm,访问时间2019-10-21

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
评论区

    下一篇