这个算法模型,可以用技术相近程度找出近似专利集合!

2021-11-17 18:00:00
通过技术相近程度算法模型,你可以快速的找到与你要申请的专利A最近似一批专利集合B。

作者 | 付亚腾  知产宝数据(商业)分析中心

编辑 | 布鲁斯

我申请的专利能否得到授权?

想要得到授权,你申请的专利需要具有创造性、新颖性、实用性。

简单来说,翻译成机器语言就是你的专利需要“长得”与别人专利不相似。但是目前仅仅中国专利申请库中就有2793,8919件专利文件[1],而全球专利库就有9613,7808件专利文件(2021年11月1日18点41分)。

那如何看你的专利是否与这中国专利库的2800万的专利存在近似呢?今天我们不讨论传统费时费力的检索方法,我们现在推出了一个新的检索模型,技术相近程度(以下称相关度)算法模型,通过这个相关度算法模型,你可以快速的找到与你要申请的专利A最近似一批专利集合B。

640?wx_fmt=png

有人可能会问,你的相关度算法行不行呀?有可能是秀而不实、虚有其表、银样蜡枪头、外强中干、金玉其外败絮其中……

等等,我们来验证一下不就行了嘛。

如何验证呢,我们只需要请求专利审查中心的帮助,找到他们是如何驳回那些专利申请的对比文件,不就行了吗?对比文件就是那个与你的专利“长得”很像的专利B,能够驳回你的申请专利A。

数据样本选取为:(2019年做)与专利审查中心合作得到的285万专利检索报告中的X类文献,X类文献就是一篇对比文件即可否定你的申请专利,与其对应的Y类文献(大于1)是多篇专利文件否定你的申请专利。这里只以X类文献作为样本,应该不用我解释吧!!!(因为我们找的是最相近的那件专利,非几篇专利组合起来的相似)

来,看结果,下图为我们在2018年、2019年做的测试结果对比。

640?wx_fmt=png

解释一下就是如果用我们的相关度算法模型,就可以找到与你的申请专利A相关度极其近似的专利B(审查员可能会用的样例)的概率为,在第1位就出现的概率为9.76%,前10个就出现的概率为23.61%,而前400位出现的概率为62.58%。也就是说只要你申请的专利与用我们相关度检索到的前400专利不相似,你就有62.58%的概率通过专利审查。

目前来说的,我们的相关度算法模型一直在优化,上图明显看出我们比2018年进步了嘛。

这里相关度不仅可用于专利申请时的专利查新检索,而且还可用于寻找“创新型专利”,还可用于发生专利纠纷时,快速找到能反制主诉企业的专利,达到专利交叉许可的目的,还可用于评价申请专利的价值,比如你申请了一件专利,找到申请后与这件专利技术相近的专利量的变化,如果申请量多,说明你这件专利具有前瞻性,看这件专利能否收取下后来者的专利许可费)等等,还有许多可以深挖的东西。(本文内容技术支持:知产宝和Patentics)

当然,读者你可能对相关度的算法还是产生不信任,来来你可以发个专利或一段话,我给检索一下这个专利对应的最相近的专利是啥,你看下我们检索得准不准确不就行了吗?

备注:上述的内容表达的可能有些简单,但实际上里面的逻辑还是很复杂的,比如对比文件其实不止包含以往专利,还包括已发表的杂志、期刊上的文章、论文等资料,所以上述部分内容只作参考,但我们算法的逻辑还是很坚挺的。

注释:

[1] 专利文件包括专利申请时文件,也包括授权文件,所以你们在对外说中国专利申请数量时,应说我下面的这个数字2793,8632件,检索日2021年11月1日。

(图片来源 | 网络)

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
评论区

    下一篇

    本文将从大数据的角度深度挖掘首例“药品专利链接”诉讼案件。

    2021-11-11 19:00:00