信息|国际标准化组织标准必要专利评析( 二 )


2.1 数据来源
为了提高标准制定过程的透明度 , 同时促进标准的使用 , ISO在其官方网站提供了一个标准必要专利信息表(可下载的excel文件) 。 该信息表中收集了自1980年以来各机构/企业提交给ISO的标准必要专利声明信息 , 表1中整理了ISO标准必要信息表中包括的主要信息内容:

信息|国际标准化组织标准必要专利评析
文章图片

为了全面分析国际标准组织所制定的各标准中专利和标准的融合情况 , 本研究选取了ISO官方披露的所有标准必要专利信息作为分析样本 , 数据的时间范围截止到2019年3月31日 。
2.2 数据存在的问题及处理
ISO虽然在《ITU-T/ITU-R/ISO/IEC专利政策实施指南》及其提供的《ITU-T/ITU-R/ISO/IEC标准必要专利声明和许可声明模版》中对专利持有人披露信息的内容进行了一定要求 , 但这种要求非常宽泛 , 对信息的完备性、准确性、规范性都未做明确的、强制性的要求 。 与此同时 , 与标准化组织不参与专利评估、不干涉专利纠纷、不涉及专利纠纷的立场相一致的是 , ISO也声明:“ISO不核实信息的真实性或准确性 , 也不核实所确定的专利/专利申请与ISO标准的相关性 。 ”因此 , ISO网站所提供的标准必要专利信息表内容存在严重的缺失、规范性差、错误率高等问题 。 主要的问题具体如下:
(1)部分字段缺失率极高 , 比如:专利号的内容缺失率高达64% 。 (2)字段表现形式多样、内容模糊不确定:以专利号为例 , 标准必要专利信息表中该字段的表现形式包括“See the copy of the declaration”和“See separate file”两种链接和罗列号码等三种 。 其中 , 前两种链接分别指向一个文件夹而非与标准对应的标准必要专利声明文件 。 (3)数据的规范性差、错误率高:还是以专利号字段为例 , 由于《ITU-T/ITU-R/ISO/IEC标准必要专利声明和许可声明模版》并未对提交的专利号码类型提出规范要求 , 因此标准必要专利信息表中的专利号码混杂了专利申请号、公开/公告号、授权公告号等多种类型 , 而且专利号码的格式没有统一的规范 。 同时 , 专利号码的错误率也很高 。
基于数据质量的现状 , 有必要对ISO提供的标准必要专利信息表中的数据进行预处理 , 以提高分析结果的准确性和可靠性 。 具体预处理的工作包括:
(1)下载ISO网站所公开的所有标准必要专利声明文件(pdf格式)原始文本 , 对其中的专利号、标准号等信息进行提取;(2)根据提取到的信息对标准必要专利信息表进行补充和规范;(3)以中国科学技术信息研究所自建的ISTIC—专利分析数据库为基础 , 对专利号的类型进行识别 , 并对专利号格式进行统一规范化处理 。

推荐阅读