2.1 数据来源
为了提高标准制定过程的透明度 , 同时促进标准的使用 , ISO在其官方网站提供了一个标准必要专利信息表(可下载的excel文件) 。 该信息表中收集了自1980年以来各机构/企业提交给ISO的标准必要专利声明信息 , 表1中整理了ISO标准必要信息表中包括的主要信息内容:
文章图片
为了全面分析国际标准组织所制定的各标准中专利和标准的融合情况 , 本研究选取了ISO官方披露的所有标准必要专利信息作为分析样本 , 数据的时间范围截止到2019年3月31日 。
2.2 数据存在的问题及处理
ISO虽然在《ITU-T/ITU-R/ISO/IEC专利政策实施指南》及其提供的《ITU-T/ITU-R/ISO/IEC标准必要专利声明和许可声明模版》中对专利持有人披露信息的内容进行了一定要求 , 但这种要求非常宽泛 , 对信息的完备性、准确性、规范性都未做明确的、强制性的要求 。 与此同时 , 与标准化组织不参与专利评估、不干涉专利纠纷、不涉及专利纠纷的立场相一致的是 , ISO也声明:“ISO不核实信息的真实性或准确性 , 也不核实所确定的专利/专利申请与ISO标准的相关性 。 ”因此 , ISO网站所提供的标准必要专利信息表内容存在严重的缺失、规范性差、错误率高等问题 。 主要的问题具体如下:
(1)部分字段缺失率极高 , 比如:专利号的内容缺失率高达64% 。 (2)字段表现形式多样、内容模糊不确定:以专利号为例 , 标准必要专利信息表中该字段的表现形式包括“See the copy of the declaration”和“See separate file”两种链接和罗列号码等三种 。 其中 , 前两种链接分别指向一个文件夹而非与标准对应的标准必要专利声明文件 。 (3)数据的规范性差、错误率高:还是以专利号字段为例 , 由于《ITU-T/ITU-R/ISO/IEC标准必要专利声明和许可声明模版》并未对提交的专利号码类型提出规范要求 , 因此标准必要专利信息表中的专利号码混杂了专利申请号、公开/公告号、授权公告号等多种类型 , 而且专利号码的格式没有统一的规范 。 同时 , 专利号码的错误率也很高 。
基于数据质量的现状 , 有必要对ISO提供的标准必要专利信息表中的数据进行预处理 , 以提高分析结果的准确性和可靠性 。 具体预处理的工作包括:
(1)下载ISO网站所公开的所有标准必要专利声明文件(pdf格式)原始文本 , 对其中的专利号、标准号等信息进行提取;(2)根据提取到的信息对标准必要专利信息表进行补充和规范;(3)以中国科学技术信息研究所自建的ISTIC—专利分析数据库为基础 , 对专利号的类型进行识别 , 并对专利号格式进行统一规范化处理 。
推荐阅读
- 建设|这一次,我们用SASE为教育信息化建设保驾护航
- 国家|2022上海国际热处理、工业炉展览会
- 国际|微创血管介入手术机器人获国际创业大赛冠军,获价值千万元奖励
- 机器人|微创血管介入手术机器人获国际创业大赛冠军,获价值千万元奖励
- 领域|上海市电子信息产业“十四五”规划:以集成电路为核心先导
- 电子商务|国际品牌崛起 亚马逊在全球购物应用安装量中下滑至第四位
- Tencent|微信小程序新规则:调用个人敏感信息将需授权
- Hotel|向光前行,点亮未来 -- 2022上海国际商业及工程照明展
- 国家|张云涛:中国新冠疫苗研发处于国际第一方阵
- 国际|第23届高交会线上线下共享科技盛宴