特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。

前几天 ,Meta 公司推出了一个据说开发了4年的鉴黄工具 ,为了阻止别人在社交网络上传你的私密照 。
功能简单来讲是这样:
用户需要先通过第三方运营的网站上传照片给工具 , 提取照片的数字指纹 , 之后这个数字指纹会共享到社交平台 , 用于检测是否有人分享这些照片 。
听起来是不是挺厉害? 但这里面有个前提条件 , 就是得先把自己的落照上传给这个工具 。

特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。
文章图片

不是 , 你们搞了 4 年 , 就搞出了这么个玩意?
要说这个项目 , 还得追溯到 2017 年 。
当时还叫 Facebook 的 Meta 公司 , 为了帮助身陷色情报复的受害者 , 开始研究起了网络鉴黄 , 这一项目还获得了社会各界的认同 。
最初版本的工具于 2018 年推出 , 需要用户通过邮件上传自己的私密照片 ,由工作人员审核 , 进行照片的数字指纹提取 , 用于检测平台上是否存在相似图片 。

特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。
文章图片

征集也就算了 , 还打算依靠人工审核 , 这波操作当时就收获了一大片问号 。
过了一年 ,Facebook 打了一个补丁 。 这一次 , 后续检测平台图片的任务 , 交到了 AI 手上 。
然而 , 前期搜集照片数字指纹的步骤 , 还是得依靠人工审核 。。。
前前后后四年过去了 ,Meta 公司终于憋出了工具的新版本 。
审核人员终于下岗了 , 提取照片数字指纹的工作 , 总算交给了 AI。
为了挽救一下被搞臭的名声 ,Meta 公司还把提取数字指纹的工具搭建在了第三方网站上 , 只共享包含数字指纹的数据库 。

特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。
文章图片

这个怎么都绕不开的数字指纹 , 其实就是哈希值 , 也相当于一张图片独一无二的数字信息 。 两组图片哈希值差异越小 , 图片的相似度就越高 。
搞出这么一套东西的原因 , 也是因为单张图片信息量太大了 , 直接拿来比对非常困难 , 所以需要一个更简单的方式 。

特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。
文章图片

想要把数据量压缩下来 , 就得抓取出来图片的关键特征 , 用特征点来代表这张图 。
而对于图片而言 , 最关键的特征 , 就是线条 。
之所以选择线条 , 原因也很简单 。 以下面这张图为例 , 去掉颜色和明暗细节 , 只保留线条 , 我们就可以得到第二张图 。

特征|想防裸照被发,得先自己上传,脸书搞色色搞了个寂寞。

推荐阅读