图片搜索引擎在舆情导控中运用的实验研究

发布日期:2019年4月24日
图片搜索引擎在舆情导控中运用的实验研究 图片搜索引擎在舆情导控中运用的实验研究

本内容试读结束

下载后可阅读完整内容,立即下载

图片搜索引擎是新兴的一种专门用来查询图形、图像并以网站名称或内容为形式反馈检索结果的网络检索工具。通过实验对图片搜索引擎以图搜图检索效率的分析,以及对具体舆论事件进行图片搜索引擎的 *通讯作者。

自进入互联网时代,信息资源被广泛利用,有力推动了社会建设和经济发展。随着人们对信息的搜集、存储、检索、分析、应用、评估需求越来越大,搜索引擎应运而生。搜索引擎为广大用户获得最准确、最广泛、最具时效性的信息提供了坚实基础。近年来随着以微信为代表的各类新媒体以锐不可当之势进入社会生活,图片、视频信息在互联网信息资源中上传播数量急剧增加,以关键词为主的传统搜索引擎已经无法满足人们的需求,图片搜索引擎的快速崛起已然不可阻挡。

图片搜索引擎是近十年来兴起的一种专门用来查询图形、图像并以网站名称或内容为形式反馈检索结果的网络检索工具。其中,最具代表性的功能便是“以图搜图”。“以图搜图”即相似图片搜索,又称基于内容的图像检索或反向图像搜索,是根据用户提供的目标图片,检索与其相似的图片等信息的一种专业搜索引擎。以图搜图技术不仅仅在商品比价、技术辅助、视频搜索等领域具有广阔的发展前景, 它更可为公安机关进行网络监管、舆情导控提供重要技术支撑。

现今,以图搜图技术的发展还不成熟,公安网络监管、舆情导控中鲜见运用,文献中也没有相关的研究。本文拟在实验基础上,通过对图片搜索引擎“以图搜图”的检索效率的研究分析,以及结合网络舆情典型事件搜索引擎“以图搜图”的检索结果的研究分析,探讨运用图片搜索引擎“以图搜图”功能实现舆情导控,为图片搜索引擎“以图搜图”功能的运用提供新的角度和方向,从而为公安一线干警开展网络舆情导控工作提供参考。

2. 实验设计 (一) 实验原理 图片搜索引擎“以图搜图”的工作原理就是通过特定的算法(如SIFT 描述子、指纹算法函数、bundling features 算法)将目标图片进行特征提取,然后将所提取的图片特征信息进行编码,并将海量图片编码做查找表,通过相似度匹配运算,以目标图片的编码值为基础,在图片搜索引擎图片库中进行局部或者全局的相似度计算,根据所需图像的设定阈值,保留相似度高的图片,最后运用特征检测算法筛选出最佳匹配图片。

图片搜索引擎“以图搜图”的实现有一项关键的技术叫做“感知哈希算法”(Perceptual Hash Algorithm)。

它的处理方法是将每一张图片生成一个指纹(fingerprint)字符串,通过比较不同图片的指纹,计算它们的相似度,从而得出两张图片是否相似。具体有以下六个步骤: 第一步,读取所需图片。

第二步,缩小图片尺寸。将读取图片缩小到8 × 8 的尺寸,即64 个像素。目的在于只保留读取图片



相关标签