当今时代是互联网时代,互联网作为这个时代的主题使得这个时代具有资源共享性和信息传播性的特点,给人们的生活带来了便利。网络在为人们认识世界带来便利的同时也为有害信息的广泛传播提供了便捷且广泛的途径。人们在享受互联网带来的便利的同时,也常常会受到一些非法信息的滋扰。因此信息安全问题对于维护网络环境的健康有着十分重要的意义。 目前网络的过滤技术主要有三种,它们是基于URL过滤方式、基于文本的过滤方式和基于图像内容的过滤方式。这几种过滤技术各有优劣,有的实现比较简单,有的具有更广泛的适应性,有的效率高实时性更强。单一采用某一技术的准确性不高,而考虑到图片和图片附近的文字一般具有相同的类别,它们有相互补充说明的特性,所以综合考虑图片和文本的分类特点是主要的过滤方式。 主要以过滤敏感信息为主要目的,基于内容的文本过滤技术和图像过滤技术是针对文本过滤的特征提取和图像过滤中的肤色检测方面的技术,并根据敏感图像的特点,提出一种连通域探测算法,实验中该算法表现出更好的可靠性和更少的时间开销。 LJKeyScanner过滤系统就是一款由灵玖软件研发的敏感信息过滤系统,它将各环节的特征提取和优化算法及分类等算法应用于文本和图像过滤模块,并对网络敏感信息过滤系统的实验结果进行分析,取得了较好的效果。 LJKeyScanner关键词敏感扫描系统主要完成对待检测网页的敏感关键词检测,并对检测出的敏感关键词,标出其在源文件中的位置,将检测结果与检测时间等信息写入敏感关键词检测结果表中。系统在敏感词检测期间需要驻留内存,通过加载敏感关键词知识库来做敏感关键词的检测。同时,还可以准确的检测出待检测文本中的敏感关键词,敏感词位置及上下文摘要等具体信息,并在实际的页面中将检测出的敏感关键词进行了标注,管理员可以通过检测出的敏感词进行判定,并反馈给系统,及时更新词库。以防止网页不良信息的蔓延和给社会和人们带来重大损失。
词条
词条说明
近日,经过公司技术部门的不断努力、销售部门的积极协调,航天咨询《航天咨询数据搜索与挖掘平台》项目初验*。公司为客户建设了一套基于互联网大数据的数据搜索与挖掘平台,并满足将分散在互联网中的航天领域信息和数据搜集起来,再通过大数据搜索与挖掘的技术手段,及时准确的进行分析、处理和提取,最后利用针对专业领域的数据搜索引擎进行查询,帮助用户**时间获得重要的信息数据,从而解决客户数据采集和挖掘的难题
随着计算机技术的革新,互联网新媒体的快速发展,人们的生活已经进入高速信息时代。我们每天的生活都要产生大量数据,因此我们获取数据的速度和规模不断增长,大量数据不断的被存入存储介质中形成海量数据。海量数据的存储、应用及挖掘已成为人们急需解决的难题。 数据挖掘是一门新兴的学科,它诞生于20世纪80年代,主要面向商业应用的人工只能研究领域。大数据是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的
随着计算机技术的革新,互联网新媒体的快速发展,人们的生活已经进入高速信息时代。我们每天的生活都要产生大量数据,因此我们获取数据的速度和规模不断增长,大量数据不断的被存入存储介质中形成海量数据。 数据挖掘是从存放在数据库、数据仓库或者其他信息库*量的不完全的有噪声的模糊的随机的数据中提取隐含在其中的人们事先未知、但潜在有用的信息和知识过程。数据挖掘需要经历数据收集、数据分析和数据可视化等三个必要
文本挖掘(Text Mining)是一个从结构化或非结构化文本信息中获取用户感兴趣或者有用的模式的过程。文本挖掘的主要目的是从非结构化文本文档中提取有趣的、重要的模式和知识。可以看成是基于数据库的数据挖掘或知识发现的扩展。 文本挖掘是从数据挖掘发展而来,因此其定义与我们熟知的数据挖掘定义相类似。但与传统的数据挖掘相比,文本挖掘有其*特之处,主要表现在:文档本身是半结构化或非结构化的,无确定形式并
公司名: 灵玖中科软件(北京)有限公司
联系人: 张宝
电 话: 010-62648216
手 机: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀区苏州街49-3号盈智大厦5层
邮 编: