010-62369181 Contact@sinohuarui.com |
产品中心
PROJECT
产品中心
PROJECT
|
1. 产品概述 华瑞数据防泄漏安全防护产品以统一策略为基础,采用深层内容分析,对静态数据、动态数据及使用中的数据进行即时的识别、监控、保护的安全产品。可智能的基于内容识别技术发现敏感数据,定位敏感数据,同时对敏感数据的传播途径(邮件、聊天软件、U盘、光盘、打印)进行有效的控制,控制手段包括阻断、告警、选择性阻断、加密、授权以及生成全面的分析审计报告。 华瑞数据防泄漏产品通过敏感数据分布扫描与分类分级,发现存储服务器、终端敏感数据分布,通过相关合规性政策要求,对敏感数据网络传输数据监控与审计,终端数据使用监控保护企业数据免受终端泄密之苦。 2. 功能介绍
数据自动聚类 中恒华瑞数据梳理系列产品,利用人工智能算法分析语义,针对海量数据进行自动分析,解决数据初步分类,辅助进行企业数据分类标准的划定。 自动聚类是一种典型的无指导机器学习方法:使用特定算法将不同文档分别映射成特征向量空间中不同的点,然后根据这些点的聚集程度,将对应文档聚集成某些特定类别。在一个特征空间中,同一类文本对应点的集合,往往集聚在一个空间区域中,机器即可通过计算点与点的相似度,将属于同一类的文档寻找出来。 关键字筛选 采用自然语言处理技术,通过对分类数据的文本内容进行切词,并利用机器统计完成识别关键词自动抽取的工作,是最有效的方式。 在自然语言处理层面,中文内容识别比与英文内容识别难度更高,技术更加复杂,主要体现在词法分析、词干还原和语言的计算机表达三个方面。 中恒华瑞终端敏感数据扫描产品可以基于统计概率模型和基本词库进行关键词抽取,还内置了石油、金融、通讯等行业词库,可以抽取行业专有名词,提高行业用户数据分类中内容特征提取的有效性和准确性。 用户可以将导出的关键词做成分类规则,还可根据自身情况,加入更多自定义关键词库,如部门名称和项目名称等内容,利用自动分类软件进行验证,如果没有达到预期效果,可以调整关键词选取并再次验证,直至满足需求。 数据自动分类 用户使用终端敏感数据扫描产品,在存储设备指定位置进行扫描,可以验证分类规则是否有效和准确,找出与识别规则相符的分类数据,是否还有同类数据没有被正确分类。 终端敏感数据扫描产品支持自然语言处理规则、以及关键词和正则表达式规则;支持所有主流数据格式,如Office文档、压缩文件、Outlook邮箱PST文件、PDF、网页等;支持Unicode、UTF-8、GB18030等中文编码方式。桌面版自动分类软件内置OCR引擎,支持将扫描件、图片等先自动转化为文本格式,再进行内容识别,判断文档分类。本软件有大量参数设置,用户可自行灵活调整。 标记敏感数据 监管机构要求敏感数据文件需要标识,如国资委印发的《中央企业商业秘密保护规定》中有明确规定。 关键数据梳理结果经过验证后,可以使用自动标签模块对指定的分类数据标记合适的标签。 3. 核心技术优势 基于中文自然语言处理的聚类和分类 无监督的自动聚类 候选关键字挑选 文档格式支持 中文编码支持 高性能,并发支持 支持指定特征的抽取 针对DLP方案定制 一体化的软件,易于使用 |