北京市海淀区北三环西路甲18号
大钟寺中坤场E座611室
010-68472973
2667297716
010-88422509
yc_support@126.com
1746017028
010-68920681
100089
需求背景
当大量工作文件集中存储在服务器上时,简单的通过文件名的搜索功能基本不能满足工作需要,降低了历史文件的再利用水平,特别是当文件都为密文状态时,通过文件名进行检索也变得困难起来。实现对集中加密存储文件的内容检索,就可以充分发挥文件的利用价值。
密文全文检索模块正是按照全文检索理论建立起来的用于提供全文检索服务的软件服务。此功能通过扫描密文文件中的每一个词建立索引,指明该词在文件中出现的次数和位置,当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。
系统的主要实现以下目标与效果:
1. 高安全性:不需要将文件转换为明文就可实现全文检索,保证了文件本体的安全性;
2. 高兼容性:支持主流格式的办公文件,如:Word文档、Excel表格、PPT报告、PDF文档、TXT文件等;
3. 高索引效率:可实现豪秒级的检索效率以及每秒上百次的并发检索支持,保证全面快速的响应用户检索需求;
4. 检索结果直观:不但可以显示检索结果文件名称,还可以定位文件位置,检索内容在文件中的段落信息等,有助于用户对检索结果的高效甄别与利用;
5. 分词优化:对检索关键字进行分词优化,剔除由于中文字序带来的干扰因素;
6. 数据字典:通过对数据字典的维护,可以实现初级的语意检索分析,将符合检索关键词语意的同义信息检索并展现。