姚寒冰,邢娜娜,周俊伟,李勇华.支持结果排序的安全密文检索方法研究[J].计算机科学,2018,45(5):123-130
支持结果排序的安全密文检索方法研究
Study on Secure Retrieval Scheme over Encrypted Data Supporting Result Ranking
投稿时间:2017-02-23  修订日期:2017-05-05
DOI:10.11896/j.issn.1002-137X.2018.05.021
中文关键词:  倒排索引,相关分,计数布隆过滤器,数据隐私,排序搜索
英文关键词:Inverted index,Relevance score,Counting bloom filter,Data privacy,Ranked search
基金项目:本文受国家自然科学基金项目(61601337),湖北省自然科学基金重点项目(ZRZ2015000393),交通物联网技术湖北省重点实验室基金项目(2017III028-002),内河航运技术湖北省重点实验室基金项目(NHHY2017003)资助
作者单位E-mail
姚寒冰 武汉理工大学计算机科学与技术学院 武汉430063
交通物联网技术湖北省重点实验室武汉理工大学 武汉430070 
yaohb@whut.edu.cn 
邢娜娜 武汉理工大学计算机科学与技术学院 武汉430063  
周俊伟 武汉理工大学计算机科学与技术学院 武汉430063
交通物联网技术湖北省重点实验室武汉理工大学 武汉430070 
 
李勇华 武汉理工大学计算机科学与技术学院 武汉430063
交通物联网技术湖北省重点实验室武汉理工大学 武汉430070 
 
摘要点击次数: 288
全文下载次数: 193
中文摘要:
      越来越多的企业和个人用户将数据部署到低成本、高质量的云存储中。为了保护敏感数据,用户在部署前会对其进行加密处理,但海量的加密数据给检索工作带来很大挑战。文中将传统的倒排索引结构改造成密文倒排索引,并在密文倒排索引上构建计数布隆过滤器,进而提出了基于计数布隆过滤器的密文安全索引(SICBF),其在保证隐私安全的前提下实现了对密文的快速检索。为减少SICBF索引中的数据冗余,设计了计数布隆过滤器的剪枝算法。为保护密文倒排索引中相关分的隐私安全,采用一对多保序加密机制(OPME)对相关分进行加密,并在密文相关分上对检索结果直接进行排序,将最相关检索结果top-k返回给授权用户。安全分析表明, 不同于原始数据分布,OPME算法加密后的相关分分布隐藏了数据的峰值,能防止针对相关分的统计攻击。实验结果表明,SICBF的检索效率高,计算量小,适用于海量加密数据文件的快速安全检索。
英文摘要:
      More and more organizations and users outsource their data into the low-cost and high-quality cloud storage.In order to protect the sensitive data,users will encrypt them before deployment,but this will bring big challenge to retrieval.This paper modified the traditional inverted index into the encrypted inverted index,and then built counting Bloom filter(CBF) on the encrypted inverted index.It proposed secure index based on counting Bloom filter(SICBF) to search encrypted data,which meet strict keyword and index privacy requirements.It also designed the CBF pruning algorithm to reduce redundancy of SICBF index.In order to protect the privacy of the relevance score(RSC) in SICBF,it employed one-to-many order-preserving mapping encryption(OPME) to encrypt RSC.The search results are directly sorted on the encrypted RSC,and only the most relevant top-k documents are returned to the authorized users.Security analysis illustrates that the encrypted RSC distribution is different from the original RSC,which hides the peak value of the RSC to prevent statistical attacks.The experiments show that the SICBF has high retrieval efficiency and low computational cost,which is suitable for searching massive encrypted data.
查看全文  查看/发表评论  下载PDF阅读器