PSI定义和种类
隐私集合求交(Private Set Intersection,PSI)是指,参与双方在不泄露任何额外信息的情况下,得到双方持有数据的交集。在这里,额外的信息指的是除了双方的数据交集以外的任何信息。
1、PSI定义:

2、安全求交集:Private Set Intersection ( PSI)
- 一种特殊的安全多方计算(MPC)
- 协议Alice持有集合X,Bob持有集合Y,
- Alice和Bob通过执行PSI协议,得到交集结果XnY
- 除交集外不会泄漏交集外的其它信息
3、PSI分类:
- 2-Party/ Multi-Party PSI
- Balanced/Unbalanced PSl
- Semi-honest/Malicious PSI
- PSl with computation:
- PSI-CA ( cardinality)
- PSl-Payload Analytics
- Circuit PSI
4、SecretFlow SPU 实现了下面的PSI(Private Set Intersection)协议:
- Semi-honest ECDH-based two-party PSI protocol [HFH99]
- Semi-honest ECDH-based three-party PSI protocol
- Semi-honest OT-based two-party PSI protocol [KKRT16]
- Semi-honest PCG/VOLE-based two-party PSI protocol (with improved communication efficiency) [BC22]
- Semi-honest EC-OPRF based two-party Unbalanced PSI protocol
- Differentially Private (DP) PSI Protocol [DP-PSI]
5、PSI发展趋势

SPU实现PSI介绍
1、ECDH-PSI

2、KKRT'16-PSI
[KKRT16] 是半诚实 OT-based PSI协议,基于 OT Extension, BaRK-OPRF 和 CuckooHash。 [KKRT16] 是第一个在千万( 224224)规模,长度(128 bits)数据集上,求交时间在1分钟之内的PSI协议.
隐语 SPU PSI 中使用了 [PSZ18] 提到的 3-way stash-less CuckooHash
缺点在于内存占用大、通信量大。

3、BC22 PCG PSI
PCG(伪随机相关生成器)的优势在于可以将满足特定相关条件的随机数,在不影响安全的前提下进行压缩.
[BC22] 使用PCG加速PSI协议,减少计算量和通信量。

4、Unbalanced PSI
EC-OPRF based
SHE-based
5、基于ECDH的三方PSI协议

优点在于协议简单易于实现;缺点是会泄露Alice和Bob两方的数据量。