Post by 棘《面向隐私保护的用户评论基准数据集构建与大模型推理能力评估》阅读随记* 根据评论最容易推断出来的是性别、职业与居住地

Post by 棘

《面向隐私保护的用户评论基准数据集构建与大模型推理能力评估》阅读随记

* 根据评论最容易推断出来的是性别、职业与居住地。
* “匿名化机制能够在一定程度上限制模型对隐私属性的推理能力。然而,这种降低幅度相对有限,大模型仍能捕捉大部分隐性特征,完成对个体身份信息的推理。"(此结论在通过Presidio 匿名器将敏感信息脱敏基础上的匿名)
* 大数据研究员已经不局限于搜集数据，甚至开始用AI来揣度评论反向推理用户群像了，恐怖如斯。

#格物致知