识别并脱敏上传到deepseek/chatgpt的文本文件中的护照信息
本文将介绍一种简单高效的方法解决用户在上传文件到DeepSeek、ChatGPT,文心一言,AI等大语言模型平台过程中的护照号识别和脱敏问题。
DeepSeek、ChatGPT,Qwen,Claude等AI平台工具快速的被接受和使用,用户每天上传的文本数据中潜藏着大量敏感信息,大量的AI服务数据泄漏事件源于未正确处理输入数据。
- 你是否在上传数据到deepseek,chatgpt,通义千问,豆包,腾讯元宝,纳米搜索等平台之前犹豫过?
- 是否纠结如何快速的检查数据中是否存在敏感信息?
- 是否受制于如何快速轻量的对这些数据进行脱敏?
- 你是否担心数据上传到大语言模型等AI平台之后,敏感信息等会被用于特殊的用途?
- 你是否担心数据不仅会被大模型平台获取,还会被诸多的插件应用获取?
那么本文将帮你找到答案。前面的文章介绍了手机号,身份证号的脱敏,详见这里。
如果不想了解原理部分的内容,可以直接跳转到护照号脱敏章节获取使用的方法和技巧,本文的目录结构如下: