当前位置：首页 > news >正文

识别并脱敏上传到deepseek/chatgpt的文本文件中的护照信息

news 2025/3/20 21:54:29

本文将介绍一种简单高效的方法解决用户在上传文件到DeepSeek、ChatGPT，文心一言，AI等大语言模型平台过程中的护照号识别和脱敏问题。

DeepSeek、ChatGPT，Qwen，Claude等AI平台工具快速的被接受和使用，用户每天上传的文本数据中潜藏着大量敏感信息，大量的AI服务数据泄漏事件源于未正确处理输入数据。

你是否在上传数据到deepseek，chatgpt，通义千问，豆包，腾讯元宝，纳米搜索等平台之前犹豫过？
是否纠结如何快速的检查数据中是否存在敏感信息？
是否受制于如何快速轻量的对这些数据进行脱敏？
你是否担心数据上传到大语言模型等AI平台之后，敏感信息等会被用于特殊的用途？
你是否担心数据不仅会被大模型平台获取，还会被诸多的插件应用获取？

那么本文将帮你找到答案。前面的文章介绍了手机号，身份证号的脱敏，详见这里。

如果不想了解原理部分的内容，可以直接跳转到护照号脱敏章节获取使用的方法和技巧，本文的目录结构如下：

http://www.mrgr.cn/news/95195.html

相关文章：

同等学力申硕-计算机专业-数学基础-历年真题和答案解析

鬼泣：动作系统3

【ESP32】虚拟机Ubuntu20.04下ESP32环境搭建

C++特性——RAII、智能指针

C语言每日一练——day_12（最后一天）

算法刷题记录——专题目录汇总

Python（3）掌握Python循环：从基础到实战的完整指南

Wi-Fi NAN 架构（Wi-Fi Aware Specification v4.0，第2章：2.3~2.6）

在VMware上部署【Ubuntu】

iwebsec-updatexml报错注入

尝试在软考66天前开始成为软件设计师-数据库系统

DeepSeek-R1深度解读

Git 使用笔记

内网安全-横向移动Kerberos 攻击SPN 扫描WinRMWinRSRDP

机器学习面试重点第二部分(动画版)

高级java每日一道面试题-2025年3月04日-微服务篇[Eureka篇]-Eureka是什么？

【笔记】计算机网络——数据链路层

阿里云平台服务器操作以及发布静态项目

DevEco Studio的使用

OpenAI--Agent SDK简介