开源大模型存数据泄露风险专家提醒勿投喂敏感信息

据天融信（002212）消息，国家安全部近日披露案例，个别单位因直接使用开源框架建立联网大模型，导致内部网络遭未授权访问，引发数据泄露。专家指出，开源大模型会存储用户上传的所有数据，存在被开发者或黑客获取的风险，日常使用中应避免向其提供敏感信息。

开源大模型是指将模型架构、参数、训练数据公开供免费使用的人工智能（885728）模型。天融信（002212）科技集团助理总裁王媛媛表示，这类模型在互联网上数量众多，具备推理、编程、文本或影像处理等不同功能。

数据安全（885942）是开源大模型的主要隐患。用户上传至模型的任何文件、图片等数据均会被模型存储。若涉及公司机密或个人敏感信息，这些数据可能面临泄露风险。

数据泄露主要通过两种途径发生：一是开发者拥有数据访问权限，可直接查看；二是黑客可利用模型漏洞入侵后台获取数据。

为保护数据安全（885942），专家提出两方面建议：

一、普通用户应避免向开源大模型上传个人敏感或隐私信息。

二、企业使用开源大模型进行数据训练时，应采用私有化部署方式，将数据保存在本地，并投入基础设施与专业团队进行维护，防止内部数据泄露至互联网。