开源大模型存数据泄露风险 专家提醒勿投喂敏感信息
据天融信(002212)消息,国家安全部近日披露案例,个别单位因直接使用开源框架建立联网大模型,导致内部网络遭未授权访问,引发数据泄露。专家指出,开源大模型会存储用户上传的所有数据,存在被开发者或黑客获取的风险,日常使用中应避免向其提供敏感信息。
开源大模型是指将模型架构、参数、训练数据公开供免费使用的人工智能模型。天融信科技集团助理总裁王媛媛表示,这类模型在互联网上数量众多,具备推理、编程、文本或影像处理等不同功能。
数据安全是开源大模型的主要隐患。用户上传至模型的任何文件、图片等数据均会被模型存储。若涉及公司机密或个人敏感信息,这些数据可能面临泄露风险。
数据泄露主要通过两种途径发生:一是开发者拥有数据访问权限,可直接查看;二是黑客可利用模型漏洞入侵后台获取数据。
为保护数据安全,专家提出两方面建议:
一、普通用户应避免向开源大模型上传个人敏感或隐私信息。
二、企业使用开源大模型进行数据训练时,应采用私有化部署方式,将数据保存在本地,并投入基础设施与专业团队进行维护,防止内部数据泄露至互联网。
0人