官方微信
登录
注册
搜索
搜索
文章
帖子
用户
免费发布信息
首页
Portal
新闻资讯
论坛
BBS
分类信息
房源中心
租房
跳蚤市场
活动
新闻
加国
大多
美国
环球
经济
时政
娱乐
地产
信息
房源
新盘
家庭旅馆
跳蚤市场
拼车
折扣
机票邮轮
生活服务
社区
城事杂谈
旅游天地
大多生活
房产楼市
北美股票
房东信息
税务理财
健康锻炼
交友征婚
法律求助
加国新闻
大多新闻
美国新闻
环球新闻
经济观察
时政频道
财经资讯
娱乐八卦
生活百态
史海钩沉
健康养生
国际体坛
城事杂谈
大多生活
旅游天地
房产聚焦
税务理财
北美股票
子女教育
房东信息
健康锻炼
移民留学
体育娱乐
婚姻生活
宠物乐园
我爱我家
流行时尚
交友征婚
法律求助
便民信息
黄页
机票邮轮
求职招聘
换汇交易
拼车中心
商家折扣
二手车
非诚勿扰
周边游
扫一扫,关注我们
我的空间
我的消息
我的收藏
我的好友
我的相册
我的道具
帐号设置
退出登录
加国新闻
大多新闻
美国新闻
环球新闻
经济观察
时政频道
财经资讯
娱乐八卦
生活百态
史海钩沉
健康养生
国际体坛
城事杂谈
大多生活
旅游天地
房产聚焦
税务理财
北美股票
子女教育
房东信息
健康锻炼
移民留学
体育娱乐
婚姻生活
宠物乐园
我爱我家
流行时尚
交友征婚
法律求助
便民信息
黄页
机票邮轮
求职招聘
换汇交易
拼车中心
商家折扣
二手车
非诚勿扰
周边游
加国同城
›
首页
›
科技
›
查看内容
男朋友和ChatGPT的加密聊天 被我破解了(组图)
2024-4-18 05:03
|
发布者:
青青草
|
查看:
11
|
评论:0
|
来自: 酷玩实验室
摘要:
随着AI技术大爆炸,各种与AI相关的产品也开始进入了我们的生活。你可能用妙鸭相机的AI生图画过头像、用月之暗面的Kimi总结过论文,让ChatGPT写过应付领导的文件。但是,这些朋友们得注意了,现在你 ...
随着AI技术大爆炸,各种与AI相关的产品也开始进入了我们的生活。 你可能用妙鸭相机的AI生图画过头像、用月之暗面的Kimi总结过论文,让ChatGPT写过应付领导的文件。 但是,这些朋友们得注意了,现在你们与AI的对话可能已经不再安全。
以色列本·古里安大学进攻性人工智能实验室的研究人员发现了一种攻击AI的方法,如果有心之人拿它入侵你的通信系统,那么你与AI的谈话内容,就会出现在别人的电脑屏幕上。你的隐私、他人的隐私、商业机密等都将暴露无遗。
正如有些国家的警方会根据住户不正常的用电量,去推测他是否在种植违禁药品,本·古里安大学的这种方法也不是直接破译密码,而是所谓的测信道攻击,也就是利用时间、电磁、声音、电源甚至风扇的转速这些,表面上看起来跟个人隐私毫无关系的信息,来推测敏感信息,非常的神奇。
以ChatGPT为代表的一众AI聊天助手面对这种进攻完全没有招架之力,只有一个例外,那就是谷歌的Gemini。 所以这种攻击AI的方法到底是怎么回事?为啥谷歌能独善其身呢? 且容我细细道来。 01 你发现你对象最近有些神神秘秘的,经常用ChatGPT,但不愿意给你看到底聊了什么。 莫非ta有什么不可告人的秘密?
你有没有办法可以获得ta的聊天记录呢? 是有的,而且只需要三步。
第一步,拦截数据。 从哪里拦截呢? 理论上来说,数据从ChatGPT的服务器中传输到电脑之间的任何节点都可以拦截,也就是途中经过的任何路由器。但最方便的截击点,显然是家里的路由器。 现在我们控制了路由器,任何一台家里设备上网的数据,你都一清二楚。
这就好像我想要知道你有多少快递,最好的办法就是盘下你家附近的快递网点。 你本就知道账号密码,所以很轻松地启动了家里路由器的管理权限,查看所有经过路由器的数据。 只要等ta跟ChatGPT聊天的时候截获数据就行。 你蹲守在厕所里启动电脑,经过短时间的等待,好的,ta开始跟ChatGPT聊天了。 但是这里遇到了一个问题,ChatGPT跟ta之间的通话是加密过的(废话)。 OpenAI对所有存储的数据用AES-256算法加密,对所有传输中的数据用TLS数据加密,介于你手头暂时没有量子计算机,根本破解不了啊!
那怎么办? 不要慌,有办法。 现在我们需要进入第二步。 第二步:虽然我们无法破解数据包的内容,但我们可以先把数据包的长度记下来。 数据包的长度跟我们想破解的信息有什么关系呢? 你也许听说过一个叫Token的概念。 类似ChatGPT这样的大语言模型的运行机制,本质上就是单词接龙。更准确地说,就是用它那几千亿的参数,去预测下一个最小的语义单元应该接什么,如此重复,从而接出一段完整的话。这个最小的语义单元,就是一个token。 比如:
或这样:
这些用色块隔出来的东西,就是一个一个的token。 可以发现,token跟单词基本上是一一对应的,这也就意味着: token的长度与单词长度是基本一致的。 如此一来,只要依次记录下每个数据包的长度,我们就知道了ChatGPT发给ta的话,是由多长的词语依次组成的。 比如上面那句话,就是:2、2、1、1、1、5、2、4、4、1、3、8、4、5、1。 也就是说,我们知道了ta这句话的节奏。 是不是有点意思啦?
不是,你不要急嘛。 要把这个节奏跟具体的文本对应上,就必须进入第三步了。 第三步:用魔法打败魔法,用大语言模型去治大语言模型。 这群以色列的研究人员训练了一个大语言模型,专门根据一句话的节奏去预测这句话是啥。 长度序列(节奏)与具体的文本之间的能有什么关系呢?这对作为人类的你我来说可能有点难以想象。从一堆数据中找出规律正是AI所擅长的,研究人员就直接给大语言模型喂大量的长度序列,训练它们去预测对应的文字。再基于正确结果对于生成的答案进行排序,不断地卷,提升预测的准确度。
为了让预测的更准确,他们还做了进一步的fine-tuned。 由于AI生成的语句在第一句通常风格最明确,更容易预测。所以他们用一个大语言模型专门做第一句的预测,然后让再用另一个大语言模型根据第一句的结果预测后面的内容。 那么这样预测的结果如何呢?你能拿到朝思暮想的聊天记录吗? 02 在以色列研究人员的演示视频中,这两个大语言模型最终得到了50句不同的答案。 其中,通过侧信道攻击得到评分最高的答案是:Several recent advancements in machine learning and artificial intelligence that could be a game-changing tool. 翻译:一些机器学习和人工智能领域近期的研究成果,它们有可能是改变局势的工具。 而AI发来的原文本是:There are several recent developments in machine learning and artificial intelligence that could revolutionize the health industry. 翻译:这是一些机器学习和人工智能领域近期的研究成果,它们有可能改变整个健康产业。 这一说这个答案和原文本相当的吻合了。在关键信息上,侧信道攻击得到的句子包含了“机器学习和人工智能领域”,“研究成果”,唯独缺少了“健康产业”这一关键信息。 不过如果我们仔细看的话,那两个大语言模型给到的50个答案中有不少都提到了与“健康产业”接近的信息,比如排名第10的答案中提到了“healthcare institution”(医疗机构)和“hospital”(医院)。 总体来说,这种攻击方式有55%的情况下能达到高精确度(只有一两个词不同),29%的情况下能完美破解。 听起来好像不高啊,这不71%的情况都不能完美破解嘛?但在现实中,能完全破解当然好,但对发起进攻的人来说,他们需要的更多的是关键信息。 怎么理解呢? 假如,你对象跟ChatGPT探讨了半天两个人去成都有什么可玩的。而却从来没有告诉过你任何去成都的计划……
这TM就是关键信息了。 03 那么这种侧信道攻击有什么办法解决吗? 正如我们在开头所说,以ChatGPT为代表的绝大多数AI聊天助手都防不住这种攻击,只有Google的Gemini双子座可以。
为什么呢? 其实原因非常的扯淡。不是这个Gemini有什么特殊的架构或者特殊的加密算法,而是它回复用户的时候不像其他AI一样生成一个词就立马就发,而是等一段答案生成完了再发。 结果,攻击者截获到的token序列不再是1、2、5、6、1这种了,而是15。 这还怎么玩。 但是,从Gemini目前孤家寡人的境况你也能看出,这种方式是非常影响用户体验的。一个个往外蹦,我看到有不对的时候就马上开始准备新的问题了。而干等一分钟最后等来一个离谱的回答,容易导致高血压等心脑血管疾病的发生。
所以在即时发送的方式不变的情况下还有什么办法吗? 有一种“填充”的办法,向不同长度的数据包填充一些“空格”,使得发送的每个数据包长度相似。 但同样的,这也会影响用户体验,因为数据包中随即填充的这些“空格”,在打开数据包时也是需要时间去处理。所以延迟会比通常情况久不少。 以色列的这项研究发表后,在所有易受攻击的AI中,OpenAI在48小时内实施了“填充”措施,不过拒绝对其发表评论。微软则还没有采取措施,他们发表了一项声明,声明中称这种方式”不太可能预测像名字这样的具体细节”。 看来微软不是很在乎用户的隐私问题啊。
现实来讲,当一项技术处于爆发期的时候,忽略安全隐患是很多厂家的常规操作。因为很显然,安全是拦在效率前面的绊脚石,在AI界疯狂内卷的今天,把安全放在效率前面有时候是很难活下去的。 但安全问题可以被忽视,但并不会消失。当它再被提起时候,往往就是酿成大祸,舆论哗然的时候了。 不过除了具体的技术问题,我觉得侧信道攻击这件事背后的逻辑更有意思。 如果没有AI大模型,谁又能想到,原来只需要知道一句话的节奏,就能推断出这句话的内容呢?? 这有点像一种名为海龟汤的游戏。在游戏中玩家只被根据非常有限的信息(汤面)去推测整个故事(汤底)。 比如给你一个汤面:“6岁时外婆告诉我不要吃黄苹果。13岁时,外婆告诉我不要吃青苹果。18岁时外婆告诉我不要吃红苹果。20岁时外婆去世了,我向外婆祈愿:以后所有的苹果都可以吃了。” 那么,外婆和苹果到底是有什么关系呢?
这个关系就类似于隐藏在表象下的规律,人类需要构建一整个故事去理解,因为人是线性思维,必须依赖因果关系去理解。而像数据包的长度和内容之间的规律,你是无法通过编故事去理解的。但这部分缺失的能力,现在AI替我们补上了。
路过
雷人
握手
鲜花
鸡蛋
分享
邀请
上一篇:
AI美女广告让人难辨真假!博主被迫录视频自证(组图)
下一篇:
炸裂!华为P70发布会来了 这次真的是太拼了(组图)
最新评论
评论
相关分类
新闻资讯
分类信息
地产
健康
活动
移民
历史
军事
生活
科技
就业
旅游
文化
测试
图文热点
ROM皇家安大略博物馆多少有点夸张了吧
安省省立公园免费入园:公园通行证申请攻略
热门推荐
ROM皇家安大略博物馆多少有点夸张了吧
马斯克又遭Twitter前高管起诉 索赔375万美
摩根大通美国国债客户净多头占比创数周以来
瑞士监管机构:汇丰私人银行业务违反了反洗
欧盟反垄断主管:苹果的问题很严重 调查结
美银调查:货币市场基金资产重新配置料对美
联系客服
关注微信
返回顶部
点击联系客服
在线时间:8:30-17:00
电子邮件
[email protected]
扫一扫,关注我们
下载APP客户端