如何阻止百度输入法联网,防止隐私泄露

        我以前写过一篇用Fiddler抓包然后去掉金山词霸广告的文章,参见:金山词霸2016.1.3.3 手动去广告方法(https://blog.csdn.net/pijianzhirui/article/details/50492714),现在还是用Fiddler对百度输入法抓包,

        如果你启用了“显示云结果”的功能(似乎默认就是启用的),那么你在中文状态输入的全部的内容都会被发送到百度的服务器(olime.baidu.com)。Fiddler可抓到Win版百度输入法的如下GET请求:
GET /py?input=[1,[a,[N00,O1G],b,[01G],c,[J1G],d,[410],e,[Q1G],f,[31G],g,[81G]]]&resultcoding=utf-8&version=1&inputtype=sg&result=hanzi|aladdin&ch_en=0&bg=0&ed=2&clientinfo=pc&fuzzy=sheng|shen|cheng|chen|zheng|zhen|jing|jin|ming|min|zhen|zheng|ying|yin|xing|xin|ling|ning|chen|cheng|xin|xing|jin|jing|fen|feng|yin|ying|zen|zeng|qin|qing|pin|ping|nin|ning|li|ni|la|na&scene=winword%2Eexe& HTTP/1.1

        用电脑开热点,然后用安卓手机连接电脑的热点,并将电脑设为代理,遗憾的是,Fiddler并不能抓到安卓版百度输入法的云输入联网请求(olimenew.baidu.com),在安卓手机上安装名为Packet Capture(中文名“无root抓包”)的app,能抓到百度输入法的POST请求包,但是似乎无法解密https的内容,于是只能看见乱码。(等我以后知道如何还原乱码的内容,再来更新此文)
        我设置的模糊音是l=n,in=ing,en=eng,百度发送GET请求不直接发fuzzy=[l=n|in=ing|en=eng],却发了fuzzy=sheng|shen|cheng|chen|zheng|zhen|jing|jin|ming|min|zhen|zheng|ying|yin|xing|xin|ling|ning|chen|cheng|xin|xing|jin|jing|fen|feng|yin|ying|zen|zeng|qin|qing|pin|ping|nin|ning|li|ni|la|na这么长一串内容,这是要故意浪费上网流量、增加网络设备的负担吗?另外,GET请求中还包括了scene=winword%2Eexe这样的参数和值(%2E是小数点的URL编码结果)。你觉得,是在word、powerpoint中输入的内容可能具有更高的价值,还是在浏览器和QQ中输入的内容更具价值?我猜测,百度是想用尽量少的硬盘空间存储价值尽可能高的用户隐私内容。比如,word和powerpoint中输入的内容全部存储,而浏览器和QQ中输入的内容只统计关键词的词频,不存储内容本身。
        你在一台联网的电脑上用百度输入法写一篇文章,即使敲错了一些字母,删除后再重新敲,即使中英夹杂,即使百度不知道你通过数字键选了哪个词(这就相当于语音识别了),在大数据和人工智能的帮助下,百度的服务器基本上可以拼凑出你写的全文,百度的工程师不可能不知道这一点。假如这篇文章涉及重要机密,那么很不幸,百度也掌握了这个机密。监守者常常自盗,你觉得像百度这种毫无底线、毫无社会责任感的企业,是会替你保守秘密?还是把你的输入内容卖给广告商,让你享受更精准的广告?或者把重要的商业机密、技术机密卖给其他人?另外别忘了,百度的服务器是可以记录用户的IP地址的,根据IP地址就能对计算机粗略定位,再根据用户输入的内容进行关键词分析,甚至可以推断出用户属于哪个企业。比如某个IP大概位于浙江省宁波市慈溪滨海四路,而且经常输入吉利、沃尔沃、发动机、变速箱、远景、帝豪等词,此用户就有很大的可能是吉利研发中心的人,盯着这样的用户,往往能获取很多重要的资料。所以,很多军工企业严格禁止员工回家用自己的电脑办公是有道理的,即使你不主动泄密,也可能通过输入法意外泄密。同时提醒企业的网络管理员,一定要通过防火墙阻止对olime.baidu.com的访问。当然,对谷歌、微软、搜狗、QQ、手心等输入法,网络管理员用样要禁止对相关域名的访问。
        谷歌、微软、百度、搜狗,都是既做搜索引擎,又做输入法,(如果手心输入法分享数据给360,那360也算同时有搜索引擎和输入法)。通过输入法收集用户输入内容,确实可以改善搜索引擎的结果。谷歌输入法已经多年不更新了,这与谷歌的很多服务在大陆被禁脱不了关系。因为即使通过输入法收集的数据对包括谷歌搜索在内的服务进行改进,由于来自中国的“蕃蔷”用户数量太少,带来的经济效益太少,所以谷歌没有动力去更新输入法。如果谷歌搜索能够回归,谷歌输入法必定随之回归。
        要在安卓手机上阻止百度输入法联网,先在输入法设置中关闭云输入功能,再到安卓系统设置的应用联网中禁止百度输入法联网。(在下图的“应用联网”界面中,“个人应用”才会出现“移动数据”和“WLAN”两个复选框,“系统应用”只出现“移动数据”一个复选框。我估计这意味着,如果不获取root权限或者借助第三方app,则没办法阻止系统应用通过WLAN联网。)
        windows系统上,先去输入法设置中关闭“显示云结果”,然后把如下规则加入到"C:\Windows\System32\drivers\etc\HOSTS"

127.0.0.1 olime.baidu.com
127.0.0.1 dr-ime.baidu.com
127.0.0.1 updateime.baidu.com
127.0.0.1 tips.ime.baidu.com
127.0.0.1 typing.bae.baidu.com
127.0.0.1 pcinput.baidu.com

        如果你想进一步研究百度输入法还访问了哪些域名,可以用Exeinfo PE的Ripper功能从C:\Program Files (x86)\Baidu\BaiduPinyin\5.4.4920.0\中的exe和dll文件中提取网址,

        还可以使用防火墙阻止百度输入法联网,步骤如下

猜你喜欢

转载自blog.csdn.net/pijianzhirui/article/details/83244592
今日推荐