令人费解的'1' '-'排序，那位高人给解释一下

8992026 2004-04-30 08:45:54

select a='-' into #t
union all select '1'
union all select '--'
union all select '-1'
union all select '1-'
union all select '11'
union all select '---'
union all select '--1'
union all select '-1-'
union all select '-11'
union all select '1--'
union all select '1-1'
union all select '11-'
union all select '111'

select * from #t order by a

drop table #t

结果：
a
----
-
--
---
1
-1
--1
-1-
1-
1--
11
-11
1-1
11-
111

（所影响的行数为 14 行）

为什么这个次序？？

...全文

93 52 打赏收藏转发到动态举报

写回复

用AI写文章

52 条回复

切换为时间正序

请发表友善的回复…

发表回复

8992026 2004-05-05

打赏
举报

你提前的太频繁了!!!

8992026 2004-05-04

打赏
举报

顶

realgz 2004-04-30

打赏
举报

正好今天接到老板的邮件不爽，走水想问题，拖多爽啊。。。。。。谢谢楼主的题目。

realgz 2004-04-30

打赏
举报

有头绪了，确实是2字节到4字节的问题，但是没把机制想清楚，于是是没想好具体证明的查询怎么写，没办法圆满证明。。。。。慢慢想，5.1不还有7天吗，我不急。

8992026 2004-04-30

打赏
举报

等ing

realgz 2004-04-30

打赏
举报

这样解释不同，但还是觉得我的方向是正确的，分析方法还不够完善，等到晚上我看能不能写个论证出来。

xiao_bai 2004-04-30

打赏
举报

来学习一下，我觉得问题出在对中文的处理上，具体怎么排的只有微软知道了

8992026 2004-04-30

打赏
举报

结果：
a
----------- ----------- ----------- --------------------
45 32 32 -
45 45 32 --
45 45 45 ---
49 32 32 1
45 49 32 -1
45 45 49 --1
45 49 45 -1-
49 45 32 1-
49 45 45 1--
49 49 32 11
45 49 49 -11
49 45 49 1-1
49 49 45 11-
49 49 49 111

（所影响的行数为 14 行）

8992026 2004-04-30

打赏
举报

realgz(realgz) :
你的理论根本就不行，看这个
create table #t(a char(20))
insert #t
select a='-'
union all select '1'
union all select '--'
union all select '-1'
union all select '1-'
union all select '11'
union all select '---'
union all select '--1'
union all select '-1-'
union all select '-11'
union all select '1--'
union all select '1-1'
union all select '11-'
union all select '111'

select unicode(substring(a,1,1)),unicode(substring(a,2,1)),unicode(substring(a,3,1)),* from #t order by a

8992026 2004-04-30

打赏
举报

realgz(realgz) :
这样解释不通的
select unicode(substring(a,1,1)),unicode(substring(a,2,1)),unicode(substring(a,3,1)),* from #t order by a

结果：
a 按你的解释
----------- ----------- ----------- ----
45 NULL NULL - 0045
45 45 NULL -- 4545
45 45 45 --- 4545
49 NULL NULL 1 0049
45 49 NULL -1 4945 --关键这一行和下两行
45 45 49 --1 4545
45 49 45 -1- 4945
49 45 NULL 1-
49 45 45 1--
49 49 NULL 11
45 49 49 -11
49 45 49 1-1
49 49 45 11-
49 49 49 111

（所影响的行数为 14 行）

realgz 2004-04-30

打赏
举报

可以看见，除非在比较的时候是2D31和31比，否则没有可能 2D>31
所以你的字段如果足够长，理论上就没有这个问题了。

8992026 2004-04-30

打赏
举报

分大把，看来现在结论只能是用Chinese_PRC_CI_AS排序规则的时候要小心点

realgz 2004-04-30

打赏
举报

-1 2D 31
1 31
10 31 30
11 31 31
可以看到，以上字符的二进制表示
唯一的合理解释似乎是在中文状态下用4个字节表示一个字符，所以 SQL 自动取每4个字节进行比较
if '-1'>'1' COLLATE SQL_Latin1_General_Cp437_CS_AS
print 'surprise! -1>1'
使用2个字节的排序规则自然搞定

if '-1'>'1' COLLATE Chinese_Taiwan_Stroke_CI_AS
print 'surprise! -1>1'
4字节的就有问题搞定1

txlicenhe 2004-04-30