ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 11830|回复: 26

[分享] 提高百万级SQL数据库in查询速度的方法

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2012-9-24 08:30 | 显示全部楼层 |阅读模式
此方法只适用于在B表(百万条记录)中查询包括A表记录(有一定限制,见下文)的操作

表A:临时表,只有一个索引文本字段,一般不到1000条记录,主要用于比对。

表B:目标表,我这有800万条记录,3个索引文本字段

经常要查询表B中包含表A的记录,我用了4种方法

方法一:一般人喜欢用的IN语句

select * from 表B where 字段 in (select 字段 from 表A)

这个速度可想而知,我前年买的主流配置电脑,如果表A有200条以上记录,基本上要等近一分钟,如果超过1K,估计就当机了(曾经等过5分钟,电脑一直在读,CTRL+BREAK都停不了,直接结束进程)

但是此方法如果反用则很快,select * from 表A where 字段 in (select 字段 from 表B)只要3秒。说明小表里找大表记录用in还是可以的。

方法二:用exists

select * from 表B where exists(select 字段 from 表A where 表B.字段=表A.字段)

比方法一快点,表A超过1K记录基本也当机。

方法三:用left join

select * from 表B left join 表A on 表B.字段=表A.字段 where 表B.字段<>表A.字段

速度提升比较明显,表A中有2K条记录时,要45秒左右。

方法四:用IN,这个IN非方法一的IN,是select * from table where field in ("t1","t2","t3"...)的IN

这个过程稍微复杂,但速度最快,基本上3秒搞定,时间多花在取字符串上去了,另外由于我是动态加载表,表中各字段类型又不一致,所以我SQL语句中的字段前加了CVAR,这个可能也影响速度。

先将表A中的字段取成字符串,做成("值1“,"值2“,"值3"...)

后面大家应该明白了。

测试了一下,这个和记录数没有关系,但和字符串长度有关,我在ACCESS里检测,发现整个SQL语句最长不能超过32717,就是说in后面的括号里差不多不能超过32000吧,这个问题目前还没有解决。

不过我只是测试中在表1中插入了5K条记录,取成字符串后长度一度达到10万多,真正比对时一般没有这么多数据。

说到最后,无非就是说查询里最快的应该是select * from t where f in ("t1","t2"...),这个可能很多人都知道,但是能把表字段取成这种样式,我如果不百度还真不一定想到,希望对程序员们有点帮助。

该贴已经同步到 little-key的微博

TA的精华主题

TA的得分主题

发表于 2012-9-24 09:00 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
总结的很好,感谢分享!

TA的精华主题

TA的得分主题

发表于 2012-9-24 10:30 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
学习了,谢谢

TA的精华主题

TA的得分主题

发表于 2012-9-24 15:44 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
在数据库操作上一般都会尽量避免用IN和EXISTS,因为这会涉及到全表扫描,最好还是在关键字上用JOIN联结,当然,还需要对关键字段做好索引,你的第4种方法对真正的数据库使用就略显笨拙。

TA的精华主题

TA的得分主题

发表于 2012-9-24 15:53 | 显示全部楼层
[code=sql]SELECT * FROM A AS A
WHERE NOT EXISTS
(SELECT * FROM B AS B WHERE NOT EXISTS
(SELECT * FROM A AS C
WHERE A.ID = B.ID AND B.ID = C.ID))
[/code]

这个呢

TA的精华主题

TA的得分主题

发表于 2012-9-24 15:59 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
写错了,第一个A改成B
SELECT * FROM  B AS x
WHERE NOT EXISTS
(SELECT * FROM B AS y WHERE NOT EXISTS
(SELECT * FROM A AS z
WHERE x.ID = y.ID AND y.ID = z.ID))

TA的精华主题

TA的得分主题

发表于 2012-9-24 16:10 | 显示全部楼层
[code=sql]select * from test2 as a
where not exists
(select * from
(select * from test2 as b
where not exists
(select * from test3 as c
where b.id=c.id)) as d
where a.id=d.id)[/code]

TA的精华主题

TA的得分主题

发表于 2012-9-24 16:11 | 显示全部楼层
[code=sql]select * from test2 as a
where not exists
(select 1 from
(select * from test2 as b
where not exists
(select 1 from test3 as c
where b.id=c.id)) as d
where a.id=d.id)[/code]

TA的精华主题

TA的得分主题

发表于 2012-9-25 15:14 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
对大型的数据分析是有必要研究效率问题

TA的精华主题

TA的得分主题

发表于 2012-9-26 08:27 | 显示全部楼层
百万级数据库用你这样的方法就死定了。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-17 01:34 , Processed in 0.037219 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表