SQL中如何实现大数据量共现分析

brody18 2012-12-24 03:46:12
SQL中如何实现大数据量共现分析 :现有上千万篇论文,每篇论文有一个或多个作者,如何统计 作者两两合作次数,

以下表示 论文1有2个作者,论文2有3个作者;论文1作者A,B称为合作一次,数据量较大,希望考虑效率,通过连接的方式会出现2次,如 A B ;B A
论文 作者
1 A
1 B
2 A
2 C
2 B

希望得到结果
作者 作者 合作次数
A B 2
A C 1
B C 1
...全文
275 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
Andy-W 2012-12-25
  • 打赏
  • 举报
回复
這應該從設計方面考慮,至少有一張table來存儲合作次數,每一次合作就mark下合作的table. 這樣根本不用擔心因數據量,使用聚合函數統計引起的性能問題。
haitao 2012-12-24
  • 打赏
  • 举报
回复
select t1.作者 f1,t2.作者 f2,count(*) 合作次数
from t t1
left join t t2 on t1.论文=t2.论文 and t1.作者<>t2.作者
group t1.作者,t2.作者

22,209

社区成员

发帖
与我相关
我的任务
社区描述
MS-SQL Server 疑难问题
社区管理员
  • 疑难问题社区
  • 尘觉
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧