第七章分布式查询处理
分布查询处理优化目标
总代价最小
CPU , I/O 代价
通讯代价
响应时间最短
并行处理的可能性
分布式查询策略的重要性
例子
S(s#, sname, age, sex) 104 元组 Site A
C(c#, cname, teacher) 105 元组 Site B
SC(s#, c#, grade) 106 元组 Site A
每个元组长度100Bit, 通讯传输率 104 bit/sec, 通讯延迟 1sec
查询: 所有选修maths 课的男生学号和姓名.
SELECT s#, sname
FROM S, C, SC
WHERE #=# AND #=# AND sex=‘男’
ame=‘maths’;
查询代价估算方法
代价公式
QC = I/O 代价+ CPU 代价+ 通讯代价
通讯代价
TC = 传输延迟时间C0
+ (传输数据量X * 数据传输速率C1)
6种策略
C
S, SC
S, SC
C
(C)
S, SC
(S)
C
SC
(S), SC
C
S, SC
(C)
T1=1+(105*100/104)=
T2=(2+ 104 +105)*100/104=28小时
T3=2*105*1=
T4=2*10*1=20秒
T5=1+(105*100/104)=
T6=1+(10*100/104)=1秒
基础知识
SQL与代数的等价描述
SELECT sname FROM S, SC
WHERE #=# and #=‘c03’;
代数描述
sname(#=# and #=‘c03’(S SC))
SELCT sname FROM S WHERE # in
( SELECT #
FROM SC WHER c#=‘c03’);
代数描述
sname(#=# (S #=‘c03’ SC))
SELCT sname FROM S , ( SELECT #
FROM SC WHER c#=‘c03’) SCC
WHERE # = # ;
代数描述
sname(S #=‘c03’ SC)
查询树
S
SC
#=#
and #=‘c03’
sname
S
SC
#=#
and #=‘c03’
sname
S
SC
#=#
sname
c#=‘c03’
c#=‘c03’
代数操作符
一目操作
(SL), (PJ)
二目操作
(UN), , - (DF), X (CP), (JN),
(SJ),
选择操作
关系 r
A=B ^ D > 5 (r)
A
B
C
D
1
5
12
23
7
7
3
10
A
B
C
D
1
23
7
10
分布式查询处理 来自淘豆网m.daumloan.com转载请标明出处.