[百度分享]以太网卡TSO技术浅析(一)

baiduforum 2010-06-23 03:35:53
加精
最近对Linux研究较多,现在对以太网卡TSO技术浅析三个方面的分析:
一.分为TCP/IP协议栈对TSO的支持 ;二.网卡驱动层对TSO的支持 ;三.TSO对基于RAW_SOCKET的抓包工具的影响
第一个我会在这边阐述,下面两个我会再分两个帖子写!
TSO(TCP Segment Offload)技术是一种利用网卡的少量处理能力,降低CPU发送数据包负载的技术,需要网卡硬件及驱动的支持。
在不支持TSO的网卡上,TCP层向IP层发送数据会考虑mss,使得TCP向下发送的数据可以包含在一个IP分组中而不会造成分片, mss是在TCP初始建立连接时由网卡MTU确定并和对端协商的,所以在一个MTU=1500的网卡上,TCP向下发送的数据不会大于min(mss_local, mss_remote)-ip头-tcp头。
而当网卡支持TSO时,TCP层会逐渐增大mss(总是整数倍数增加),当TCP层向下发送大块数据时,仅仅计算TCP头,网卡接到到了IP层传下的大数 据包后自己重新分成若干个IP数据包,添加IP头,复制TCP头并且重新计算校验和等相关数据,这样就把一部分CPU相关的处理工作转移到由网卡来处理。 内核TCP/IP协议栈也必须考虑下发包数和实际包数不一致的情况,例如处理拥塞控制算法时必须做一些特殊的处理等等。

逐渐增大mss(offload)
在不支持TSO的网卡 上,TCP层向IP层发送数据会考虑mss,使得TCP向下发送的数据可以包含在一个IP分组中而不会造成分片, mss是在TCP初始建立连接时根据网卡MTU确定并和对端协商的,所以在一个MTU=1500的网卡上,TCP向下发送的数据不会大于min (mss_local, mss_remote)-ip头-tcp头。
在应用层向传输层传输数据时,对于TCP协议,最终会调用如下函数:
文件 net/ipv4/tcp.c
int tcp_sendmsg(struct kiocb *iocb, struct sock *sk, struct msghdr *msg, size_t size)
该函数会调用如下函数
文件 net/ipv4/tcp.c
unsigned int tcp_current_mss(struct sock *sk, int large)

获得当前的mss值,如果网卡不支持TSO,则该函数返回的mss值将和原来相同,否则如果当前不是一个MSG_OOB类型的消息,内核将尝试增大 mss值,注意: 最大的mss值不会大于65535-ip头-tcp。 内核根据/proc变量tcp_tso_win_divisor决定增大后的mss占当前拥塞控制窗口的比率(snd_cwnd)。最终的效果是:增大的mss总是原有mss值的整数倍,但是不会超过snd_cwnd/tcp_tso_win_divisor。

对skb计数的修正
在启用TSO时,由于TCP层向下发送一个skb, 有可能最终会发出n个IP数据包,即一个skb和一个IP packet可能不是一一对应的关系,而我们都知道,TCP拥塞控制算法需要精确跟踪当前发送、接收以及拥塞控制窗口来决定最终发送多少数据包,TSO的 存在给计算带来了一定的复杂性,所以内核在每一个skb的末尾维护了额外的数据(struct skb_shared_info,通过skb_shinfo取出),表示该skb包含多少个packet。内核提供下列函数操作这块数据:
tcp_skb_pcount
tcp_skb_mss
tcp_inc_pcount
tcp_inc_pcount_explicit
tcp_dec_pcount_explicit
tcp_dec_pcount
tcp_dec_pcount_approx
tcp_get_pcount
tcp_set_pcount
tcp_packets_out_inc
tcp_packets_out_dec
tcp_packets_in_flight
最终,当TCP协议栈在调用tcp_snd_test决定是否可以发送当前skb时,会调用上述函数修正计算结果。
...全文
1793 49 打赏 收藏 转发到动态 举报
写回复
用AI写文章
49 条回复
切换为时间正序
请发表友善的回复…
发表回复
sy86529220 2012-09-26
  • 打赏
  • 举报
回复
很好很强大
rout83063 2010-10-23
  • 打赏
  • 举报
回复
我不为楼主这样的标题所吸引,
也不是被帖子的内容所迷惑。
我不是来抢沙发的,
也不是来打酱油的。
我不是为楼主呐喊加油的,
也不是对楼主进行围堵攻击的。
我只是为了每天20帖默默奋斗。
你是个美女,
我毫不关心;
你是个怪兽,
我决不在意;
你是个帅哥,
我不会妒忌;
你是个畜男,
我也不会PS。
你的情操再怎么高尚,
我也不会赞美;
你的道德如何沦丧,
我也不为所动。
在这个处处都要银币的时代,
不得不弄个牛B的数字来显眼,
于是我抄下了这段话,
专门用来回帖,
好让我每天有固定的积分.
收入
nettman 2010-10-14
  • 打赏
  • 举报
回复
收藏,学习!
天亮后说晚安 2010-07-06
  • 打赏
  • 举报
回复
学习了、、、、、、、、
helloquixote 2010-07-06
  • 打赏
  • 举报
回复
学习了,接分顺便。。
lfbelief 2010-07-05
  • 打赏
  • 举报
回复
学习。。。
f_usheng 2010-07-05
  • 打赏
  • 举报
回复
学习了,学习了
一名程序员 2010-07-05
  • 打赏
  • 举报
回复
顶一下吧!虽然说的不太详细。
piaolankeke 2010-07-05
  • 打赏
  • 举报
回复
顶一个 接分:)
nhqwy 2010-07-03
  • 打赏
  • 举报
回复
学习ing
lwlongyan 2010-07-03
  • 打赏
  • 举报
回复
学习学习
MFC200710186 2010-07-03
  • 打赏
  • 举报
回复
长知识了
Cneagle 2010-07-03
  • 打赏
  • 举报
回复
ding
wujiaohui 2010-07-03
  • 打赏
  • 举报
回复
支持一下,接分
wuguaifei 2010-07-03
  • 打赏
  • 举报
回复
en
嘿嘿
limonene 2010-07-02
  • 打赏
  • 举报
回复
type of service?
qingfeng042 2010-07-02
  • 打赏
  • 举报
回复
留个脚印
ylfleo820 2010-07-02
  • 打赏
  • 举报
回复
这个好高深呀,论坛里藏龙卧虎呀!
y000dd 2010-07-02
  • 打赏
  • 举报
回复
学习下
hehe1281 2010-07-01
  • 打赏
  • 举报
回复
评价以后得第二天才给积分啊?
加载更多回复(26)

3,286

社区成员

发帖
与我相关
我的任务
社区描述
Linux/Unix社区 实用资料发布区
社区管理员
  • 实用资料发布区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧