网页中有个table,想用python 读取每天的数据,请高手帮忙,提供一下正则表达式和代码,谢谢!

Mom319 2009-06-17 03:44:10
<table>
<tr> <td width="80" bgcolor="#ECECEC">Day </td> <td width="80" bgcolor="#F4F090">Number of visits </td> <td width="80" bgcolor="#4477DD">Pages </td> <td width="80" bgcolor="#66DDEE">Hits </td> <td width="80" bgcolor="#2EA495">Bandwidth </td> </tr> <tr> <td>01 May 2009 </td> <td>7 </td> <td>13 </td> <td>112 </td> <td>1.90 MB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>02 May 2009 </td> <td>7 </td> <td>12 </td> <td>12 </td> <td>4.64 KB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>03 May 2009 </td> <td>4 </td> <td>7 </td> <td>40 </td> <td>85.88 KB </td> </tr>
<tr> <td>04 May 2009 </td> <td>10 </td> <td>51 </td> <td>263 </td> <td>252.63 MB </td> </tr>
<tr> <td>05 May 2009 </td> <td>11 </td> <td>22 </td> <td>279 </td> <td>89.37 MB </td> </tr>
<tr> <td>06 May 2009 </td> <td>10 </td> <td>10 </td> <td>363 </td> <td>8.02 MB </td> </tr>
<tr> <td>07 May 2009 </td> <td>7 </td> <td>13 </td> <td>151 </td> <td>7.69 MB </td> </tr>
<tr> <td>08 May 2009 </td> <td>4 </td> <td>5 </td> <td>35 </td> <td>1.32 MB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>09 May 2009 </td> <td>4 </td> <td>4 </td> <td>209 </td> <td>4.06 MB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>10 May 2009 </td> <td>3 </td> <td>3 </td> <td>3 </td> <td>2.78 KB </td> </tr>
<tr> <td>11 May 2009 </td> <td>6 </td> <td>6 </td> <td>67 </td> <td>4.78 MB </td> </tr>
<tr> <td>12 May 2009 </td> <td>6 </td> <td>6 </td> <td>6 </td> <td>5.57 KB </td> </tr>
<tr> <td>13 May 2009 </td> <td>8 </td> <td>10 </td> <td>163 </td> <td>2.86 MB </td> </tr>
<tr> <td>14 May 2009 </td> <td>3 </td> <td>3 </td> <td>528 </td> <td>10.22 MB </td> </tr>
<tr> <td>15 May 2009 </td> <td>2 </td> <td>27 </td> <td>251 </td> <td>226.05 MB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>16 May 2009 </td> <td>5 </td> <td>5 </td> <td>97 </td> <td>1.87 MB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>17 May 2009 </td> <td>2 </td> <td>7 </td> <td>163 </td> <td>37.65 MB </td> </tr>
<tr> <td>18 May 2009 </td> <td>7 </td> <td>17 </td> <td>485 </td> <td>92.14 MB </td> </tr>
<tr> <td>19 May 2009 </td> <td>10 </td> <td>32 </td> <td>122 </td> <td>113.13 MB </td> </tr>
<tr> <td>20 May 2009 </td> <td>9 </td> <td>22 </td> <td>129 </td> <td>96.10 MB </td> </tr>
<tr> <td>21 May 2009 </td> <td>5 </td> <td>7 </td> <td>21 </td> <td>37.15 MB </td> </tr>
<tr> <td>22 May 2009 </td> <td>34 </td> <td>35 </td> <td>35 </td> <td>32.47 KB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>23 May 2009 </td> <td>136 </td> <td>136 </td> <td>136 </td> <td>124.32 KB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>24 May 2009 </td> <td>108 </td> <td>109 </td> <td>109 </td> <td>100.20 KB </td> </tr>
<tr> <td>25 May 2009 </td> <td>139 </td> <td>149 </td> <td>234 </td> <td>414.03 KB </td> </tr>
<tr> <td>26 May 2009 </td> <td>129 </td> <td>129 </td> <td>129 </td> <td>116.89 KB </td> </tr>
<tr> <td>27 May 2009 </td> <td>124 </td> <td>124 </td> <td>124 </td> <td>114.11 KB </td> </tr>
<tr> <td>28 May 2009 </td> <td>129 </td> <td>129 </td> <td>129 </td> <td>119.68 KB </td> </tr>
<tr> <td>29 May 2009 </td> <td>160 </td> <td>160 </td> <td>160 </td> <td>147.51 KB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>30 May 2009 </td> <td>117 </td> <td>117 </td> <td>117 </td> <td>105.76 KB </td> </tr>
<tr bgcolor="#EAEAEA"> <td>31 May 2009 </td> <td>125 </td> <td>125 </td> <td>125 </td> <td>115.97 KB </td> </tr>
<tr bgcolor="#ECECEC"> <td>Average </td> <td>42.94 </td> <td>48.23 </td> <td>154.74 </td> <td>31.88 MB </td> </tr>
<tr bgcolor="#ECECEC"> <td>Total </td> <td>1331 </td> <td>1495 </td> <td>4797 </td> <td>988.40 MB </td> </tr>
</table>


网页中有个table,想用python 读取每天的数据,请高手帮忙,提供一下正则表达式和代码,谢谢!
...全文
307 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
duzif 2009-06-20
  • 打赏
  • 举报
回复
^<tr.*?> <td>(.*?)</td> <td>(.*?)</td> <td>(.*?)</td> <td>(.*?)</td> <td>(.*?)</td> </tr>$
king6o60 2009-06-19
  • 打赏
  • 举报
回复
仅仅提供思路,因为当天日期的数据和其他天的数据格式相同或相似。因此
首先判断当前日期,datetime.datetime.now()
然后逐行取出日期 15 May 2009 来判断是否为同一天,是则匹配该行所有需要的内容,否则继续。
至于匹配该行所需要的内容
<td>\d+ \w+ \d+ </td> <td>\d+ </td> <td>\d+ </td> <td>\d+ </td> <td>.*?</td> </tr>
lixq2000 2009-06-18
  • 打赏
  • 举报
回复
读取内容,然后用正则表达式匹配?
Mom319 2009-06-18
  • 打赏
  • 举报
回复
读出当天日期对应的: 17 May 2009,2,7,163
多鱼的夏天 2009-06-17
  • 打赏
  • 举报
回复
使用BeautifulSoup吧,分析html比正则好用
http://www.crummy.com/software/BeautifulSoup/
iambic 2009-06-17
  • 打赏
  • 举报
回复
你想读出什么来啊?读所有的数据?还是当前的数据?

37,720

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧