如何判断一个网页中是否存在视频?

ncok123 2010-01-20 07:17:46
我在做一个网页视频抓取的爬虫,目前遇到的瓶颈是无法迅速确认该网页中是否含有视频。

请教有什么好办法去解决这个问题?如果对HTML文件进行解析的话,正确率是100%,不过效率太低。

目前我采用的几个办法

1.对视频门户网站URL进行定制(如youku),这样可以不必检查源码,速度很快,但必须人工定制。

2.检查如<embed type="application/x-shockwave-flash"的HTML标签,可是适用范围有限,漏检很多。

我想从Javascript入手,分析有没有视频或播放器载入的操作或类似可以表示出现视频的线索。

先谢谢大家!
...全文
1989 3 打赏 收藏 举报
写回复
3 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
chenxicigema 2012-09-23
  • 打赏
  • 举报
回复
请问楼主找到解决方案了么?另外怎么通过html解析?我发现有的视频网站不含有video标签 比如土豆
ncok123 2010-01-20
  • 打赏
  • 举报
回复
楼上误会我的意思了,我的漏检是指有些网页不是采用embed的方式加载视频播放器的,而是采用其他方法,因此仅仅依赖embed标签来判断会漏检这些网页
singlion 2010-01-20
  • 打赏
  • 举报
回复
用JQuery啊,一句话搞定
$("embed")
这个是检查DOM,应该不会漏检,只要内存中存在<embed>就可以,不管是HTML中本来就有的还是使用JS拼接成的都成
发帖
JavaScript

8.7w+

社区成员

Web 开发 JavaScript
社区管理员
  • JavaScript
  • 无·法
加入社区
帖子事件
创建了帖子
2010-01-20 07:17
社区公告
暂无公告