社区
游戏开发
帖子详情
请教编码算法
xdpan
2000-07-14 04:07:00
这一讨论区将专门讨论编码算法问题,如HUFFMAN编码、矢量量化编码和代数编码等。请高手赐教,有代码最好。
...全文
143
1
打赏
收藏
请教编码算法
这一讨论区将专门讨论编码算法问题,如HUFFMAN编码、矢量量化编码和代数编码等。请高手赐教,有代码最好。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
lyzcom
2000-08-01
打赏
举报
回复
我现在暂时没有代码,因为我没有时间写。如果有兴趣,发一份E-mail给我,事后我就给你!
lyzcom@163.net
小日本视频转换器
TMPGEnc 是日本人堀浩行开发的一套老牌的高画质视频
编码
转换工具软件,在 Canopus ProCoder v2.0 Final 推出以前,一直是视频转换领域的画质冠军,支持 VCD、SVCD、DVD 以及所有主流媒体格式 (Windows Media、Real Video、Apple QuickTime、Microsoft DirectShow、Microsoft Video for Windows、Microsoft DV、Canopus DV、Canopus MPEG-1 和 MPEG-2
编码
),而且还提供对高清晰度视频格式的支持。 TMPGEnc Xpress 4.0 最新推出的版本,在保证原有的高质量视频转换品质的前提下,对新近推出的英特尔和 AMD 处理器进行了代码优化,支持最新的多媒体扩展指令,令其在提高视频转换质量的情况下大大加快了视频转换的速度。同时,软件在提供各类视频格式的标准
编码
设置外还提供了各种自定义设置,加强了
编码
的灵活性。 程序安装时如出现提示错误则选择“忽略”,安装完成后点击绿化然后退出程序,再运行软件即可使用!小日本TMPGEnc为津波同享(TMPGEnc)的商业版。津波同享(TMPGEnc)应广大用户的期待,郑重推出商品版津波视像
编码
(TMPGEnc Plus )。 即使非专业人员也能易如反掌地进行
编码
设定的“项目助手”功能 装备面向更高画质的“新2次处理可变码率
编码
引擎” 制作原版DVD/VCD的“DVD,SVCD和VCD源码”生成之功能对AVI等类型的影片文件进行MPEG-1/2软
编码
编码
时画面大小,宽高比调整视频与音频的码流合成/分解 TMPGEnc小日本参数设定详解 本文并不介绍tmpgenc的菜单部分,因为影响mpeg
编码
效率/质量的主要是参数设置。TMPGEnc小日本菜单提供了一些很好的功能,比如压缩完成自动关机等,请大家自己摸索。 A. video(视频)部分: 本部分设定输出的视频码流的类型和参数,大部分参数在模版中已经固定。 1)基本类型:有mpeg1/mpeg2,mpeg1用于vcd, mpeg2用于svcd/dvd. 2)大小:PAL vcd标准为352x288, pal svcd标准为480x576, pal dvd标准为720x576 3)画面宽高比:一般应该用4:3 625 line PAL, 这是电视机的屏幕比例 4)桢率:pal 的标准为25fps 5) 码率控制:码率控制
算法
是造成各种
编码
器
编码
效率和质量不同的关键因素。mpeg标准中并没有对次
算法
的具体实现做规定,这通常也是商业版本的知识产权内容。 CBR(固定码率):保持码率基本维持在平均码率。实现简单,对复杂场景会因码率不足造成马赛克现象,对于简单场景则不能充分利用
编码
空间。(老枯这里讲的复杂场景是指细节/边缘丰富以及快速变化场景)。 VBR, (2-pass VBR), “二次处理VBR”。老枯认为其意思是通过对整个视频源进行2次处理使
编码
效率最高:第一遍判断何处为复杂场景和简单场景,第二遍根据码率的上下限,把码 率重新分配更多给复杂场景。可以在实验中看出,tmpgenc在进行这种
编码
时进度指示在50%以前是没有预览图象的,而且桢进度指示为0。所以老枯建议 威龙改译为“二次处理”。这种码流控制方式应该在给定码率下得到最好的质量,但是和具体2次分配
算法
关系很大。同时耗时最长。一些其他
编码
器甚至有3次处 理的码率优化。 MVBR (手动可变码率),设定最大码率和对不同的帧类型设定不同的信息损失量,实现局部码率优化。可以通过手工指定复杂场景为I帧对之进行较精细的
编码
。参见对于GOP参数设定部分。 CQ-VBR (自动可变码率),设定主观质量值和码率上下限,以主观质量标准对
编码
器量化环节进行控制,在可选参数中设定主观质量值以后,
编码
器就在能达到此质量标准 的前提下尽量节省码率。关键在于
编码
器对主观质量的评价方法。这是CQ和VBR的综合,也可以看作自动的MVBR. 威龙汉化5版在可选参数中有一行是“不破坏最小码率的状态而填充数据”,老枯的理解是,如果码率过低就填充无意义码(好浪费啊,不过可能是为了兼容性的原 因),英文版这一句没有翻译,还是日文。 :-( CQ (固定品质),就是比MVBR多了一个主观质量值的设定。老枯不明白到底是怎么控制的。 RT-CBR (实时固定码率):连GOP层次的码率优化也不做了的CBR,快一点,质量不高 RT-CQ (实时固定品质):连GOP层次的码率优化也不做了的CQ,快一点,质量不高 6)码率:这个码率是指CBR方式下的平均码率 7)VBV缓冲区大小:缓冲区大的话,
编码
优化会好一些,但是解码的时候也要求大一些的缓冲区。因此,vcd/svcd标准中参数是固定的,否则可能机器无法播放。 8)Pofile & level(类别与级别): 这个参数是mpeg1没有的。在svcd/dvd应用中应该是MP&ML,模版自动选定。 MP&HL是为HDTV定义的,分辨率可以高达 19??x11?? . 9)制式:好象这个也是mpeg2相关的参数。我们应该用PAL. 10) 隔行扫描:mpeg1只支持逐行扫描(25 frame/sec),mpeg2可以选择隔行(50 field/sec)。如果成品在电视上播放,老枯建议选择隔行,使运动平滑。但是隔行的视频在pc上看会有毛刺现象,在水平运动景象中尤其明显。 11)播放时实现3:2下拉: 这是在film/NTSC制式转换中需要的,即在
编码
时维持帧率不变,不做3:2下拉,而在播放中实现。参见 B.advanced部分。感谢威龙指正。 12)YUV格式:给亮度/红色差/蓝色差分配的码位。对于人眼来说,亮度信号是最敏感的,所以就分配比较多的
编码
空间以求精细,对于色差则粗糙些。一般就是4:2:0了。(其实4:2:0方案给蓝色差的码位不是0,老枯不知道为什么这样写) 13)DC分量精度:在mpeg
编码
中需要对8x8的图象块进行DCT(离散余弦变换),DC分量的意义基本是代表8x8块中的平均值,一般需要为之分配比较大的
编码
空间,否则马赛克的边缘效应就比较明显。(8bit就不小啦,图象压缩中是每个bit的油水都要榨干的) 14)运动检测精度:mpeg是对I帧进行帧内
编码
,对P帧进行预测误差
编码
。就是对于P帧的图块,在I帧中寻找对应的部分,然后对两个图块的差异部分进 行
编码
,可以大大节省码率。运动检测精度越高,图块搜索匹配的范围越大,
编码
效率越高,同时
编码
速度越慢。这部分
算法
同样没有在mpeg标准中定义,各个 厂商实现水平相差会很大。一般来说,在tmpgenc中设置为普通即可。 B. Advanced (影象源)部分: 本部分设置视频源相关的参数,以及在
编码
之前对视频源进行的预处理。 1)视频源类型:隔行扫描/逐行扫描。这个参数在打开视频源文件的时候会对之自动判断设置。Tmpgenc12版不能自动识别type 1 DV,在12a版本中已经解决。参看老枯的
编码
测试页。 2)场顺序:这是整个tmpgenc甚至整个桌面视频领域中最混乱的一部分。tmpgenc12a好象也不能根据视频源自动设置这个参数。老枯在这个问题 上搞了很久,才算明白了一点。这个参数是至关重要的,设置反了会造成生成图象的明显闪动,打个比方,一个物体的运动位置次序本来是1-2-3-4-5-6 -……,设置反了以后就成了2-1-4-3-6-5-8……对于模拟视频源,其场序是由捕捉卡类型决定的,对于dv,则定义为 field order A。讲到这里还没有什么麻烦,但麻烦的是虽然场序只有2种,对于他们的叫法却有3种: field order A/B (在ulead软件中的叫法), even/odd line first (tmpgenc的叫法), field top/bottom first(bitrate viewer叫法),这3种叫法之间的对应关系是最让人头疼的。在英文版的tmpgenc12a中,缺省的设置为“even line first (field A)”,,但在威龙汉化中缺省设置为“奇数场->偶数场”,老枯曾就此
请教
威龙,威龙讲这是日文版的原意,注意不要在字面上混淆了。总之,3种叫法 的关系是这样的:field A = even line first(奇数场->偶数场) = field bottom first。最可*的方法,是用不同的设置对高速运动场景各生成一段隔行扫描的视频,并在电视上观察,应该能够看到差别。 3)视频源的宽高比:tmpgenc可以自动识别设置,一般应该为4:3 625line PAL. 4) 画面显示比例和位置:一般选用“全画面显示并宽高比不变”,所谓“全画面显示并宽高比不变2”选项可能是会造成部分画面不可见,老枯没有尝试过这一种。在 4:3视频源中可能没有差别,但对于16:9宽屏影象在4:3屏幕上输出而言,“全画面显示并宽高比不变”是在上下留出空白,“全画面显示并宽高比不变 2”会截掉左右两端画面。。。没有这样试过,仅为老枯猜测,不正确的地方请朋友们指正。 5)滤镜选项组: 这一组设置可以对视频源进行预处理以提高影象质量。一般来说,老枯都是在非编软件中实现这些功能的。另外,对滤镜的使用要适度,因为客观上任何滤镜的使用都是引入了信息损失,这是对低品质视频源提高主观质量的代价。 影象源范围:选取部分影象源进行压缩 24fps化:24fps是电影标准,一般不选 消除鬼影:鬼影是影象的重影,视频源不好的时候会出现。老枯在dv中没有遇到过。 消除噪点:在低光条件下的拍摄中影响中回出现明显的颗粒噪点,利用此滤镜可以消除。不过副作用是平滑了图象,比如人的面部会象橡皮娃娃一样,光滑但没有质感。 锐化边缘:可以对横向/纵向边缘分别设置参数,做增强处理。 简单色彩校正:调整亮度,对比度,gamma,色度等 高级色彩校正:可以按照不同的色彩空间RGB/YUV等进行色彩校正。 消除交错信号(de-interlace):把隔行扫描的视频源转换成逐行扫描的视频,如果对输出的视频设置为隔行扫描(如在打算电视上播放的 svcd/dvd),则不要选用。老枯认为在做vcd(逐行扫描mpeg1)时候也未必需要选用,要看视频源的大小决定。比如老枯用dv 576线,在做vcd时候只需要288线,简单舍弃一个场就可以,不需要deinterlace. 相反,如果视频源是352x288的隔行扫描视频,则需要做de-interlace. 裁剑画面:由于电视机播放视频的时候对边缘四周的部分做舍弃,所以可以利用这一点只对可见部分进行
编码
,这样可以加快
编码
速度,并且因为节省的码率可以利用在未裁剪区域从而提高画面质量。一般来说对上下左右各裁剪5%是安全的。 3:2下拉变换:因film 24fps和 NTSC 30fps帧率不同,在制式转换中所需要做的调整。一般不用。 帧率不变:没什么好讲的 声音处理:可以增大/减小音量,并做声音的淡入/淡出。 C. GOP结构 GOP = group of picture. 在mpeg中一个GOP就是一组时间上连续的画面。mp4视频中的画面分为3种:I,P,B. I是内部
编码
帧,
编码
方式基本上就是jpeg的格式。P是前向预测帧,
编码
方式是使用运动检测误差
编码
,参看A部分对运动检测的说明;B是双向内插帧,根 据前后I/P帧进行插值运算,对插值误差进行
编码
。 建议一般不要修改GOP结构,以取得压缩比例和图象质量之间的最好平衡。极端的例子是只用I帧,图象质量会有保证,但码流会很大。 1)输出编辑用的码流:这个选项会把GOP最后的B帧取消。因为B帧是双向内插的,其
编码
/解码不仅需要以前的I/P,也需要以后的I/P帧。取消最后的B帧,可以去除GOP之间的依赖性,从而便于编辑。 2)检测场景变化:对于快速变化的场景,强行设置为I帧,以保证画面质量 3)手工强制设定帧类型:手工设定需要精细
编码
的画面帧为I帧。结合MVBR码流控制可以全面控制码流分配。 D、量化矩阵 mpeg中的量化是对8x8 YUV 信号图块进行DCT变换之后的系数的量化。通过对高频分量使用比较大的量化阶从而达到减小高频分量的
编码
空间,达到压缩的目的。代价就是丧失图像细节,边缘模糊等。 1)帧内
编码
量化矩阵:这是指对I帧使用的帧内
编码
量化矩阵 2)帧间
编码
量化矩阵:是指对非I帧的帧间预测误差
编码
所用的量化矩阵。威龙汉化版中叫外部矩阵。 3)矩阵模版的选择:建议对一般的视频选用mpeg标准,可以看到,其帧间
编码
矩阵统一为16,这是因为帧间误差已经抵消了低频分量,高频分量丰富,所以 和帧内
编码
矩阵有所不同。对于计算机动画尤其是2维线条为主的动画,建议选用CG模版,可以看到因为CG本身高频信号丰富,其帧内
编码
矩阵也统一为32。 4)YUV输出为YCrCb: YCrCb色彩空间分配给Y亮度信号的
编码
空间更大,如果视频源是YCrCb格式的话,这个选项可以增加画面质量。不过一般都是采用YUV(CCIR601),如dv,所以不要选择这个选项,否则白白浪费码率。 5)浮点离散余弦变换:整点运算的速度比浮点要快很多,但精度不如浮点。老枯猜测这里的浮点其实只是把DCT变换的系数从8bit增大为16bit的精度,并不需要浮点运算器单元参与变换,否则速度是不可忍耐的。 6)不对静止部分做半像素的运动检测:由于视频源是隔行的,对于精细的静止边缘线条(1个像素宽度)比如静止字幕会出现一个场中出现,另一个场中不出现的闪动。选中这个选项会消除闪动。。不过老枯觉得好像这个和量化矩阵无关。 F. 系统: mpeg的系统是指视频+音频。vcd/svcd/dvd模版中已经设定好。
AV1
编码
技术学习路径
学习AV1的工具使用:掌握AV1的
编码
工具和解码工具的使用方法。可以查阅相关的文档、教程,学习
编码
器的使用和参数设置,以及解码器的使用和性能优化。学习视频
编码
基础知识:了解视频
编码
的基本原理、常用的视频
编码
算法
,比如Transform、Quantization、Entropy Coding等。AV1的开发社区提供了许多资源和学习机会,可以向其他开发者
请教
问题、学习经验,也可以提交自己的代码和贡献。了解AV1的基本原理:学习AV1的
编码
结构、帧间预测、帧内预测、变换、量化、熵
编码
等基本原理。
ThinkPHP5生成二维码及背景图片合成
二维码是我们在开发网站和项目的时候经常遇到的,我第一次接触二维码时,翻过许多资料,也
请教
许多所谓高人,被整的还是一头雾水,于是自己下决心一定搞明白二维码到底怎么回事,在经历许多坑,花费许多时间和精力后...
Google 图片搜索
算法
Google 按图搜索的原理 来源:maggie@知乎 分类: IT技术 maggie@知乎 : 针对这个问题,
请教
了
算法
组的同事,他分享了基本的思路: 对于这种图像搜索的
算法
,一般是三个步骤: 1. 将目标图片进行特征提取,描述图像的
算法
很多,用的比较多的是:SIFT描述子,指纹
算法
函数,bundling features
算法
,
编码
:KR字符串匹配,一个简单到领导都看得懂的
算法
“ 常怀感恩,生活或许就不会处处深渊。”这几天看了《柔性字符串匹配》,觉得很有意思。书是好书,只是这个脑子是不是猪脑就不知道了,于是秉着知之为知之,不知为不知的精神,我准备再次去
请教
一下我的领导,在一个月黑风高的夜晚,我给领导发了个消息,领导这么回复了我。01—KR
算法
话说回来,我们今天要说的这个字符串匹配
算法
比之前讲过的kmp,horspool,sunday简单的多的字符串匹配
算法
,我们知道暴力匹配是通过对两个字符串进行每一个位置字符对比来查找匹配的上的子字符串。今天说的这个KR
算法
的思想和暴力
游戏开发
8,301
社区成员
23,681
社区内容
发帖
与我相关
我的任务
游戏开发
游戏开发相关内容讨论专区
复制链接
扫一扫
分享
社区描述
游戏开发相关内容讨论专区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章