关于facefusion 实时直播换脸,光影和色彩 变化的问题
社区首页 (3104)
我加入的社区
我管理的社区
官方推荐社区
76
其他社区
3104
请编写您的帖子内容
社区频道(14)
显示侧栏
卡片版式
全部
AI资讯
AIGC
文生图
文生视频
图生图
技术交流
开源推荐
Java
Python
知识干货
求助
Ada助手
博文收录
最新发布
最新回复
标题
阅读量
内容评分
精选
64
评分
回复
关于facefusion 实时直播换脸,光影和色彩 变化的问题
我发现facefusion(我是用在实时换脸直播的,不是视频换脸的)在修复换脸的时候光影和颜色都发生了变化(灯光打在脸上),需要,尽可能的还原光影和色彩。这个有没有大佬有办法解决吗?或者有没有其他程序可以支持实时直播换脸,可以解决这个光影和色彩的问题
复制链接 扫一扫
分享
求助
35
评分
回复
复制链接
扫一扫
分享
AI资讯
67
评分
回复
Lora模型「1.5-毛茸茸的动物」
今天看到有网友分享了一个可爱的Lora模型「1.5-毛茸茸的动物」,模型地址:https://www.liblib.ai/modelinfo/5921422aa8d84dcc87d2a76e09a2c0a0 这个模型可以生成一些毛茸茸的动物,效果挺可
复制链接 扫一扫
分享
文生图
55
评分
回复
OpenAI最新发布的文生视频模型Sora到底强在哪?
OpenAI发布首款文生成视频大模型 Sora ,其炸裂登场让人感到惊艳!
复制链接 扫一扫
分享
文生视频
57
评分
回复
Generative AI 新世界 | 走进文生图(Text-to-Image)领域
还记得在 2022 年 4 月,第一次读完 DALL-E-2 论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》,那时的感觉是:惊为天人。只不过没想到在之后的一年里,这个文生图(Text-to-Image)领域发展得如此之快。DALL-E-2 论文我们下集再展开分析,这次先带大家看这篇论文里结构图里面的名词,是不是有些术语我们有些熟悉呢?是的,就是 CLIP。Source:上图是 DALL-E-2 模型主要架构。
复制链接 扫一扫
分享
文生视频
56
评分
回复
字节跳动推出MagicVideo-V2超高清文生视频模型
MagicVideo-V2是由字节跳动的研究人员开发的一种超高清文生视频模型。该模型在视频的高清度、润滑度、连贯性、文本语义还原等方面表现出色,比目前主流的文生视频模型Gen-2、Stable Video Diffusion、Pika 1.0等更优秀。MagicVideo-V2将文生图像、图像生成视频、视频到视频和视频帧插值4种功能整合到一个模型中,解决了之前面临的4大难题。
复制链接 扫一扫
分享
文生视频
51
评分
回复
OpenAI Sora文生视频模型技术报告中英全文
我们最大的模型Sora能够生成一分钟的高保真视频。Sora是一种通用的视觉数据模型——它可以生成持续时间、宽高比和分辨率各异的视频和图像,长达一分钟的高清视频。我们将Sora与一个版本的模型进行了比较,该模型将所有训练视频裁剪成正方形,这是训练生成模型时的常见做法。我们在我们的登录页面列举了模型的其他常见故障模式——比如在长时间样本中发展的不连贯性或物体的自发出现。这项能力使得Sora能够执行广泛的图像和视频编辑任务——创建完美循环的视频,为静态图像添加动画,向前或向后延长视频的时间等。
复制链接 扫一扫
分享
文生视频
52
评分
回复
利用Sora文生视频模型生成视频内容
未来,随着技术的不断进步和应用场景的拓展,我们期待Sora文生视频模型能够在视频创作领域发挥更大的作用,为我们带来更加丰富、多样和个性化的视觉体验。例如,通过引入更先进的神经网络架构、使用更大规模的数据集进行训练,以及结合其他技术如自然语言处理(NLP)和计算机视觉(CV)等,模型可能会实现更高的生成速度、更准确的场景理解和更丰富的创意输出。这包括调整视频的帧率、分辨率、色彩等参数,以及优化视频的场景、人物、动作等元素,使生成的视频更加符合我们的期望。:首先,我们需要明确想要生成的视频的主题和风格。
复制链接 扫一扫
分享
文生视频
52
评分
回复
OpenAI 全新发布文生视频模型 Sora,功能有多强大?
Sora是一种扩散模型,它能够通过从一开始看似静态噪声的视频出发,经过多步骤的噪声去除过程,逐渐生成视频。Sora不仅能够一次性生成完整的视频,还能延长已生成的视频。通过让模型能够预见多帧内容,团队成功克服了确保视频中的主体即便暂时消失也能保持一致性的难题。与GPT模型类似,Sora采用了Transformer架构,从而实现了卓越的性能扩展。OpenAI把视频和图像分解为较小的数据单元——「patches」,每个「patches」相当于GPT中的一个「token」。
复制链接 扫一扫
分享
文生视频
54
评分
回复
文生图、文生视频领域PaperList [持续更新]
AutoEncoder 【自编码器】 : https://arxiv.org/abs/2003.05991VAE 【变分自编码器,Diffusion Model的源头】: https://arxiv.org/abs/1906.02691非均衡热动力学深度无监督学习【Diffusion的理论基础】: https://arxiv.org/abs/1503.03585DDPM 【第一篇将Diffusion成功应用于图像生成的论文】: https://arxiv.org/abs/2006.11239DDI
复制链接 扫一扫
分享
文生视频
56
评分
回复
OpenAI Sora 文生视频体验入口!能够生成1分钟的视频,目前最强的AI视频生成技术
还展现出一些模拟物理世界和数字世界的能力,如三维一致性和交互,揭示了继续扩大视频生成模型规模来发展高能力模拟器的前景。它能够生成长达 1 分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。OpenAI刚刚发布了 Sora,一种文字生成视频的技术,效果相当炸裂。ChatGPT狂飙160天,世界已经不是之前的样子。ChatGPT狂飙160天,世界已经不是之前的样子。每天给大家更新可用的国内可用chatGPT资源。
复制链接 扫一扫
分享
文生视频
53
评分
回复
人工智能专题:OpenAI发布Sora文生视频模型,AI行业持续高速发展
今天分享的是深度研究报告:《页。
复制链接 扫一扫
分享
文生视频
56
评分
回复
【文生图系列】文生图大模型合集与效果对比
本篇博文粗略了介绍了OpenAI的DALL E系列,百度的ERNIE-ViLG系列,google的Imagen,MidJourney,Stable Diffusion,智源研究院的AltDiffusion,英伟达的eDiff-I和阿里的通义文生图大模型,并进行了效果对比。
复制链接 扫一扫
分享
文生视频
53
评分
回复
OpenAI全新发布文生视频模型Sora - 现实,不存在了
OpenAI,发他们的文生视频大模型,Sora了。而且,是强到,能震惊我一万年的程度。如果非要用三个词来总结Sora,那就是。
复制链接 扫一扫
分享
文生视频
52
评分
回复
AIGC文生图及工具产品简介
AIGC,全称是人工智能生成内容(Artificial Intelligence Generated Content)是继UGC(用户生成内容),PGC(平台生成内容)后,利用人工智能技术,自动生成内容的生产方式;目前主要利用&集成自然语言处理、计算机视觉、语音生成等算法训练生成式大模型,且已经从纯文本生成、纯图像生成拓展到了跨模态的内容理解与生成,促进了更接近普通人定义的“智慧”的加速涌现。
复制链接 扫一扫
分享
文生视频
61
评分
回复
【NovelAI 小说SD批量生成 文生图/视频克隆】问题汇总解决办法
【样品】《谜影之夜》文生图全自动版SD一键成片操作步骤&环境配置地址:【NovelAI】月产10000+全自动批量原创小说短视频支持文生图和视频克隆。
复制链接 扫一扫
分享
文生视频
55
评分
回复
Sora - 探索AI视频模型的无限可能
OpenAI推出的首个AI视频模型Sora,以其卓越的性能和前瞻性的技术,引领着AI视频领域的创新发展。
复制链接 扫一扫
分享
文生视频
52
评分
回复
探索AI视频生成新纪元:文生视频Sora VS RunwayML、Pika及StableVideo——谁将引领未来
探索AI视频生成新纪元:文生视频Sora VS RunwayML、Pika及StableVideo——谁将引领未来
复制链接 扫一扫
分享
文生视频
53
评分
回复
文生视频模型调研
文生视频只有OpenAI的Sora,其他的()都是动图。OpenAI发布了可以生成60s视频的Sora模型。刚刚发布的google的就一下子变得无人问津了,太尴尬了。
复制链接 扫一扫
分享
文生视频
为您搜索到以下结果: