开源项目分享之AnyText

Huazie
全栈领域优质创作者
博客专家认证
2024-02-27 14:52:54
加精

 AnyText 是一个多语言视觉文本生成和编辑模型,由阿里巴巴智能计算研究院的团队开源。


项目地址:GitHub


AnyText 由一个扩散管道组成,主要包括两个元素:辅助潜在模块 文本嵌入模块

前者使用文本字形、位置和遮罩图像等输入,生成用于文本生成或编辑的潜在特征。

后者采用OCR模型将笔画数据编码为嵌入向量,这些嵌入向量与来自标记器的图像字幕嵌入向量混合,生成与背景无缝融合的文本。

AnyText 采用了文本控制扩散损失和文本感知损失进行训练,以进一步提高书写准确性。

 来看看官方的案例展示:

 

 

 

...全文
246 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

68

社区成员

发帖
与我相关
我的任务
社区描述
开源项目分享,鼓励大家把自己或他人的开源项目分享出来!!!
github开源开源协议 个人社区
社区管理员
  • Huazie
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧