开源项目分享之AnyText

全栈领域优质创作者

博客专家认证

2024-02-27 14:52:54

加精

AnyText 是一个多语言视觉文本生成和编辑模型，由阿里巴巴智能计算研究院的团队开源。

项目地址：GitHub

AnyText 由一个扩散管道组成，主要包括两个元素：辅助潜在模块 和 文本嵌入模块。

前者使用文本字形、位置和遮罩图像等输入，生成用于文本生成或编辑的潜在特征。

后者采用OCR模型将笔画数据编码为嵌入向量，这些嵌入向量与来自标记器的图像字幕嵌入向量混合，生成与背景无缝融合的文本。

AnyText 采用了文本控制扩散损失和文本感知损失进行训练，以进一步提高书写准确性。

来看看官方的案例展示：

...全文

246 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

项目就会从第三方网抓取数据，数据抓取完全是在客户端完成，托管的服务器上不存放任何文件和媒体，所有文件均由第三方传输。输入 prompt ，要求带有 “Any Text” 字样，AnyText 算法一键合成。简约的界面，仅显示你...

AnyText：瞬息之间，文本随需而变！智能生成定制化内容，让创作无界延伸！ - 精选真开源，释放新价值。

今天我分享一个开源项目QAnything，它是由网易开源自研的 RAG 引擎。该引擎允许用户上传 PDF、图片、Word、Excel、PowerPoint 等多种格式的文档，并实现类似于 ChatGPT 的互动问答功能，其中每个答案都能精确追溯到...

Python 趋势月报，按月浏览往期 GitHub,Gitee 等最热门的Python开源项目，入选的项目主要参考。注:当前文章会不定期进行更新。入选公式＝70%GitHub Trending+20%Gitee+10%其他。排名不分先后，都是当前月份内相对...

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行...

68

社区成员

65

社区内容

发帖

与我相关

我的任务

github开源开源协议个人社区

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章