You dont have javascript enabled! Please enable it!
百度/360权重5 查看详情
立即入驻
AI世界AI工具大全

混元-DiT

腾讯推出的高性能细粒度中文理解,多分辨率扩散Transformer模型

标签:

腾讯推出的高性能细粒度中文理解,多分辨率扩散Transformer模型

首个中英双语DiT架构

我们提出了混元DiT,一个基于Diffusion transformer的文本到图像生成模型,此模型具有中英文细粒度理解能力。为了构建混元DiT,我们精心设计了Transformer结构、文本编码器和位置编码。我们构建了完整的数据管道,用于更新和评估数据,为模型优化迭代提供帮助。为了实现细粒度的文本理解,我们训练了多模态大语言模型来优化图像的文本描述。最终,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。

混元-DiT

相关导航


外贸建站推广

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...