DualToken如何让模型理解自己画出来的东西? - Duoia

Wait 5 sec.

【摘要】论文简述 图像理解着重深度的语义,图像生成着重细节的纹理,像素,两者先天不相容。DualToken通过ViT天生自带的分层来生成两套token,实现了一个模型既能生成图像又能理解图像。 正文 依旧非常长的论文题目,依旧底部给arxiv链接 话说主包一直很喜欢看毕导,漫士沉思录,小Lin说这种风格的科 阅读全文