腾讯混元大模型升级：新增“文生图”，代码能力大幅提升

近日，腾讯宣布，混元大模型迎来全新升级，并正式对外开放“文生图”功能，展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5，代码能力大幅提升20%，达到业界领先水平。

腾讯混元

文生图是AIGC领域的核心技术之一，也是体现通用大模型能力的试金石，对模型算法、训练平台、算力设施都有较高的要求。

腾讯最早在广告场景进行AI自动生成图像的探索，在此过程中积累了深厚的研发能力。据介绍，相比其他大模型，腾讯混元的文生图应用，在人像真实感、场景真实感上有比较明显的优势，同时，在中国风景、动漫游戏等场景等生成上有较好的表现。

在业界公认难度较高的人脸画像生成上，腾讯混元也交出了令人满意的作品。比如，输入提示词“生成可爱的亚洲 4 岁女孩穿着棉质连衣裙，大眼睛，古代中国，摄影风格，汉服”，腾讯混元大模型生成如下：

腾讯混元

可以看到，腾讯混元大模型可以很好地理解提示词中提到的“棉质连衣裙”“汉服”等内容，同时在风格上，也通过建筑和风景等衬托，很好的展示了“古代中国”的风格要求。

作为实用级的通用大模型，腾讯混元大模型的应用场景丰富多样。目前，超过180个腾讯内部业务已接入腾讯混元，包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。最近，QQ浏览器还基于腾讯混元推出了“PDF阅读助手”，具备智能摘要、智能问答和多轮提问等功能。

免责声明：素材源于网络，如有侵权，请联系删稿。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。