找回密码
 立即注册
查看: 206|回复: 1

BAGEL - 字节开源统一多模态理解和生成模型 图像生成、图像编辑、图像理解 本地一键整合包下载

[复制链接]

签到天数: 27 天

[LV.4]偶尔看看III

656

主题

890

回帖

5万

积分

武林盟主

积分
57114

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 4 天前 | 显示全部楼层 |阅读模式

BAGEL - 字节开源统一多模态理解和生成模型 图像生成、图像编辑、图像理解 本地一键整合包下载 ... ... ... ...

BAGEL - 字节开源统一多模态理解和生成模型 图像生成、图像编辑、图像理解 本地一键整合包下载 ... ... ... ...

BAGEL 是字节跳动 Seed 团队开源的统一多模态理解和生成模型。该模型支持文本、图像和视频的统一理解和生成。

BAGEL 旨在通过一个统一的模型来处理多种类型的数据(如文本、图像、音频等),从而实现更加智能、高效的交互体验。

今天分享的一键包基于一位技术大佬的FP8量化模型打包,虽然模型精度和生成效果有所降低,但大大降低了显卡门槛要求,消费级显卡也可流畅运行。理论上8G显存即可运行(8G需要开启共享显存),但生成速度较慢,所以建议12G显存,内存不低于16G。

应用领域

智能客服‌:Bagel AI的多模态交互能力使得智能客服系统能够更准确地理解用户的意图和需求,提供更加个性化的服务体验。 ‌
内容创作‌:利用Bagel AI的模型,可以自动生成文本、图像、音频等多种形式的内容,为内容创作者提供强大的辅助工具。 ‌
医疗诊断‌:在医疗领域,Bagel AI可以分析患者的病历、影像资料等多种数据,为医生提供更加全面、准确的诊断建议。 ‌
自动驾驶‌:自动驾驶汽车需要实时处理来自摄像头、雷达、激光雷达等多种传感器的信息。Bagel AI的多模态处理能力有助于提升自动驾驶系统的安全性和可靠性。


使用教程:( 建议N卡,显存12G起。基于CUDA12.4 )

文生图:输入提示词,设置参数,生成即可。
图像编辑:上传需要编辑的图像,输入需要编辑的提示词内容,提交即可。
图像理解:上传需要理解的图像,输入需要理解的提示词内容,提交即可。


下载地址:
迅雷云盘:https://pan.xunlei.com/s/VORtxmWxQUKtXVzBBbczjQaLA1?pwd=bj8t
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源立即购买


解压密码:https://deepfaces.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 16 天

[LV.4]偶尔看看III

0

主题

128

回帖

159

积分

无名之辈

积分
159
发表于 3 天前 | 显示全部楼层
又抢到了首评啦,看来国内的互联网公司还是很厉害的,不管是语音、图片、数字人都有涉及的
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-6-8 12:25 , Processed in 0.144464 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表