CV-Climber 2024-03-12 15:11 采纳率: 0%
浏览 17

文本生成图像github代码复现

大家好,谁能把他跑通的文生图代码打包给我,我也试试,
现在一个模型都没跑出来,要被骂了
如果有愿意的,谢谢,万分感谢!

  • 写回答

3条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-03-12 15:12
    关注

    引自免费微信小程序:皆我百晓生

    当然可以,这里提供一个基于OpenAI的DALL·E Mini(也称为 Craiyon)项目的GitHub代码库链接,它是一个相对轻量级且易于复现的文本生成图像模型:https://github.com/rom1504/dalle-mini

    要复现并运行该项目,请按照以下步骤操作:

    1. 首先确保你已安装了Python和相关依赖。在命令行中执行以下命令以创建一个虚拟环境并激活它:
    python -m venv dalle_venv
    source dalle_venv/bin/activate  # 对于Windows系统使用 `dalle_venv\Scripts\activate`
    
    1. 克隆DALL·E Mini项目到本地:
    git clone https://github.com/rom1504/dalle-mini.git
    cd dalle-mini
    
    1. 安装所需依赖包:
    pip install -r requirements.txt
    
    1. 下载预训练权重文件,并将其放置在项目指定目录下。根据项目README.md文件中的指示获取权重文件。

    2. 运行代码进行文本转图像生成:

    from dalle_mini.model import Custom dalle
    
    # 初始化模型,加载预训练权重
    dalle = CustomDalle()
    # 提供一段文本输入
    text_input = 'a painting of a robot eating a pizza'
    # 生成图像
    images, captions = dalle.generate_images(text=text_input, num_return_sequences=1)
    # 将生成的图像保存至本地
    images.save(f'result_{text_input.replace(" ", "_")}.png')
    

    请注意,由于原始DALL·E Mini不是最先进的模型,生成效果可能受限。对于更高质量的文生图模型如OpenAI的DALL·E 2或阿里云的通义千问等,它们的代码通常不公开或需要特定环境才能运行。如果需要尝试这些高级模型,建议查看对应官方文档或申请试用API服务。

    评论 编辑记录

报告相同问题?

问题事件

  • 创建了问题 3月12日

悬赏问题

  • ¥15 cocos的js代码调用wx.createUseInfoButton问题!
  • ¥15 关于自相关函数法和周期图法实现对随机信号的功率谱估计的matlab程序运行的问题,请各位专家解答!
  • ¥15 Python程序,深度学习,有偿私
  • ¥15 扫描枪扫条形码出现问题
  • ¥35 poi合并多个word成一个新word,原word中横版没了.
  • ¥15 【火车头采集器】搜狐娱乐这种列表页网址,怎么采集?
  • ¥15 求MCSCANX 帮助
  • ¥15 机器学习训练相关模型
  • ¥15 Todesk 远程写代码 anaconda jupyter python3
  • ¥15 我的R语言提示去除连锁不平衡时clump_data报错,图片以下所示,卡了好几天了,苦恼不知道如何解决,有人帮我看看怎么解决吗?