菜单导航

探索发现
AI数字人项目-hallo一键启动整合包
探索发现

AI数字人项目-hallo一键启动整合包

NoiseNoise
2024-06-26

介绍

hallo是一个用于人像图像动画的分层音频驱动视觉合成的项目,在使用语音音频输入的驱动下,人像图像动画领域在生成逼真和动态的人像。它采用了端到端扩散范式,并引入了分层音频驱动的视觉合成模块,以提高音频输入和视觉输出之间的对齐精度,包括嘴唇、表情和姿势运动。无缝集成了基于扩散的生成模型、基于UNet的降噪器、时间对齐技术和参考网络。所提出的分层音频驱动的视觉合成提供了对表情和姿势多样性的自适应控制,从而实现了针对不同身份的更有效的个性化。在图像和视频质量、唇形同步精度和运动多样性方面取得了明显的提高

此外,该项目支持与 ComfyUI 工具集成

img

官网:https://fudan-generative-vision.github.io/hallo/

github:https://github.com/fudan-generative-vision/hallo

启动整合包下载:https://pan.quark.cn/s/455b24f79fc6

演示

启动包说明

启动整合包不包含训练模型,适用于WIN系统,大小6.8g,要求最低内存需要8G,训练模型可从 HuggingFace 存储库(https://huggingface.co/fudan-generative-ai/hallo)中获取推理所需的所有预训练模型。

通过以下cmd将预训练模型克隆到目录中:${PROJECT_ROOT}/pretrained_models

git lfs install
git clone https://huggingface.co/fudan-generative-ai/hallo pretrained_models

启动包运行后你可以在端口7860中找到ui界面

1719407070799

其它

官方社区版离线包下载: https://huggingface.co/daswer123/portable_webuis/resolve/main/hallo-portable-2.zip?download=true

安装webui社区版

Docker安装

docker compose up -d 

这将启动 Gradio Web UI,并将映射到 8020 的端口 7680 公开到容器的主机 该应用程序将于 http://localhost:8020 年提供

注意:如果 GPU 驱动程序版本不是从头开始构建的,请务必为您的 GPU 驱动程序版本使用正确的 cuda 启动映像。

WIN

  1. 克隆此存储库:

    git clone https://github.com/yourusername/hallo.git
    
  2. 运行以设置环境并下载预训练模型。install.bat

  3. 确保系统上安装了 ffmpeg。它位于何处并不重要,只要系统能找到它。

  4. 通过运行 来启动 Web 界面。start.bat

Linux操作系统

  1. 克隆此存储库:

    git clone https://github.com/yourusername/hallo.git
    
  2. 运行以设置环境并下载预训练模型。install.sh

  3. 确保系统上安装了 ffmpeg。您可以通过以下方式安装它:

    sudo apt-get install ffmpeg
    
  4. 通过运行 来启动 Web 界面。start.sh

手动安装

如果您希望手动安装,以下是详细步骤:

  1. 克隆存储库和预训练模型:

    git lfs install
    git clone https://github.com/yourusername/hallo.git
    git clone https://huggingface.co/fudan-generative-ai/hallo pretrained_models
    curl -L -o pretrained_models/hallo/net.pth https://huggingface.co/fudan-generative-ai/hallo/resolve/main/hallo/net.pth?download=true
    
  2. 创建一个虚拟环境并激活它:

    python -m venv venv
    venv\Scripts\activate  # For Windows
    source venv/bin/activate  # For Linux
    
  3. 安装所需的软件包:

    pip install -r requirements.txt
    pip install -e .
    pip install bitsandbytes-windows --force-reinstall  # For Windows only
    
  4. 安装 GPU 库:

    pip install torch==2.2.2+cu121 torchaudio torchvision --index-url https://download.pytorch.org/whl/cu121
    pip install onnxruntime-gpu
    
  5. 启动 Web 界面:

    python app.py
    
版权声明

本文为「Noise」原创内容或编译整理;除特别说明外,文中图片并非个人手绘,可能来源于网络、AI 生成、截图等,后期使用 PhotoMator / Procreate 进行处理,仅用于学习与交流。如涉及版权或来源标注不全,请联系处理。未经授权,禁止用于商业用途,禁止抹除水印。转载请注明出处与链接并保留本声明。

...

评论 (0)

评论功能加载中...
Noise

Noise

执迷不悟

推荐阅读

Memory-不负时光摄影相册程序
探索发现

Memory-不负时光摄影相册程序

Noise | 2025-08-10

简介

一个瀑布流摄影图库,也是专为摄影师做的独立网络相册程序,它是基于[Moment](https://github.com/Robert-Stackflow/M

139
AI Movie Clip - 基于python的智能视频剪辑系统
探索发现

AI Movie Clip - 基于python的智能视频剪辑系统

Noise | 2025-08-10

一个基于人工智能的自动视频剪辑系统,能够自动分析视频内容并根据用户需求生成编辑后的视频。该项目为视频剪辑mcp提供了一个新的研究方向,它使用python脚本来分

75
CrossPaste-跨设备的粘贴神器,在任意设备间复制粘贴
探索发现

CrossPaste-跨设备的粘贴神器,在任意设备间复制粘贴

Noise | 2025-07-26

此前已介绍过多个粘贴软件了,如PasteBar等,它们各有所长,但有没有适合不同设备之间使用的呢,有的,CrossPaste就很好满足了跨设备同时复制粘贴的问题

特性

  • 🔄 实时共享:设备之间实时共享粘贴板内容,操作自然流畅。
  • 🖥️ 跨平台统一体验:Mac、Win
94