fantaios AI-инструменты, собранные с заботой
Help center · запись База знаний / Помощь
10.06.2026 8 мин чтения Как заменить лицо в видео через FaceFusion на ПК
На этой странице

Замена лица в видео через FaceFusion на ПК: два маршрута без онлайн-сервисов

Локальная замена лица в видео через FaceFusion на ПК идёт по одному из двух маршрутов. Маршрут 1: распаковать FaceFusion Portable v2.2.1, запустить bat-файл под свою видеокарту, загрузить фото-донора в Source и видео в Target, выбрать модель inswapper_128_fp16 и нажать генерацию. Маршрут 2: клонировать репозиторий с GitHub, поставить актуальную версию по официальной документации и работать с CUDA-ускорением. Дальше в статье разбираются оба пути, выбор моделей, реальные ошибки из комментариев и реалистичные ожидания по времени.

Что такое FaceFusion и зачем запускать его локально

FaceFusion – open-source инструмент для замены лица, идейный преемник нейросети roop. Репозиторий лежит на GitHub под адресом facefusion/facefusion и, по данным devtrends.ru, набрал более 27 503 звёзд: для нишевого AI-проекта это признак живого сообщества и регулярных правок.

Главное отличие от облачных сервисов: вычисления идут целиком на машине пользователя. Видео и фото никуда не загружаются, ключи и подписки не нужны для работы движка как такового. По материалам habr.com, FaceFusion поддерживает вывод в форматах видео, изображения, GIF и WebP, то есть один и тот же запуск закрывает и короткий ролик, и статичный мем, и анимированную аватарку.

Локальный запуск выигрывает в трёх вещах. Конфиденциальность: исходное фото лица человека не уходит на чужой сервер. Отсутствие лимитов: нет ограничений по длине видео и количеству генераций, кроме возможностей вашего железа. Контроль качества: доступны все процессоры (face_swapper, face_enhancer, frame_enhancer) и тонкая настройка Face Selector Mode.

Снимок экрана веб-интерфейса FaceFusion в браузере на тёмной теме, фронтально по центру кадра, с тремя выделенными жёлтыми рамками блоками: загрузка Source с превью фото лица, загрузка Target с миниатюрой видеокадра, выпадающий список Face Selector Mode со значениями reference, one, many. Поверх рамок стоят короткие подписи кириллицей: Source, Target, Режим выбора лица. Освещение мягкое равномерное от монитора, холодный синий оттенок свечения по краям, без бликов, атмосфера сосредоточенной технической работы.

Системные требования: что нужно для запуска

Перед скачиванием стоит честно сравнить свою конфигурацию с минималкой и рекомендуемыми. По данным aiprovideos.com, минимум для запуска FaceFusion: видеокарта с 8 ГБ VRAM, 16 ГБ оперативной памяти, Windows 10 или новее. Рекомендуемая планка: GPU с 12 ГБ VRAM и более (например RTX 3070 или RTX 4060), 32 ГБ RAM.

От ускорителя зависит, какой маршрут вам подходит. Видеокарта NVIDIA с актуальными драйверами раскрывает CUDA – самый быстрый и стабильный путь. AMD и Intel работают через DirectML: запускается, но скорость падает заметно, и секунды на NVIDIA превращаются в минуты на встроенной графике.

  • Маршрут Portable: достаточно 7-Zip или WinRAR и Windows. Python ставить не нужно.
  • Полная установка: понадобятся Python, conda или pip и базовые навыки командной строки.
  • Исходное фото лица-донора – анфас, хорошее освещение, без очков и без перекрытий.
  • Целевое видео – умеренная мимика, без резких поворотов головы, лицо не закрыто волосами или руками.

Маршрут 1: FaceFusion Portable, запуск без установки

Этот путь рассчитан на тех, кто впервые открывает что-то сложнее видеоредактора. Никакого Python, никакой консоли. Важная оговорка по версии: по данным cpa.rip, бесплатно доступна именно FaceFusion Portable v2.2.1, а актуальные сборки автор распространяет по платной подписке на Boosty. Для первого знакомства v2.2.1 хватает с запасом.

  1. Скачайте архив FaceFusion Portable v2.2.1 и распакуйте его в папку с латинским путём, например C:\FaceFusion\. Кириллица в пути ломает запуск bat-файлов и автозагрузку моделей.
  2. Запустите start_portable_nvidia.bat, если у вас NVIDIA, или start_portable_amd_intel.bat для AMD и Intel. Окно консоли откроется первым – это нормально.
  3. Дождитесь, пока в браузере появится веб-интерфейс на адресе вида http://127.0.0.1:7860. Если вкладка не открылась автоматически, скопируйте адрес из консоли руками.
  4. В блоке Source загрузите фото лица-донора. Анфас, ровный свет, без очков, без волос, закрывающих лоб и брови.
  5. В блок Target положите целевое видео. Лучше короткий клип на 10–20 секунд для первого прогона.
  6. Выберите Face Selector Mode: reference, если в кадре несколько людей и нужно заменить только одного; one – автоматически возьмёт первое найденное лицо; many – заменит все лица сразу.
  7. В процессорах включите face_swapper и в его настройках поставьте модель inswapper_128_fp16.
  8. Нажмите кнопку генерации и заберите готовый файл из папки Output, которая лежит рядом с bat-файлом.

Совет по Face Selector Mode из практики комментариев: пользователи регулярно спрашивают, как заменить только одного человека из двух в кадре. Ответ – режим reference. Загружаете отдельное референсное фото нужного героя, программа сравнивает эмбеддинги и трогает только совпадающее лицо. Остальные в кадре остаются нетронутыми.

Маршрут 2: полная установка через GitHub для пользователей с NVIDIA

Если у вас свежая видеокарта NVIDIA и не пугает командная строка, имеет смысл сразу ставить актуальную версию. Так вы получаете последние модели, исправления багов и полноценное CUDA-ускорение без оглядки на устаревшую сборку.

  1. Откройте терминал в нужной папке и выполните: git clone https://github.com/facefusion/facefusion.git && cd facefusion. Источник команды – материал habr.com.
  2. Дальше шаги зависят от ОС и GPU, поэтому идите по официальной документации docs.facefusion.io/installation: там разнесены ветки под Windows, Linux и macOS, под NVIDIA и под CPU.
  3. В блоке Execution providers выберите cuda для NVIDIA, directml – запасной вариант для AMD на Windows, cpu – аварийный режим для тестов.
  4. Запустите интерфейс командой из документации, загрузите Source (фото) и Target (видео).
  5. Настройте Face Selector Mode и процессоры кадров: face_swapper с моделью inswapper_128_fp16, по необходимости face_enhancer.
  6. Если в логе появилось сообщение, что модель не найдена, спуститесь вниз страницы интерфейса и снимите галочку skip_download.
  7. Запустите генерацию. Результат окажется в папке Output внутри клонированного репозитория.

Документация на docs.facefusion.io – единственный источник, который не отстаёт от свежих коммитов. Все сторонние гайды на момент чтения уже частично устарели: имена флагов и моделей в FaceFusion периодически переименовывают.

Какую модель face_swapper выбрать и зачем

Самый частый вопрос после первого запуска: что лучше – inswapper_128 или inswapper_128_fp16. Разница не в архитектуре, а в точности весов. Полноточная версия хранит параметры в float32, fp16-вариант – в float16, ровно вдвое компактнее по памяти.

Модель VRAM Скорость Когда брать
inswapper_128_fp16 ниже быстрее по умолчанию для большинства задач
inswapper_128 выше медленнее мощное железо, погоня за максимальной детализацией

По материалу cpa.rip, рекомендуемая модель – именно inswapper_128_fp16: она быстрее, занимает меньше VRAM, а качество на глаз сопоставимо с полноточной версией. Полная inswapper_128 иногда вытягивает чуть больше микродеталей кожи на мощном GPU, но разница заметна редко и не оправдывает удвоенный расход памяти.

Поверх face_swapper можно подключить face_enhancer – это GFPGAN или CodeFormer. Включайте его только если базовый результат выглядит размыто: оба усилителя дорисовывают черты лица и убирают мыло, но удлиняют обработку. frame_enhancer улучшает уже весь кадр целиком (фон, одежду, общую резкость) и стоит ещё дороже по времени.

Горизонтальный диптих из двух кадров одного видео с заменённым лицом, разделённый тонкой белой вертикальной линией по центру. Слева кадр без обработки face_enhancer: лицо чуть размытое, мягкие черты, видно лёгкое мыло на коже. Справа тот же кадр после прогона через GFPGAN: резкие ресницы, чёткие контуры губ, проработанная текстура кожи. В верхней части каждой половины крупная подпись белым цветом без засечек заглавными буквами: BEFORE и AFTER. Освещение в кадрах студийное фронтальное, мягкие тени на скулах, нейтральная тёплая температура, атмосфера спокойной демонстрации.

Типичные ошибки и как их исправить

Большинство сбоев у новичков – не баги движка, а четыре повторяющиеся причины: неснятая галочка, кириллица в пути, отсутствие прав администратора и плохой исходник.

Модель не скачивается, ничего не происходит при запуске

В терминале висит сообщение об отсутствии файла модели, генерация не стартует. По данным habr.com, причина – активная галочка skip_download в нижней части страницы интерфейса: она прямо запрещает движку тянуть веса с сервера. Снимите её и перезапустите генерацию: модель подтянется автоматически.

WinError 1314 при первом запуске

Эта ошибка означает, что Windows не разрешает создавать символические ссылки. FaceFusion использует их для подкладывания моделей в нужные пути. Лечится двумя способами: запустите bat-файл правой кнопкой и через Запуск от имени администратора, либо распакуйте архив в папку без ограничений прав, например в корень диска C:\FaceFusion\, а не в Program Files.

no face detected, хотя лицо в кадре очевидно есть

Распространённая жалоба из комментариев на YouTube. Механика проста: детектор работает по ключевым точкам (глаза, нос, контур губ), и если фото-донор сильно повёрнут, в очках, с густой чёлкой или смазан, набор точек собрать не удаётся, и движок честно отвечает, что лица нет. Замените Source на анфас в хорошем качестве, без очков и аксессуаров.

Артефакты при перекрытиях, мимике и разнице пропорций

Когда в кадре рука у подбородка или волосы лежат на лбу, по данным cpa.rip, перекрытия мешают корректному анализу геометрии лица: алгоритм считает закрытую часть лицом и пытается туда что-то нарисовать. Сильная мимика и резкие повороты головы дают похожий эффект – трекинг между кадрами теряет ключевые точки, появляется дрожание и швы. Лечится подбором: видео с умеренной мимикой и Source, близкий к Target по форме головы, ширине скул и пропорциям лица.

Error на первом кадре при включённом face_enhancer

Часто всплывает после обновления интерфейса. Сначала отключите face_enhancer и прогоните видео только через face_swapper – если получилось, проблема именно в усилителе. Дальше обновите драйверы видеокарты до свежих: GFPGAN и CodeFormer чувствительны к версии CUDA и DirectML.

Полезный отладочный приём перед финальной обработкой: подключите процессор face_debugger. Он рисует поверх кадра распознанные точки и маску. Если маска уползает за край щеки или цепляет волосы, проблема не в моделях, а в исходных данных, и стоит остановиться раньше, чем потратить полчаса на бесполезный рендер.

Скорость обработки: чего ожидать на разном железе

Реалистичные цифры важнее любых маркетинговых обещаний. По данным cpa.rip, на ПК с NVIDIA GeForce RTX 4070 12 ГБ небольшие ролики обрабатываются за несколько секунд. На офисном ноутбуке с AMD Radeon Vega 2 те же секунды превращаются в минуты – движок работает через DirectML и упирается в слабую графику.

  • RTX 4070 12 ГБ: короткое видео – единицы секунд, длинное – соразмерно длине ролика.
  • Средний игровой GPU 8 ГБ VRAM: десятки секунд на короткий клип, разумные минуты на видео.
  • AMD или Intel без выделенного ускорителя: минуты на короткий ролик, заметные паузы на каждом кадре.
  • CPU-режим: сильно медленнее GPU, оправдан только для фото или клипов длиной несколько секунд.

Длинные видео отдельно: при ролике больше минуты в FaceFusion вырастает риск нехватки VRAM, особенно с включённым face_enhancer. Практичный обход: нарежьте исходник на куски по 30–60 секунд, прогоните каждый отдельно и склейте уже готовые фрагменты в любом видеоредакторе. Для AMD и Intel также помогает уменьшить разрешение целевого видео перед загрузкой – обработка ускоряется кратно при минимальной потере качества лица.

Этика и правовые ограничения

Технология даёт серьёзный рычаг, и сами авторы FaceFusion в материале habr.com формулируют ограничения прямо. Не используйте лица людей без их явного согласия. Не применяйте инструмент для мошенничества, дезинформации и политической манипуляции. Не создавайте контент, порочащий репутацию или нарушающий авторские права. И не пытайтесь обходить системы аутентификации (FaceID, верификации в банках, KYC) – это уже территория уголовного законодательства, а не этической рекомендации.

Montpantoja

без 12гб vram facefusion это лотерея, всё остальное в статье вторично. на 8гб упрётесь в oom как только включите face_enhancer.

Cesaro

не совсем, на 8гб гоняю inswapper_128_fp16 без энхансера спокойно, разрешение target держу 720.

Davai Lama

плюсую цесаро, у меня 1660 super 6гб и тоже едет, просто медленнее.

Montpantoja

ну на 6гб уже без батч сайза и без энхансера, это не про комфорт а про выживание.

KEEMOKAZI

ребят а directml на rx 6600 это вообще реально? или сразу на cuda копить?

Cesaro

@KEEMOKAZI запустится, но 23 секунды клипа на 6600 у меня шли минут 7, прикинь сам стоит ли.

Hao

вопрос про vpn в шапке не раскрыт. на скачке моделей через hf у меня без впн вис на 137 мб и дальше тишина.

Chisbug

у меня то же самое, поднимаю wireguard и тогда модели тянутся за минуту.

QueenArrow

то есть статья про локальный запуск, но без впн локально модели не скачать. отличная автономность.

Fujiiian

@QueenArrow ну справедливости ради это не вина facefusion, это hf зеркалят.

Armada

а есть зеркало моделей где без впн? хз как сейчас с этим.

taylorswift13

я скачивала через прокси в браузере и потом руками в папку моделей клала, работает.

Astral

а в какую папку класть? у меня portable v2.2.1, не пойму куда inswapper кидать.

taylorswift13

@Astral у меня в .assets/models внутри папки facefusion, проверь.

Dunha1

по поводу аккаунтов: для самой проги не нужны, но boosty подписка для свежих сборок это уже другая история.

Montpantoja

вот это вообще главное, на v2.2.1 половина новых моделей просто не подгружается.

Cesaro

v2.2.1 нормально живёт если не лезть за свежими face_enhancer моделями. инсваппер старый и так доедет.

sOAZ

за бусти платить ради нейросетки которая на гитхабе лежит бесплатно, это сильно.

Dunha1

@sOAZ так в этом и фишка: на гитхабе только исходники, собирай сам. portable это удобство, за него и просят.

sOAZ

ну собрать через conda это полчаса один раз, не вижу проблемы.

KEEMOKAZI

полчаса это для тех кто видел conda раньше))

Abeng

winerror 1314 у меня лечился только распаковкой в корень диска, права админа не помогли.

Chisbug

+1, ещё антивирус иногда блочит symlink, eset точно ругается.

QueenArrow

автор пишет что лечится двумя способами, на деле третий: отключить контролируемый доступ к папкам в defender.

Davai Lama

хм, не знал про это, попробую.

Hao

по скорости цифры в целом адекватные, но 4070 на коротком ролике у меня скорее 30-40 секунд чем единицы, видимо зависит от длины.

Cesaro

@Hao единицы это про 5 сек клип без энхансера. с энхансером даже на 4090 уже не единицы.

Montpantoja

вот тут согласен, маркетинговые цифры всегда без энхансера, а без него лицо мыльное.

Armada

мне на 3060 12гб ролик в 1080 секунд на 14 шёл около 4 минут с энхансером, нормально вообще?

Cesaro

@Armada нормально, у меня на 3070 примерно так же.

taylorswift13

а кто нибудь пробовал на маке м1? в доке вроде есть но молчат все.

Dunha1

пробовал на м2, mps работает но медленнее чем cuda на 3060, плюс часть моделей не грузится.

Fujiiian

вопрос: для портабла обязательно дискретку в панели прописывать или сам подхватит nvidia?

Chisbug

@Fujiiian в панели nvidia добавь bat в список приложений с дискретной графикой, иначе на встройке запустится.

KuroKy

у меня портабл вообще не видел gpu пока я не обновил драйвер студии до 555.

Astral

слушайте, а если в source несколько лиц, фото групповое, оно как выбирает?

Cesaro

никак, бери крупное фото одного лица. groupshot в source это путь к артефактам.

QueenArrow

странно что про reference mode подробно а про то что source должен быть single face ни слова.

Davai Lama

имхо это очевидно, но да, новичкам не очевидно.

KEEMOKAZI

а лицо в маске или с бородой как заходит?

Cesaro

борода ок если в target тоже борода. маска медицинская например убивает детектор.

Hao

пользуюсь полгода, лучший results когда source и target близки по углу и освещению, остальное вторично.