ebook2audiobook — self-hosted конвертер, который берёт epub/pdf/mobi и генерирует полноценную аудиокнигу с главами, метаданными и обложкой. Под капотом несколько TTS-движков на выбор: XTTSv2, Bark, VITS, Fairseq, YourTTS, Tacotron2 .
Главные фишки:
🔘 Voice cloning — можно скормить аудиофайл с голосом (свой или чей-то) и модель будет читать этим голосом
🔘 1110+ языков — включая русский, поддержка через Fairseq
🔘 Автоматическое разбиение на главы — лучше всего работает с epub/mobi
🔘 Веб-интерфейс на Gradio — не нужно возиться с CLI
🔘 Минимальные требования — 4GB RAM, работает на CPU (медленно) или GPU (почти realtime на NVIDIA)
Как запустить:
Откроется веб-интерфейс на localhost:7860. Есть готовый Docker-образ с поддержкой GPU.
Выходные форматы: m4b (с главами), mp3, flac, wav, ogg. Проект активно развивается — 13.9k звёзд, 22 контрибьютора.
Репо на гитхабе, на видео демо.
@prog_tools
Главные фишки:
Как запустить:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
cd ebook2audiobook
./ebook2audiobook.sh # Linux/Mac
# или ebook2audiobook.cmd на Windows
Откроется веб-интерфейс на localhost:7860. Есть готовый Docker-образ с поддержкой GPU.
Выходные форматы: m4b (с главами), mp3, flac, wav, ogg. Проект активно развивается — 13.9k звёзд, 22 контрибьютора.
Репо на гитхабе, на видео демо.
@prog_tools
This media is not supported in your browser
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒7👍3🔥2
EyesOff — приложение для macOS, которое следит через веб-камеру и предупреждает, когда кто-то подглядывает в ваш экран.
Написано на Python + PyQt, модель распознавания лиц крутится локально — ничего не уходит в облако. Есть три режима оповещения: попап на экране, системная нотификация или автозапуск любого приложения (можно настроить блокировку экрана).
Автор написал подробный разбор как тренировал модель детекции. Интересный момент: он оптимизировал accuracy не в среднем, а конкретно для mid-range дистанции (~1-2 метра) — именно там обычно стоят любопытные коллеги.
Из ограничений: пока детектит просто лица в кадре, а не направление взгляда. То есть если человек в кадре, но смотрит в сторону — всё равно сработает. Автор обещает доработать в следующих версиях.
Для параноиков в опенспейсах и коворкингах — самое то.
@prog_tools
Написано на Python + PyQt, модель распознавания лиц крутится локально — ничего не уходит в облако. Есть три режима оповещения: попап на экране, системная нотификация или автозапуск любого приложения (можно настроить блокировку экрана).
Автор написал подробный разбор как тренировал модель детекции. Интересный момент: он оптимизировал accuracy не в среднем, а конкретно для mid-range дистанции (~1-2 метра) — именно там обычно стоят любопытные коллеги.
Из ограничений: пока детектит просто лица в кадре, а не направление взгляда. То есть если человек в кадре, но смотрит в сторону — всё равно сработает. Автор обещает доработать в следующих версиях.
Для параноиков в опенспейсах и коворкингах — самое то.
@prog_tools
This media is not supported in your browser
VIEW IN TELEGRAM
🔥3🤷♀1🤔1