feat: backend registry, S2-Pro INT4, progressive segmentation, text cleaning
...
- VRAM снижен 15.4->9.6 GB (max_seq_len 32768->4096, KV cache -4.7 GB)
- Создан реестр бэкендов tts/__init__.py с @register() декоратором
- Бэкенды саморегистрируются: dummy, s2, fish_speech, f5_tts, xtts_v2
- server.py упрощён: create_engine() из реестра, нет _BACKEND_MAP
- _sync_synthesize универсален (нет isinstance проверок)
- ref_text добавлен в TTSEngine.synthesize base class
- Удалён bnb 4-bit код из inference.py (INT4 авто-детект по пути)
- cleanup_text_for_tts(): эмодзи, HTML, URL, маркдаун, спецсимволы
- Прогрессивная сегментация (fast_start_initial=12, fast_start_count=3)
- Документация: README, .env.example, docs/05_usage.md под S2-Pro
- AGENTS.md: актуальное состояние проекта
- .gitignore: .hf_home/, outputs/, voices/*.{m4a,mp4,flac,bak}
Eugene Sukhodolskiy
committed
7 hours ago