- Co to jest VideoChat LLM?
- Główne korzyści
- Przykłady użycia
- Jak zacząć?
- Podsumowanie
- Kontakt i dokumentacja
- Konfiguracja RTSP Video
VideoChat LLM to nowoczesna aplikacja desktopowa umożliwiająca naturalną rozmowę głosową z asystentem AI, wizualizowanym jako animacja ASCII. Łączy lokalny model językowy, rozpoznawanie i syntezę mowy oraz infrastrukturę mikrousługową w jednym, łatwym do wdrożenia pakiecie.
- Prywatność: Wszystkie modele (LLM, TTS, STT) działają lokalnie, bez wysyłania danych do chmury.
- Brak zależności od internetu: Rozmowy i przetwarzanie mowy działają offline.
- Uniwersalność: Obsługa Linux (AppImage, DEB, RPM), łatwa instalacja na różnych dystrybucjach.
- Automatyzacja: Instalacja i testy w pełni zautomatyzowane (
install.sh,test.sh). - Nowoczesny interfejs: Połączenie Electron + React + animacje ASCII.
- Elastyczność: Możliwość wdrożenia jako pojedyncza aplikacja lub zestaw mikrousług (K3s, Terraform, Ansible).
- Open Source: Kod dostępny do modyfikacji i rozwoju.
- Użytkownik uruchamia aplikację na swoim laptopie bez dostępu do internetu.
- Może prowadzić rozmowy głosowe z AI, dyktować notatki, zadawać pytania.
- Wszystko działa lokalnie, dane nie opuszczają komputera.
- Integracja z infrastrukturą K3s/Terraform/Ansible.
- Bot może przyjąć polecenie głosowe (np. „zrestartuj serwis X”, „pokaż status klastra”) i wykonać je przez backend.
- Animacja ASCII pokazuje status operacji na żywo.
- Uczeń ćwiczy wymowę i konwersacje z AI.
- System rozpoznaje mowę, poprawia błędy, odpowiada głosem.
- Historia rozmów pozwala śledzić postępy.
- Zainstaluj zależności systemowe (patrz README.md)
- Uruchom
./install.sh– wszystko zostanie przygotowane automatycznie - Startuj aplikację:
./bin/start-app - Testuj i rozwijaj własne funkcje!
VideoChat LLM to kompletne, prywatne i nowoczesne rozwiązanie AI na desktop. Idealne do biura, edukacji, pracy offline i jako baza do własnych projektów głosowych lub konwersacyjnych.
- Szczegóły techniczne: README.md, katalog docs/
- Skrypt instalacyjny: install.sh
- Skrypt testowy: test.sh
- Użytkownik może podać dane do streamu RTSP bezpośrednio w rozmowie z asystentem lub przez ustawienia.
- Asystent automatycznie poprosi o wymagane informacje (adres, login, hasło) i zapisze konfigurację.
- Dzięki temu możliwa jest prezentacja lub opis obrazu z dowolnego źródła RTSP.