Більшість додатків для голосового вводу трактують українську як одну зі "100+ підтримуваних мов" — і зазвичай це означає, що вона якось працює, але з постійними дрібницями: загублені апострофи, англійські слова посеред речення, LLM cleanup, який "виправляє" українську на російську. Hovor не тренує власних мовних моделей — але ми вибираємо найсильніші відкриті моделі для європейських мов і вибудовуємо пайплайн (промпт, словник, UI) так, щоб українська якість перестала бути другорядною.
Голосові й мовні моделі, які використовує Hovor, створили інші команди:
Наша робота — обрати з відкритих моделей ті, що дають найкращу якість для українських користувачів, плюс інженерія навколо: промпт із захистом від непрошеного перекладу, словник, синхронізація між пристроями, UI українською, і живий розробник у Києві, до якого можна написати.
Speech-to-text моделі тренуються на тому аудіо, яке зібрали їхні творці. Для англійської це сотні тисяч годин з подкастів, YouTube, книжок, розмов. Для української пул даних драматично менший — і історично українське аудіо часто помилково класифікувалося як російське у старіших датасетах, що псувало training corpus.
Результат: більшість хмарних STT-сервісів формально підтримують українську, але якість відстає на 1–2 покоління від англійської. Поширені failure modes:
Parakeet v3 (NVIDIA, 0.6B параметрів) тренувалася на 24 європейських мовах із явним балансом між ними. Українське аудіо отримує ту саму увагу під час тренування, що й німецька чи французька — це інженерне рішення NVIDIA, не наше, але саме тому ми обрали цю модель як дефолт у Hovor. На бенчмарку FLEURS Parakeet v3 показує 12.0% WER для української (проти 12.6% у Whisper Large V3, у 4 рази менший і 4–10 разів швидший).
Важливіше за бенчмарки: у реальній українській диктовці Parakeet зберігає апострофи (м'ясо, об'єкт), не втрачає м'які знаки (день, тінь), і слідує українським правилам капіталізації, а не англійським. Це не наша інженерія — це NVIDIA натренували модель на правильно розмічених українських даних. Наш внесок — зробити роботу з оцінки і вибору саме цієї моделі.
Коли Hovor використовує LLM для cleanup-проходу (gpt-4o-mini на сервері, EuroLLM на Mac, Apple Foundation Models на iOS 26+, або ваш BYOK провайдер), системний промпт явно інструктує модель зберігати мову оригіналу і ніколи не перекладати, якщо переклад — не явний запит користувача. Цей один guard прибирає найпоширенішу помилку для українського тексту: gpt-4o-mini, що вирішує "перекласти" українську фразу російською або англійською посеред cleanup.
Промпт також містить специфічні для української правила: зберігати апострофи, слідувати українській капіталізації, зберігати регіональні варіанти, не підставляти російські аналоги. Це інженерна робота, яку ми робили самі (у файлі hovor-server/prompt.go), і ми постійно її вдосконалюємо в міру того, як приходять випадки помилок.
Голосові моделі регулярно неправильно чують особисті імена, географічні назви, технічні терміни. Словник Hovor дозволяє мапити варіанти транскрипції на канонічну форму: Кирило|Кирилл|Cyril → Кирило, Київ|Киев → Київ, Львів|Львов → Львів. Словник передається LLM cleanup стадії як підказка, тож модель навчається ваших уподобань усередині сесії.
Інтерфейс додатка Hovor професійно перекладено українською. Onboarding, налаштування, повідомлення про помилки, сторінки підтримки — все нативна UA-копія, не машинний переклад. Те саме для кабінету на hovor.app і system templates.
Розробник (Кирило, з Києва) обробляє підтримку напряму. Українські юзери отримують відповіді українською зазвичай протягом 24 годин. Без аутсорсової підтримки за межами країни, яка не розуміє лінгвістичного контексту.
Оскільки Hovor використовує Parakeet v3 (24 мови) плюс Whisper Large V3 Turbo (розширена підтримка) як fallback, плюс EuroLLM/Apple Foundation Models для cleanup, реальна матриця мов виглядає так:
Виключення російської й білоруської — навмисне рішення в тренуванні Parakeet v3 від NVIDIA, і воно випадково збігається з геополітичною позицією Hovor.
Чесне попередження: точність розпізнавання мови залежить від вашого голосу, акценту, оточення, контенту. Жоден універсальний "він працює X% часу" не виживе зустрічі з реальністю.
Що ви можете зробити: встановити безкоштовний тариф (без банківської картки, зі щедрою on-device квотою) і продиктувати три реальних абзаци свого типового контенту. Якщо точність недостатня — видаліть, без зобов'язань.
Внутрішнє тестування на українських новинних статтях, художній літературі, технічній документації і повсякденній розмові показує ~95–97% точність на стандартній українській, з нижчими цифрами на сильному діалекті чи extreme code-switching. Cleanup-прохід (LLM) додатково підвищує сприйняту якість, виправляючи пунктуацію й капіталізацію.
| Платформа | Якість UA | Приватність | iPhone клавіатура |
|---|---|---|---|
| Apple system Dictation | Прийнятна | На Apple Silicon — на пристрої | Так (вбудована) |
| Google Voice Typing | Гарна | Хмара | Через Gboard |
| Wispr Flow | У списку, не "pro-tuned" | Хмара (OpenAI/Meta) | Так |
| Superwhisper | Базова Whisper | Локально + хмарні опції | Обмежена |
| Hovor | Сильна (Parakeet v3) | На пристрої за замовчуванням | Системна |
| Notta / Voice In | Хмарно, English-biased | Хмара | Тільки браузер |
Якщо ви чернеткуєте статті, пости в блог, есеї українською, диктовка у 3–5 разів швидша за друк. Довгі записи Hovor (без 6-хв обмеження), AI cleanup і приватність на пристрої працюють для цього сценарію без компромісу.
Конспекти лекцій, чернетки есеїв, резюме досліджень — українська академічна проза багатослівна, і диктовка зберігає години. Безкоштовного тарифу вистачає більшості студентів.
50–70% програмістів стикаються з RSI у певний момент. Для україномовних розробників Hovor + кастомний словник (назви функцій, бібліотек, проєктних термінів) дає робочу hands-free диктовку рідною мовою.
Юристи, лікарі, консультанти, менеджери, які перемикаються між українською й англійською протягом дня. Авто-визначення мови у Hovor (з per-app workflow-правилами) обробляє перемикання автоматично.
Складати довгі повідомлення в Telegram чи Signal, відповідати на email, писати Notes — голос швидший за пальці, особливо українською, де речення зазвичай довші.
У української голосової даної є непроста історія: тренувальні датасети, що неправильно класифікували UA як RU, записи, що потрапляли до постачальників, пов'язаних з Росією, voice-prints у комерційних продуктах без чіткої згоди. Модель приватності Hovor спроєктована для тих, хто переймається:
| Ціна | Що отримуєте | |
|---|---|---|
| Безкоштовно | $0 | 2000 хмарних слів/тиждень + безкоштовна тижнева on-device квота |
| Pro місячна | $11.99 | Необмежені слова, 5 пристроїв, пріоритетна підтримка |
| Pro річна | $89.99 | ~$7.50/міс при оплаті за рік |
| Local Unlock (одноразово) | $49.99 / 1999 ₴ | Необмежена офлайн-диктовка + необмежені словник/снипети/workflow |
| BYOK Unlock (одноразово) | $24.99 / 999 ₴ | Власні ключі OpenAI/Anthropic/custom назавжди |
| Бандл Local + BYOK | $69.99 / 2799 ₴ | Обидва розблокування, ~$5 дешевше ніж окремо |
Безкоштовний тариф включає 2000 хмарних слів на тиждень плюс безкоштовну тижневу квоту на транскрипцію на пристрої на iPhone (Parakeet v3) і Mac (EuroLLM cleanup). Для більшості студентів і casual-письменників безкоштовно достатньо. Pro — для power users, яким потрібен необмежений хмарний доступ, синхронізація між 5 пристроями і пріоритетна підтримка. Одноразові розблокування — family-shareable і продаються і в App Store (iOS), і через Monobank (macOS). BYOK-ключі (OpenAI, Anthropic або будь-який custom OpenAI-сумісний ендпоінт на кшталт Ollama, LM Studio, vLLM) зберігаються у вашому Keychain і ніколи не проходять через сервер Hovor.
Технічно — так, Parakeet v3 розпізнає змішане мовлення, але результат буде непередбачуваним. Краще диктувати або українською, або англійською, не змішуючи в одному реченні.
Так. На пристрої Parakeet v3 + (Mac) EuroLLM або (iOS 26+) Apple Foundation Models покривають повний пайплайн офлайн. iPhone з менш ніж 4 GB RAM використовує fallback на хмарний Whisper, який потребує інтернету.
Так. Рекомендована конфігурація для журналістів: speech model = Parakeet v3 (на пристрої), cleanup model = Apple Foundation Models (iOS 26+) або вимкнений (raw transcript). Аудіо ніколи не залишає пристрій. Зберігайте транскрипти локально, синхронізуйте лише словник.
Parakeet v3 не підтримує російську за дизайном (рішення NVIDIA при тренуванні). Хмарний шлях через Whisper підтримує російську, якщо реально треба — але наше позиціонування ставить пріоритет на українську й інші європейські мови.
Через App Store (картка, Apple Pay) — стандартні ціни Apple, можливо з конвертацією валюти. Або через сайт hovor.app — Monobank приймає українські картки в гривні. І Pro-підписка, і одноразові розблокування (Local Unlock 1999 ₴, BYOK Unlock 999 ₴, бандл 2799 ₴) доступні через Monobank.
Безкоштовний тариф, без банківської картки, щедра on-device квота. iPhone та Mac (Windows — скоро).
Завантажити HovorАльтернатива Wispr Flow · Альтернатива Superwhisper · English version