З загальновживаними словами системи розпізнавання мовлення справляються добре. Але щойно справа доходить до власних назв, брендів або технічного жаргону, — починаються помилки. Словник Hovor вирішує це: ви задаєте правила зіставлення, модель виправляє транскрипцію, а AI-очистка засвоює ваш словник прямо під час сесії.
Моделі розпізнавання мовлення навчались на величезних масивах тексту — новинних статтях, книгах, субтитрах, вебсторінках. Цей корпус перевантажений частотними словами в стандартних контекстах. Рідкісні власні назви — особисті імена, брендові назви, технічний жаргон, топоніми з нестандартним написанням — трапляються у навчальних даних значно рідше. Тому модель надає їм меншу ймовірність і підставляє більш знайому альтернативу.
Типові ситуації:
Причина не в тому, що модель погана, — вона робить рівно те, на що навчена: видає найімовірніший результат для даного аудіосигналу. Ваше завдання — зрушити ці ймовірності для вашого конкретного словника.
Словник Hovor — це набір правил зіставлення. Кожне правило каже: «якщо транскрипція містить будь-який з цих варіантів — замінити на цю канонічну форму». Синтаксис простий: усі некоректні варіанти, які може видати модель, перелічуються через символ |, після чого йде стрілка і правильна форма.
Приклади:
Кирило|Кирилл|Cyril → Кирило — яким би способом модель не написала ваше ім'я, в тексті завжди буде українське написання.Київ|Киев → Київ — столиця завжди пишеться правильно, навіть коли модель підставляє застарілу форму.Харків|Харьков → Харків — аналогічно для другого міста України.kubernetes|cube ornetes → Kubernetes — і фонетичне спотворення, і регістр виправляються одним правилом.postgresql|post gres|post gres sequel → PostgreSQL — поширені спотворення назви бази даних перехоплюються відразу.oauth|oh auth|o-auth → OAuth — стандарт автентифікації завжди пишеться однаково.Заміна відбувається після транскрипції і до кроку AI-очистки. Ця двоступенева схема важлива: спершу сирий текст від моделі виправляється за вашими правилами, і вже потім LLM-очистка отримує виправлений варіант. Тому AI-модель бачить коректні терміни і підсилює їх у процесі форматування, а не змагається з ними.
Крім заміни, записи словника слугують підказками для LLM. Коли Hovor формує системний промпт для моделі очистки, він включає ваш словник як контекст словника. Це означає, що модель знає про ваші переваги з самого початку сесії і застосовує їх послідовно по всьому тексту — не просто як механічну заміну рядків, а як частину розуміння вашого домену.
|. Можна додавати скільки завгодно варіантів — трьох-чотирьох зазвичай достатньо. Якщо не впевнені, які варіанти видає модель, — продиктуйте слово кілька разів без словника і перевірте сирий текст транскрипції.Записи можна редагувати або видаляти в будь-який момент на тому самому екрані «Словник». Зміни синхронізуються між пристроями автоматично.
Варіанти за замовчуванням не чутливі до регістру. Якщо ваш термін має різнорегістрові варіанти з різним змістом (рідкісний випадок), створіть окремі записи.
Записи словника зберігаються на сервері Hovor і синхронізуються між усіма вашими пристроями. Додали запис на iPhone під час поїздки — він чекає на вас на Mac, коли ви сідаєте за стіл. Синхронізація відбувається у фоновому режимі і не перериває активну сесію диктування.
Аспект навчання AI заслуговує окремої уваги. Крок очистки в Hovor використовує LLM (gpt-4o-mini на сервері, або EuroLLM / Apple Foundation Models для обробки на пристрої), щоб виправити пунктуацію, регістр і формулювання після сирої транскрипції. Системний промпт для цієї моделі будується заново для кожної сесії і включає ваш словник як контекст. Це означає:
Ефект накопичується: добре заповнений словник означає менше правок після диктування, а менше правок — швидше письмо, а швидше письмо — більше диктування, під час якого виявляються нові записи для додавання.
Якщо ви диктуєте контент, дотичний до коду — документацію, технічні публікації, дизайн-документи, повідомлення в Slack про ваш стек — невелика кількість записів покриває більшість помилок. Почніть з назв технологій, фреймворків і інструментів, якими користуєтеся щодня. Також варто додати назви внутрішніх проєктів або мікросервісів з нестандартним написанням.
Приклади, які заощаджують багато часу на виправлення: docker|doc ker → Docker, github|git hub → GitHub, typescript|type script → TypeScript, graphql|graph ql|graph queue el → GraphQL.
Багато брендових назв — це просто звичайні слова з нестандартним регістром, який голосова модель не може вивести з аудіо. iphone|I phone|I-phone → iPhone — одразу корисний запис. Принцип той самий: перелічуєте фонетично правдоподібні спотворення і малий регістр, а канонічна форма — офіційне написання.
Якщо ви диктуєте кількома мовами, той самий словник діє для всіх. Це перевага: якщо у вашому словнику є і англійські, і українські власні назви — а в більшості технічних фахівців саме так — ви додаєте їх один раз і вони працюють незалежно від мови поточної сесії.
Для україномовних користувачів найціннішими записами зазвичай є власні назви, що мають усталені радянські транслітерації: назви міст, особисті імена з українським написанням, термінологія, яка розійшлась між українською і «радянською» нормою після незалежності. Запис Харків|Харьков → Харків або Львів|Львов → Львів гарантує, що в тексті завжди буде українська форма.
Фахівці, які диктують у вузькій предметній галузі, отримують від словника найбільше користі. Лікарі можуть внести фонетичні спотворення назв препаратів, анатомічних термінів і назв процедур. Юристи — забезпечити однакове написання специфічної правової термінології. Дослідники — зафіксувати точну форму технічних термінів, назв генів або скорочень, які повторюються в їхніх текстах.
У словника немає семантичних обмежень — якщо голосова модель може щось переплутати, ви можете це виправити.
Безкоштовний тариф Hovor включає власний словник. Local Unlock (1999 ₴ / $49.99, одноразово, спільний доступ для родини) знімає обмеження на кількість записів у словнику, а також на кількість сніпетів і воркфлоу. Для більшості користувачів словникового ліміту безкоштовного тарифу цілком вистачає для особистого і робочого словника. Розробникам із великими списками термінів, фахівцям із широкою предметною термінологією — Local Unlock окупається вже з необмеженого словника.
Налаштуйте власний словник у Hovor і дозвольте AI засвоїти ваш словник. Доступно на iOS, macOS і Android. Безкоштовний тариф включає словник; Local Unlock знімає всі ліміти — одноразово, для всієї родини.
Отримати Hovor