← Блог

Як налаштувати словник диктування для імен і термінів

З загальновживаними словами системи розпізнавання мовлення справляються добре. Але щойно справа доходить до власних назв, брендів або технічного жаргону, — починаються помилки. Словник Hovor вирішує це: ви задаєте правила зіставлення, модель виправляє транскрипцію, а AI-очистка засвоює ваш словник прямо під час сесії.

Оновлено: червень 2026

Чому диктування плутає імена

Моделі розпізнавання мовлення навчались на величезних масивах тексту — новинних статтях, книгах, субтитрах, вебсторінках. Цей корпус перевантажений частотними словами в стандартних контекстах. Рідкісні власні назви — особисті імена, брендові назви, технічний жаргон, топоніми з нестандартним написанням — трапляються у навчальних даних значно рідше. Тому модель надає їм меншу ймовірність і підставляє більш знайому альтернативу.

Типові ситуації:

Причина не в тому, що модель погана, — вона робить рівно те, на що навчена: видає найімовірніший результат для даного аудіосигналу. Ваше завдання — зрушити ці ймовірності для вашого конкретного словника.

Як працює власний словник

Словник Hovor — це набір правил зіставлення. Кожне правило каже: «якщо транскрипція містить будь-який з цих варіантів — замінити на цю канонічну форму». Синтаксис простий: усі некоректні варіанти, які може видати модель, перелічуються через символ |, після чого йде стрілка і правильна форма.

Приклади:

Заміна відбувається після транскрипції і до кроку AI-очистки. Ця двоступенева схема важлива: спершу сирий текст від моделі виправляється за вашими правилами, і вже потім LLM-очистка отримує виправлений варіант. Тому AI-модель бачить коректні терміни і підсилює їх у процесі форматування, а не змагається з ними.

Крім заміни, записи словника слугують підказками для LLM. Коли Hovor формує системний промпт для моделі очистки, він включає ваш словник як контекст словника. Це означає, що модель знає про ваші переваги з самого початку сесії і застосовує їх послідовно по всьому тексту — не просто як механічну заміну рядків, а як частину розуміння вашого домену.

Покроково: додайте перші записи

  1. Відкрийте налаштування Hovor. На iOS — натисніть іконку профілю і перейдіть у «Словник». На macOS — відкрийте меню Hovor у рядку меню і виберіть «Налаштування» → «Словник». На Android — відкрийте додаток, натисніть меню і виберіть «Словник».
  2. Натисніть «Додати запис» (або кнопку +). З'являться два поля: варіанти (те, що може видати модель) і канонічна форма (те, що ви хочете бачити в тексті).
  3. Введіть варіанти. Наберіть або вставте всі некоректні форми, які модель зазвичай генерує, розділивши їх символом |. Можна додавати скільки завгодно варіантів — трьох-чотирьох зазвичай достатньо. Якщо не впевнені, які варіанти видає модель, — продиктуйте слово кілька разів без словника і перевірте сирий текст транскрипції.
  4. Введіть канонічну форму. Це точне написання, регістр і пунктуація, яку ви хочете бачити в підсумковому тексті. Для брендових назв — дотримуйтесь офіційного написання. Для власних імен — використовуйте ту форму, яку ви обираєте для себе.
  5. Збережіть. Запис набирає чинності одразу для всіх наступних сесій диктування на цьому пристрої. Синхронізація розповсюджує його на ваші інші пристрої за лічені секунди.

Записи можна редагувати або видаляти в будь-який момент на тому самому екрані «Словник». Зміни синхронізуються між пристроями автоматично.

Варіанти за замовчуванням не чутливі до регістру. Якщо ваш термін має різнорегістрові варіанти з різним змістом (рідкісний випадок), створіть окремі записи.

Синхронізація і навчання AI

Записи словника зберігаються на сервері Hovor і синхронізуються між усіма вашими пристроями. Додали запис на iPhone під час поїздки — він чекає на вас на Mac, коли ви сідаєте за стіл. Синхронізація відбувається у фоновому режимі і не перериває активну сесію диктування.

Аспект навчання AI заслуговує окремої уваги. Крок очистки в Hovor використовує LLM (gpt-4o-mini на сервері, або EuroLLM / Apple Foundation Models для обробки на пристрої), щоб виправити пунктуацію, регістр і формулювання після сирої транскрипції. Системний промпт для цієї моделі будується заново для кожної сесії і включає ваш словник як контекст. Це означає:

Ефект накопичується: добре заповнений словник означає менше правок після диктування, а менше правок — швидше письмо, а швидше письмо — більше диктування, під час якого виявляються нові записи для додавання.

Поради: жаргон, бренди та багатомовні сценарії

Технічний жаргон і терміни розробників

Якщо ви диктуєте контент, дотичний до коду — документацію, технічні публікації, дизайн-документи, повідомлення в Slack про ваш стек — невелика кількість записів покриває більшість помилок. Почніть з назв технологій, фреймворків і інструментів, якими користуєтеся щодня. Також варто додати назви внутрішніх проєктів або мікросервісів з нестандартним написанням.

Приклади, які заощаджують багато часу на виправлення: docker|doc ker → Docker, github|git hub → GitHub, typescript|type script → TypeScript, graphql|graph ql|graph queue el → GraphQL.

Назви брендів і продуктів

Багато брендових назв — це просто звичайні слова з нестандартним регістром, який голосова модель не може вивести з аудіо. iphone|I phone|I-phone → iPhone — одразу корисний запис. Принцип той самий: перелічуєте фонетично правдоподібні спотворення і малий регістр, а канонічна форма — офіційне написання.

Багатомовні сценарії

Якщо ви диктуєте кількома мовами, той самий словник діє для всіх. Це перевага: якщо у вашому словнику є і англійські, і українські власні назви — а в більшості технічних фахівців саме так — ви додаєте їх один раз і вони працюють незалежно від мови поточної сесії.

Для україномовних користувачів найціннішими записами зазвичай є власні назви, що мають усталені радянські транслітерації: назви міст, особисті імена з українським написанням, термінологія, яка розійшлась між українською і «радянською» нормою після незалежності. Запис Харків|Харьков → Харків або Львів|Львов → Львів гарантує, що в тексті завжди буде українська форма.

Медичні, юридичні та вузькоспеціалізовані терміни

Фахівці, які диктують у вузькій предметній галузі, отримують від словника найбільше користі. Лікарі можуть внести фонетичні спотворення назв препаратів, анатомічних термінів і назв процедур. Юристи — забезпечити однакове написання специфічної правової термінології. Дослідники — зафіксувати точну форму технічних термінів, назв генів або скорочень, які повторюються в їхніх текстах.

У словника немає семантичних обмежень — якщо голосова модель може щось переплутати, ви можете це виправити.

Про ліміти записів

Безкоштовний тариф Hovor включає власний словник. Local Unlock (1999 ₴ / $49.99, одноразово, спільний доступ для родини) знімає обмеження на кількість записів у словнику, а також на кількість сніпетів і воркфлоу. Для більшості користувачів словникового ліміту безкоштовного тарифу цілком вистачає для особистого і робочого словника. Розробникам із великими списками термінів, фахівцям із широкою предметною термінологією — Local Unlock окупається вже з необмеженого словника.

Припиніть виправляти одні й ті самі імена вручну

Налаштуйте власний словник у Hovor і дозвольте AI засвоїти ваш словник. Доступно на iOS, macOS і Android. Безкоштовний тариф включає словник; Local Unlock знімає всі ліміти — одноразово, для всієї родини.

Отримати Hovor