← Блог

Як налаштувати словник диктування для імен і термінів

З загальновживаними словами системи розпізнавання мовлення справляються добре. Але щойно справа доходить до власних назв, брендів або технічного жаргону, — починаються помилки. Словник Hovor вирішує це: ви задаєте правила зіставлення, модель виправляє транскрипцію, а AI-очистка засвоює ваш словник прямо під час сесії.

Оновлено: червень 2026

Чому диктування плутає імена

Диктування плутає імена й терміни тому, що моделі розпізнавання мовлення навчались на текстах, де частотні слова кардинально переважають рідкісні власні назви. Модель, яка бачила «Cyril» тисячі разів, а «Кирило» — значно рідше, за замовчуванням підставить знайоміший варіант, навіть якщо в аудіо чітко звучить менш поширений. Виправляє це не якість запису, а пряма вказівка моделі, яке саме написання вам потрібне.

Типові ситуації:

Особисті імена. «Cyril» або «Кирилл» модель бачила тисячі разів, «Кирило» — значно рідше. Навіть якщо ви чітко говорите українською, підставляється знайоміший варіант.
Назви брендів і продуктів. «Kubernetes» звучить як «cube ornetes» для моделі, яка ніколи не пов'язувала цей звук із цим словом. «PostgreSQL» перетворюється на «post gres sequel» або щось ще гірше.
Технічні терміни з незвичною фонетикою. «OAuth» стає «oh auth» або «o-auth»; «webpack» записується як два слова — «web pack».
Топоніми. Українські назви міст часто підміняються радянськими транслітераціями або англійськими фонетичними наближеннями: «Київ» → «Киев», «Харків» → «Харьков», «Львів» → «Львов».
Вузькоспеціалізована термінологія. Медичні, юридичні й наукові терміни, яких немає у побутовому тексті, регулярно «перетворюються» на фонетично схожі загальновживані слова.

Причина не в тому, що модель погана, — вона робить рівно те, на що навчена: видає найімовірніший результат для даного аудіосигналу. Ваше завдання — зрушити ці ймовірності для вашого конкретного словника.

Як працює власний словник

Словник Hovor зіставляє список хибних варіантів з однією канонічною формою у два етапи: спершу як пряма заміна тексту в сирій транскрипції, потім — ще раз як підказка про словник, вбудована в системний промпт моделі очистки. Другий етап означає, що AI отримує явну вказівку, яке написання зберігати, а не просто вже виправлений текст. Синтаксис: перелічуєте всі некоректні варіанти через |, потім стрілка і правильна форма.

Приклади:

Кирило|Кирилл|Cyril → Кирило — яким би способом модель не написала ваше ім'я, в тексті завжди буде українське написання.
Київ|Киев → Київ — столиця завжди пишеться правильно, навіть коли модель підставляє застарілу форму.
Харків|Харьков → Харків — аналогічно для другого міста України.
kubernetes|cube ornetes → Kubernetes — і фонетичне спотворення, і регістр виправляються одним правилом.
postgresql|post gres|post gres sequel → PostgreSQL — поширені спотворення назви бази даних перехоплюються відразу.
oauth|oh auth|o-auth → OAuth — стандарт автентифікації завжди пишеться однаково.

Заміна відбувається після транскрипції і до кроку AI-очистки. Ця двоступенева схема важлива: спершу сирий текст від моделі виправляється за вашими правилами, і вже потім LLM-очистка отримує виправлений варіант. Тому AI-модель бачить коректні терміни і підсилює їх у процесі форматування, а не змагається з ними.

Крім заміни, записи словника слугують підказками для LLM. Коли Hovor формує системний промпт для моделі очистки, він включає ваш словник як контекст словника. Це означає, що модель знає про ваші переваги з самого початку сесії і застосовує їх послідовно по всьому тексту — не просто як механічну заміну рядків, а як частину розуміння вашого домену.

Покроково: додайте перші записи

Додавання запису займає п'ять кроків: відкрити «Словник» у налаштуваннях, натиснути «Додати», ввести всі варіанти, які зазвичай видає модель, розділивши їх символом |, ввести точну канонічну форму і зберегти. Запис діє одразу на цьому пристрої й потрапляє на інші ваші пристрої через фонову синхронізацію за секунди — без експорту, імпорту чи перезапуску.

Відкрийте налаштування Hovor. На iOS — натисніть іконку профілю і перейдіть у «Словник». На macOS — відкрийте меню Hovor у рядку меню і виберіть «Налаштування» → «Словник».
Натисніть «Додати запис» (або кнопку +). З'являться два поля: варіанти (те, що може видати модель) і канонічна форма (те, що ви хочете бачити в тексті).
Введіть варіанти. Наберіть або вставте всі некоректні форми, які модель зазвичай генерує, розділивши їх символом |. Можна додавати скільки завгодно варіантів — трьох-чотирьох зазвичай достатньо. Якщо не впевнені, які варіанти видає модель, — продиктуйте слово кілька разів без словника і перевірте сирий текст транскрипції.
Введіть канонічну форму. Це точне написання, регістр і пунктуація, яку ви хочете бачити в підсумковому тексті. Для брендових назв — дотримуйтесь офіційного написання. Для власних імен — використовуйте ту форму, яку ви обираєте для себе.
Збережіть. Запис набирає чинності одразу для всіх наступних сесій диктування на цьому пристрої. Синхронізація розповсюджує його на ваші інші пристрої за лічені секунди.

Записи можна редагувати або видаляти в будь-який момент на тому самому екрані «Словник». Зміни синхронізуються між пристроями автоматично.

Варіанти за замовчуванням не чутливі до регістру. Якщо ваш термін має різнорегістрові варіанти з різним змістом (рідкісний випадок), створіть окремі записи.

Синхронізація і навчання AI

Кожна зміна в словнику (додавання, редагування, видалення) записується як подія з часовою міткою на сервері Hovor, а кожен інший ваш пристрій підтягує нові події у фоні. Додали запис на iPhone під час поїздки — він уже чекає на Mac, коли ви сідаєте за стіл. Синхронізація працює у фоновому режимі і ніколи не перериває активну сесію диктування.

Аспект навчання AI заслуговує окремої уваги. Крок очистки в Hovor використовує LLM (gpt-4o-mini на сервері, або Apple Foundation Models для обробки на пристрої), щоб виправити пунктуацію, регістр і формулювання після сирої транскрипції. Системний промпт для цієї моделі будується заново для кожної сесії і включає ваш словник як контекст. Це означає:

Модель не просто механічно замінює рядки — вона розуміє ваш словник у контексті.
Якщо бренд або ім'я зустрічаються в незвичній граматичній позиції, модель все одно застосує правильне написання, бо знає, що це за термін.
Що більше записів ви додаєте, то глибше модель розуміє вашу предметну область у кожній новій сесії.

Ефект накопичується: добре заповнений словник означає менше правок після диктування, а менше правок — швидше письмо, а швидше письмо — більше диктування, під час якого виявляються нові записи для додавання.

Поради: жаргон, бренди та багатомовні сценарії

Словник працює однаково для будь-якої категорії: технічний жаргон, брендові назви і багатомовні власні назви використовують той самий синтаксис «список варіантів → канонічна форма». Різниться лише пріоритет — які варіанти варто внести першими. Нижче — категорії, які заощаджують найбільше часу на виправлення, у порядку пріоритету для більшості професійних користувачів.

Технічний жаргон і терміни розробників

Якщо ви диктуєте контент, дотичний до коду — документацію, технічні публікації, дизайн-документи, повідомлення в Slack про ваш стек — невелика кількість записів покриває більшість помилок. Почніть з назв технологій, фреймворків і інструментів, якими користуєтеся щодня. Також варто додати назви внутрішніх проєктів або мікросервісів з нестандартним написанням.

Назви брендів і продуктів

Багато брендових назв — це просто звичайні слова з нестандартним регістром, який голосова модель не може вивести з аудіо. iphone|I phone|I-phone → iPhone — одразу корисний запис. Принцип той самий: перелічуєте фонетично правдоподібні спотворення і малий регістр, а канонічна форма — офіційне написання.

Багатомовні сценарії

Якщо ви диктуєте кількома мовами, той самий словник діє для всіх. Це перевага: якщо у вашому словнику є і англійські, і українські власні назви — а в більшості технічних фахівців саме так — ви додаєте їх один раз і вони працюють незалежно від мови поточної сесії.

Для україномовних користувачів найціннішими записами зазвичай є власні назви, що мають усталені радянські транслітерації: назви міст, особисті імена з українським написанням, термінологія, яка розійшлась між українською і «радянською» нормою після незалежності. Запис Харків|Харьков → Харків або Львів|Львов → Львів гарантує, що в тексті завжди буде українська форма.

Медичні, юридичні та вузькоспеціалізовані терміни

Фахівці, які диктують у вузькій предметній галузі, отримують від словника найбільше користі. Лікарі можуть внести фонетичні спотворення назв препаратів, анатомічних термінів і назв процедур. Юристи — забезпечити однакове написання специфічної правової термінології. Дослідники — зафіксувати точну форму технічних термінів, назв генів або скорочень, які повторюються в їхніх текстах.

У словника немає семантичних обмежень — якщо голосова модель може щось переплутати, ви можете це виправити.

Про ліміти записів

Безкоштовний тариф обмежує словник 20 правилами заміни, окремо діє такий самий ліміт у 20 записів для сніпетів. Для більшості особистих сценаріїв цього достатньо, але розробнику з великим списком жаргону чи фахівцю з широкою предметною термінологією стане тісно. Будь-який з варіантів — Pro Monthly, Pro Yearly, Local Unlock або BYOK Unlock — знімає обидва ліміти, це не прив'язано лише до одного шляху апгрейду.

Словник, сніпети й воркфлоу вирішують різні задачі і мають різні ліміти:

Функція	Що робить	Ліміт безкоштовного тарифу	Синхронізується між пристроями
Словник	Виправляє хибну транскрипцію слів/імен і передає їх AI як контекст	20 записів	Так
Сніпети	Розгортає короткий тригер у довший блок збереженого тексту	20 сніпетів	Так
Воркфлоу	Налаштовує пайплайн тону/перекладу/форматування для всієї сесії	Залежить від провайдера (сервер вимагає Pro; Apple Foundation і BYOK мають власні умови)	Так

Pro Monthly ($11.99), Pro Yearly ($89.99), Local Unlock (1999 ₴ / $49.99, одноразово, спільний доступ для родини) і BYOK Unlock (999 ₴ / $24.99, одноразово, спільний доступ для родини) — кожен окремо знімає ліміти словника і сніпетів до необмежених; пакет Local + BYOK ($69.99 / 2799 ₴) покриває обидва одноразові розблокування разом.

Часті запитання

Скільки записів словника можна додати на безкоштовному тарифі?

Безкоштовний тариф обмежує словник 20 правилами заміни. Такий самий ліміт у 20 записів окремо діє для сніпетів. Будь-який з варіантів — Pro Monthly, Pro Yearly, Local Unlock (1999 ₴ / $49.99) або BYOK Unlock (999 ₴ / $24.99) — знімає обидва ліміти, тож для зняття ліміту словника не обов'язково купувати саме Local Unlock.

Словник лише замінює текст, чи він також допомагає AI розуміти, що я маю на увазі?

І те, і те. Спершу відбувається заміна: сирий текст транскрипції виправляється за вашим списком варіантів ще до будь-якої іншої обробки. Окремо ваші записи словника додаються в системний промпт моделі очистки (gpt-4o-mini на сервері або Apple Foundation Models на пристрої) як рядок відомого словника, який треба зберегти без змін. Тобто модель і отримує вже виправлений текст, і знає, які терміни в ньому не можна чіпати під час форматування.

Чи чутливе зіставлення словника до регістру?

Ні, зіставлення варіантів за замовчуванням не чутливе до регістру. Кожен запис окремо може мати режим точного збігу (exact-match-only), якщо вам потрібно, щоб варіант спрацьовував лише в певному регістрі; це налаштування зберігається для кожного запису окремо, а не глобально.

Чи синхронізується словник між моїми пристроями?

Так. Кожне додавання, редагування чи видалення записується як подія на сервері Hovor, і кожен ваш інший пристрій під тим самим акаунтом підтягує нові події у фоні. Тому запис, доданий на iPhone, потрапляє на Mac без ручного експорту чи імпорту. Синхронізація не перериває активну сесію диктування.

У чому різниця між словником, сніпетами і воркфлоу?

Словник виправляє транскрипцію окремих слів та імен і передає їх AI як контекст словника. Сніпети розгортають короткий тригер у довший блок збереженого тексту — зручно для повторюваного шаблонного контенту. Воркфлоу налаштовують, який пайплайн тону, перекладу і форматування застосовується до всієї сесії диктування. Усі три синхронізуються між пристроями; словник і сніпети мають окремий ліміт у 20 елементів на безкоштовному тарифі, а доступність воркфлоу залежить від того, який провайдер форматування (сервер, Apple Foundation чи BYOK) використовує конкретний воркфлоу.

Припиніть виправляти одні й ті самі імена вручну

Налаштуйте власний словник у Hovor і дозвольте AI засвоїти ваш словник. Доступно на iOS та macOS. Безкоштовний тариф включає 20 записів словника; Pro, Local Unlock або BYOK Unlock знімають ліміт.

Отримати Hovor