8000 ml-projects/speech_recognition at main · Inchimonsha/ml-projects · GitHub
[go: up one dir, main page]

Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
Преобразование речи в текст (Speech-to-Text)
Объяснить и практиковать задачи преобразования устной речи в письменный текст — основу распознавания речи. Это может включать простые примеры с записью аудио и преобразованием его в текст с помощью библиотек или сервисов

Автоматическое распознавание команд и управление
Создание системы, которая распознает голосовые команды (например, "включи музыку", "открой приложение") и запускает соответствующие действия. Это учит работать с ключевыми словами и фразами в аудио

Распознавание и разметка речи в реальном времени
Задачи приема голосовых сообщений через очередь (например, RabbitMQ), их распознавание и передача результата в следующий этап обработки, что тренирует навыки интеграции потоковой передачи данных и моделей распознавания речи с системами оркестрации (Airflow)

Анализ и классификация распознанного текста
После преобразования речи в текст можно выполнять анализ тональности, классификацию по темам или извлечение именованных сущностей, что учит комбинировать распознавание речи с основными задачами NLP

Построение простого голосового помощника или чат-бота
Проект, который распознает голосовые команды, обрабатывает их NLP-моделью и отвечает голосом (или текстом). Это позволит познакомиться с полным циклом: распознавание речи → обработка → генерация ответа

Распознавание речи в шумной среде или с разными акцентами
Демонстрация сложности и возможностей обработки речи с помехами или разными вариантами произношения. Можно показать ограничения моделей и методы улучшения качества распознавания

0