ml-projects/speech_recognition at main · Inchimonsha/ml-projects

History

Name		Name	Last commit message	Last commit date
parent directory ..
README		README

README

Преобразование речи в текст (Speech-to-Text)
Объяснить и практиковать задачи преобразования устной речи в письменный текст — основу распознавания речи. Это может включать простые примеры с записью аудио и преобразованием его в текст с помощью библиотек или сервисов

Автоматическое распознавание команд и управление
Создание системы, которая распознает голосовые команды (например, "включи музыку", "открой приложение") и запускает соответствующие действия. Это учит работать с ключевыми словами и фразами в аудио

Распознавание и разметка речи в реальном времени
Задачи приема голосовых сообщений через очередь (например, RabbitMQ), их распознавание и передача результата в следующий этап обработки, что тренирует навыки интеграции потоковой передачи данных и моделей распознавания речи с системами оркестрации (Airflow)

Анализ и классификация распознанного текста
После преобразования речи в текст можно выполнять анализ тональности, классификацию по темам или извлечение именованных сущностей, что учит комбинировать распознавание речи с основными задачами NLP

Построение простого голосового помощника или чат-бота
Проект, который распознает голосовые команды, обрабатывает их NLP-моделью и отвечает голосом (или текстом). Это позволит познакомиться с полным циклом: распознавание речи → обработка → генерация ответа

Распознавание речи в шумной среде или с разными акцентами
Демонстрация сложности и возможностей обработки речи с помехами или разными вариантами произношения. Можно показать ограничения моделей и методы улучшения качества распознавания

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README

FilesExpand file tree

speech_recognition

Directory actions

76ED More options

Directory actions

More options

Latest commit

History

speech_recognition

Folders and files

parent directory

README