Разработка сервиса распознавания речи на основе ИИ
Разработка MVP-версии сервиса с нейросетью для быстрой проверки гипотезы.
Сделано в 2024
Задача
Облегчить процесс записи лекций для студентов, предоставив инструмент, который позволит автоматически преобразовывать аудиозаписи лекций в текст.

Проблема

Студентам часто приходится тратить много времени и усилий на конспектирование лекций вручную, что отвлекает от самого процесса восприятия информации.

Заказчик решил протестировать гипотезу, что сервис распознавания речи поможет автоматизировать ведение записей и упростит жизнь студентам.

Разработка сервиса с ИИ для распознавания речи

Решение

Для проверки идеи мы создали минимально жизнеспособный продукт (MVP). Интерфейс программы максимально простой: нажать на кнопку для старта и завершения записи, после чего полученное аудио отправляется на обработку нейросетью. Через пару минут пользователь получает текстовую расшифровку на свою электронную почту.

Разработка сервиса по распознаванию речи

Почему результат отправляется на почту, а не отображается сразу в сервисе?
На данном этапе это позволило сэкономить время и деньги, поскольку реализация функций хранения, отображения и поиска по истории записей требует дополнительных усилий. Такой подход дал возможность разработать и передать продукт для тестирования первыми пользователями всего за 7 дней!

Чтобы открыть доступ к конвертации аудиофайлов, необходимо пройти простую регистрацию — здесь мы и получаем электронную почту для отправки данных.

Разработка сервиса на основе ИИ: авторизация
Авторизация и регистрация

Техническая сторона

Для распознавания речи был выбран сервис Elevate, так как он отвечает ключевым требованиям:

  • поддержка английского и японского языков,
  • высокая точность распознавания: во время занятия преподаватель может перемещаться по аудитории, отворачиваться, говорить громче или тише, это не должно существенно сказываться на результате,
  • недорогая стоимость использования (в данном случае, есть даже бесплатный вариант с лимитом количества запросов).

Текстовые страницы сервиса

После завершения первого этапа тестирования идеи планируется реализовать платную подписку: 3 пакета на выбор с разным количеством минут для обработки. И реализовать интеграцию с платежным сервисом для онлайн-оплаты.

Результат

На волне популярности ИИ, новые сервисы, использующие нейросети, появляются каждый день. Поэтому здесь так важна скорость реализации.
Слаженная команда и правильный выбор приоритетов позволил получить рабочую версию в короткий срок. MVP уже тестируется на целевом рынке в Японии, и мы получаем первые позитивные отзывы от довольных студентов.

Поделиться в соцсетях: