
Я работаю в международной компании и у меня проблема. Несмотря на то что я вполне свободно читаю и пишу на английском, мне очень очень трудно понять, что говорят мои коллеги на созвонах. Ведь в реальной жизни люди говорят вовсе не так как в учебных материалах на курсах английского и даже не так, как в сериалах на Netflix. Практически все люди в реальной жизни проглатывают звуки, имеют те или иные дефекты речи и акцент. Вишенка на торте - мне часто приходится созваниваться с людьми, которые работают на складе с очень громким фоновым шумом.
Обычно в таких ситуациях советуют больше смотреть сериалов на английском без субтитров, или выступления на TED Talks. Слушать подкасты. Но все эти неинтересные варианты я сразу отбросил.
Я решил сделать сервис, на котором разные люди смогут оставлять записи фраз на различных языках в различных условиях, чтобы другие люди могли использовать их для аудирования. С упором на неправильное произношение и дефекты речи и фоновые звуки. Такой сервис, с помощью которого я бы и сам смог прокачать свои навыки понимания английского.
Так появился Soningo
Идея сразу же потерпела крах. Оказалось очень не просто заставить людей хоть что-то сделать на сайте, не говоря уже о том, чтобы оставить короткую запись аудио на 2 секунды.
Тут мне пришла в голову интересная идея. Нейросети, умеющие распознавать речь, на чем-то тренировались, значит в природе существуют датасеты с записями аудио и их расшифровкой. А раз эти датасеты можно использовать для тренировки искусственных нейросетей, то и для естественных подойдет.
И такой датасет нашелся на сайте Tatoeba. Да, это не совсем то, что я хотел изначально. Всё-таки люди на аудио с этого сайта стараются произносить слова разборчиво и без запинок. Но это не всегда получается. Всё таки его наполняли самые разные люди, не только дикторы и профессиональные актеры. Так что некоторые особенности речи всё же присутствуют.
Изначально на Soningo был только один тип упражнений - диктант. Но оно оказалось слишком сложным и отбивало мотивацию. Очень сложно понять и написать все слова в предложении, если ты ещё недостаточно хорошо понимаешь язык. Тогда я сделал другое упражнение на упорядочивание слов. Но оно оказалось слишком простым. Третьим я сделал упражнение на заполнение пропусков в предложении.
Кроме того, я добавил возможность выбирать уровень языка, чтобы новичкам не попадались предложения с использованием слов, несоответствующих их уровню языка.
Изначально я решил, что не буду генерировать контент при помощи AI, ведь я делаю упор на реальном произношении реальных людей. И я этой концепции придерживаюсь. Но мне было нужно классифицировать предложения по уровням, убедиться что они не нарушают законов и не расжигают рознь. Для этого я сделал AI модератор, который проверяет все эти аспекты. Кроме того, одно и тоже предложение может быть записано разными спосгобами. Например числа могут быть записаны как словами, так и цифрами, валюты с использованием знаков, различные сокращения. А некоторые языки используют несколько алфавитов. Таким образом при провеке, должны учитываться разные варианты написания. Для того чтобы найти все эти варианты я тоже использовал AI.
Заходите на сайт https://soningo.com, делайте упражнения, оставляйте свои аудио для других. Напишите в комментариях сервисы для изучения языков, которые вы используете или создаете.





















