Первые цифровые казахские голоса создали в НУ

Ученые Назарбаев университета создали первые цифровые казахские голоса – мужской и женский. Их назвали Исеке и Рая - это производные от настоящих имен двух дикторов, чьи голоса и легли в основу программы. Разработка преобразовывает текст в аудио и способствует продвижению использования казахского языка в цифровой сфере.

Саида Мусаходжаева, аналитик данных института умных систем и искусственного интеллекта Назарбаев Университета:

- Мы собрали более 90 часов голоса от двух дикторов, а также разработали 2 системы, которые могут перевести текст в речь. Во-первых, мы первые, кто собрал такое количество данных в Казахстане.  Во-вторых,  это все в общем доступе. Любой человек может скачать эти данные и использовать в некоммерческих и коммерческих целях. В связке с другими компонентами в будущем их можно использовать в виртуальных ассистентах, таких как Сири, либо в том же самом 2гис.

Работа над проектом длилась почти год. За это время дикторы наговорили много слов, звуков, букв и чисел, чтобы цифровые Исеке и Рая без труда произносили как распространенные, так и неизвестные или даже несуществующие слова. Программой уже заинтересовались несколько казахстанских компаний. 

Делятся ученые не только всей базой данных, но и кодом программы и предварительно обученными моделями, для того чтобы другие разработчики смогли использовать их для еще большего развития казахстанских технологий искусственного интеллекта.   

 

Автор: Марал Аманжолова