Домой Главные новости интервью «Научить колонку «Алису» татарскому языку – задача сложная, но выполнимая»

«Научить колонку «Алису» татарскому языку – задача сложная, но выполнимая»

0
«Научить колонку «Алису» татарскому языку – задача сложная, но выполнимая»

Как татарин из Оренбурга Рустам Юсупов создал для эвенкийского языка библиотеку, словарь-бот и планирует разработать удобное приложение.

Библиотека и словарь-бот для эвенкийского языка

– Вы создатель крупнейшей библиотеки по эвенкийской тематике «Эвенкитека». Расскажите, как и почему она создавалась? Почему вас заинтересовал именно эвенкийский язык? 

– Я родился в Сибири и интересовался краеведением. Если посмотреть на карту моего района, все названия либо русские, либо эвенкийские. Отсюда появился интерес – а что это означает, а как это переводится? Таким образом, я начал искать материалы по эвенкийскому языку. В то время их было мало. Речь идет, наверное, о конец нулевых годов – 2007-2008 гг. Я находил материалы и выкладывал их в интернет, чтобы поделиться с другими людьми, которым это тоже может понравиться. Постепенно выросла целая библиотека. 


Источник фото: скрин сайта «Эвенкитека


– Я так понимаю, вы создавали ее, еще будучи студентом, и что вы учились в Казани? 

– я учился в Казани. В КФУ. 

– Что сейчас с проектом? Много пользователей?

– По метрике могу сказать, что человек 50 в день бывает. Но для сайта с такой очень узкой тематикой это достаточно много. В основном заходят из Москвы, Республики Саха и Дальнего Востока. 

– Есть еще какие-то проекты, разработки, связанные с лингвистикой? Насколько я знаю, вы еще создали словарь-бот для эвенкийского языка.

– У меня есть сайт «Эвенгус». Правда, формально он мне сейчас не принадлежит, поскольку я поставил [проект] на паузу. Этот сайт посвящен изучению эвенкийского языка. У меня есть план перевести его в интерактивную языковую плоскость. То есть, сделать что-то подобное известным сервисам по изучению языков. Например, как Duolingo и т.д. 

Да, есть у меня словарный бот в «Телеграме». Он называется «Русско-эвенкийский словарь». Собираюсь еще сделать эвенкийско-русский словарь, и на этой основе думаю вырастить что-то похожее на переводчик. 


Фото: из открытых источников vk.com


– Почему создание таких сайтов, приложений важно для сохранения миноритарных языков? 

– Все должно быть в телефоне, потому что мы проводим в нем много времени. Я стараюсь сделать так, чтобы и эти языки были представлены в современных технологиях. 

«Можно сделать так, чтобы вы говорили по-татарски: «Исәнмесез”, а колонка отвечала: «Хәерле иртә”»

– Нет ли планов создать приложение или словарь для татарского языка? 

– Для татарского языка есть целые институты, которые занимаются этими вопросами.

– Несмотря на то, что много делается, такого словаря нет. Удобного приложения наподобие Duolingo тоже нет. Как думаете, почему не получается реализовать такие успешные проекты? 

– Я в свое время пытался учить татарский. Была большая проблема в методических материалах. Учебники просто отвратительно составлены. Первые два-три урока ты учишь слова «мама», «папа», «кушать», а на четвертом уроке тебя просят перевести поэму Мусы Джалиля, например. Я не понимаю, почему они так устроены. Но я не вдавался в преподавание татарского языка. 


Фото: из открытых источников vk.com


– Сейчас загорелись идеей создать умную колонку наподобие «Алисы» на татарском языке. Это реально? Что для этого нужно? 

– Для этого нужна технология распознавания татарской речи. Насколько я понимаю, такой технологии на текущий момент нет. Есть технология по распознаванию русской речи. Для эвенкийского языка есть проект Ayana, они используют разработки «Яндекса» для распознавания русской речи и выдачи информации, касающейся эвенков, на русском языке. Научить колонку татарскому языку – задача сложная, но выполнимая.

– В чем сложность?

– Во-первых, у вас должен быть рабочий переводчик, который понимает текстовую информацию на татарском языке. Такие вроде бы есть. Тот же «Яндекс» довольно неплохо переводит с русского на татарский, то есть, переводчики есть. Вы должны обучить компьютер понимать татарскую речь. Для этого в нее нужно довольно вложить звуковой информации. 

– Этим кто должен заниматься – филологи, программисты? 

– И филологи, и программисты вместе, и носители языка. Вы должны наговорить много татарского текста компьютеру и показать ему, что это за текст, то есть, перевести его в буквы. Дальше технологии искусственного интеллекта сами разберутся, какие звуки какому слову или каким буквам соответствуют. 

– И чтобы она ответ находила? 

– Ответ она будет находить, я так понимаю, в переводчике. Переводчиком можно пользоваться «яндексовским». Нужно связываться с компанией «Яндекс». Но насколько я понимаю, в Татарстане есть такая возможность. 

– То есть, я задаю вопрос (например, что такое китап?), колонка находит ответ и она переводит его на татарский? 

– Теоретически можно даже сделать так, чтобы вы говорили по-татарски: «Исәнмесез», а она отвечала: «Хәерле иртә» или «Хәерле көн». То есть, чтобы она не просто переводила, а понимала вашу речь и адекватно отвечала. 

– Расскажите о себе. У вас имя татарское, и вы учились в Казани. У вас есть татарские корни? 

– У меня отец татарин. Я жил и учился в Казани, какое-то время жил в Мензелинске. Сейчас я переехал в Оренбург. 


Ассоциация коренных малочисленных народов Севера, Сибири и Дальнего востока вручила медаль “За верность Северу” — за языковые проекты “Эвенгус” и “Эвенкитека”
Фото: из открытых источников vk.com


– Чем занимаетесь? 

– Дизайном. У меня еще есть проект «Тофастан». Он про язык тофаларов, это тюркский язык. Это небольшой народ, их осталось около 300 человек, а говрящих на тофаларском языке всего 3 человека. Это небольшой сайт, единственный в мире, посвященный тофаларскому языку. Со мной недавно связывались из концерна Виниокт, советовались, не нужно ли добавить новую букву в таблицу Виникода – это ч с крючком такая. По этому языку тоже запустить сайт, он будет русско-тафаларскийй, тафаларско-русским. 

– А почему этим языком заинтересовались? 

– Тофалары – это тоже один из народов Сибири. 

– Какие у вас интересные проекты по дизайну? 

– В прошлом году я, например, оформлял Тунгусский конгресс. Это съезд эвенков и тунгуссо-язычных народов, первый в истории России. Он проходил на Байкале. Я делал им фирменный стиль, придумал логотип. 


Автор: Гуландам Фатхуллина
Фото на анонсе: из открытых источников vk.com