Как татарин из Оренбурга Рустам Юсупов создал для эвенкийского языка библиотеку, словарь-бот и планирует разработать удобное приложение.
Библиотека и словарь-бот для эвенкийского языка
– Вы создатель крупнейшей библиотеки по эвенкийской тематике «Эвенкитека». Расскажите, как и почему она создавалась? Почему вас заинтересовал именно эвенкийский язык?
– Я родился в Сибири и интересовался краеведением. Если посмотреть на карту моего района, все названия либо русские, либо эвенкийские. Отсюда появился интерес – а что это означает, а как это переводится? Таким образом, я начал искать материалы по эвенкийскому языку. В то время их было мало. Речь идет, наверное, о конец нулевых годов – 2007-2008 гг. Я находил материалы и выкладывал их в интернет, чтобы поделиться с другими людьми, которым это тоже может понравиться. Постепенно выросла целая библиотека.
– Я так понимаю, вы создавали ее, еще будучи студентом, и что вы учились в Казани?
– я учился в Казани. В КФУ.
– Что сейчас с проектом? Много пользователей?
– По метрике могу сказать, что человек 50 в день бывает. Но для сайта с такой очень узкой тематикой это достаточно много. В основном заходят из Москвы, Республики Саха и Дальнего Востока.
– Есть еще какие-то проекты, разработки, связанные с лингвистикой? Насколько я знаю, вы еще создали словарь-бот для эвенкийского языка.
– У меня есть сайт «Эвенгус». Правда, формально он мне сейчас не принадлежит, поскольку я поставил [проект] на паузу. Этот сайт посвящен изучению эвенкийского языка. У меня есть план перевести его в интерактивную языковую плоскость. То есть, сделать что-то подобное известным сервисам по изучению языков. Например, как Duolingo и т.д.
Да, есть у меня словарный бот в «Телеграме». Он называется «Русско-эвенкийский словарь». Собираюсь еще сделать эвенкийско-русский словарь, и на этой основе думаю вырастить что-то похожее на переводчик.
– Почему создание таких сайтов, приложений важно для сохранения миноритарных языков?
– Все должно быть в телефоне, потому что мы проводим в нем много времени. Я стараюсь сделать так, чтобы и эти языки были представлены в современных технологиях.
«Можно сделать так, чтобы вы говорили по-татарски: «Исәнмесез”, а колонка отвечала: «Хәерле иртә”»
– Нет ли планов создать приложение или словарь для татарского языка?
– Для татарского языка есть целые институты, которые занимаются этими вопросами.
– Несмотря на то, что много делается, такого словаря нет. Удобного приложения наподобие Duolingo тоже нет. Как думаете, почему не получается реализовать такие успешные проекты?
– Я в свое время пытался учить татарский. Была большая проблема в методических материалах. Учебники просто отвратительно составлены. Первые два-три урока ты учишь слова «мама», «папа», «кушать», а на четвертом уроке тебя просят перевести поэму Мусы Джалиля, например. Я не понимаю, почему они так устроены. Но я не вдавался в преподавание татарского языка.
– Сейчас загорелись идеей создать умную колонку наподобие «Алисы» на татарском языке. Это реально? Что для этого нужно?
– Для этого нужна технология распознавания татарской речи. Насколько я понимаю, такой технологии на текущий момент нет. Есть технология по распознаванию русской речи. Для эвенкийского языка есть проект Ayana, они используют разработки «Яндекса» для распознавания русской речи и выдачи информации, касающейся эвенков, на русском языке. Научить колонку татарскому языку – задача сложная, но выполнимая.
– В чем сложность?
– Во-первых, у вас должен быть рабочий переводчик, который понимает текстовую информацию на татарском языке. Такие вроде бы есть. Тот же «Яндекс» довольно неплохо переводит с русского на татарский, то есть, переводчики есть. Вы должны обучить компьютер понимать татарскую речь. Для этого в нее нужно довольно вложить звуковой информации.
– Этим кто должен заниматься – филологи, программисты?
– И филологи, и программисты вместе, и носители языка. Вы должны наговорить много татарского текста компьютеру и показать ему, что это за текст, то есть, перевести его в буквы. Дальше технологии искусственного интеллекта сами разберутся, какие звуки какому слову или каким буквам соответствуют.
– И чтобы она ответ находила?
– Ответ она будет находить, я так понимаю, в переводчике. Переводчиком можно пользоваться «яндексовским». Нужно связываться с компанией «Яндекс». Но насколько я понимаю, в Татарстане есть такая возможность.
– То есть, я задаю вопрос (например, что такое китап?), колонка находит ответ и она переводит его на татарский?
– Теоретически можно даже сделать так, чтобы вы говорили по-татарски: «Исәнмесез», а она отвечала: «Хәерле иртә» или «Хәерле көн». То есть, чтобы она не просто переводила, а понимала вашу речь и адекватно отвечала.
– Расскажите о себе. У вас имя татарское, и вы учились в Казани. У вас есть татарские корни?
– У меня отец татарин. Я жил и учился в Казани, какое-то время жил в Мензелинске. Сейчас я переехал в Оренбург.
– Чем занимаетесь?
– Дизайном. У меня еще есть проект «Тофастан». Он про язык тофаларов, это тюркский язык. Это небольшой народ, их осталось около 300 человек, а говрящих на тофаларском языке всего 3 человека. Это небольшой сайт, единственный в мире, посвященный тофаларскому языку. Со мной недавно связывались из концерна Виниокт, советовались, не нужно ли добавить новую букву в таблицу Виникода – это ч с крючком такая. По этому языку тоже запустить сайт, он будет русско-тафаларскийй, тафаларско-русским.
– А почему этим языком заинтересовались?
– Тофалары – это тоже один из народов Сибири.
– Какие у вас интересные проекты по дизайну?
– В прошлом году я, например, оформлял Тунгусский конгресс. Это съезд эвенков и тунгуссо-язычных народов, первый в истории России. Он проходил на Байкале. Я делал им фирменный стиль, придумал логотип.
Автор: Гуландам Фатхуллина
Фото на анонсе: из открытых источников vk.com