Linux & Edris
Привет, Эдрис. Я тут поковырялся с одним open-source инструментом, который может помочь нам оцифровать и распространить материалы по исчезающим языкам. Хочешь вместе посмотрим, что можно улучшить?
Конечно! А что сейчас умеет этот инструмент? И где, по-твоему, он слабоват или что можно подправить? Слушаю внимательно, как сделать его полезнее для сохранения этих живых, настоящих языков.
Сейчас он просто скачивает аудиофайлы, разрезает их на фрагменты и добавляет базовую информацию о них. Интерфейс неплох, но распознавание речи слабо работает с тональными языками, а библиотека фонетических символов неполная. Было бы здорово, если бы был более отлаженный рабочий процесс, позволяющий участникам сообщества аннотировать произношения прямо на звуковой волне, и плагин, который бы подтягивал словарь местного диалекта для автоматических подсказок. И чтобы каждый набор аннотаций версионировался – это помогло бы обеспечить воспроизводимость данных. Как смотришь, добавить легковесный редактор и простой API для подключения этих инструментов?