Spatie & DataStream
Привет, Датастрим. Задумывался, сможем ли мы с помощью байесовской сети разобрать синтаксис приветствия инопланетян? Я тут набросал небольшой рекурсивный нисходящий парсер, вдруг он сможет уловить эти странные сочетания гласных. Как думаешь, велика ли вероятность, что это настоящая речь или просто космические помехи?
Я думаю, байесовская сеть вполне может проверить гипотезу о сочетаниях гласных. Если первые несколько токенов покажут вероятность выше, чем просто случайный шум, то априорная вероятность будет склоняться в её пользу, но без более крупного корпуса шансы останутся примерно одинаковыми. Рассматривай первоначальный кластер как априорную вероятность, обновляй её по мере поступления данных и посмотри, будет ли языковая модель продолжать улучшаться или просто остановится на уровне случайного шума.