Vacuum & Tonik
Привет, Вакуум, когда-нибудь думал превратить свою одержимость кодом в идеальную кофемашину? Я тут ковырялся с алгоритмами, которые предсказывают качество крема на основе данных об обжарке зерен и давлении машины – прям как отладка латте. Хочешь погрязнуть в математике этого?
Звучит интересно, но сначала мне нужны точные параметры и наборы данных. Если ты поделишься спецификациями и переменными, я посмотрю, как модель выглядит в сравнении с другими.
Конечно. У меня есть свежеобжаренная партия, все данные по DPP, TDS и помолу записаны. Параметры машины: 9 бар давления, 25 градусов вода, экстракция за 30 секунд. Сейчас скину тебе CSV-файлы, но предупреждаю – эти цифры просто золото.
Конечно, отправляй CSV-файлы, я начну разбираться с данными. Просто скажи, какие переменные самые важные и какую предварительную обработку ты хочешь.
Вот файлы на твоём почтовом ящике — бери "espresso_batch.csv". Начни с размеров помола (мкм), дозировки (г), температуры воды (°C), давления (бар), времени экстракции (с) и TDS (%). Удали выбросы (любое значение, отклоняющееся более чем на 3 стандартных отклонения от среднего), логарифмируй TDS для приведения к нормальному распределению, затем нормализуй размер помола и дозировку, чтобы модель могла правильно оценивать их вклад. Это даст тебе чистую отправную точку для настройки соотношения крема. Удачи в работе!
Я не могу вытащить файлы из почтового ящика, но если ты скопируешь первые несколько строк или сводные показатели, я смогу объяснить, как их очистить и построить простую регрессию, чтобы связать помол, дозу, давление и время с зафиксированными показателями TDS. Просто дай знать, что у тебя уже посчитано.
Вот краткий срез первых десяти строк, плюс среднее значение и стандартное отклонение для каждого ключевого параметра. Не стесняйся подправить числа на свой вкус.
**Первые десять строк (в формате CSV)**
grind (мкм), dose (г), temp (°C), pressure (бар), time (с), TDS (%)
350,18,25,9,30,2.15
342,18,25,9,30,2.18
355,17,25,9,30,2.12
347,19,25,9,30,2.20
349,18,25,9,30,2.16
346,18,25,9,30,2.14
348,17,25,9,30,2.11
351,19,25,9,30,2.22
345,18,25,9,30,2.15
350,18,25,9,30,2.17
**Общая статистика**
grind: среднее 348.5 мкм, стандартное отклонение 3.4 мкм
dose: среднее 18.1 г, стандартное отклонение 0.4 г
temp: 25°C (постоянное значение)
pressure: 9 бар (постоянное значение)
time: 30 с (постоянное значение)
TDS: среднее 2.16%, стандартное отклонение 0.03%
Удали строки, где TDS > 2.25% или < 2.10%, чтобы избавиться от выбросов, а затем примени логарифмическое преобразование к TDS перед подгонкой модели. Для простой линейной модели сделай log(TDS) зависимой переменной, а grind, dose, time и pressure – независимыми. Это даст тебе отправную точку, чтобы увидеть, как grind и dose влияют на оптимальную точку для крема. Приятного кофе!
Отлично. Я отфильтрую строки, где TDS выходит за пределы 2.10–2.25, а потом возьму натуральный логарифм оставшихся значений TDS. Далее, нормализую помол и дозировку, вычитая средние и деля на стандартные отклонения. После этого простая линейная регрессия с log(TDS) в качестве зависимой переменной и нормализованным помолом, дозировкой, временем и давлением в качестве предикторов, должна дать чёткие коэффициенты, показывающие, как каждый фактор влияет на качество крема. Если запустишь это в R или Python, просто пришли мне вывод, и мы подкорректируем параметры.