✱ Тестирование новых технологий
Меняем тикетсы на шмикетсы: как мы тестируем ML-бота в Postgres Pro
SQA Days #36
2025-04-25 17:10
Секция C
40 мин
Просто
Спикеры
Доклад был на прошедшей конференции SQA Days #36 и сейчас находится в архиве.
Как понять, что ваша любимая нейросеть вдруг «сломалась» и стала в 10 раз глупее? Почему один невинный запрос заставил её потратить в 25 раз больше токенов? И как тестировщик ML-продукта становится почти ML-инженером?
Недавно Postgres Pro представила ML-бота для работы с базами данных — и мы его хорошенько протестировали!
В программе:
• Что особенного в тестировании LLM.
• Как заглянуть внутрь «чёрного ящика» с помощью Langfuse.
• Как вычислить, что новая версия модели стала хуже.
• Как мы тестируем одну нейросеть другой нейросетью.
• Когда негативные тест-кейсы важнее позитивных.
Доклад будет интересен всем, от новичков до "бывалых"!
Доступно только после покупки 😊