Недавно (пару дней назад) я обновил продакшен, где поменял много разных процессов, и сегодня получил такую обратную связь от пользователей, что в какой-то момент система зависла, перестала работать на время, и, соответственно, не было отклика.
Я узнал, какое это было время, зашел в монитор, в мониторе вижу, что есть довольно большое время ожидания от сервера, и начал примерно в это время смотреть логи по ошибкам, и нашел, что вызывается Endpoint zpo_24, и ошибка из-за того, что парсится нулевое значение.
Как я понимаю, запрос искал очень много строчек из базы данных, так как не были заданы фильтры по выборке данных, из-за чего была в моменте очень большая нагрузка, и система висла.
Но, что интересно, что данный блок в БП на вебе я удалил, протестировал, его больше нигде не было.
Я как-то замечал, что иногда после публикации приложения, пока не почистишь кэш, иногда визуально не обновляется интерфейс, это бывает частенько, но иногда, когда я не замечал, что интерфейс не обновляется, и вызывал какие-то процессы, то они почему-то не работали без очистки кэша.
И как вроде бы, как-то пару раз я замечал, что вызывались Endpointы, которых уже не было в бизнес-процессах. Я не зафиксировал это, и сейчас как-то воспроизвести этот кейс не получалось.
Но есть вот такая гипотеза, что возможна такая ошибка, которая приводит к таким последствиям.