Особенности тестирования веб-приложений Лаборатория Качества

Сейчас вы видите довольно неплохую сводную таблицу из одной хорошей статьи, последняя ревизия которой публиковалась несколько месяцев назад. С этой статьи хорошо начать ознакомление с этим замечательным разделом математики. Но мы будем обсуждать только то, что хорошо работает на практике и быстро выдаёт надёжные результаты на перформанс-данных. Классическими приложениями, которые можно использовать для генерации запросов, является Fiddler или Postman. Инсталляция на веб-сервер
Итак, прежде чем приступить к тестированию, мы должны установить (инсталлировать) веб-приложение на веб-сервер. Тестирование масштабируемости (scalability testing)[13] — данное тестирование производится для проверки возможностей масштабирования приложения под любым видом нагрузки.

Семантическое ядро – это набор фраз, соответствующих поисковым запросам пользователей в поисковых системах, которые характеризуют определенную тема… Можно выбрать некоммерческий инструмент, например, популярный Apache JMeter с открытым кодом, который бесплатно предоставляет большой набор опций. Она из первых программ тестирования, перформанс тестирование была создана в конце 90-х годов. Система корпоративного уровня WebLoad может моделировать одновременно несколько тысяч посетителей. Из недостатков этого решения можно выделить то, что для его запуска необходимо открыть его Web UI, написанный на Flask, и отсутствие поддержки получения отчетов в формате xUnit.

Как мы выбирали и докручивали фреймворк для performance-тестирования

В итоге средний элемент — всегда больше всех элементов нижней кучи и меньше всех элементов верхней кучи. Мы переходим к рассмотрению скользящих квантильных оценок, которые рассчитываются на потоке чисел без их непосредственного хранения. Одним из подходов являются взвешенные выборки, на основе которых мы можем реализовать экспоненциальное сглаживание. При расчете усеченного варианта оценки мы отбрасываем элементы с малыми весовыми коэффициентами и используем только порядковые статистики с большими весами. В итоге мы совсем чуть-чуть теряем в эффективности, но зато заметно улучшаем робастность. А еще этот способ быстрее с вычислительной точки зрения, т.к.

Сначала мы загружаем историю замеров данного бенчмарка для данной конкретной машины. Далее мы делаем N итераций бенчмарка на текущей ревизии. И применяем хитрую математическую формулу, чтобы определить, есть ли у нас деградация. Ситуация стала лучше, но у нас всё ещё есть одна константа — количество итераций. Работает он немного дольше по сравнению с EdPelt, но зато он способен находить все точки разладки даже на большой истории. Мы уже несколько месяцев гоняем RqqPelt в Rider на наших наборах тестов и он показывает очень хорошие результаты.

Трудности и их решения

А методы описательной статистики используются как кирпичики при построении более сложных подходов. Мне хочется только подчеркнуть те направления подходов, на которые стоит обратить особое внимание. Если мы перейдем к математической классификации распределений, то мы можем сказать, что у распределения уровней наводнений тяжелый хвост. Если мы сравним тяжелохвостое распределение с экспоненциальным, то тяжелый хвост в какой-то точке графика обязательно окажется выше хвоста экспоненциального распределения. В общем, оценку плотности также не всегда просто подобрать. Существует очень много разных методов и подходов, есть из чего повыбирать.

На данной картинке вы видите тримодальное распределение, у которого сдвинулась средняя мода. Обычные сводные метрики вроде среднего значения или дисперсии могут почти не измениться при такой трансформации. Но функция сдвига мгновенно показывает нам суть изменений.

Python на стероидах. Измеряем производительность в продакшене без потери скорости

Математические формулы зачастую требуют от нас такого количества итераций, которое мы не можем себе позволить. С помощью такой кривой мы можем заточить систему перформанс-тестов под наши конкретные требования. Помимо уже рассмотренных проблем, сюда добавляется эффект под названием p-hacking.

А в таком случае может заинтересовать и следующий Heisenbug.
В течение долгих недель я методично изучал разные перформанс-графики и пытался отгадать ситуации, в которых у нас есть проблемы.
Но стоит только разобраться с одной проблемой, сразу появляется другая, а за ней третья, четвертая и так далее.
Руководствоваться ими или нет — решать тебе, я лишь поделюсь своими наблюдениями по этому поводу.

К тому же, сразу после окончания цикла оценки, программа автоматически позволяет назначить итоговый 1-on-1 с менеджером. Процесс ревью проходит тет-а-тет между менеджером и работником. Мнения о том, что подразумевает “перформанс-тестинг”, слегка расходятся. Бренд- и перформанс-маркетинг одинаково важны для успеха компании. Иногда два этих направления могут конфликтовать, если вы не до конца понимаете их смысл.

Что такое перформанс-тестирование

Если бы мы сделали очень много итераций, то могли бы тут обнаружить статистически значимую разницу. Но вот только практически значимая разница бы всё равно не появилась. А вот статистические тесты на такой вопрос отвечать совсем не умеют, не эту задачу они решают.

С его помощью можно тестировать любые веб-приложения, но сценарии придется писать на Java. Простые сценарии можно составлять без написания кода — достаточно настроек и нажатия кнопок в GUI. Главное, на мой взгляд, достоинство JMeter представляют его отчеты.

Квантильная оценка Харрела-Дэвиса

Запустили одну вариацию креатива, протестировали, проанализировали метрики на соответствие главным критериям — запускаем следующую. Когда мы собрали достаточно данных, вычленяем креативы, показавшие лучшие результаты — самые “перформящие” из всех. Чтобы креатив “драйвил” метрики, нужно соблюдать определенные правила. В данном случае мы заранее договорились, что для обнаружения деградации на 100% нам достаточно 9 итераций. Подход выглядит костыльным и не очень математическим, но очень хорошо ложится на реальную жизнь.

А можно сказать, что нам недостаточно данных для ответа на вопрос, нужно сделать больше замеров. И повторяем процесс до тех пор, пока не получим нужный результат. Как и в случае с разладками, нам поможет адаптивный подход.

Как мы выбирали и докручивали фреймворк для performance-тестирования

Трудности и их решения

Python на стероидах. Измеряем производительность в продакшене без потери скорости

Что такое перформанс-тестирование

Квантильная оценка Харрела-Дэвиса

Leave a Reply Cancel reply