- Введение: зачем отделять математику от физики
- Цели статьи
- Базовые вероятностные модели
- Моделирование вероятности выигрыша
- Оптимизация ставочного правила
- Аналитическое решение для простых случаев
- First-price аукцион: равновесие и оптимальные стратегии
- Многоканальные и многопродуктовые сценарии: векторная вероятность
- Матричная форма и пример
- Вероятностные ограничения и риск
- Варианты регуляризации
- Стохастическое программирование и динамические стратегии
- Пример динамической оптимизации
- Эмпирические наблюдения и статистика
- Пример статистики (иллюстрация)
- Ограничения чисто математического подхода
- Практические рекомендации и стратегия внедрения
- Примеры применения: кейсы
- Кейс 1: низкоконкурентная ниша
- Кейс 2: высокая волатильность и heavy-tail
- Контрольные формулы и краткая шпаргалка
- Заключение
Введение: зачем отделять математику от физики
Programmatic-bid optimization (оптимизация ставок в программных торгах) традиционно учитывает множество факторов: скорость отклика, лаги, ограничения бюджета, частотные кэппинги, правила платформ. Однако существует ценная теоретическая плоскость — чистая математическая вероятность — где можно исследовать оптимальные стратегии в идеализированном мире без физических ограничений. Такая абстракция позволяет выявить фундаментальные закономерности и разработать универсальные принципы, применимые затем в реальной жизни с поправками.

Цели статьи
- Описать ключевые вероятностные модели для оптимизации бидов;
- Показать, как строятся решения при отсутствии физических ограничений;
- Предложить практические выводы и рекомендации, которые можно адаптировать к реальным системам.
Базовые вероятностные модели
В идеализированной задаче считается, что аукцион — это серия независимых случайных событий с известными или оценимыми распределениями. Ключевые величины:
- V — ценность показа для рекламодателя (в терминах чистой ожидаемой прибыли или конверсий);
- B — ставка (bid), которую выставляет рекламодатель;
- P_win(B) — вероятность выигрыша аукциона при ставке B;
- C — цена, которую платит рекламодатель при выигрыше (в модели second-price либо first-price);
- U(B) — ожидаемая полезность (utility) при ставке B: U(B) = P_win(B) * (V — E[C | B]).
Моделирование вероятности выигрыша
Одним из простейших и распространённых предположений является наличие распределения максимальной ставки конкурентов F(x). Тогда P_win(B) = F(B). В идеальном мире F известна или может быть оценена с любой точностью. Примеры распределений:
- Равномерное распределение на [0, M]: F(B) = B / M при 0 ≤ B ≤ M;
- Экспоненциальное: F(B) = 1 − e^{−λB};
- Нормальное (с отсечением снизу): для сложных ситуаций с многомодальностью.
Оптимизация ставочного правила
Цель — максимизировать суммарную ожидаемую полезность при каждом аукционе. Без бюджетных и временных ограничений оптимизация сводится к выбору B, максимизирующего U(B).
Аналитическое решение для простых случаев
Рассмотрим second-price аукцион и предположим, что цена C равна максимуму вторых ставок конкурентов, имеющих распределение F. Тогда E[C | B] = E[X | X < B] при условии, что X распределена по F. Для непрерывного F оптимум достигается при решении уравнения dU/dB = 0.
Например, при равномерном распределении X ~ U(0, M) и фиксированной V:
- P_win(B) = B/M;
- E[C | B] = B/2;
- U(B) = (B/M) * (V − B/2).
Дифференцируя:
dU/dB = (1/M)*(V − B/2) + (B/M)*(-1/2) = (V/M) − (B/M).
Ноль достигается при B* = V. Проверка: при B* ≤ M, оптимальная ставка равна ценности V — известный результат: ставить истинную ценность в идеальном second-price аукцион. В контексте probability-based оптимизации это вытекает чисто математически.
First-price аукцион: равновесие и оптимальные стратегии
В first-price случае платится ровно ставка B. Математическая задача меняется: U(B) = F(B)*(V − B). Для равномерного распределения X ~ U(0,M):
- U(B) = (B/M)*(V − B);
- dU/dB = (1/M)*(V − B) + (B/M)*(-1) = (V/M) − (2B/M);
- Оптимум B* = V/2.
Таким образом, в первом ценовом аукционе оптимальная ставка — половина оценки ценности (при равномерной конкуренции). Это классический байесовский результат для симметричных игр с приватными значениями.
Многоканальные и многопродуктовые сценарии: векторная вероятность
Если рекламодатель одновременно делает ставки на несколько аукционов (каналов, площадок, креативов), полезность становится суммой по событиям. Без ограничений на бюджет оптимизация распадается по аукционам: в каждом аукционе выбирается ставка, максимизирующая локальную ожидаемую полезность. Однако добавление корреляций и перекрёстных эффектов (например, пользователи видят несколько креативов) вводит в задачу совместные распределения и условные вероятности конверсии.
Матричная форма и пример
Пусть есть 3 аукциона с ценностями V1, V2, V3 и соответствующими распределениями конкурентов F1, F2, F3. Если конверсии независимы, то оптимум по каждому аукциону находится локально. Таблица ниже демонстрирует разницу оптимальных ставок для first- и second-price при равномерных распределениях и равных M.
| Аукцион | V | Первый ценовой (B*) | Второй ценовой (B*) |
|---|---|---|---|
| 1 | 2.0 | 1.0 | 2.0 |
| 2 | 1.0 | 0.5 | 1.0 |
| 3 | 0.4 | 0.2 | 0.4 |
Вероятностные ограничения и риск
Хотя в условии исключены физические ограничения, математически имеет смысл ввести риск-аверсию или вероятностные ограничения (например, вероятность перерасхода гипотетического бюджета). Это реализуется через регуляризацию полезности или ограничение на вероятности событий.
Варианты регуляризации
- Штраф за высокие ставки: U_reg(B) = U(B) − λ * g(B), где g(B) растёт с B (например, g(B)=B^2);
- Ограничение вероятности крупного проигрыша: P(C > t) ≤ α — преобразуется в дополнительное условие на распределение;
- Введение полезности от сохранённого бюджета: комбинированная функция ожидаемой прибыли и ожидаемой экономии.
Стохастическое программирование и динамические стратегии
Если аукционы повторяются, можно рассматривать многопериодную оптимизацию, где решения в текущем периоде учитывают вероятностное распределение будущих возможных событий. В отсутствие физических ограничений базовая динамика упрощается, но всё равно полезно моделировать:
- Белмановский принцип применим: оптимальная политика максимизирует суммарную ожидаемую полезность;
- Стационарные политики часто оптимальны при iid-аукционах;
- Если распределения конкурентов меняются — применяются адаптивные вероятностные модели (online learning в вероятностном представлении).
Пример динамической оптимизации
Рассмотрим бесконечную серию аукционов с дисконтированием β. Без бюджета оптимальная политика в second-price аукционе остаётся — ставить V каждый раз (если V постоянна и известна). В first-price случае оптимальная доля (например, 1/2 для равномерного) также стационарна. При случайных V_t оптимальная политика зависит от распределения V_t и может требовать байесовской оценки.
Эмпирические наблюдения и статистика
Хотя статья опирается на идеализированные вероятностные модели, сравнение с эмпирическими данными даёт полезные инсайты:
- В реальных DSP показатели win-rate при одной и той же ставке демонстрируют сглаженные S-образные кривые, близкие к логистическим — что соответствует предположению о непрерывном F;
- Анализ исторических аукционов часто показывает асимметрию распределения конкурентов (тяжёлый хвост справа), что смещает оптимум в сторону более консервативных ставок;
- В экспериментальных A/B тестах стратегии, близкие к теоретическим оптимумам (например, B=V для second-price), дают значимое улучшение ROI — типично +5–15% в контрольных условиях.
Пример статистики (иллюстрация)
| Метрика | Теория | Эмпирика (среднее по выборке) |
|---|---|---|
| Win-rate при B = 0.5V | ≈50% (при равномерной конкуренции) | 48% (наблюдаемая) |
| ROI при second-price и B=V | максимум по U(B) | увеличение на 8% vs эвристика |
| Средняя цена оплаты | ≈E[X | X < B] | слегка выше теоретической для heavy-tail |
Ограничения чисто математического подхода
Важно понимать, что абсолютно «чистая» вероятностная оптимизация опирается на идеализацию, которая опускает:
- Задержки и пропускную способность системы;
- Ограничения бюджета и кадровые/операционные факторы;
- Стратегии конкурентов, адаптирующиеся во времени;
- Неточности в оценке распределений F и ценностей V.
Тем не менее, математический анализ служит каркасом для построения более сложных и практичных систем.
Практические рекомендации и стратегия внедрения
Опираясь на вероятностные выводы, можно предложить следующую дорожную карту внедрения оптимизаций в реальную DSP или рекламную стратегию:
- Построить и оценить распределения конкурентов F на исторических данных;
- Для каждого типа аукциона (first/second) вычислить аналитические оптимумы при упрощённых предположениях;
- Провести A/B тесты стратегий, близких к теоретическим оптимумам (например, B ≈ V для second-price, B ≈ V/2 для first-price в симметричной среде);
- Добавить регуляризацию для риска и вероятностных ограничений; адаптировать к бюджету и latency;
- Использовать байесовские обновления для динамической адаптации распределений F и V.
«Автор считает, что чистая вероятностная модель — не цель, а инструмент: она даёт ясные эталоны поведения, от которых стоит отталкиваться при построении реальных оптимизаторов.» — Мнение автора
Примеры применения: кейсы
Кейс 1: низкоконкурентная ниша
В нише с небольшим числом участников распределение конкурентов близко к равномерному на небольшом отрезке. Теория предсказывает, что в second-price можно ставить близко к V, что увеличит win-rate без существенного перерасхода.
Кейс 2: высокая волатильность и heavy-tail
При heavy-tail распределении оптимумы смещаются в сторону снижения ставок, чтобы избегать редких, но дорогих выплат. Здесь полезна регуляризация и использование медианных оценок V вместо средних.
Контрольные формулы и краткая шпаргалка
- U(B) = P_win(B) * (V − E[C | B]) — общая формула;
- Second-price, независимые конкуренты: оптимум B* = V (при корректной модели);
- First-price, равномерное распределение: B* = V/2;
- Регуляризация: U_reg = U − λ*g(B) помогает учитывать риск в вероятностной модели;
- Динамика: стационарные политики часто оптимальны при iid-асуках.
Заключение
Стратегии programmatic-bid optimization, выведенные исключительно из теории вероятностей, дают чёткие и полезные ориентиры: в идеализированных second-price аукционах оптимальной является ставка, равная ценности V, в first-price — её часть (зависит от распределения конкурентов). Эти результаты позволяют сформировать эталонные стратегии, которые затем корректируются под реальные физические и операционные условия. Внедрение таких подходов в практику требует оценки распределений конкурентов, A/B тестов и добавления регуляризации для управления риском.
Автор рекомендует рассматривать чисто математическую оптимизацию как первую ступень: выстраивая модель вероятностей и проверяя её эмпирически, команда получает прочный фундамент для разработки гибких, адаптивных и эффективных стратегий бид-оптимизации.