Стратегии programmatic-bid optimization using pure mathematical probability without physical constraints

Содержание

Введение: зачем отделять математику от физики
Цели статьи
Базовые вероятностные модели
Моделирование вероятности выигрыша
Оптимизация ставочного правила
Аналитическое решение для простых случаев
First-price аукцион: равновесие и оптимальные стратегии
Многоканальные и многопродуктовые сценарии: векторная вероятность
Матричная форма и пример
Вероятностные ограничения и риск
Варианты регуляризации
Стохастическое программирование и динамические стратегии
Пример динамической оптимизации
Эмпирические наблюдения и статистика
Пример статистики (иллюстрация)
Ограничения чисто математического подхода
Практические рекомендации и стратегия внедрения
Примеры применения: кейсы
Кейс 1: низкоконкурентная ниша
Кейс 2: высокая волатильность и heavy-tail
Контрольные формулы и краткая шпаргалка
Заключение

Введение: зачем отделять математику от физики

Programmatic-bid optimization (оптимизация ставок в программных торгах) традиционно учитывает множество факторов: скорость отклика, лаги, ограничения бюджета, частотные кэппинги, правила платформ. Однако существует ценная теоретическая плоскость — чистая математическая вероятность — где можно исследовать оптимальные стратегии в идеализированном мире без физических ограничений. Такая абстракция позволяет выявить фундаментальные закономерности и разработать универсальные принципы, применимые затем в реальной жизни с поправками.

Цели статьи

Описать ключевые вероятностные модели для оптимизации бидов;
Показать, как строятся решения при отсутствии физических ограничений;
Предложить практические выводы и рекомендации, которые можно адаптировать к реальным системам.

Базовые вероятностные модели

В идеализированной задаче считается, что аукцион — это серия независимых случайных событий с известными или оценимыми распределениями. Ключевые величины:

V — ценность показа для рекламодателя (в терминах чистой ожидаемой прибыли или конверсий);
B — ставка (bid), которую выставляет рекламодатель;
P_win(B) — вероятность выигрыша аукциона при ставке B;
C — цена, которую платит рекламодатель при выигрыше (в модели second-price либо first-price);
U(B) — ожидаемая полезность (utility) при ставке B: U(B) = P_win(B) * (V — E[C | B]).

Моделирование вероятности выигрыша

Одним из простейших и распространённых предположений является наличие распределения максимальной ставки конкурентов F(x). Тогда P_win(B) = F(B). В идеальном мире F известна или может быть оценена с любой точностью. Примеры распределений:

Равномерное распределение на [0, M]: F(B) = B / M при 0 ≤ B ≤ M;
Экспоненциальное: F(B) = 1 − e^{−λB};
Нормальное (с отсечением снизу): для сложных ситуаций с многомодальностью.

Оптимизация ставочного правила

Цель — максимизировать суммарную ожидаемую полезность при каждом аукционе. Без бюджетных и временных ограничений оптимизация сводится к выбору B, максимизирующего U(B).

Аналитическое решение для простых случаев

Рассмотрим second-price аукцион и предположим, что цена C равна максимуму вторых ставок конкурентов, имеющих распределение F. Тогда E[C | B] = E[X | X < B] при условии, что X распределена по F. Для непрерывного F оптимум достигается при решении уравнения dU/dB = 0.

Например, при равномерном распределении X ~ U(0, M) и фиксированной V:

P_win(B) = B/M;
E[C | B] = B/2;
U(B) = (B/M) * (V − B/2).

Дифференцируя:

dU/dB = (1/M)*(V − B/2) + (B/M)*(-1/2) = (V/M) − (B/M).

Ноль достигается при B* = V. Проверка: при B* ≤ M, оптимальная ставка равна ценности V — известный результат: ставить истинную ценность в идеальном second-price аукцион. В контексте probability-based оптимизации это вытекает чисто математически.

First-price аукцион: равновесие и оптимальные стратегии

В first-price случае платится ровно ставка B. Математическая задача меняется: U(B) = F(B)*(V − B). Для равномерного распределения X ~ U(0,M):

U(B) = (B/M)*(V − B);
dU/dB = (1/M)*(V − B) + (B/M)*(-1) = (V/M) − (2B/M);
Оптимум B* = V/2.

Таким образом, в первом ценовом аукционе оптимальная ставка — половина оценки ценности (при равномерной конкуренции). Это классический байесовский результат для симметричных игр с приватными значениями.

Многоканальные и многопродуктовые сценарии: векторная вероятность

Если рекламодатель одновременно делает ставки на несколько аукционов (каналов, площадок, креативов), полезность становится суммой по событиям. Без ограничений на бюджет оптимизация распадается по аукционам: в каждом аукционе выбирается ставка, максимизирующая локальную ожидаемую полезность. Однако добавление корреляций и перекрёстных эффектов (например, пользователи видят несколько креативов) вводит в задачу совместные распределения и условные вероятности конверсии.

Матричная форма и пример

Пусть есть 3 аукциона с ценностями V1, V2, V3 и соответствующими распределениями конкурентов F1, F2, F3. Если конверсии независимы, то оптимум по каждому аукциону находится локально. Таблица ниже демонстрирует разницу оптимальных ставок для first- и second-price при равномерных распределениях и равных M.

Аукцион	V	Первый ценовой (B*)	Второй ценовой (B*)
1	2.0	1.0	2.0
2	1.0	0.5	1.0
3	0.4	0.2	0.4

Вероятностные ограничения и риск

Хотя в условии исключены физические ограничения, математически имеет смысл ввести риск-аверсию или вероятностные ограничения (например, вероятность перерасхода гипотетического бюджета). Это реализуется через регуляризацию полезности или ограничение на вероятности событий.

Варианты регуляризации

Штраф за высокие ставки: U_reg(B) = U(B) − λ * g(B), где g(B) растёт с B (например, g(B)=B^2);
Ограничение вероятности крупного проигрыша: P(C > t) ≤ α — преобразуется в дополнительное условие на распределение;
Введение полезности от сохранённого бюджета: комбинированная функция ожидаемой прибыли и ожидаемой экономии.

Стохастическое программирование и динамические стратегии

Если аукционы повторяются, можно рассматривать многопериодную оптимизацию, где решения в текущем периоде учитывают вероятностное распределение будущих возможных событий. В отсутствие физических ограничений базовая динамика упрощается, но всё равно полезно моделировать:

Белмановский принцип применим: оптимальная политика максимизирует суммарную ожидаемую полезность;
Стационарные политики часто оптимальны при iid-аукционах;
Если распределения конкурентов меняются — применяются адаптивные вероятностные модели (online learning в вероятностном представлении).

Пример динамической оптимизации

Рассмотрим бесконечную серию аукционов с дисконтированием β. Без бюджета оптимальная политика в second-price аукционе остаётся — ставить V каждый раз (если V постоянна и известна). В first-price случае оптимальная доля (например, 1/2 для равномерного) также стационарна. При случайных V_t оптимальная политика зависит от распределения V_t и может требовать байесовской оценки.

Эмпирические наблюдения и статистика

Хотя статья опирается на идеализированные вероятностные модели, сравнение с эмпирическими данными даёт полезные инсайты:

В реальных DSP показатели win-rate при одной и той же ставке демонстрируют сглаженные S-образные кривые, близкие к логистическим — что соответствует предположению о непрерывном F;
Анализ исторических аукционов часто показывает асимметрию распределения конкурентов (тяжёлый хвост справа), что смещает оптимум в сторону более консервативных ставок;
В экспериментальных A/B тестах стратегии, близкие к теоретическим оптимумам (например, B=V для second-price), дают значимое улучшение ROI — типично +5–15% в контрольных условиях.

Пример статистики (иллюстрация)

Метрика	Теория	Эмпирика (среднее по выборке)
Win-rate при B = 0.5V	≈50% (при равномерной конкуренции)	48% (наблюдаемая)
ROI при second-price и B=V	максимум по U(B)	увеличение на 8% vs эвристика
Средняя цена оплаты	≈E[X \| X < B]	слегка выше теоретической для heavy-tail

Ограничения чисто математического подхода

Важно понимать, что абсолютно «чистая» вероятностная оптимизация опирается на идеализацию, которая опускает:

Задержки и пропускную способность системы;
Ограничения бюджета и кадровые/операционные факторы;
Стратегии конкурентов, адаптирующиеся во времени;
Неточности в оценке распределений F и ценностей V.

Тем не менее, математический анализ служит каркасом для построения более сложных и практичных систем.

Практические рекомендации и стратегия внедрения

Опираясь на вероятностные выводы, можно предложить следующую дорожную карту внедрения оптимизаций в реальную DSP или рекламную стратегию:

Построить и оценить распределения конкурентов F на исторических данных;
Для каждого типа аукциона (first/second) вычислить аналитические оптимумы при упрощённых предположениях;
Провести A/B тесты стратегий, близких к теоретическим оптимумам (например, B ≈ V для second-price, B ≈ V/2 для first-price в симметричной среде);
Добавить регуляризацию для риска и вероятностных ограничений; адаптировать к бюджету и latency;
Использовать байесовские обновления для динамической адаптации распределений F и V.

«Автор считает, что чистая вероятностная модель — не цель, а инструмент: она даёт ясные эталоны поведения, от которых стоит отталкиваться при построении реальных оптимизаторов.» — Мнение автора

Примеры применения: кейсы

Кейс 1: низкоконкурентная ниша

В нише с небольшим числом участников распределение конкурентов близко к равномерному на небольшом отрезке. Теория предсказывает, что в second-price можно ставить близко к V, что увеличит win-rate без существенного перерасхода.

Кейс 2: высокая волатильность и heavy-tail

При heavy-tail распределении оптимумы смещаются в сторону снижения ставок, чтобы избегать редких, но дорогих выплат. Здесь полезна регуляризация и использование медианных оценок V вместо средних.

Контрольные формулы и краткая шпаргалка

U(B) = P_win(B) * (V − E[C | B]) — общая формула;
Second-price, независимые конкуренты: оптимум B* = V (при корректной модели);
First-price, равномерное распределение: B* = V/2;
Регуляризация: U_reg = U − λ*g(B) помогает учитывать риск в вероятностной модели;
Динамика: стационарные политики часто оптимальны при iid-асуках.

Заключение

Стратегии programmatic-bid optimization, выведенные исключительно из теории вероятностей, дают чёткие и полезные ориентиры: в идеализированных second-price аукционах оптимальной является ставка, равная ценности V, в first-price — её часть (зависит от распределения конкурентов). Эти результаты позволяют сформировать эталонные стратегии, которые затем корректируются под реальные физические и операционные условия. Внедрение таких подходов в практику требует оценки распределений конкурентов, A/B тестов и добавления регуляризации для управления риском.

Автор рекомендует рассматривать чисто математическую оптимизацию как первую ступень: выстраивая модель вероятностей и проверяя её эмпирически, команда получает прочный фундамент для разработки гибких, адаптивных и эффективных стратегий бид-оптимизации.