iQIYI Performance Advertising Dual Bidding Optimierungsprozess

01

   Hintergrund des Projekts


Die Platzierung von Performance-Werbung ist ein Spieleszenario: Die Medienplattform hofft, den Traffic zum höchsten Preis verkaufen zu können, und der Kunde hofft, dass die Werbekosten und der Back-End-Effekt den Standards entsprechen. Mit der Entwicklung der Performance-Werbebranche geben sich Kunden nicht mehr damit zufrieden, nur oberflächliche Conversion-Effekte wie Aweckung und Aktivierung zu bewerten. Immer mehr Werbetreibende äußern ihre Forderungen an Medienplattformen zur Optimierung von Back-End-Effekten. Zu den Back-End-Effekten gehören die Bindungsrate, die Zahlungsrate, der ROI der Zahlung am ersten Tag und andere tiefgreifende Conversion-Typen.

In diesem Artikel gehen wir auf den Optimierungsprozess von Performance-Werbung im Gebotsmodell ein.

Werbemedienplattformen verwenden im Allgemeinen ein Dual-Bid-Modell, um gleichzeitig die geringen Conversion-Kosten und Back-End-Effekte der Werbetreibenden zu schützen. Zu den Werbeanforderungen der Werbetreibenden gehören eine geringe Einhaltung der Conversion-Kosten, eine tiefe Einhaltung der Conversion-Kosten und eine tiefe Einhaltung der Conversion-Rate, die in den beiden Geboten impliziert sind. Daher muss die Medienplattform eine geeignete eCPM-Gebotsformel (effektive Kosten pro Mille, Werbeeinnahmen pro tausend Impressionen) entwickeln, um den Anforderungen der Werbetreibenden gerecht zu werden und gleichzeitig den Umsatz der Medienplattform zu maximieren.


02

   Projektgeschichte

2.1 Traditionelles Einzelgebot

Kunden bieten nur für ein Conversion-Ziel (z. B. Download, Wake usw.). Die Medienplattform schätzt Klickraten und Konversionsraten anhand von Modellen und wandelt den Wert einer Konversion in den Bekanntheitswert eines Teils des Datenverkehrs um. Aufgrund der Schätzungsabweichung muss ein zusätzlicher Gebotsfaktor α verwendet werden, um das Gebot anzupassen und die Conversion-Kosten des Kunden zu schützen.


Der Gebotsfaktor in der obigen Formel spielt hauptsächlich zwei Rollen. Erstens handelt es sich um die Kalibrierung von Schätzungen, sodass der Belichtungswert basierend auf der Klick-Conversion-Rate genau gemessen werden kann. Zweitens handelt es sich um die Überprüfung von qualitativ hochwertigem Datenverkehr, bei dem Schätzungen und Crowd-Tags kombiniert werden, um die Gebotsfähigkeit hochwertiger Websites dynamisch zu verbessern. Qualitätsverkehr.

Bis 2022 haben wir diese Formel auf einem relativ extremen Niveau erreicht. Die Gebotsfaktoren haben sich von der invers proportionalen Steuerung zur Kalkülsteuerung, von stündlichen Aktualisierungen zu Minutenaktualisierungen, von der Einzelgranularitätssteuerung zur mehrdimensionalen dynamischen Aggregation und von einer einzelnen Strategie zur Kompatibilität mit Logik wie Kaltstart, regelmäßiger Lieferung und aggressivem Volumen gewandelt Erwerb. Mit der kontinuierlichen Verbesserung der Fähigkeiten von Vorhersagemodellen und der Entwicklung fortschrittlicher Modellkalibrierungsalgorithmen spielen Gebotsfaktoren tatsächlich zunehmend eine Rolle bei der Überprüfung von qualitativ hochwertigem Datenverkehr. Geringe Kosten hängen von der genauen Vorhersage und der schnellen Kalibrierung des Modells selbst ab, damit es stabil und kontrollierbar ist. Die obige Reihe von Optimierungen ist eine weitere wunderbare Geschichte, die ich bei Gelegenheit noch einmal mit Ihnen teilen werde.

Die Herausforderung trat in der zweiten Hälfte des Jahres 2021 auf, als die Werbebranche begann, vollständig auf Dual-Bid-Werbung umzustellen. Zu diesem Zeitpunkt standen wir vor einem tiefgreifenden Kostenproblem, und die Änderungen in der Haushaltsstruktur machten dieses Problem zu einer Hürde, die überwunden werden musste.

2.2 Gewichtetes Doppelgebot

Die geschäftliche Bedeutung des doppelten Bietens liegt darin, dass Kunden zwei Gebotsziele festlegen, eines flach und eines tief, wie z. B. Aktivierung + Bindung, Erwachen + Zahlung usw. Während Kunden geringe Kosten zur Einhaltung von Standards verlangen, verlangen sie auch tiefgreifendere Effekte, um Standards zu erfüllen, insbesondere hohe Kostenstandards. Ab der zweiten Jahreshälfte 2021 sind tiefgreifende Kostenkontrolle und -optimierung zu den Hauptproblemen dieser Zeit geworden. Um uns schnell an Veränderungen anzupassen, haben wir einen Ansatz in kleinen Schritten gewählt und schnell gewichtete Doppelgebote eingeführt.

Für mehrzielige Optimierungsprobleme gehören zu den häufig verwendeten Methoden die Pareto-Optimalität und die gewichtete Optimalität. Wir verwenden die gewichtete optimale Methode, um tiefe Kostenkontrollfaktoren auf der Grundlage flacher Einzelgebote hinzuzufügen, sie zu gewichten, um die endgültigen Kostenkontrollfaktoren zu erhalten, und lösen zunächst das Problem, ob eine tiefe Kostenkontrolle vorliegt.


In der obigen Formel verwendet die Steuerlogik des Deep-Bidding-Faktors das flache Framework vollständig wieder. In der tatsächlichen Anwendung wurden bei dieser Strategie folgende Mängel festgestellt:

① Bei dieser Gebotsformel beeinflussen sich die flachen Kosten und die tiefen Kosten gegenseitig. Nach der Gewichtung tritt leicht ein Wippenphänomen auf. Wenn die tiefe Schicht besser ist, ist die flache Schicht schlechter. die tiefere Schicht wird schlimmer sein. Es kann sogar zu zyklischen Schwankungen kommen.

② Der Gebotsfaktor ist im Wesentlichen ein Feedback-Controller, der auf der Grundlage der Zustellungsdaten des Tages gesteuert wird. Für Verkehr mit unterschiedlichen Tiefenwirkungen wird beim Bieten keine Schätzung basierend auf historischen Daten eingeführt. Das heißt, dass an der Gebotsformel kein pDCVR beteiligt ist und das Gebot nur auf Grundlage der Lieferleistung des Tages gesteuert wird.

Um die oben genannten Probleme zu optimieren, haben wir kontinuierliche Iterationen durchgeführt.

2.3 Pareto-Doppelgebot

Die gewichtete Methode stellt sicher, dass die flachen und tiefen Kosten insgesamt optimal sind, während die Anforderung, dass beide jeweils optimal sind, im Wesentlichen ein Pareto-Optimierungsproblem ist. Daher verwenden wir den Verkehrswert und den Zielverkehr als Ausgangspunkt für die Ausarbeitung der Strategie. Gleichzeitig verlassen wir uns auf die schrittweise beginnenden Vorhersagefunktionen des pDCVR-Modells, um eine neue Doppelgebotsstrategie zu entwickeln und eine stabile Kontrolle über flache und tiefe Bereiche zu erreichen Kosten.


Um sicherzustellen, dass flache Kosten und tiefe Kosten gleichzeitig den Standards entsprechen, führen wir die Schätzung der tiefen Conversion-Rate pDCVR ein und passen die Gebotsformel an:


Da die Tiefenkontrolle streng kontrolliert wird, ist die Tiefenkonvertierung oft spärlicher, was der Datenakkumulation nicht förderlich ist, und es ist schwierig, das Volumen zu steigern, was sich auf den Umsatz auswirkt. Um dieses Problem zu lösen, steuern wir die Zielgeschwindigkeit durch Einführung eines Korrekturkoeffizienten w, um die Laufkapazität zu verbessern. Gleichzeitig wird w zur Sicherstellung der Wirkung online in Echtzeit gesteuert.


Diese Gebotsformel kontrolliert theoretisch sowohl tiefe als auch flache Kosten streng. Da die Akkumulation tiefer Transformationsdaten langsamer ist als die von flachen Daten, oft um eine oder sogar mehrere Größenordnungen, befindet sich das pDCVR-Modell in diesem Zeitraum in einem Zustand relativ genauer Sortierung, aber unzureichender Genauigkeit. Daher verwenden wir die Tiefenschätzung indirekt als Grundlage für die Beurteilung der Verkehrsqualität und beeinflussen dadurch den Tiefengebotsfaktor. Diese Gebotsformel löst die beiden Probleme in 2.2 bis zu einem gewissen Grad. Doch es entsteht ein neues Problem:

①Zwischen  strenger Kontrolle der Tiefenkosten und erhöhtem Volumen muss ein Korrekturkoeffizient w zum Ausgleich verwendet werden, aber es ist schwierig, den optimalen Koeffizienten zu bestimmen, um das gewünschte Gleichgewicht zu erreichen.

② Das Gebotslimit für hochqualitativen Traffic auf tiefer Ebene ist das Gebot, das den Kostenstandard auf flacher Ebene erfüllt. Dieses Gebot ist für hochqualitativen Traffic auf tiefer Ebene zu konservativ. Im Vergleich zum Einzelgebotsmodell auf tiefer Ebene unterdrückt dieses Modell qualitativ hochwertigen Traffic und senkt die Conversion-Rate auf tiefer Ebene.

③ Wenn die flachen Kosten und die tiefen Kosten gleichzeitig den Standard erfüllen, kann nicht garantiert werden, dass die tiefe Conversion-Rate den Standard erreicht. Im Rahmen des allgemeinen Werbetrends sind die Beurteilung der sekundären Kundenbindungsrate, der langfristigen Kundenbindungsrate und des ROI durch Kunden oft Fragen der Rate und nicht einfach tief verwurzelte Kosteneinhaltungsprobleme.


Die oben genannten Fragen lassen sich wie folgt zusammenfassen: Wie erreicht man eine geringe Kosteneinhaltung und gleichzeitig eine tiefe Einhaltung der Conversion-Rate? Wie können die Kosten schrittweise verbessert und gleichzeitig der Verbrauch während des Lieferprozesses freigesetzt werden?

2.4 Adaptives Doppelbieten

Um die oben genannten Probleme zu lösen, besteht neben der langfristigen Verbesserung der Genauigkeit des pDCVR-Modells eine effektivere Methode darin, Durchbrüche im Mechanismus zur Bewertung des Verkehrswerts zu erzielen. Deshalb haben wir eine neue Version der Gebotsstrategie überarbeitet. Die Ziele sind wie folgt:

① Optimieren Sie den Datenverkehr weiter, um eine doppelte Optimierung der Tiefenkosten und der Tiefenkonvertierungsrate zu erreichen.

② Stärken Sie bei der Optimierung des Datenverkehrs die Gebots- und Gebotsfunktionen für hochwertigen Datenverkehr, um das Problem des schrumpfenden Volumens zu lösen, wenn der Effekt nicht gut ist.

Was den Gebotsmechanismus betrifft, haben wir auf der Grundlage der kontinuierlichen Verbesserung der Fähigkeiten des Deep-Prediction-Modells die Rolle von pDCVR bei der Gebotsvorhersage im Vergleich zur Gebotsformel in Version 2.3 gestärkt. Dies führt zu einer neuen Gebotsformel:


Unter diesen ist die φ-Funktion eine S-förmige Funktion, auf deren Grundlage der endgültige Tiefeneffekt-Kontrollfaktor berechnet wird. Die folgende Abbildung zeigt zwei verschiedene φ-Funktionskurven, die als ausgewählt werden können


eta ist der Funktionskrümmungskontrollfaktor, DCVR ist die tatsächliche Deep-Conversion-Rate der aktuellen Lieferung und T ist die angestrebte Deep-Conversion-Rate des Kunden.


Die Gebotssteuerungslogik lautet wie folgt:

(1) Wenn DCVR>=T ist, ist die Krümmung η der Funktion ein Minimalwert und die Funktionskurve fällt grundsätzlich mit der x-Achse zusammen. Zu diesem Zeitpunkt ist der Wert der φ-Funktion grundsätzlich derselbe, unabhängig davon, ob der pDCVR hoch oder niedrig ist, und es gibt keinen Eingriff in die Gebote. Sie können entsprechend den Anforderungen einer geringen Kosteneinhaltung so viel Volumen wie möglich betreiben.

(2) Wenn DCVR < T, erhöht der Controller η und die Funktionskrümmung erhöht sich konservativ und Verkehr mit hohen pDCVR-Geboten aggressiv, sodass DCVR zunimmt eta zu verringern, wodurch ein dynamisches Gleichgewicht erreicht wird.

(3) Wenn DCVR<<T, wird die Krümmung η auf den Maximalwert hochgezogen, niedriger pDCVR-Verkehr wird während des Bietens aufgegeben und hoher pDCVR-Verkehr wird aktiv geboten, wodurch E(pDCVR) kontinuierlich ansteigt, wodurch DCVR nahe an T liegt , also Schritt (2) wiederholen, um dynamisches Gleichgewicht zu erreichen.

An diesem Punkt basiert es auf den Back-End-Lieferanforderungen verschiedener Kunden, unabhängig davon, ob es sich um Zahlungskosten, sekundäre Retention-Rate oder ROI am ersten Tag usw. handelt, kombiniert mit Modellen zur tiefen Conversion-Schätzung wie der Schätzung der Zahlungsrate und der sekundären Retention-Rate und Schätzung des Zahlungsbetrags. Der tiefe Wert eines einzelnen Verkehrsflusses wurde effektiv bewertet. Adaptives Dual-Bidding verwendet pDCVR, um hochwertigen Traffic zu überprüfen und zu identifizieren. Es basiert auf einer nichtlinearen Gebotsstrategie. Wenn zwischen dem Effekt und dem Ziel eine Lücke besteht, wird gleichzeitig etwas Traffic verworfen Bietet aggressiver für die Präsenz bei qualitativ hochwertigem Traffic, um die besten Ergebnisse zu erzielen. Erreichen Sie das Ziel, kontinuierlich eine Steigerung der Wirkung zu erzielen und den Verbrauch schrittweise automatisch auf qualitativ hochwertigen Verkehr zu kippen. Es gibt auch einige kleine Details, wie z. B. die G-Funktion unter gleichzeitiger Berücksichtigung von Crowd-Labels usw., die hier nicht näher erläutert werden.


03

   Online-Effekt


Es werden schrittweise mehrere Versionen eingeführt, die kumulativ zu Leistungsverbesserungen bei der Werbung führen:



04

   Zusammenfassung und Ausblick


Jede Gebotsstrategie basiert auf der Vorhersagefähigkeit des Modells und steht in engem Zusammenhang mit der Erstellung von Crowd-Labels, der Budgetzuweisungslogik, dem Entwurf von Gebotsstrategien usw. Da die Bewertungsziele der Kunden derzeit immer strenger werden und sich die Gebotsmodelle weiterentwickeln, muss das Verkehrswertbewertungssystem kontinuierlich iteriert werden, um den Anforderungen der Geschäftsentwicklung gerecht zu werden. Zukünftig werden wir in folgenden Richtungen weiter optimieren:

  • Umfassende Effektkontrolle bei extrem spärlichen Daten

  • Effektoptimierung bei starker Conversion-Verzögerung

  • Effektschwankungen, die durch Änderungen in der Echtzeit-Gebotsumgebung verursacht werden

  • Kontextbezogenes automatisiertes Gebotsframework

Vielleicht möchten Sie es auch sehen
iQIYI Data Lake Practice – Werbung für Data Lake-Anwendungen
Anwendungspraxis von Apache Spark in iQiyi
Enthüllung des Geheimnisses der Speicherexplosion: Lösung des OOM-Problems des verteilten Trainings mit großen Modellen

Dieser Artikel wurde vom öffentlichen WeChat-Konto geteilt – iQIYI Technology Product Team (iQIYI-TP).
Bei Verstößen wenden Sie sich bitte zur Löschung an [email protected].
Dieser Artikel ist Teil des „ OSC Source Creation Plan “. Alle, die ihn lesen, sind herzlich eingeladen, mitzumachen und ihn gemeinsam zu teilen.

Fellow Chicken „Open-Source“ -Deepin-IDE und endlich Bootstrapping erreicht! Guter Kerl, Tencent hat Switch wirklich in eine „denkende Lernmaschine“ verwandelt. Tencent Clouds Fehlerüberprüfung und Situationserklärung vom 8. April RustDesk-Remote-Desktop-Startup-Rekonstruktion Web-Client WeChats Open-Source-Terminaldatenbank basierend auf SQLite WCDB leitete ein großes Upgrade ein TIOBE April-Liste: PHP fiel auf ein Allzeittief, Fabrice Bellard, der Vater von FFmpeg, veröffentlichte das Audiokomprimierungstool TSAC , Google veröffentlichte ein großes Codemodell, CodeGemma , wird es dich umbringen? Es ist so gut, dass es Open Source ist – ein Open-Source-Bild- und Poster-Editor-Tool
{{o.name}}
{{m.name}}

Ich denke du magst

Origin my.oschina.net/u/4484233/blog/10122362
Empfohlen
Rangfolge