Randomisierte Algorithmen: Difference between revisions
No edit summary |
No edit summary |
||
Line 229: | Line 229: | ||
::: ''"quick and dirty generator"'' | ::: ''"quick and dirty generator"'' | ||
'''Nachteile''' | ==='''Nachteile'''=== | ||
* nicht zufällig genug für viele Anwendungen | |||
'''Bsp.''' wähle Punkt in R<sup>3</sup> | ::'''Bsp.''' wähle Punkt in R<sup>3</sup> | ||
<math>\begin{array}{ll} | ::<math>\begin{array}{ll} | ||
\mathrm{ } & p = (rand(), rand(), rand())\\ | \mathrm{ } & p = (rand(), rand(), rand())\\ | ||
\end{array}</math> | \end{array}</math> | ||
gibt Zahl u, v, w so, dass | ::gibt Zahl u, v, w so, dass | ||
<math>\begin{array}{ll} | ::<math>\begin{array}{ll} | ||
\mathrm{ } & u * p[0] + v * p[1] + w * p[3]\\ | \mathrm{ } & u * p[0] + v * p[1] + w * p[3]\\ | ||
\end{array}</math> | \end{array}</math> | ||
stark geclustert ist. | ::stark geclustert ist. | ||
* Periodenlänge ist zu kurz: | |||
:: spätestens nach m Schritten wiederholt sich die Folge | :: spätestens nach m Schritten wiederholt sich die Folge | ||
'''allgemein''': falls der interne Zustand des Zufallsgenerators ''k'' bits hat, ist Periodenlänge: | ::'''allgemein''': falls der interne Zustand des Zufallsgenerators ''k'' bits hat, ist Periodenlänge: | ||
<math>\begin{array}{ll} | ::<math>\begin{array}{ll} | ||
\mathrm{ } & Periode < 2^k\\ | \mathrm{ } & Periode < 2^k\\ | ||
\end{array}</math> | \end{array}</math> |
Revision as of 15:12, 11 July 2008
1. Randomisierte Algorithmen
Def.: Algorithmen, die bei Entscheidung oder bei der Wahl der Parameter Zufallszahlen benutzen
Bsp.: Lösen des K-SAT-Problems durch RA
geg.: logischer Ausdruck in K-CNF (n Variablen, m Klauseln, k Variablen pro Klausel)
for i in range (trials): #Anzahl der Versuche #Bestimme eine Zufallsbelegung des : for j in range (steps): if erfüllt alle Klauseln: return #wähle zufällig eine Klausel, die nicht erfüllt ist und negiere zufällig eine der Variablen in dieser Klausel (die Klausel ist jetzt erfüllt) return None
Eigenschaft: falls : steps *trials
z.B. steps=3*n, trials=
aber: bei sind im Mittel nur steps= nötig, trials=
-Zufallsbelegung hat richtige Variablen (im Mittel )
Negieren einer Variable ändert t um 1, u.Z. mit Wahrscheinlichkeit ::(für beliebiges k: )
- mit Wahrscheinlichkeit ::(für beliebiges k: )
-Wieviele Schritte braucht man im Mittel, um zu einer Lösung mit t Richtigen zu kommen?
#Abbruchbedingung der Schleife
Probe:
Das ist das Random Walk Problem
Im ungünstigsten Fall (t=0) werden im Mittel Schritte benötigt, um durch random walk nach t=n zu gelangen.
2. RANSAC-ALGORITHMUS (Random Sample Consensus)
Aufgabe: gegeben: Datenpunkte
- gesucht: Modell, das die Datenpunkte erklärt

Messpunkte:
übliche Lösung: Methode der kleinsten Quadrate Schulmathematik:
Lineares Gleichungssystem
- Problem: der Datenpunkte sind Outlier
- Einfaches Anpassen des Modells an die Datenpunkte funktioniert nicht
- Seien mindestens k Datenpunkte notwendig, um das Programm anpassen zu können
RANSAC-Algorithmus
for l in range (trials): wähle zufällig k Punkte aus passe das Modell an die k Punkte an zähle, wieviele Punkte in der Nähe des Modells liegen (d.h. muss geschickt gewählt werden) #Bsp. Geradenfinden:-wähle a,b aus zwei Punkten -berechne: -zähle Punkt i als Inlier, falls return: Modell mit höchster Zahl der Inlier
mit k=Anzahl der Datenpunkte und p=Erfolgswahrscheinlichkeit, =Outlier-Anteil
Erfolgswahrscheinlichkeit: p=99%
Ein Spiel: Wie viel Schritte braucht man im Mittel zum Ziel?
geg.: 5 Plätze, 2 Personen: eine Person rückt vom einem Platz zu dem enderen Platz; die zweite Person wirft die Münze. Wenn die Münze auf Kopf landet, rücke nach rechts und wenn die Münze auf Zahl landet, rücke nach links. <--- Zahl Kopf--> Kopf: ///// Zahl: ///
- => mit 8 Schritten bis zum Ziel
- im Mittel: bei N Plätzen braucht man N2 Schritte
- all: mit N2 Schritten um N Plätze rücken
- Wie viel Schritte braucht man im Mittel zum Ziel?
#wenn wir uns im Stuhl Nr.1 befinden
#bei 0.Platz
- Lösung:
- speziell:
#wenn man am ungünstigsten Platz startet
Beziehung zu randomisiertem 2-SAT
"Platz ": Variablen haben den richtigen Wert, sind falsch gesetzt
# Anfangszustand
Las Vegas vs. Monte Carlo
* Las Vegas - Algorithmen - Ergebnis ist immer korrekt. - Berechnung ist mit hoher Wahrscheinlichkeit effizient (d.h. Randomisierung macht den ungünstigsten Fall unwahrscheinlich).
* Monte Carlo - Algorithmen - Berechnung immer effizient. - Ergebnis mit hoher Wahrscheinlichkeit korrekt (falls kein effizienter Algorithmus bekannt, der immer die richtige Lösung liefert).
Las Vegas | Monte Carlo |
---|---|
- Erzeugen einer perfekten Hashfuktion | - Algorithmus von Freiwald(Matrizenmultiplikation) |
- universelles Hashing | - RANSAC |
- Quick Sort mit zufälliger Wahl des Pivot-Elements | - randomisierte K-SAT(k>=3)(Alg. von Schöning) |
- Treep mit zufälligen Prioritäten |
Zufallszahlen
- - kann man nicht mit deterministischen Computern erzeugen
- - aber man kann Pseudo-Zufallszahlen erzeugen, die viele Eigenschaften von echten Zufallszahlen haben
- * sehr ähnlich zum Hash
"linear Conguential Random number generator"
- -sorgfältige Wahl von a, c, m notwendig
- Bsp. m = 232
- a = 1664525, c = 1013904223
- "quick and dirty generator"
- Bsp. m = 232
Nachteile
- nicht zufällig genug für viele Anwendungen
- Bsp. wähle Punkt in R3
- gibt Zahl u, v, w so, dass
- stark geclustert ist.
- Periodenlänge ist zu kurz:
- spätestens nach m Schritten wiederholt sich die Folge
- allgemein: falls der interne Zustand des Zufallsgenerators k bits hat, ist Periodenlänge: