Randomisierte Algorithmen

From Alda
Revision as of 01:23, 11 July 2008 by 89.56.130.224 (talk)
Jump to: navigation, search

1. Randomisierte Algorithmen

Def.: Algorithmen, die bei Entscheidung oder bei der Wahl der Parameter Zufallszahlen benutzen

Bsp.: Lösen des K-SAT-Problems durch RA

   geg.: logischer Ausdruck in K-CNF (n Variablen, m Klauseln, k Variablen pro Klausel)
   \underbrace {\underbrace {\left(x_1 \vee x_3 \vee...\right)}_{k\; Variablen} \wedge \left( x_2 \vee x_4 \vee...\right)}_{m\;Klauseln}
   for i in range (trials):    #Anzahl der Versuche
        #Bestimme eine Zufallsbelegung des \{ x_i \}:
        for j in range (steps):
              if \{ x_i \} erfüllt alle Klauseln: return \{ x_i \}
              #wähle zufällig eine Klausel, die nicht erfüllt ist und negiere zufällig eine der Variablen in dieser Klausel 
              (die Klausel ist jetzt erfüllt)
   return None


Eigenschaft: falls k>2 : steps *trials \in O\left(\Alpha^n \right) \Alpha >1

z.B. k=3 steps=3*n, trials=\left(\frac{4}3\right)^n

aber: bei k=2 sind im Mittel nur steps=O\left(n^2\right) nötig, trials=O\left(1\right)



-Zufallsbelegung hat t\leq n richtige Variablen (im Mittel t\approx \frac {n} 2)

Negieren einer Variable ändert t um 1, u.Z. t\rightarrow t+1 mit Wahrscheinlichkeit \frac 1 2 ::(für beliebiges k: \frac 1 k)

t\rightarrow t-1 mit Wahrscheinlichkeit \frac 1 2 ::(für beliebiges k: \frac {k-1} k)


-Wieviele Schritte braucht man im Mittel, um zu einer Lösung mit t Richtigen zu kommen?

      S\left(t\right)=\frac 1 2 S\left(t-1\right) + \frac 1 2 S\left(t+1\right) +1
      
      S\left(n\right)=0    #Abbruchbedingung der Schleife
      
      S\left(0\right) = S\left( 1\right) + 1 \Longrightarrow S\left(t\right) = n^2-t^2



      Probe: S\left(n\right)=n^2-n^2=0 
                 
             S\left(0\right) =n^2-0^2  
             
                  =S\left(1\right)+1
             
                  \;=n^2-1^2+1
             
                  \;=n^2
             S\left(t\right)=\frac 1 2 \left(n^2-\left(t-1\right)^2\right) + \frac 1 2 \left(n^2-\left(t+1\right)^2\right)+1 
             
                  =\frac 1 2 n^2-\frac 1 2 \left( t^2-2t+1\right) + \frac 1 2 n^2-\frac 1 2
             
                  =\left(t^2+2t+1\right)              
             
                  \;=n^2-t^2


Das ist das Random Walk Problem

Im ungünstigsten Fall (t=0) werden im Mittel n^2 Schritte benötigt, um durch random walk nach t=n zu gelangen.

2. RANSAC-ALGORITHMUS (Random Sample Consensus)

Aufgabe: gegeben: Datenpunkte

gesucht: Modell, das die Datenpunkte erklärt
Rubto.png

Messpunkte:

     übliche Lösung: Methode der kleinsten Quadrate
     
     \min_{a,b} 	\sum_{i} \left(a x_i + b + y_i\right)^2
     
     Schulmathematik:      Minimum\stackrel{\wedge}{=}Ableitung=0


Lineares Gleichungssystem


\frac{d}{da}\sum{i} \left(ax_i+b-y_i\right)^2=\sum{i} \frac{d}{da} \left[ax_i+b-y_i\right)^2

f\left(g\left(x\right)\right)
f\left(x\right)=x^2
y\left(a\right)=ax_i+b-y_i

=\sum_{i}2\left(ax_i+b-y_i\right)\frac{d}{da} \underbrace {ax_i+b-y_i}_{x_i}

\underline {=2\sum_{i}\left(ax_i+b-y_i\right)x_i\stackrel{!}{=}0}

a\sum_{i}{x_i}^2+b\sum_{i}x_i=\sum_{i}x_iy_i
a\sum_{i}x_i+b\sum_{i}1=\sum_{i}y_i


\frac{d}{db}\sum_{i}\left(ax_i+b-y_i\right)^2=2\sum_{i}\left(ax_i+b-y_i\right)*1



Problem: \epsilon  % der Datenpunkte sind Outlier
\Longrightarrow Einfaches Anpassen des Modells an die Datenpunkte funktioniert nicht
Seien mindestens k Datenpunkte notwendig, um das Programm anpassen zu können


RANSAC-Algorithmus

     for  l in range (trials):
          wähle zufällig k Punkte aus
          passe das Modell an die k Punkte an
          zähle, wieviele Punkte in der Nähe des Modells liegen (d.h. d_i < d_max muss geschickt gewählt werden) 
                                          #Bsp. Geradenfinden:-wähle a,b aus zwei Punkten
                                                              -berechne: |ax_i+b-y_i|=d_i
                                                              -zähle Punkt i als Inlier, falls d_i<d_ma
     return: Modell mit höchster Zahl der Inlier


     trials= \frac{log\left(1-p\right)}{log\left(1-\left(1-\epsilon\right)^k\right)}  mit k=Anzahl der Datenpunkte und p=Erfolgswahrscheinlichkeit, \epsilon=Outlier-Anteil


Erfolgswahrscheinlichkeit: p=99%

\begin{array}{|c||c|c|c|c|c|}
         Beispiel & k & \epsilon=10% & 20% & 50% & 70%\\
         \hline
         Linie\;in\;2D & 2 & 3 &5 & 17 & 49\\
         Kreis\;in\;2D & 3 & 4 & 7 & 35 & 169\\
         Ebene\;in\;3D & 8 & 9 & 26 & 1172 & 70188\\
       \end{array}


Ein Spiel: Wie viel Schritte braucht man im Mittel zum Ziel?

  geg.: 5 Plätze, 2 Personen: eine Person rückt vom einem Platz zu dem enderen Platz;
        die zweite Person wirft die Münze.
        Wenn die Münze auf Kopf landet, rücke nach rechts und wenn die Münze auf Zahl landet, rücke nach links.
        <--- Zahl                                                         Kopf-->
        Kopf: /////
        Zahl: /// 
=> mit 8 Schritten bis zum Ziel
im Mittel: bei N Plätzen braucht man N2 Schritte
all: mit N2 Schritten um N Plätze rücken
Wie viel Schritte braucht man im Mittel zum Ziel?
        S\left(N\right)=0    #wenn wir uns im Stuhl Nr.1 befinden
          
        S\left(i\right)=\frac 1 2 S\left(1 + S\left(i+1\right)\right) + \frac 1 2 S\left(1 + S\left(i-1\right)\right) = \frac 1 2 S\left(i+1\right) + \frac 1 2 S\left(i-1\right) +1 


        S\left(0\right)=1 + S\left(1\right)    #bei 0.Platz
  • Lösung:
        S\left(i\right)= N^2 - i^2
  • speziell:
        S\left(i\right)= N^2           #wenn man am ungünstigsten Platz startet

Beziehung zu randomisiertem 2-SAT

     "Platz i ": i Variablen haben den richtigen Wert,  \left(N-i\right)  sind falsch gesetzt
     S\left(\frac N 2\right)=N^2 - \left(\frac N 2\right)^2 = N^2 - \frac N 4 ^2 = \frac 3 4 N^2 
     S\left(\frac N 2\right)     # Anfangszustand

Las Vegas vs. Monte Carlo

  * Las Vegas - Algorithmen
    - Ergebnis ist immer korrekt.
    - Berechnung ist mit hoher Wahrscheinlichkeit effizient (d.h. Randomisierung macht den ungünstigsten Fall unwahrscheinlich).
  * Monte Carlo - Algorithmen
    - Berechnung immer effizient.
    - Ergebnis mit hoher Wahrscheinlichkeit korrekt (falls kein effizienter Algorithmus bekannt, der immer die richtige Lösung liefert).
Las Vegas Monte Carlo
- Erzeugen einer perfekten Hashfuktion - Algorithmus von Freiwald(Matrizenmultiplikation)
- universelles Hashing - RANSAC
- Quick Sort mit zufälliger Wahl des Pivot-Elements - randomisierte K-SAT(k>=3)(Alg. von Schöning)
- Treep mit zufälligen Prioritäten


Zufallszahlen

- kann man nicht mit deterministischen Computern erzeugen
- aber man kann Pseudo-Zufallszahlen erzeugen, die viele Eigenschaften von echten Zufallszahlen haben
* sehr ähnlich zum Hash
    "linear Conguential Random number generator"
       I_{i+1}= \left(a*I_i + c\right)mod m
       \begin{array}{ll}
        \mathrm{=> } & I_i \in [0, m-1]\\

        \end{array}


-sorgfältige Wahl von a, c, m notwendig
Bsp. m = 232
a = 1664525, c = 1013904223
"quick and dirty generator"
- Nachteile:
  1. nicht zufällig genug für viele Anwendungen
Bsp. wähle Punkt in R3
    p = (rand(), rand(), rand())


File:C:\Users\Kadirbayeva\Desktop\test1.jpeg You can put the image in a frame with a caption: