Cosinus-Ähnlichkeitsrechner - Vektorähnlichkeitsanalyse

Berechne die Cosinus-Ähnlichkeit zwischen zwei Vektoren sofort. Ein Wert von 1 bedeutet gleiche Richtung, 0 senkrecht und −1 entgegengesetzte Richtung.

Gib zwei numerische Vektoren mit gleicher Länge ein, getrennt durch Kommas oder Leerzeichen, und klicke auf Berechnen, um die Cosinus-Ähnlichkeit und unterstützende Kennzahlen zu sehen.

Cosinus-Ähnlichkeitsrechner - Vektorähnlichkeitsanalyse
Berechne die Cosinus-Ähnlichkeit zwischen zwei Vektoren sofort. Ein Wert von 1 bedeutet gleiche Richtung, 0 senkrecht und −1 entgegengesetzte Richtung.

Zahlen durch Kommas oder Leerzeichen getrennt eingeben

Zahlen durch Kommas oder Leerzeichen getrennt eingeben

Über den Cosinus-Ähnlichkeitsrechner

Die Cosinus-Ähnlichkeit ist eines der am häufigsten verwendeten Maße für die Ähnlichkeit zwischen zwei nicht null Vektoren in einem mehrdimensionalen Raum. Anders als die euklidische Distanz, die misst, wie weit zwei Punkte auseinanderliegen, konzentriert sich die Cosinus-Ähnlichkeit ausschließlich auf die Ausrichtung der Vektoren — genauer gesagt auf den Kosinus des Winkels zwischen ihnen. Das macht sie besonders nützlich, wenn die Größe irrelevant ist, die Richtung aber zählt, etwa beim Vergleich von Dokumenten unterschiedlicher Länge oder von Nutzerpräferenzprofilen mit unterschiedlichen Aktivitätsniveaus. Die Formel ist einfach: cos(θ) = (A · B) / (‖A‖ × ‖B‖), wobei A · B das Skalarprodukt der beiden Vektoren ist und ‖A‖ sowie ‖B‖ ihre jeweiligen euklidischen Beträge (Normen) sind. Das Skalarprodukt wird berechnet, indem die entsprechenden Elemente multipliziert und die Ergebnisse summiert werden. Der Betrag eines Vektors ist die Quadratwurzel aus der Summe der quadrierten Komponenten. Das Ergebnis liegt immer im Bereich [−1, 1]. Eine Cosinus-Ähnlichkeit von 1 bedeutet, dass beide Vektoren genau in dieselbe Richtung zeigen — sie sind perfekt ausgerichtet. Ein Wert von 0 bedeutet, dass sie senkrecht (orthogonal) zueinander stehen — es gibt keine Korrelation in ihrer Ausrichtung. Ein Wert von −1 bedeutet, dass sie genau in entgegengesetzte Richtungen zeigen. In der Praxis betrachten viele Anwendungen nur nicht negative Merkmale (etwa Wortfrequenzen oder Bewertungsanzahlen); dann ist die Ähnlichkeit auf [0, 1] beschränkt. In der Verarbeitung natürlicher Sprache und in der Informationssuche ist die Cosinus-Ähnlichkeit der Standardweg, um Textdokumente zu vergleichen, die als TF-IDF- oder Bag-of-Words-Vektoren dargestellt werden. Da lange Dokumente naturgemäß größere Vektorbeträge haben, würden rohe Skalarproduktvergleiche sie unfair bevorzugen. Durch die Normierung mittels Division durch das Produkt der Beträge beseitigt die Cosinus-Ähnlichkeit diesen Längenbias und konzentriert sich nur auf die proportionale Zusammensetzung der Terme. Empfehlungssysteme nutzen die Cosinus-Ähnlichkeit, um Nutzerpräferenzvektoren zuzuordnen. Wenn zwei Nutzer ähnliche Inhalte mit ähnlicher relativer Begeisterung bewertet haben — selbst wenn einer insgesamt viel mehr Inhalte bewertet hat — ist ihre Cosinus-Ähnlichkeit hoch, was auf ähnliche Vorlieben hindeutet. Dasselbe gilt für die Bilderkennung, wo Merkmalsvektoren aus neuronalen Netzen per Cosinus-Ähnlichkeit verglichen werden, um visuell ähnliche Bilder zu finden. Für diesen Rechner kannst du Vektoren beliebiger Länge eingeben, solange beide Vektoren die gleiche Anzahl von Dimensionen haben. Trenne die Werte durch Kommas oder Leerzeichen. Der Rechner zeigt die Cosinus-Ähnlichkeit, das Skalarprodukt und den Betrag jedes Vektors an, damit du die Berechnung Schritt für Schritt nachvollziehen kannst.

Beispiele für Cosinus-Ähnlichkeit

Drei repräsentative Szenarien, die unterschiedliche Grade der Vektorähnlichkeit zeigen.

VektorenÄhnlichkeitInterpretation
A = [1, 2, 3], B = [2, 4, 6]1.000000B ist ein Skalarvielfaches von A (gleiche Richtung). Die Cosinus-Ähnlichkeit = 1, unabhängig vom Skalierungsfaktor.
A = [1, 0, 0], B = [0, 1, 0]0.000000Die Standardbasisvektoren stehen senkrecht aufeinander. Skalarprodukt = 0, daher Cosinus-Ähnlichkeit = 0.
A = [5, 3, 0, 2], B = [4, 2, 1, 3]0.947758Hohe Ähnlichkeit, typisch für Dokument- oder Nutzerpräferenzvergleiche, bei denen sich die meisten Dimensionen überschneiden. A·B=32, |A|=√38≈6.164, |B|=√30≈5.477.
A = [1, 0], B = [-1, 0]-1.000000Vektoren, die genau in entgegengesetzte Richtungen zeigen, ergeben eine Cosinus-Ähnlichkeit = −1.

So verwendest du den Cosinus-Ähnlichkeitsrechner

  1. Gib den ersten Vektor in das Feld „Erster Vektor (A)“ ein, getrennt durch Kommas oder Leerzeichen, zum Beispiel: 1, 2, 3.
  2. Gib den zweiten Vektor in das Feld „Zweiter Vektor (B)“ ein. Er muss dieselbe Anzahl von Elementen wie der erste Vektor haben.
  3. Klicke auf „Ähnlichkeit berechnen“. Das Ergebnisfeld zeigt den Cosinus-Ähnlichkeitswert, das Skalarprodukt und den Betrag jedes Vektors an.
  4. Nutze die Beispielschaltflächen unter der Tabelle, um sofort vordefinierte Vektorpaar zu laden und zu sehen, wie die Berechnung funktioniert.
  5. Klicke auf „Zurücksetzen“, um alle Felder zu leeren und eine neue Berechnung zu starten.

FAQ zur Cosinus-Ähnlichkeit

Was bedeutet eine Cosinus-Ähnlichkeit von 0.85?
Das bedeutet, dass der Winkel zwischen den beiden Vektoren ungefähr 31,8 Grad beträgt, was auf eine hohe Richtungsähnlichkeit hinweist. In der Textanalyse deutet das typischerweise darauf hin, dass die beiden Dokumente einen großen Anteil ihrer Schlüsselbegriffe mit ähnlichen relativen Häufigkeiten teilen. Werte über 0,7 gelten in den meisten Anwendungen allgemein als sehr ähnlich.
Warum wird für Text die Cosinus-Ähnlichkeit gegenüber der euklidischen Distanz bevorzugt?
Die euklidische Distanz reagiert empfindlich auf die Vektormagnitude, sodass ein langer und ein kurzer Text zum selben Thema allein wegen der höheren Termzähle des längeren Dokuments sehr unterschiedlich erscheinen. Die Cosinus-Ähnlichkeit normiert die Größe heraus und konzentriert sich nur auf den Winkel, sodass Dokumente unabhängig von ihrer Länge vergleichbar sind. Diese Längeninvarianz ist der Hauptgrund, warum die Cosinus-Ähnlichkeit in textbasierten Anwendungen dominiert.
Kann die Cosinus-Ähnlichkeit negativ sein?
Ja, die Cosinus-Ähnlichkeit reicht von −1 bis 1. Ein negativer Wert bedeutet, dass der Winkel zwischen den Vektoren größer als 90 Grad ist — die Vektoren zeigen stärker voneinander weg als aufeinander zu. In Anwendungen mit nur nicht negativen Merkmalen (Wortzählungen, Bewertungen) liegen alle Ähnlichkeiten in [0, 1]; mit vorzeichenbehafteten Merkmalen wie mittenzentrierten Bewertungen oder Sentimentwerten sind negative Ähnlichkeiten jedoch möglich und sinnvoll.
Was passiert, wenn ein Vektor nur aus Nullen besteht?
Die Cosinus-Ähnlichkeit ist mathematisch nicht definiert, wenn einer der Vektoren ein Nullvektor ist, da im Normierungsschritt eine Division durch null auftritt. Dieser Rechner zeigt in diesem Fall einen Fehler an. In der Praxis bedeutet ein Nullvektor in der Textverarbeitung meist, dass ein Dokument keines der Vokabularwörter enthalten hat, was für einen Ähnlichkeitsvergleich selten nützlich ist.
Wie viele Dimensionen können die Vektoren haben?
Dieser Rechner unterstützt Vektoren beliebiger Länge, begrenzt nur durch die Browserleistung. In der Praxis werden in realen Anwendungen oft Tausende oder sogar Millionen von Dimensionen verwendet (z. B. Wort-Embedding-Räume). Die mathematische Formel bleibt unabhängig von der Dimensionalität identisch. Beide Vektoren müssen exakt die gleiche Anzahl von Elementen haben, damit die Berechnung gültig ist.
Ist Cosinus-Ähnlichkeit dasselbe wie Korrelation?
Cosinus-Ähnlichkeit und Pearson-Korrelation sind eng verwandt, aber nicht identisch. Die Pearson-Korrelation zentriert zuerst jeden Vektor auf seinen Mittelwert (zieht den Mittelwert seiner Elemente ab), bevor die Cosinus-Ähnlichkeit der zentrierten Vektoren berechnet wird. Wenn deine Vektoren bereits mittenzentriert sind, liefern beide Maße dasselbe Ergebnis. Bei rohen Merkmalsvektoren ohne Mittenzentrierung unterscheiden sich Cosinus-Ähnlichkeit und Korrelation in der Regel.