Zum Inhalt springen

Independence

Mitglieder
  • Gesamte Inhalte

    6
  • Benutzer seit

  • Letzter Besuch

  1. Ich würde so vorgehen: Ich würde zuerst mal die Häufigkeit, mit der ein Tag vorkommt ermitteln. Dann würde ich zusammen mit der Häufigkeit und eventuell anderen Parametern (wie zb. Datum) eine Gewichtung der Tags erstellen. Nun würde ich mir ansehen, wie die Taggewichtungen verteilt sind (wie du sagstest warscheinlich eine Power-law-verteilung), und anhand dessen eine passende Interpolation zur Größenermittlung durchführen. Wäre dieses Verfahren i.A. korrekt, oder vergesse ich etwas?
  2. ok und könntest du das mit der Auswertung noch etwas näher erklären? was genau passiert bei der Datenanalyse? muss ich nun die Daten im Rahmen der Auswertung gewichten? generell: mit welchen schritten würdest du beginnen, wenn du die mathematische struktur für eine tag cloud entwickeln müsstest?
  3. Entschuldige wenn ich so dumm frage, aber reicht es als auswertung nicht auch, einfach die häufigkeit eines Tags zu zählen? Und wo ist der Unterschied zwischen Auswertung und Gewicht eines Tags?
  4. Aber du hast ja von einer Auswertung am Ende deines 1. Postings gesprochen? Was meinst du denn dann damit?
  5. Erstmal vielen Dank für all die tollen Antworten! besonders flashpixx hat mir schon um einiges weitergeholfen @flashpixx du sagst ja, dass man zuerst eine formel finden muss, um die "gewichtung" des Tags festzulegen, bevor man anhand der gewichtung die Größe errechnet? das klingt sehr plausibel, danke nur was mich noch verwirrt... du sagst, eine logarithmische darstellung sei bei der Gewichtung der Tags sinnvoll, und die größe der tags soll man dann linear interpolieren Tag Clouds : Linear vs Logarithmic Interpolation warum ist dann hier die rede von "logarithmischer interpolation". Das Interpolationsverfahren, ist doch, wenn ich richtig verstanden habe, nur das verfahren, mit dem man dann die endgültige schriftgröße der gewichtung bestimmt, und das ist doch linear problemos durchzuführen oder?
  6. Ich bin neu hier, also zuerst mal ein freundliches Hallo an alle! Ich hoffe, dass hier ist die richtige Rubrik für mein Thema. Ich bin 17 Jahre alt, und mache gerade ein Ferialpraktikum bei einer Softwarefirma. Meine Aufgabe ist es, eine konzeptionelle Arbeit über Tag Clouds zu schreiben. Ich erbitte eure geschulten Gehirne, meine Verwirrung bezüglich der Formeln aufzulösen. Tag Clouds werden hier warscheinlich viele kennen; es handelt sich um sogennante Schlagwortwolken (schauderhafte Übersetzung). Eine Tag Cloud greift auf ein System zu, auf dem Tags gespeichert sind (so wie Flickr, Delicioso, Technorati,...) und stellt die Tags, gemäß einer Hierarchie dann unterschiedlich groß (oder farbig, oder unterstrichen,...) dar. Die Hierarchie der Tags kommt bei einer klassischen Tag Cloud durch die Häufigkeit des Tags im System zustande = Häufigere Tags sollen größer dargestellt werden. Nun habe ich mir die Formel gesucht , die die relative Größe eines Tags in der Wolke berechnet (Wikipedia): si = fmin + ((ti-tmin)*(fmax-fmin)/(tmax-tmin)) • si: Anzuzeigende Fontgröße • fmax: maximale Fontgröße • ti: Häufigkeit • tmin: minimale Häufigkeit • tmax.: maximale Häufigkeit • fmin : minimale Fontgröße Diese Formel führt eine lineare Interpolation zwischen den Wertepaaren (tmin/fmin) und (tmax/fmax) durch, das heisst im Klartext sie verbindet die beiden Punkte mit einem geraden Strich (mithlife einer Funktion). Das klingt alles sehr plausibel für mich. S So könnte man abhängig vom "Gewicht" (also der Häufigkeit) ti eines Tags dessen individuelle Größe berechnen. Nun bin ich aber wieder und wieder auf andere Internetseiten ( wie diese: Tag Cloud Font Distribution Algorithm | Echo Chamber Project) gestoßen, die sich AUCH mit der Mathematik einer Tag Cloud mit linearer Größenformel auseinandersetzen, aber völlig anders vorgehen. Immer wieder, wie auch bei der Echochamberprojekt Seite, ist die Rede von "Thresholds" , sogennanten Schwellenwerten. Wenn ich das richtig verstanden habe, wird hier die Differenz aus Maximalgewicht und Minimalgewicht eines Tags einfach durch die gewünschte Anzahl an Größenordnungen dividiert, um somit in weiterer Folge "Größenbereiche" zu schaffen. Soll heißen, wenn das Gewicht eines Tags sich in einem gewissen Intervall befindet, dann wird ihm automatisch eine bestimmte Größe zugeordnet und wenn es einen vorher berechneten "Threshold" überschreitet, bekommt es die nächstgrößere Größe. Nun klingt auch DAS für mich plausibel, was ich aber (auch nach langem Überlegen) nicht verstehe, ist, wie ich diese beiden Konstruktionsansätze vereinen soll! Wenn ich den Konstruktionsansatz mit den Schwellenwerten nehme, wäre doch die oben gennante Formel für mich völlig unnötig, oder? Dann müsste ich doch nur das Gewicht eines Tags nehmen und dem entsprechenden, vorher berechneten Intervall zuordnen, um eine passende Größe zu erlangen? Ich werde trotzdem das Gefühl nicht los, dass es sich hierbei nicht um 2, sondern um 1 Theorie handelt, schon allein, weil mir diese beiden Formeln während meiner Internetrecherche immer wieder unter dem selben Schlagwort (Linearverteilung der Größe bei Tag Clouds) über den Weg laufen. Oder handelt es sich hier eventuell um zwei völlig voneinander unabhängige Möglichkeiten, die Größe der Tags in einer Cloud zu berechnen? Ich hoffe irgendjemand von euch tut sich an, diesen langen Text zu lesen, und kann mir vielleicht weiterhelfen. Im Vorhinein ein großes DANKE für jede noch so kleine Hilfestellung!

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...