geldo.de – Weblog

Web und SEO, Jazz und Grüntee

Tag-Archiv für 'tagging'

Allgemein &Hypermedia &postaweek2011 | 15 Jul 2011

Google nippt am Foto-Wein

Photovine ist ein interessantes Experiment, das der Maschine Google ein Bildergedächtnis und Semantik beibringen könnte.

Der Nutzer lädt ein Bild hoch und versieht es mit Schlagworten. Gleichgesinnte können daraufhin eigene Fotos daran anknüpfen, die sie mit den Schlagworten in Verbindung bringen:

Eine Assoziationskette entsteht.

Share

Allgemein &postaweek2011 | 10 Mrz 2011

Eingeschlossen in der Relevanz-Blase – Zeit für die Dusel-Maschine

Bubble World

Leben in einer abgekapselten Welt - schön, schön einfältig!

Kaum, dass wir persönliche Ergebnisse von Suchdiensten erhalten, werden schon die ersten Kritikerstimmen laut. Credo: Wenn wir nur die Informationen zugesteckt bekommen, die wir tatsächlich auch beachten, erweitern wir unseren Horizont nicht mehr. Prinzip Chinesische Mauer – wir leben in unserem eigenen Mini-Universum und schauen nicht mehr über den Tellerrand hinaus. Und das bei so einem innovativen Medium wie dem World Wide Web!

Nun, das Problem ist folgendes: Wir würden ja z.B. gerne “Krieg und Frieden” lesen, greifen aber dann doch zum “Lustigen Taschenbuch” oder der Fernbedienung. Das zeichnen die schlauen Algorithmen der diversen Web-Dienste natürlich geflissentlich auf und präsentieren uns als Folge dessen nur noch intellektuelles “Junk Food” und so entstehen ungewollt Scheuklappen, die das Blickfeld einengen. Doch irgendwie muss dem anschwellenden Informationsstrom Einhalt geboten werden, damit der Informationssuchende keine nassen Füsse bekommt.

Das Thema Relevanz habe ich hier in diesem Zusammenhang bereits des öfteren behandelt. Relativ neu und dementsprechend spannend ist der aufkommende Begriff Serendipidität, glücklicher Zufall – weniger akademisch ausgedrückt, oder einfach Dusel im süddeutschen Sprachraum, der derzeit im Zusammenhang mit Relevanz öfters genannt wird.

Serendipidität

Grafik nach "The Information Discovery" Matrix von Mahendra Palsule in "The Age Of Relevance"

Die Dusel-Maschine liefert mir demzufolge, indem sie den Relevanz-Filtern ein Rauschen hinzufügt, Ergebnisse, an die ich gar nicht gedacht hätte, die aber dennoch für mich interessant sind. In meinem Fall ist dies StumbleUpon und Twitter.

StumbleUpon überrascht mich immer noch mit Ergebnissen aus den weit gesteckten Interessensbereichen, die ich selbst so eingestellt habe. Es ist jedoch davon auszugehen, dass die schlauen Filter den Streuungsfaktor weiter einengen werden, sofern ich selbst nicht eine überraschende Handlung vornehme.

Twitter benutze ich in der Rohform quasi, direkt aus dem Browser und lese meine 15 bunt gewürfelten Quellen, die zwar meist aus der Technologie kommen, aber auch einen Farmer aus Alabama und eine “Soccer mom” beinhalten, eben wegen dem Streuungsfaktor der Ergebnisse.

Einige Stimmen verlangen die Freigabe und Einsicht in die verwendeten Algorithmen der Dienste oder einen Streuungsregler, mit dem den Suchergebnissen ein gewisser Anteil Zufallsrauschen hinzugefügt werden könnte. Bis dahin müssen wir jedoch selbst auf die gesunde Mischung unserer Informationsdiät achten.

mashup

Fachartikel und ein LTB - die Mischung macht's!

Wenn wir also tatsächlich “Krieg und Frieden” lesen wollen, nimmt uns das niemand ab. Ein Hörbuch wäre da ein praktikabler Kompromiss. Was unseren Konsum angeht, sind wir aber genau so selbstverantwortlich, wie wir das für das Hinterlassen unserer Datenspur auch sind. Und so beisst sich die Schlange in den Schwanz, denn das eine bedingt auch hier das andere.

Share

Allgemein &postaweek2011 | 07 Mrz 2011

Rezepte häppchenweise – Publizieren mit Microdata

Fruit Tray

Mundgerechte Happen - für unsereins die Obstschale. Maschinen bevorzugen Microdata, Microformats oder RDFa.


Angeregt vom Artikel Slice and dice your recipe search results im offiziellen Google Blog habe ich mich entschlossen mich (endlich einmal) mit der semantischen Kennzeichnung von Texten im Web auseinanderzusetzen.
Natürlich sollen Texte im Web zuerst für Menschen und erst dann für Maschinen gestaltet werden. Mit ein wenig Aufwand jedoch, lassen sich z.B. Rezepte, Adressen oder auch Produkte auch für Maschinen besser aufbereiten. Möglich ist die bessere Lesbarkeit für Google und Co. durch den Einsatz von RDFa, Microformats und Microdata.
Ich habe mich hierbei für das Microdata-Format entschieden, das im Wired Weblog Webmonkey recht gut beschrieben wird. Grund dafür ist der, dass die Strukturierung mit Microdata vermutlich die simpelste Variante der dreien ist und sich (laut Webmonkey) wohl als Standard in HTML 5 durchsetzen wird.
Über Microdata wacht die WHATWG, die Web Hypertext Application Technology Working Group, die von Mitarbeitern Apples, der Mozilla Foundation und Opera Software 2004 mit dem Web-Autor als Zielgruppe ins Leben gerufen wurde.
Angeregt durch die leckere Obstschale oben und da ich mich erst einmal auf die Strukturierung mit Microdata konzentrieren muss, beschränkte ich mich auf ein einfaches Rezept: Ein Obstsalat.
Ja, ich schreibe nebenher als Co-Autor Rezepte für einen Küchen-Weblog auf WordPress.com.
Sicherheitshalber habe ich das Rezept diesmal im externen Editor Dashcode erstellt. Das war auch besser so, denn WP.com entfernt die mühsam eingepflegten Attribute einfach beim Abspeichern. Auf diesem Weblog hier (auch WordPress, aber selbst gehostet) bleiben die Formatierungen jedenfalls im Quelltext erhalten.
Leider sieht das span-Tag in Verbindung mit einer Liste trotzdem nicht gerade schön aus. Was folgt ist jedenfalls das Ergebnis meiner Strukturierungsarbeit:

Obstsalat mit Honigquark

Von

Obstsalat mit Honigquark

Vitamine im Winter


Auch im Winter gibt es bei und Obstsalat. Als Obst wird das genommen, was gerade gut zu bekommen ist – die Orangenzeit ist mittlerweile fast vorbei und die ersten Erdbeeren (und Spargel) lauern bereits in den Startlöchern. Natürlich gehört auf den Obstsalat normalerweise (Sprüh-)Schlagsahne oder Joghurt. Interessant und winterlicher ist die Variante mit Honigquark.
Zubereitungszeit:
Kochzeit:
Gesamte Zeit:
Portionen: 3
Zutaten:


  • Äpfel:
    1 Apfel

  • Mango:
    1 Mango

  • Bananen:
    1 Banane

  • Kiwi:
    1 Kiwi

  • Ananas:
    1 Ananas

  • Zitronensaft:
    2-3 El

  • Honig:
    2-3 El

  • Halbfettquark:
    250 g

  • Milch:
    2-3 El

Zubereitung:

  1. Obst säubern und in eine grosse Schüssel schnippeln.
  2. Etwas Honig dazugeben und mit dem Zitronensaft beträufeln und mehrmals durchmengen.
  3. Den Quark in eine weitere Schüssel geben und mit der Milch und dem Honig verrühren.
  4. Vor dem Servieren den Obstsalat nochmals durchmengen. Nach Lust mit gehackten Nüssen, Mandeln oder Rosinen/ Sultaninen bestreuen.

Im Quelltext sieht das dann (in Google Chrome) so aus:

Der Quelltext, WP.com lässt die Attribute jedoch weg und das Gepfriemel ist für die Katz.


Fazit: Für eine standardisierte Erfassung strukturierter Texte, die von Google und Co. besser ausgelesen werden können, ist Microdata recht gut geeignet, sofern ein Grundverständnis an HTML und etwas Geduld für den zusätzlichen Arbeitsaufwand mitgebracht wird. Web-Autoren werden sich dennoch unnötigerweise schwer tun, solange Microdata noch nicht in das CMS der Wahl integriert ist.

Share

Allgemein | 28 Okt 2010

Probieren geht über Studieren

Probieren geht über Studieren – dieses Sprichwort kenne ich aus meiner Kindheit. Während meines Studiums wurde es hin und wieder auch in “Kopieren geht über Studieren” abgeändert. Eine ähnliche Redensart scheint es im Englischen nicht zu geben, denn Chris Dixon kommt ganz überraschend zu folgendem Schluss:

You need to use social services to understand them

cdixon.org – chris dixon’s blog / You need to use social services to understand them

Und wird begeistert ge-retweetet (ist das der richtige denglische Ausdruck?). Nun ja, es lässt sich erst wirklich fundiert über etwas berichten, das am eigenen Leibe gespürt wurde – ausprobiert oder angetestet eben. Ich selbst war bis vor eineinhalb Jahren auch nicht sonderlich begeistert vom Mitmach-Web Web 2.0. Das änderte sich schlagartig, nachdem ich das Buzzword “Web 2.0″ in meine Diplomarbeit aufnahm.

(In Zusammenhang mit Web 2.0 bevorzuge ich persönlich den Begriff “Trotzschrei”)

Jedenfalls, um eine runde Arbeit abzuliefern, musste ich recherchieren – und Web 2.0-Dienste ausprobieren. Ich war begeistert und staunte, was mir bis dato alles entgangen war. Daher mein Appell:

Probiert es doch selbst einmal aus!

Die meisten Dienste lassen die Anmeldung über ein Pseudonym (das sich später immer noch ändern lässt – oft sogar inklusive des Geschlechts) zu und eine separate E-Mail-Adresse für diese Tests ist auch nur einen Klick entfernt.

In diesem Zusammenhang möchte ich auch ganz unverschämt für meinen neuen Weblog auf WordPress.com Werbung machen:

Weissblaue Noten - mein privater Weblog

Bei diesem sehr persönlich gefärbten Weblog auf WordPress.com kommentiere ich Erlebnisse des Alltags in meiner neuen Heimat.

Ich recherchiere derzeit für ein WordPress Buch, das ich zu schreiben gedenke. Zu WordPress gehört das Programm, das auf WordPress.org zu haben ist und der Dienst unter WordPress.com. Und erst nachdem ich Letzteren ausprobiert habe, kann ich sagen, wie gut er wirklich ist. Vermutlich würde ich mein Diplom, wenn ich es jetzt schreiben würde, um diesen Dienst herum aufbauen, anstatt den Weblog, der Gegenstand meiner Arbeit war, selbst zu betreiben.

Ohne grössere weiter Umschweife hier nun die Web-Dienste, die mittlerweiler fester Bestandteil meines Alltags wurden:

  • Dienste von Google – über Google lässt sich sagen, was man mag, die Anwendungen sind jedenfalls sehr gut:
    • Gmail – die Einstiegsdroge, der Großteil meines E-Mail-Volumens läuft über diesen Dienst. Wer ein Google-Benutzerkonto hat, aka Gmail-Account, dem stehen alle weiteren Google-Dienste zur Verfügung.
    • Google Docs – Text, Tabellenkalkulation, Präsentationen, gegenseitige Nutzung von Daten und Dateien – oft braucht es nicht mehr, um alleine oder in der Gruppe erfolgreich an verschiedensten Projekten zu arbeiten und die Tabellenkalkulation hat ein paar nette Tricks auf Lager.
    • iGoogle – die personalisierte Google-Startseite, alle Anwendungen auf einem Blick.
    • Google Calendar – Googles Terminplaner – hat mich soeben an meine Termine erinnert.
    • Google url shortener – goo.gl – zum Kürzen langer URLs – Google direkt mit Hyperlinks füttern.
    • Panoramio – hier hinterlasse ich virtuelle Brotkrumen auf der Landkarte.
    • YouTube – gehört auch zum Google Imperium – der gelegentliche Clip zur Entspannung oder zum Speichern interessanter (Technologie) Videobeiträge.
  • Auch Yahoo! bietet jede Menge nützlicher Dienste an – hier meine kleine Auswahl:
    • Flickr – für mich der Web-Dienst zum Speichern, Suchen und Weiterleiten von Bilddateien schlechthin. Die Flickr Gruppen sind ein kleines Ökosystem für sich.
    • Delicious – das Lesezeichen-Arbeitstier. Ich kann mir nicht vorstellen, wie ich mit meinen derzeit knapp 900 Lesezeichen sonst zurechtkäme. So sollte eine Lesezeichen-Verwaltung sein, ohne Delicious machen Lesezeichen keinen Sinn. Zwar habe ich bei Delicious keine Freunde zum gemeinsamen Lesezeichen-Austausch (wink, wink), jedoch ändert das nichts an dem rundum klasse Dienst.
  • Natürlich gibt es auch noch weitere interessante Dienste verschiedener Anbieter, die sich in meinen Alltag eingeschlichen haben:
    • Twitter – viel Lärm und wirklich gute brandaktuelle Informationen mittendrin, der clevere Mix der Nachrichtenkanäle entscheidet zwischen Top oder Flop!
    • SlideShare – nicht der einzige Dienst zum Konvertieren, Einbetten und Austauschen von Präsentationen und Dokumenten (spontan fallen mir da DocShare und Scribd ein) – ich kann nicht auf allen Hochzeiten gleichzeitig tanzen und SlideShare ist nach eigenen Angaben hier der dickste Fisch im Teich.
    • Photoshop.com – Der Platzhirsch auf den Schreibtischen professioneller Bildbearbeiter, derer die sich dafür halten und Raubkopierer. Ich raubkopiere nicht, also habe ich keinen Photoshop. Doch den gibt’s ja online. Richtig gelesen, für die gelegentliche Bildbearbeitung (von derzeit leider nur JPEG-Dateien) reicht die Online-Anwendung vollkommen aus und funktioniert auch ohne Registrierung – nette Effekte inklusive. Wer sich dennoch anmeldet, bekommt 2 GB Speicher spendiert, eine Flickr-ähnliche Fotoverwaltung und einen Organizer, mit dem sich auch die Bilder auf Flickr, Facebook, Picasa und Photobucket verwalten lassen.
    • WordPress – ein simpler Weblog oder ein CMS als Dienst oder zum selber Betreiben. Wird auch professionellen Ansprüchen gerecht.  Habe ich bereits weiter oben mit Lobhudeleien bedacht.
    • Xing – das Netzwerk für die Arbeitswelt, hier versuche ich erst seit kurzem Fuß zu fassen.
    • Facebook – die Erfogsstory um Facebook-Gründer Mark Zuckerberg wurde unlängst sogar verfilmt. Mir ist es eigentlich egal, wieviel Freunde Herr Zuckerberg nun tatsächlich hat, Facebook nervt mich derzeit eher, als dass es mich erfreut. Facebook ist angeblich für Konsumenten, Twitter für Kreative. Da bevorzuge ich doch Twitter. IMHO lassen sich die beiden ohnehin nicht vergleichen. Praktisch ist jedoch Facebook Connect, mit dem ich mich auf weiteren Seiten anmelden kann, ohne eine weitere Registrierungs-Prozedur absolvieren zu müssen. Twitter Benutzern wird diese Option jedoch auch oft angeboten. Ein Unentschieden also. Die Facebook-Spiele sind recht amüsant, wer jedoch nicht über sehr viel freie Zeit verfügt, sollte von Spielen, die auf -Ville oder -Wars enden, am besten gleich die Finger lassen. Tu es nicht!

Habe ich einen interessanten Dienst ausgelassen oder einen ungerechtfertigterweise zu sehr über den grünen Klee gelobt? Konstruktive Kritik ist gerne gesehen.

Share

Hypermedia | 02 Mai 2010

Web-Suche, Suche in Echtzeit, zukünftige Web-Suche

Share

SEO-Tests | 05 Feb 2010

SEO-Nudeln – Test Image-Hosting und Tagging

Fresh spinach pasta on Flickr - uploaded by Vincent Ma

Bildquelle: http://www.flickr.com/photos/thevince/ Lizenz: CC BY-NC-SA 2.0



Regelmässige Leser dieses Weblogs werden sich letzten Monat über einige seltsame Artikel gewundert haben. Es handelte sich hierbei um ein paar SEO-Tests, die als Nebenprodukt meiner Diplomarbeit entstanden sind. Aus persönlicher Neugierde heraus, habe ich einige davon in Angriff genommen und wenn mir weiterhin etwas Zeit bleibt, werden weitere folgen.
Ohne grössere Umschweife nun das Ergebnis des Tests Image-Hosting und Tagging:

In diesem Test sollte untersucht werden, welche Art des Image-Hostings verwendet werden soll, damit eine Bilddatei sowohl bei der Web- als auch bei der Bilder-Suche optimal platziert wird. Dazu wurde ein Foto bei mehreren Image-Hosting-Services (Flickr, Picasa und Photobucket) und in einen WordPress Weblog hochgeladen (inkl. Erstellung eines Artikels) und mit entsprechenden Schlagworten (Tags) und einer Beschreibung versehen. Bei der Web- und Bildersuche wurden bevorzugt Ergebnisse des Weblogs vor Flickr angezeigt. Weitere Ergebnisse kamen dadurch zustande, dass dritte Websites (z.B. MyBlogLog, Flickriver) den Flickr-Datenstrom nach Schlagworten geordnet auslesen und auf diese Weise zusätzliche Listeneinträge erzeugen. Die Testergebnisse lassen darauf schliessen, dass eine Bilddatei besonders gut in den Google-Suchergebnissen platziert und darüberhinaus im WWW publiziert wird, wenn sie bei Flickr gehostet wird und in einen Weblog-Artikel eingebunden ist.

Die komplette Testanordnung sowie das Protokoll der Ergebnisse kann in diesem Dokument eingesehen werden.

Share

Allgemein &Fortschritt Diplomarbeit | 28 Aug 2009

Modell einer zukünftige Web-Suche – aktualisiert

Modell einer zukünftigen Web-Suche

Modell zukünftige Web-Suche – Originally uploaded by Hank Mobley

Gestern Nacht bis heute in den frühen Morgenstunden saß ich an dieser Zeichnung. Warum immer nachts?
Die Überlegungen zu diesem Modell sind folgende:
Eine Echtzeit-Suche, so wie sie z.B. derzeit von TwitterSense (Quelle: http://www.techcrunch.com/2009/08/27/twittersense-its-coming/) entwickelt wird, kann die konventionelle Suche, die auf Archiven basiert, (zumindest vorerst) nicht ersetzen.
Eine Bereicherung für Informationssuchende ist die Suche in Echtzeit auf jeden Fall. Ein Modell, das derzeitige Suchmöglichkeiten kombiniert, könnte wie folgt aussehen:
Der Benutzer stellt sich seinen Informationsstrom aus unterschiedlichen Kanälen zusammen. Die Echtzeit-Suchmaschine setzt Zeiger auf Einträge, die von Interesse sein könnten. Wird eine Information für wertvoll gehalten (oder auch nur, um später in Ruhe gelesen werden zu können), wandert sie ins persönliche Archiv, in dem Schlagworte und Bewertungen vergeben werden können und das natürlich selbst über Suchfunktionen verfügt (ähnlich Delicious).
Parallel dazu existiert natürlich noch ein globales Web-Archiv des gesamten Datenstroms (z.B. Google). Aus diesem können ebenso Informationen gezogen werden. Mundpropaganda vs. Bibliothek quasi.

Interessant ist hier die Schnittstelle zwischen persönlichem und globalem Archiv. Hier werden die Informationen bewertet, verglichen und berechnet. An diesem Schnittpunkt setzen Lösungen wie WolframAlpha und auch Wikis an. Ergebnisse, die sich hier ergeben, können wieder in den Datenstrom einfliessen.

Update: Twine ist bereits daran ein ähnliches Konzept (mit APIs) zu realisieren:

http://www.techcrunch.com/2009/09/18/sneak-peak-at-t2-twines-semantic-search-engine/

Share

Fortschritt Diplomarbeit &Vorbereitung | 27 Aug 2009

Model einer zukünftigen Web-Suche – Skizze

Skizze

Modell-Web-Suche-Zukunft – Originally uploaded by Hank Mobley

Da bin ich mal für knapp zwei Stunden komplett ungestört, fliegt mir diese Skizze vom Kopf in den Schoß. Diese Illustration deckt ca. ein Drittel meines vorletzten Kapitels, das ich derzeit bearbeite. Mit OmniGraffle werde ich sie demnächst ins Reine zeichnen. Aktualisierung folgt!

Share

Fortschritt Diplomarbeit &Migration | 29 Mai 2009

Batz – Leuchtsysteme & Handels GmbH » Arbeitsplatzleuchten

Maschinen-Schutzrohrleuchten T 70 mit integriertem EVG

Batz – Leuchtsysteme & Handels GmbH » Arbeitsplatzleuchten

Ein Anfang ist gemacht, die kompletten Arbeitsplatzleuchten (9 Artikel) sind nun eingepflegt (und neu strukturiert), damit die Crawler etwas in Schwung kommen. Zuvor habe ich noch den Ist-Stand des alten Webauftritts (lupenleuchtsysteme.de) anhand von 15 Schlagwörtern überprüft. Interessant an unten aufgeführter Liste ist, dass der neue Webauftritt (batz-leuchtsysteme.de) bei Punkt 8 (control leuchtsysteme) bereits auf Platz 1 und Punkt 4 (batz leuchtsysteme) immerhin auf Platz 4 ist.

  1. arbeitsplatzsysteme licht => Platz 1 Google, 2009-05-29
  2. leuchtsysteme => Platz 5 Google, 2009-05-29
  3. lupenleuchtsysteme => Platz 1 Google, 2009-05-29
  4. batz leuchtsysteme => Platz 1 Google, 2009-05-29
  5. lupen control => Platz 7 Google, 2009-05-29
  6. büroleuchten beratung messung => Platz 3/4 Google, 2009-05-29
  7. arbeitsplatzsysteme beleuchtung => Platz 6 Google, 2009-05-29
  8. control leuchtsysteme => Platz 3 Google, 2009-05-29
  9. batz augsburg => Platz 9 Google, 2009-05-29
  10. kostenlose teststellung => Platz 6 Google, 2009-05-29
  11. lupen aplanat => Platz 8 Google, 2009-05-29
  12. lupen qualitätssicherung => Platz 15 Google, 2009-05-29
  13. teststellung lupen => Platz 7 Google, 2009-05-29
  14. arbeitsplatzleuchten => Platz 4 Google, 2009-05-29
  15. led maschinenleuchte => ?

Leider hat aus irgendeinem Grund das automatische Publizieren nicht komplett funktioniert, so dass ich doch die restlichen Entwürfe manuell publizieren musste.

Share

Allgemein | 12 Mai 2009

Hypothese III Tagging

Meta Informationen sind wichtig, um Semantik zu ermöglichen. Semantik ist ein besonders wichtiger Aspekt des späten Web 2.0 oder angehenden Web 3.0 (Wainewright 2005-11-29).
Google mag Meta-Tags!
Dennoch sind Meta-Tags – so wie sie früher mit der Gießkanne über den eigentlichen Inhalt einer Webseite gekippt wurden – der falsche Weg. Was Google mag ist manuelles Tagging, weniger, dafür genauere Tags und diese von einem Menschen eingegeben.
Goggle will lernen Beziehungen zu erkennen. Das kann z.B. durch das Auslesen der vielen Möglichkeiten zum Tagging geschehen, die Google selber anbietet wie z.B.  Picasa, Notes, Bookmarks, ect. oder von anderen Anbietern, die es aber ebenso gut auslesen kann wie Flickr, Delicious o.ä.

Share

Ältere Einträge »