Das neue Indexing System von Google – genannt Caffeine – ist nun offiziell in allen Datencentern live und von Google bestätigt. Der neue Index liefert 50% aktuellere Resultate als der alte Index und ist um einiges größer und schneller.
Google beschreibt Caffeine folgendermassen (Zitat, in Englisch):
With Caffeine, we analyze the web in small portions and update our search index on a continuous basis, globally. As we find new pages, or new information on existing pages, we can add these straight to the index. That means you can find fresher information than ever before—no matter when or where it was published.
Caffeine lets us index web pages on an enormous scale. In fact, every second Caffeine processes hundreds of thousands of pages in parallel. If this were a pile of paper it would grow three miles taller every second. Caffeine takes up nearly 100 million gigabytes of storage in one database and adds new information at a rate of hundreds of thousands of gigabytes per day. You would need 625,000 of the largest iPods to store that much information; if these were stacked end-to-end they would go for more than 40 miles.
Wenn man nach aktuellen Themen wie z.B. WM 2010 und Varianten damit sucht, macht das Suchen gleich um einiges mehr Spaß und man kann die Verbesserungen besonders gut feststellen. Glückwunsch Google zum neuen gelungenen Index!
Mich hat ja schon immer mal interessiert, wie die Büros bei Google aussehen. Bei Ignant und Fubiz habe ich welche gefunden, die einen fast vom Hocker hauen. Es sind wohl Fotos der Büros in Mountain View, Californien und Zürich in der Schweiz. Schöne Ideen, klasse Einrichtung, viel bunt und ne Menge für die Pausen zwischendurch. So ein Büro wär was.. Chef wie sieht’s aus?
Google wird Twitter nun in Realtime in seinen Index bzw. die Suche integrieren. Was ist daran neu? Sicher, einige werden jetzt sagen “Mm.. Tweets habe ich doch schon im Google-Index gesehen!”. Klar, aber nicht in Realtime. D.h. du zwitscherst bzw. twitterst etwas und gleich danach, quasi sofort, wird der Tweet in die Suche integriert. Jedenfalls hat sich Google gestern mit Twitter geeinigt, die Updates von Twitter direkt in die Such-Resultate aufzunehmen. Bin gespannt, wie sich das auf die Suche und vorallem SEO, die Suchmaschinenoptimierung, auswirkt. Ich freue mich drauf, let’s go GoogTwittler!
Es macht immer – und nicht allein für SEO – Sinn, wenn eine Website nur unter einer Domain erreichbar ist. Das realisiert man am besten mit einer Weiterleitung der kompletten Domain mit z.B. www. auf die Domain ohne www. Nutzt man als Webserver nginx, kann man mit folgenden Zeilen eine Weiterleitung ganz easy einrichten:
Das ganze packt man in die Konfiguration eines Server bzw. VirtualHosts und schon ist die Domain nur noch ohne www. und unter einer Adresse – hier deine_domain.com – erreichbar. Alles andere wird auf diese Domain weitergeleitet.
Anhand dieser Zeilen könnt Ihr die Weiterleitung ganz einfach auf Eure Bedürfnisse anpassen. Viel Spaß!
Das neue Experiment von Google in den Google Labs ermöglicht schnelleres Überfliegen und Lesen der aktuellen Online-News-Welt. Man kann sich in Sekunden einen Überblick über das aktuelle Geschehen verschaffen. Ermöglicht wird dies mit Screenshots der jeweiligen Websites, die Google kategorisiert in News-Bundles zur Verfügung stellt. Das Navigieren durch die jeweiligen Seiten geht rasend schnell. Auf Klick gelangt man zur Großansicht zum Anlesen und schließlich zur Original-Website der Informations-Quelle.
Um dies zu realisieren, geht Google eine Partnerschaft mit vielen großen Verlegern ein, die an den Werbeeinnahmen beteiligt werden. Darunter New York Times, the Atlantic, the Washington Post, Salon, Fast Company, ProPublica und Newsweek.
Ich bin gespannt wie sich Fast Flip entwickelt und ob es eine bleibende Erweiterung oder sogar Alternative zu Google News werden kann. Toll finde ich wirklich wie schnell man hier an Informationen kommt, ohne erst die jeweilige Seite zu besuchen und etliche Kilobyte downzuloaden.
Als ich heute morgen die erste Google-Suche abfeuerte, dachte ich schon ich hätte ausversehen eine Brille auf oder mein Firefox sei kaputt. Die Suchbox (das Feld für die Sucheingabe) war erheblich größer als gewohnt. Auch der Button daneben bzw. auf der Google-Startseite darunter waren in der Größe angepasst. Zuerst dachte ich mir, Google testet wieder etwas. Nein! Ebenlasich, das Google bzw. Marissa Mayer von Google dies in einem Blog-Post offiziell bestätigt hat:
Search, that is. For us, search has always been our focus. And, starting today, you’ll notice on our homepage and on our search results pages, our search box is growing in size. Although this is a very simple idea and an even simpler change, we’re excited about it — because it symbolizes our focus on search and because it makes our clean, minimalist homepage even easier and more fun to use. [..]
Ich finde es klasse! Hab eh ein Faible für große Eingabefelder, Überschriften und großen Text im Allgemeinen. Nicht, weil ich Probleme mit den Augen habe, sondern weil ich keine haben möchte und es einfach besser aussieht. Danke Google, bitte weiter so!
Das hat mich schon immer mal interessiert, wie wohl das Innere eines Rechenzentrums bei Google aussieht. Man sieht den gesamten Aufbau inkl. Stromversorgung, Kühlung, sogar die Server und einiges mehr. Schaut wirklich alles sehr effizient aus. Mit meinem Serverraum kann es jedoch nicht mithalten: Weniger Stromverbrauch und schnellere Suche Indizierung :-) Aber seht selbst:
Über SSL indizierte Seiten können in Google und anderen Suchmaschinen Probleme mit doppelten Content, sowie unnötiges indizieren der Webseite und somit Resourcenverschwendung verursachen. Hier eine einfache Methode, den Zugriff von Suchmaschinen auf die eigene Webseite per SSL zu verhindern. Man nehme das Apache-Modul mod_rewrite und verweisst über eine RewriteRule einfach auf eine andere robots.txt Datei, wenn diese per https angefordert wird. Einfach in der .htaccess-Datei folgendes hinzufügen oder neu anlegen, falls nicht vorhanden:
RewriteEngine on
RewriteCond %{HTTPS} on
RewriteRule ^robots\.txt$ robots_https.txt
Die Datei robots_https.txt sollte so aussehen, um alle Suchmaschinen-Bots (Googlebot etc.) und Seiten zu verbieten: