Direkt zum Inhalt
Die Community für Leser


(Thinking Machines, Internet Archive, Wayback Machine, Alexa Internet, WAIS)
Das Internetarchiv ist das älteste, größte Webarchiv und es ist öffentlich. Das Archiv arbeite weltweit mit mehr als 1200 Bibliotheks- und Universitätspartnern zusammen – heißt es.
Archive.org, die Webseite, die im Mai 1996 von Brewster Kahle ins Leben gerufen wurde, arbeitet mit der Software Wayback Machine und hat seit der Gründung des Portals mehr als 860 Milliarden Webseiten archiviert.

Ist eine Webseite aus dem öffentlichen Internet verschwunden, kann sie höchstwahrscheinlich auf archive.org wiederentdeckt werden!
Webseitenbetreiber im Glauben, ihre einstmals eingerichtete Webseite mit sämtlichen Daten entsorgt zu haben, werden eines Besseren belehrt. Daten, ob privaten oder geschäftlichen Ursprungs, werden so jahrzehntelang mit Speicher- und Energieressourcen versorgt, die dem Steuerzahler immense Summen abverlangen.

Dennoch kann es sinnvoll sein, gelöschte Webseiten, und damit Informationen für die Nachwelt aufzubewahren. Vor allem, wenn es um Gerichtsakten, wissenschaftliche und gesundheitsbezogene Informationen geht, die zur Beweisfindung von entscheidender Bedeutung sind.

Wichtig: Inwieweit sind die dort gespeicherten Webseiten vor Manipulation sicher?

Jeder Webseitenbesucher ist in der Lage, im Internetarchiv Webseiten seiner Wahl zu speichern. Mit der Eingabe folgender URL in den Internetbrowser: web.archive.org/save/
Hinsichtlich dessen habe ich Tests mit der Webseite des RKI und der Washington Post durchgeführt. Dieses Thema werde ich ausgiebig verfolgen und in einem weiteren Buch vertiefen.

Diese beiden Sicherungen sind über folgende Links zu erreichen:
• https://rki.de; https://web.archive.org/web/20241105150054/https://www.rki.de/DE/Home/homepage_node.html
• https://www.washingtonpost.com; https://web.archive.org/web/20241105132337/https://www.washingtonpost.com/
Zwischenfragen:

• Sind die dort gespeicherten Webseiten sicher vor Veränderungen? Archive.org ist nicht unter der Verwaltung des Volkes, sondern unter der eines Konsortiums aus dem Bereich Marketing und Big Tech.
• Welche Inhalte genau werden gespeichert? Nur die statischen Seiten?
• Wie lange verbleiben die dort gespeicherten Webseiten?
• Welcher Grund steckt tatsächlich dahinter, Milliarden alter Webauftritte zu speichern?
• Haben das US-Militär, Palantir, Dreamgroup und die Geheimdienste Zugriff darauf und wenn ja, was machen sie mit den Daten?
• Wie hoch ist der Ressourcenverbrauch, wenn 866 Milliarden (und es werden mehr) veraltete Webauftritte komplett gespeichert und verwaltet werden müssen?

Auf der Webseite Wikipedia: Das Internetarchiv (archive.org) ist eine amerikanische Non-Profit-Organisation und eine digitale Bibliothekswebseite, die 1996 von Brewster Kahle gegründet wurde und betrieben wird. Es bietet freien Zugang zu Sammlungen digitalisierter Medien, einschließlich Webseiten, Softwareanwendungen, Musik, audiovisuellen und gedruckten Materialien. Das Archiv setzt sich auch für ein freies und offenes Internet ein. Mit Stand vom 5. September 2024 verfügt das Internetarchiv über mehr als 42,5 Millionen Druckmaterialien, 13 Millionen Videos, 3 Millionen TV-Nachrichten, 1,2 Millionen Softwareprogramme, 14 Millionen Audiodateien, 5 Millionen Bilder, 272 660 Konzerte und über 866 Milliarden Webseiten in seiner Wayback Machine. Seine Mission ist es, einen universellen Zugang zu allem Wissen zu ermöglichen.

Überlegung:
• Weshalb wird eine so umfangreiche Sammlung von Informationen nicht für Schulen und Universitäten genutzt und in Lehrpläne aufgenommen?
• Wer hat Zugriff auf die Server und somit auf alle gespeicherten Daten? Noch wichtiger: Wer kann diese bearbeiten und verändern?
• Können wir diese Datenbank für Aufklärung nutzen?
• Ist dieser Datenpool bereits von Geheimdiensten und Big Tech bearbeitet worden und daher für die Allgemeinheit unbrauchbar?

Der Gründer von archive.org, Brewster Kahle, stammt aus den USA, ist Verfechter von künstlicher Intelligenz und stark mit Big Tech verbunden (wen verwundert es).

Auf der Webseite ›ted.com‹ stehen folgende Worte über Brewster Kahle: Brewster Kahle ist Erfinder, Philanthrop und digitaler Bibliothekar. Sein Internetarchiv bietet 85 Milliarden Stücke Deep-Web-Geologie – ein faszinierender Blick auf die Entstehung des Internets im Laufe der Jahre und eine Herausforderung für diejenigen, die Wissen begraben halten wollen.

Brewster Kahles erklärtes Ziel ist der universelle Zugang zu allem Wissen. Sein Katalog mit Erfindungen und Institutionen, der zu diesem Zweck geschaffen wurde, liest sich wie eine Liste der größten Hits des Webs. Im Jahr 1982 half er bei der Gründung von Thinking Machines, einem Supercomputer-Unternehmen, das sich auf die Textsuche spezialisiert hatte, und erfand das erste Verlags- und verteilte Suchsystem des Internets, WAIS, zu dessen Kunden die New York Times und der Senat der Vereinigten Staaten gehörten. Vor allem aber ist Kahle Gründer und Direktor des Internetarchivs, eines kostenlosen Dienstes, der unerschütterlich Dokumente aus dem World Wide Web archiviert, auch wenn sie von halsbrecherischen Trends in Wirtschaft, Kultur und Politik umgepflügt werden. Auf seiner Wayback Machine können Sie Seiten so betrachten, wie sie in der Web-Antike erschienen sind – sagen wir Yahoo! im Jahr 1996. Als Mitglied des Vorstands der Electronic Frontier Foundation setzt er sich dafür ein, dass solche Informationen frei und zugänglich bleiben.

Recherche über Brewster Kahle

Nach 25 Jahren arbeiten Brewster Kahle und das Internetarchiv immer noch daran, Wissen zu demokratisieren. Konzerne kontrollieren weiterhin den Zugang zu Inhalten, die sich in der Bibliothek befinden, was die Konservierung kontrolliert und uns umbringt.
Wieder einmal werden Daten kopiert, gesammelt und aufbereitet angezeigt. Eine weitere Datenbank unfassbarer Größe, die angeblich unser Wissen aufbewahrt. Große Plattenfirmen haben die Onlinebibliothek Internetarchiv wegen Tausender alter Aufnahmen verklagt und die Frage aufgeworfen: Wem gehört die Vergangenheit?

Wie viel Lüge steckt in diesem Archiv?

Nach seinem Abschluss am MIT (Massachusetts Institute of Technology) im Jahr 1982 hilft Kahle bei der Gründung des Supercomputer-Unternehmens Thinking Machines, das Systeme zum Durchsuchen großer Textsammlungen entwickelt. Das erste Veröffentlichungs- und verteilte Suchsystem des Internets, WAIS (Wide Area Information Server), erfindet er 1989. WAIS Inc. erstellt die Onlinepräsenz für viele der größten Verlage der Welt und wird 1995 von AOL (America Online) gekauft. Im Jahr 1996 ist Kahle Mitbegründer von Alexa Internet (anlehnend an die Bibliothek von Alexandria), das Such- und Entdeckungsdienste anbietet, die in mehr als 90 Prozent der Webbrowser enthalten sind. Alexa Internet wird 1999 von Amazon gekauft.

Brewster hat daran gearbeitet, Gesetze und Richtlinien unter Berücksichtigung des technischen Fortschritts zu gestalten. Er ist Vorstandsmitglied der Electronic Frontier Foundation und Kläger im Fall Kahle gegen Gonzales (ehemals Kahle gegen Ashcroft), der die jüngsten Fristverlängerungen des Urheberrechts anficht.

Bekannte Aktionen und Meldungen über Brewster Kahle im Einzelnen.

1999: Im Rahmen der Übernahme von Alexa Internet durch Amazon verhandelt Kahle mit Jeff Bezos und besteht darauf, eine Kopie von allem, was bisher von Alexa aufgezeichnet wurde, der Wayback Machine zur Verfügung zu stellen, die bis heute jede Seite des Internets archiviert.

2011: Aus einem Artikel der Financial Times.
Brewster Kahle sagt: »Letzte Woche haben wir weitere 2 Mio. Gigabyte an Datenspeicherkapazität hinzugefügt. Es kostete 200 000 US$, die Server zu kaufen, aber es hat sich gelohnt, unsere ständig wachsende Sammlung von digitalem Material zu schützen. Wir digitalisieren täglich 1000 Bücher und sammeln Musik, Filme und Internetseiten.«

Oktober 2022: Aus einem Artikel der Financial Times.
Heute, so erzählt der Gründer des Archivs, Brewster Kahle, stehe das Projekt kurz davor, die 100-Petabyte-Marke zu überschreiten – etwa 50 000 Mal größer als 1997. (2025 sind es über 145 Petabyte!)

Kahle sagt: »Früher wurde die Archivierung von Nachrichten sehr ernst genommen, aber Eigentümerwechsel oder auch nur eine Neugestaltung der Webseite können dazu führen, dass Inhalte verschwinden.«

Die Technikjournalistin Kara Swisher beklagte kürzlich, dass einige ihrer frühen Arbeiten beim Wall Street Journal ›kaputtgegangen‹ seien, nachdem die Zeitung sich vor einigen Jahren geweigert hatte, ihr das Material zu verkaufen.

Mai 2024: Internetarchiv und die Wayback Machine unter DDoS-Cyberangriff!
Seit Beginn der Angriffe am Sonntag (26. Mai) hat das DDoS-Eindringen Zehntausende von gefälschten Informationsanfragen pro Sekunde gestartet. Die Quelle des Angriffs ist unbekannt.

Cyberangriffe auf Bibliotheken und andere Wissenseinrichtungen häufen sich, darunter die British Library, die Solano County Public Library (Kalifornien), das Naturhistorische Museum Berlin und die London Public Library in Ontario. Zusätzlich zu einer Welle von Cyberangriffen in jüngster Zeit wird das Internetarchiv auch von den Verbänden der US-Buchverlage und der US-Tonträgerindustrie verklagt, die Urheberrechtsverletzungen geltend machen und von allen Bibliotheken Schadenersatz in Höhe von Hunderten Millionen US$ und eingeschränkte Dienstleistungen fordern.

Oktober 2024: Angriff auf das weltweit größte Archiv des Internets hat die Informationen von Millionen Nutzern kompromittiert und eine vorübergehende Abschaltung seiner Dienste erzwungen!
Bei dem Angriff auf das Internetarchiv (archive.org) wurden identifizierende Informationen von mehr als 31 Millionen Benutzerkonten entwendet, darunter E‑Mail-Adressen und verschlüsselte Passwörter.

März 2025: Brewster Kahle hält Vorlesung an der Universität Leiden über digitale Bibliotheken und Künstliche Intelligenz!

Brendan Halpin über Kahle: Im Juli 2023 veröffentlicht Brendan Halpin einen Text, in dem er mit der Verherrlichung von Brewster Lurton Kahle aufräumen möchte!

Aber wer ist Brendan Halpin?
Halpin arbeitete im gleichen Unternehmen wie Kahle – Thinking Machines Corporation.
Er erzählt von Computern, die nicht funktionierten, und von Ingenieuren, die mit den Geräten eingekauft werden mussten, um diese einigermaßen zum Funktionieren zu bewegen. Die Rede ist weiterhin von Geldwäsche und dass Steuerzahler indirekt für Geräte aus dem Hause Thinking Machines Corporation aufkamen, die von Regierungseinrichtungen gekauften worden waren. Halpin sagte: Kaum etwas funktionierte in dem Betrieb und öffentliche Gelder wanderten in private Taschen.

WAIS: Das Projekt WAIS (Wide Area Information Servers), das Kahle 1991 mit Harry Morris und in Zusammenarbeit mit Apple Computer, Dow Jones und KPMG Peat Marwick entwickelt, soll das erste Internet-Veröffentlichungssystem sein. AOL kauft das schlecht funktionierende System und nutzt es als Onlinesuchmaschine.

Nachdem sich Kahle aus dem WAIS Projekt zurückgezogen hat, startet er gemeinsam mit Bruce Gilliat das nächste unter dem Namen ›Alexa Internet‹. Aussagen dazu lauten: Alexa Internet ist das Rückgrat von Internetarchiv, das dazu dient, Wissen in das Internetarchiv zu pumpen.
Doch es ist weit mehr als das. Alexa Internet wird benutzt, um das Surfverhalten von Internetnutzern zu protokollieren, um dann geeignete Werbung schalten zu können. Weshalb sonst hat es Jeffrey Bezos (Amazon) für eine viertel Milliarde US$ gekauft?
Die New York Times schreibt dazu am 03. Mai 1999: Komprimierte Daten; Alexas Kreuzzug geht unter der Flagge von Amazon.com weiter.
Alexa Internet startet zunächst als Empfehlungssystem. Auf die Eingabe eines Begriffs folgen Empfehlungen zu Webseiten. Das Geheimnis dabei, Schnappschüsse von Webseiten werden über den Crawler (Datensauger) namens ia_archiver gesammelt. Im Laufe der Zeit sind sie auf diese Weise in der Lage, selbst Statistiken und Metriken von Webseiten zu sammeln. So entsteht die bekannteste Funktion von Alexa – Alexa Rank.

Welche Seiten sind am beliebtesten, in welchen Kategorien und wann?

Nach und nach wird diese Betonung der Webanalyse zum Wettbewerbsvorteil von Alexa. Brewster Kahle ist gerade dabei, eine gemeinnützige Organisation namens ›Internet Archive‹ zu gründen. Während Webdaten über Alexa Internet angehäuft werden, sammelt auch Kahle über sein Internetarchiv für die langfristige Aufbewahrung. Beide Techniken sind von Anfang an miteinander verbunden.
Alexa Internet ist ein gewinnorientiertes Unternehmen, das Internetarchiv eine als gemeinnützig deklarierte Non-Profit-Organisation. Beide setzen sich dafür ein, Meta-Statistiken im Internet zu veröffentlichen. Der Wendepunkt kommt im Jahr 1999, als Amazon beschließt, Alexa Internet (nicht das Smart-Home-Produkt) für ca. 250 Millionen US$ zu erwerben. Alexa braucht Wachstum und das Projekt Internetarchiv Geld.

Nach der Übernahme durch Amazon pumpt Alexa weiter Daten in das Internetarchiv!
Das Gremium des Internet Archivs: Die Leitung des Internet Archivs wird von einem Vorstand überwacht, dem Experten aus den Bereichen Technologie, Recht und Bildung angehören. Dieses Gremium ist dafür verantwortlich, dass das Archiv seinen Auftrag erfüllt und in Übereinstimmung mit seinem gemeinnützigen Status arbeitet. Der Vorstand biete auch strategische Beratung und Aufsicht für das Führungsteam der Organisation – heißt es.

Weitere Informationen von der archive.org Webseite und aus dem Internet:
• Brewster Kahle, Vorstandsvorsitzender.
• Rick Prelinger, Präsident: Rick Prelinger ist Archivar, Filmemacher, Autor und Pädagoge. Im Jahr 1983 begann er, ›ephemere Filme‹ zu sammeln. (Filme, die zu bestimmten Zwecken, zu bestimmten Zeiten gedreht wurden, wie Werbe-, Bildungs- und Industriefilme; in jüngerer Zeit als ›nützliches Kino‹ bezeichnet.)
• Kathleen Burch, stellvertretende Vorsitzende des Vorstands und auf Dauer Mitglied des Exekutivausschusses. Sie verfügt über jahrzehntelange Erfahrung im Non-Profit-Management, im strategischen Denken und in der Aktivierung von Gemeinschaften, um ihrer Leidenschaft und ihrem Engagement für universelle Alphabetisierung und Veröffentlichung von Büchern gerecht zu werden.
• David Rumsey ist Präsident von Cartography Associates, einem digitalen Verlagsunternehmen mit Sitz in San Francisco, und Vorsitzender von Luna Imaging, einem Anbieter von Software für Online-Bildsammlungen. Rumsey hat historische Kartenprojekte sowohl in Google Earth als auch in der virtuellen Welt von Second Life erstellt.

Das Gremium, das über das Internetarchiv vordergründig wacht, deckt damit die Hauptkategorien der Inhalte in der Datenverarbeitung ab: Technik, Film, Sprache, Marketing, Bücher. Alles Kategorien, die für eine Vermarktung und Gestaltung von Wissen und Daten für Technokraten nützlich sind.

Brewster Kahle macht kräftig Werbung für Künstliche Intelligenz. Er reist um die Welt, um andere zu überzeugen, sie bräuchten KI und müssten darin investieren. Seine Sammlung von Daten machte es für einen Menschen ohne technische Hilfe unmöglich, Ordnung in das Datenchaos zu bringen. Er wirbt indirekt für die Wayback Machine und deren Datenverbindung in Universitäten und anderen Einrichtungen.

Ende Brewster Kahle

Autor

0
0
0
0
0
1
0
0
0
0