
Falls Sie schon einmal von BrowserOS gehört haben und sich gefragt haben, warum so viele Leute von einem „Browser mit Köpfchen“ sprechen, hier ist das Gesamtbild. BrowserOS ist ein Open-Source-Browser, der KI-Agenten integriert, die in der Lage sind, Anweisungen in natürlicher Sprache zu verstehen und auszuführen.Klicken, Tippen und Surfen in Ihrem Namen – mithilfe Ihrer angemeldeten Sitzungen und Ihres lokalen Zugriffs. Und das alles mit einem standardmäßigen Datenschutzansatz und ohne auf Cloud-Infrastruktur für Ihre persönlichen Daten angewiesen zu sein.
Der Vorschlag ist nicht einfach nur eine weitere zufällige Idee in der Welt der Browser: BrowserOS entstand als Abspaltung von Chromium und bietet Kompatibilität mit Ihren Chrome-Erweiterungen sowie ein klares Ziel.: eine offene und datenschutzorientierte Alternative zu Lösungen wie Atlas (ChatGPT)Comet (Perplexity) oder Dia, zusätzlich zu herkömmlichen Browsern. Das Prinzip ist einfach erklärt und wirkungsvoll: Sie beschreiben die Aufgabe, und ein Agent führt sie von Ihrem eigenen Computer aus – mit Ihren Zugangsdaten und ohne Ihre Browserhistorie an Dritte weiterzugeben.
Was ist BrowserOS und wodurch unterscheidet es sich von anderen Geräten?
Im Wesentlichen, BrowserOS ist ein Browser, der KI-Agenten nativ ausführt.Es ermöglicht Ihnen, Anweisungen so zu verfassen, als würden Sie sie einem Kollegen erklären, und das System übernimmt die Ausführung der einzelnen Aktionen: Seiten öffnen, Suchanfragen starten, Formulare ausfüllen oder Daten extrahieren. Es handelt sich nicht um einen externen Assistenten, der Ihren Browser „überprüft“: Die Agenten sind direkt in BrowserOS integriert.
Weil es auf Chrom basiert, Das Erlebnis fühlt sich von der ersten Minute an vertraut anEine vertraute Benutzeroberfläche, Kompatibilität mit Erweiterungen, Chrome-Datenimport und eine nahezu sofortige Akzeptanz für alle, die das Ökosystem bereits kennen. Dieses „Ich-fühle- mich-wie-zu-hause“-Gefühl reduziert die Hürden beim Einstieg in die Automatisierung, ohne dass die alltägliche Nutzung eingeschränkt wird.
Warum gerade jetzt: Es ist Zeit für Agenten im Browser
In den letzten Monaten haben KI-gestützte Programmierwerkzeuge die Produktivität von Entwicklern vervielfacht. Millionen von Wissensarbeitern stecken jedoch weiterhin in sich wiederholenden Browseraufgaben fest.Kopieren und Einfügen, Ausfüllen von Formularen, Exportieren von Dashboard-Daten, Starten von Kampagnen usw. – das ist ein täglicher Engpass.
Das BrowserOS-Team deutet an, dass dies zum ersten Mal seit den Zeiten von Netscape der Fall ist. Wir haben die Möglichkeit, den Browser für reale Aufgaben neu zu gestalten.Wenn KI bereits ganze Projekte "schreibt", warum kann sie dann nicht auch Schaltflächen drücken, eine Weboberfläche bedienen oder Aktionen verketten, so wie Sie es tun würden, aber ohne dass Sie ständig die Kontrolle behalten müssen?
Die Probleme, die BrowserOS angeht
Vor BrowserOS scheiterte der Einsatz von Agenten in realen Anwendungsszenarien aus ganz bestimmten Gründen. Das Projekt identifiziert drei Haupthindernisse, die eine breite Akzeptanz verhindert haben.insbesondere in Unternehmen:
- Zugriff auf authentifizierte SitzungenViele Agentenlösungen laufen auf entfernten Rechnern und können nicht mit Ihren realen Konten (Gmail, LinkedIn, Unternehmens-Tools) interagieren. Daher sind sie für praktische Aufgaben unzureichend.
- WerkzeugfragmentierungManche Agenten kommunizieren mit MCP-Servern, andere führen lediglich Webautomatisierungen durch, und wieder andere verknüpfen APIs wie Zaps. Was fehlt, ist ein einheitliches „Werkzeugset“ zum Erstellen komplexer Abläufe.
- Schwarze Box und SchlossViele gängige Browser sind Such- oder Werbeprodukte. Sie geben weder Einblick in ihre Eingabeaufforderungen noch in ihre internen Abläufe.Sie weisen Ihnen einen bestimmten LLM zu und leiten die Daten an ihre Server weiter. Für viele Unternehmen ist das definitiv keine Option.
BrowserOS reagiert von Grund auf: Agenten in Ihrem Browser, die auf Ihrem Computer ausgeführt werdenDurch die Kombination von MCP und Automatisierung und unter der Grundlage einer 100% offenen Philosophie, die es ermöglicht, jederzeit zu prüfen und zu forken, löst diese Kombination das Problem, das die Delegation ernsthafter Aufgaben an KI im Browser bisher unmöglich machte.
Wie BrowserOS funktioniert und erste Schritte
Der Fluss ist direkt: Sie laden BrowserOS herunter und installieren es genauso wie jeden anderen Browser.Sie melden sich bei den von Ihnen täglich genutzten Websites an und beschreiben dort Aufgaben in natürlicher Sprache. Der Agent agiert in Ihrem realen Kontext, mit Ihren Berechtigungen und aktiven Sitzungen, so als säßen Sie direkt vor dem Bildschirm.
- Download und Installation BrowserOS für Ihr System (verfügbar für macOS, Windows und Linux). Falls Sie Bedenken hinsichtlich der Installation unter Linux haben, ist es als AppImage verfügbar. auf GitHub.
- Importieren Sie Ihre Chrome-Daten Wenn Sie daran interessiert sind, Lesezeichen, Verlauf oder Einstellungen zu speichern.
- Verbinden Sie Ihren KI-Anbieter: OpenAIAnthropic- oder lokale Modelle über Ollama/LM Studio, mit Ihren eigenen Schlüsseln.
- Beginnen Sie mit der Automatisierung.: Ziele in Textform formulieren und den Agenten die Schritte im Web ausführen lassen.
Sie können auch jederzeit das Zentrum Browserautomatisierung mit MCP-Servern kombinieren und API-Aufrufe im selben Ablauf. Diese Kombination ermöglicht es Ihnen, Assistenten zu erstellen, die Daten extrahieren, sie in einem Modell verarbeiten und Tabellenkalkulationen oder SaaS-Tools aktualisieren können – alles verkettet durch einen einzigen Agenten.
Die wichtigsten Funktionen von BrowserOS, die den Unterschied ausmachen
- Erstellung von Agenten in natürlicher SpracheSag, was du willst, ohne zu programmieren.
- Freiheit der ModelleBringen Sie Ihre Schlüssel mit und wechseln Sie zwischen LLMs oder nutzen Sie lokale Modelle.
- Es ist ein "normaler" BrowserChrombasis Funktionieren Ihre Chrome-Erweiterungen?.
Privatsphäre ist ein Grundpfeiler des Designs: Ihre Daten, Ihr Verlauf und Ihre Sitzungen bleiben auf Ihrem Computer gespeichert.Ohne aufdringliche Telemetrie oder Abhängigkeit von externen Clouds. Wenn Sie es vorziehen, können Sie ausschließlich mit lokalen Modellen arbeiten und die Datenerfassung komplett unterbinden.
Um es noch schlimmer zu machen, Sie arbeiten an einem KI-gestützten Werbeblocker. Dies verspricht, komplexere Szenarien als statische Filter abzudecken. Und für Entwickler und fortgeschrittene Benutzer gibt es Unterstützung für die Verwendung des Browsers als MCP-Server, wodurch er sich in Tools wie beispielsweise … integrieren lässt. claude-code o gemini-cli.
Integrationen, MCP und Nutzung externer Tools
Eine ihrer größten Stärken ist, dass BrowserOS kann als MCP-Server fungieren.Dies bedeutet, dass andere mit dem Protokoll kompatible Anwendungen (wie die bereits erwähnten) claude-code o gemini-cliSie können mit Ihrem Browser "kommunizieren" und Aufgaben der Weboberfläche an ihre Agenten delegieren.
Interessant ist die Orchestrierung: Sie müssen sich nicht zwischen der Automatisierung des Browsers oder dem Aufruf einer API entscheiden.Beides ist mit demselben Agentenrezept möglich. Beispielsweise können Sie Daten aus einem Portal mit komplexer Benutzeroberfläche extrahieren, diese mit einem Modell verarbeiten und das Ergebnis anschließend in eine Tabellenkalkulation oder ein CRM-System laden, ohne die Tools manuell zu kombinieren.
Schneller Vergleich mit Chrome, Brave, Arc/Dia und Perplexity Comet
Im Vergleich zu Chrome
Dank Chromiums Open-Source-Architektur erbt BrowserOS die Grundlage, aber Seit Jahren hat Chrome keine bedeutenden nativen KI-Fortschritte im Bereich der Automatisierung mehr erlebt.Ohne MCP, ohne lokale Agenten, ohne diese integrierte Orchestrierungsschicht bleibt es nur ein großartiger Browser... ohne einen "Klick-für-dich"-Assistenten.
Mutig begegnen
Brave hat den Weg für Privatsphäre geebnet, aber Ihr Fokus liegt auf Kryptowährungen, Suchmaschinen, VPNs und mehr.BrowserOS geht seinen eigenen Weg: KI im Browser und echte Arbeitsautomatisierung.
Blickrichtung Bogen/Durchmesser
Viele Menschen begrüßten Arcs Vorschlag, aber Es stellte seinen Code ein und ließ die Nutzer im Ungewissen.Bei BrowserOS ist es genau umgekehrt: 100% offen, überprüfbar, abzweigbar, mit einer engagierten Community und ohne Abhängigkeit von einem einzigen Anbieter.
Konfrontation mit dem Kometen
Perplexity ist letztendlich ein Such- und Werbeunternehmen. Ihre Geschichte kann zu einem Produkt werdenIn BrowserOS ist das Versprechen klar: lokale Daten und vollständige Kontrolle Ihrerseits.
Sicherheit, Datenschutz und Lizenzierung
Die Philosophie lautet: „Datenschutz hat oberste Priorität“. Sie verwenden Ihre eigenen API-Schlüssel oder lokale Modelle mit Ollama/LM Studio.Sie entscheiden, was auf Ihrem Gerät gespeichert wird und was nicht, und Sie schützen Verlauf und Sitzungen vor dem Zugriff Dritter.
Auf rechtlicher und gesellschaftlicher Ebene, BrowserOS ist freie Software und unter der AGPL-3.0-Lizenz lizenziert.Sie können den Entstehungsprozess verfolgen, Systemabfragen prüfen, Änderungen vorschlagen, das Projekt forken und dazu beitragen. All dies im Sinne der von den Entwicklern erwähnten Philosophie „Mit Liebe aus San Francisco entwickelt“.
Gemeinschaft, Persönlichkeiten und Projektdynamik
Das Interesse ist spürbar. Es kann über 4,3 Sterne auf GitHub, mehr als 25.000 Downloads und eine Discord-Community mit über tausend Mitgliedern vorweisen. von Personen, die aktiv teilnehmen. In einem anderen Fragment erscheinen Kennzahlen wie „6,3k“ und „558“ (bezogen auf das Repository, vermutlich Sterne/Follower/Branches), was auf einen Aufwärtstrend hindeutet.
Technisch gesehen zeichnet sich das Projekt durch sein Fundament aus. C++ auf dem Chromium-Giganten, eine anspruchsvolle Reise, die viel harte Arbeit erfordert und die Kompatibilität mit vorgelagerten Änderungen aufrechterhält, während gleichzeitig Innovationen auf der Agentenebene vorangetrieben werden.
Anwendungsfälle und Demos
Denken Sie an Aufgaben aus der realen Welt: Identifizieren Sie interessante Profile unter Ihren LinkedIn-Bewerbungen und fügen Sie diese einer Google-Tabelle hinzu.Sie füllen lange Formulare aus, sammeln Daten von verschiedenen Websites oder bereiten ein Vorgespräch mit wichtigen Informationen vor. Sie beschreiben es in Textform, und der Agent navigiert und handelt so, wie Sie es tun würden.
Es gibt audiovisuelles Material, das das Konzept in der Praxis veranschaulicht: Demos wie „HackerNews.top.3.mp4“, „use-browserOS-to-chat.mp4“ oder „use-browserOS-to-extract.mp4“ Sie vermitteln alles von unterstützten Gesprächen bis hin zur Datenextraktion in realen Umgebungen und unterstreichen so, dass Automatisierung im authentischen Kontext stattfindet.
Vision: Der Browser als „Betriebssystem“ für Agenten
Unternehmen leben im Browser: Salesforce, SAP, Workday, interne Tools… Eine Vielzahl von Wissensarbeitern verbringt 60–80 % ihres Arbeitstages mit Webanwendungen.Wenn ein Agent wie ein Mensch klicken und tippen kann, kann er praktisch jede Schnittstelle automatisieren, auch solche ohne APIs.
Die im Projekt vorgestellte Vision ist, dass Die IT kann wiederverwendbare „Mitarbeiter-Agenten“ einsetzen.Der firmeneigene „Ausgabenagent“, der gemeinschaftlich genutzte „Facebook-Anzeigenagent“, den Sie an Ihren Workflow anpassen können usw. Weniger mechanische Aufgaben, mehr Fokus auf das, was Mehrwert schafft.
Wer steckt hinter BrowserOS?
Das Kernstück des Projekts bilden zwei Zwillingsbrüder mit einer beeindruckenden Erfolgsbilanz in der Tech-Branche. Nikhil hat mit C++ und Systemen an der Backend-Entwicklung von Reels und dem Facebook-Feed gearbeitet.Nithin war als ML-Ingenieur bei YouTube tätig und wirkte an der Entwicklung des ersten großen Empfehlungsmodells (LRM) der Plattform mit. Diese Mischung aus Low-Level- und die KI-Schicht gibt ihnen die Freiheit, mit Chromium umzugehen und gleichzeitig das "Agentenhirn" darauf aufzubauen.
- Erfahrung in C++ und großen SystemenAufrechterhaltung kritischer und leistungsstarker Dienste.
- Spezialisierung auf maschinelles Lernen und Empfehlungssysteme: tiefes Verständnis moderner Modelle und ihrer Implementierung.
Stimmen aus der Community und weniger bekannte Alternativen
Bei fortgeschrittenen Nutzern besteht ein Interesse an „anderen“ Browsern mit Potenzial. Alternativen wie Wavebox, Ulaa, Arc, Ghost Browser oder Thorium wurden getestet.Zen Browser wird für seine Produktivität gelobt (obwohl er nicht auf Chromium basiert). In den Tests wird erwähnt, dass Wavebox zwar sehr umfangreich, aber auch etwas überfordernd sein kann und die vollständige Ausschöpfung seines Potenzials zeitaufwendig ist; Ulaa wirbt mit Datenschutz, bietet aber zu viele Zusatzfunktionen; Arc hat gemischte Reaktionen hervorgerufen; und Ghost Browser konnte noch nicht alle überzeugen.
Bezüglich Thorium hört man, dass Es ist sehr schnell, birgt aber einige Sicherheitsrisiken.Deshalb schieben es manche Leute auf. Und oft wird empfohlen, nicht zu den bekanntesten zu greifen, da man bereits etwa zwanzig ausprobiert hat; das Ziel ist es vielmehr, Raritäten zu entdecken, die etwas wirklich Neues bieten.
Kurzanleitung zur Verwendung von Agenten
Sobald man drinnen ist, kommt der "magische Moment", wenn man konkrete Aufgaben beschreibt. Anstatt "es zu bitten, nach dem und dem zu suchen" und eine Zusammenfassung zurückzugeben, führt der Agent die Interaktion in Ihrem Browser aus.Wenn die Website keine API hat, spielt das keine Rolle: Es gibt eine Benutzeroberfläche, es gibt Aktionen, die ein Agent genau nachbilden kann.
- Beschreiben Sie Ihr ZielZum Beispiel das Auffinden bestimmter Kontakte in einem beruflichen Netzwerk und das Übertragen ihrer Informationen in eine Tabellenkalkulation.
- Bestätigen Sie die Schritte. falls der Agent sie Ihnen vorschlägt (nützlich, um zu überprüfen, was er tun wird).
- Beaufsichtigen Sie beim ersten Mal Um Eingabeaufforderungen oder Regeln anzupassen, verwenden Sie das Rezept anschließend erneut.
Die Verwendung von MCP und die Möglichkeit, Automatisierung, APIs und Modelle zu „verknüpfen“, ermöglichen Folgendes: Ein einzelner Agent löst vollständige End-to-End-Prozesse., wofür man zuvor mehrere Werkzeuge mit Klebeband zusammenkleben musste.
Datenschutz durch Technikgestaltung und Modellkontrolle
Ein wesentlicher Vorteil ist die Freiheit, die KI-Engine auszuwählen. Sie können mit OpenAI oder Anthropic arbeiten oder alles lokal mit Ollama/LM Studio verwalten.Die Route wird je nach Kosten, Latenz oder Projektsensibilität angepasst. Wer absolute Vertraulichkeit priorisiert, erhält eine ausschließlich lokale Route.
Zusätzlich Das Projekt veröffentlicht und ermöglicht die Bearbeitung von Systemaufforderungen.Das ist ungewöhnlich. Diese Transparenz erleichtert es, das Verhalten des Agenten an Ihre Organisation oder Ihren spezifischen Fall anzupassen und seine Entscheidungsfindung zu überprüfen.
Schritte zur Mitarbeit am BrowserOS-Projekt
Wenn Sie an die Idee glauben und helfen möchten, gibt es verschiedene Möglichkeiten, sie zu unterstützen. Hinterlasse einen Stern auf GitHub Es trägt zur Steigerung der Sichtbarkeit bei; das Herunterladen und Verwenden liefert interessante Telemetriedaten (sofern aktiviert) und Feedback; und der Beitritt zum Discord-Server ermöglicht es Ihnen, neue Funktionen vorzuschlagen, zu entdecken und zu testen.
Schließlich zeigt die offizielle Website üblicherweise einen Hinweis an Laden Sie den Browser für Ihr System herunterSie können Ihre Chrome-Daten importieren und Ihren bevorzugten KI-Anbieter verbinden. Anschließend müssen Sie nur noch Ihre Agenten erstellen und Ihre bewährten Methoden teilen.
Betrachtet man das Gesamtbild, etabliert sich BrowserOS als ein Open-Source-Browser mit agentenorientiertem Ansatz, der den Datenschutz priorisiert, auf Chromium basiert und über eine wachsende Community verfügt.Es vereint Kompatibilität mit Erweiterungen, MCP, Unterstützung für lokale Modelle (Ollama/LM Studio) und ein offenes Engagement, das eine AGPL-3.0-Lizenz und editierbare Eingabeaufforderungen umfasst. Anders als Chrome, Brave, Arc/Dia oder andere werbe- und suchbasierte Angebote zielt es darauf ab, die Vorteile von KI direkt auf die Website zu bringen, auf der Sie täglich arbeiten. Und obwohl es noch einige Details zu optimieren gibt (wie beispielsweise einen KI-gestützten Werbeblocker, der in Kürze verfügbar sein wird, oder gelegentliche Installationsprobleme unter Windows), deuten das Tempo und die Nutzerinteraktion auf ein wachsendes Projekt hin, das mit viel Liebe in San Francisco entwickelt wird und den Wunsch hat, das Web von einer bloßen Aneinanderreihung von Klicks in eine Plattform für Agenten zu verwandeln, die Sie unterstützen.