Ollama hat sich in kurzer Zeit zu einem der beliebtesten Tools entwickelt, um große Sprachmodelle (LLMs) lokal auf dem eigenen Computer zu laufen zu lassen. Ohne Cloud, ohne API-Keys, ohne monatliche Kosten: Du lädst ein Modell herunter und chattest direkt mit ihm – komplett privat und offline. In diesem Artikel erfährst du, was Ollama ist, welche Modelle verfügbar sind und wie du es auf Windows, macOS und Linux installierst.
Was ist Ollama?
Ollama ist eine Open-Source-Plattform, die es dir ermöglicht, beliebte KI-Modelle wie Llama, Gemma, Mistral, Qwen und viele andere direkt auf deinem lokalen Rechner auszuführen. Das Projekt basiert auf dem bekannten llama.cpp-Projekt von Georgi Gerganov und abstrahiert den gesamten Aufwand, der normalerweise mit dem Betrieb von LLMs verbunden ist.
Die wichtigsten Vorteile auf einen Blick
- Einfacher Start: Mit einem einzigen Befehl lädst du ein Modell herunter und startest eine Konversation.
- Vollständig lokal: Deine Daten verlassen niemals deinen Computer. Das ist ideal für sensible Inhalte und Privatsphäre-Befürworter.
- Große Modellauswahl: Über die Ollama-Model-Bibliothek sind Dutzende von Modellen verfügbar – von kompakten 1-Parameter-Modellen bis hin zu leistungsstarken Modellen mit 70+ Milliarden Parametern.
- REST-API: Ollama bietet eine integrierte REST-API, die sich nahtlos in eigene Anwendungen, Skripte und Tools einbinden lässt.
- Kostenlos und Open Source: Ollama ist komplett kostenlos und der Quellcode steht auf GitHub zur Verfügung.
So funktioniert es
Nach der Installation kannst du mit einem einfachen Befehl wie ollama run gemma3 ein Modell herunterladen und sofort damit chatten. Ollama kümmert sich automatisch um Modell-Downloads, Speicher-Management und die Kommunikation mit dem Modell. Im Hintergrund läuft ein lokaler Server auf Port 11434, der sowohl die CLI als auch die REST-API bedient.
Ollama auf macOS installieren
macOS ist die Plattform, auf der Ollama am einfachsten zum Einsatz kommt – insbesondere bei Apple Silicon (M1/M2/M3), da die KI-Berechnungen direkt auf der Neural Engine laufen.
Voraussetzungen
- macOS 14 Sonoma oder neuer
- Mindestens 8 GB RAM (mehr wird empfohlen)
Installation über das Installationspaket
- Besuche ollama.com/download
- Lade die
.dmg-Datei herunter - Öffne das Disk-Image und ziehe Ollama in deinen Applications-Ordner
- Starte Ollama aus dem Programmappe-Ordner
Installation über das Terminal
Alternativ kannst du Ollama direkt über das Terminal installieren:
curl -fsSL https://ollama.com/install.sh | sh
Nach der Installation startet Ollama automatisch als Hintergrunddienst und erscheint in der Menüleiste oben rechts.
Ollama auf Windows installieren
Auch auf Windows läuft Ollama mittlerweile flüssig. Die Installation ist denkbar einfach.
Voraussetzungen
- Windows 10 oder Windows 11 (64-bit)
- Mindestens 8 GB RAM
- WSL2 wird unterstützt, ist aber nicht zwingend erforderlich
Installation über das Setup-Paket
- Lade den Installer von ollama.com/download herunter
- Führe
OllamaSetup.exeaus - Folge den Anweisungen des Installationsassistenten
- Ollama startet automatisch nach der Installation
Installation über PowerShell
Du kannst Ollama auch direkt über PowerShell installieren:
irm https://ollama.com/install.ps1 | iex
Nach der Installation kannst du Ollama über die Eingabeaufforderung oder PowerShell starten. Der Ollama-Dienst läuft im Hintergrund und ist über localhost:11434 erreichbar.
Ollama auf Linux installieren
Linux-Nutzer haben verschiedene Installationsmöglichkeiten – von einem einfachen Installations-Skript bis hin zu Docker.
Installation über das Skript (empfohlen)
Die einfachste Methode ist das offizielle Installations-Skript:
curl -fsSL https://ollama.com/install.sh | sh
Dieses Skript installiert Ollama als Systemdienst und richtet automatisch einen Autostart ein.
Manuelles Installieren
Für manuelle Installationen bietet Ollama detaillierte Installationsanweisungen für Linux an. Dabei kannst du die passende Binärdatei für deine Architektur herunterladen und manuell einrichten.
Installation über Docker
Ollama bietet ein offizielles Docker-Image auf Docker Hub:
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
Damit hast du eine vollständig isolierte Ollama-Instanz, die sich leicht verwalten und aktualisieren lässt.
Erste Schritte nach der Installation
Egal für welche Plattform du dich entscheidest – nach der Installation ist der Einstieg gleich:
Ein Modell starten
Öffne ein Terminal und starte deine erste Konversation:
ollama run gemma3
Ollama lädt das Modell automatisch herunter (falls noch nicht vorhanden) und startet einen interaktiven Chat. Du kannst jetzt Fragen stellen, Texte generieren oder Code schreiben lassen.
Andere Modelle ausprobieren
Die Ollama-Modellbibliothek bietet eine große Auswahl. Beliebte Alternativen sind:
- Llama 3 – Meta Open Source LLM
- Mistral – Kompaktes und schnelles Modell
- Qwen – Starkes Modell von Alibaba
- Phi – Microsofts effizientes Mini-Modell
Wechsle einfach mit ollama run <modellname> zu einem anderen Modell.
Ollama mit anderen Tools verbinden
Ollama lässt sich hervorragend mit anderen Anwendungen kombinieren:
- Open WebUI – Eine ChatGPT-ähnliche Weboberfläche für Ollama
- VS Code Extensions – Direkter KI-Support in deiner Entwicklungsumgebung
- Eigene Apps – Über die REST-API kannst du Ollama in eigene Programme einbinden
Fazit
Ollama macht lokale KI-Modelle zugänglich und einfach zu handhaben. Ohne Cloud-Abhängigkeit, ohne Kosten und mit vollem Datenschutz kannst du direkt auf deinem eigenen Computer mit leistungsstarken Sprachmodellen arbeiten. Die Installation ist auf allen drei großen Plattformen – macOS, Windows und Linux – in wenigen Minuten erledigt. Probier es aus und starte noch heute deine erste lokale KI-Konversation.