Allgemein

Ollama installieren und lokale KI-Modelle nutzen

31. März 2026 Becker Julian

Abstrakte Visualisierung von künstlicher Intelligenz und neuronalen Netzwerken für Ollama Tutorial

Ollama installieren und lokale KI-Modelle nutzen

In der Welt der Künstlichen Intelligenz gewinnen lokale Modelle zunehmend an Bedeutung. Statt Daten in die Cloud zu senden, kannst du leistungsstarke LLMs direkt auf deinem Gerät betreiben – schneller, privater und unabhängig von Internetverbindungen. Ollama macht das einfach.

Was ist Ollama?

Ollama ist ein Open-Source-Framework, das es ermöglicht, Large Language Models (LLMs) lokal auszuführen. Es vereinfacht die Installation und den Betrieb von KI-Modellen erheblich und unterstützt eine Vielzahl beliebter Modelle wie Llama 3, Mistral, Phi und mehr.

Vorteile von Ollama:

Datenschutz: Keine Daten verlassen dein Gerät
Kostenlos: Keine API-Kosten oder Abos
Schnell: Lokale Ausführung ohne Wartezeiten
Flexibel: Einfaches Wechseln zwischen Modellen

Systemvoraussetzungen

Bevor du startest, prüfe deine Hardware:

Komponente	Mindestanforderung	Empfohlen
CPU	4 Kerne	8+ Kerne
RAM	8 GB	16–32 GB
Speicher	10 GB frei	50+ GB
GPU (optional)	–	NVIDIA mit 8+ GB VRAM

Ollama installieren

macOS

Für Intel-Macs:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/ollama/ollama/main/install.sh)"

Für Apple Silicon (M1/M2/M3):

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/ollama/ollama/main/install.sh)"

Linux

Debian/Ubuntu:

curl -fsSL https://ollama.com/install.sh | sh

Windows

Lade das Installer-MSI von Ollama Download herunter und führe es aus.

Erste Schritte mit Ollama

Modell herunterladen

ollama pull llama3.2

Verfügbare Modelle findest du auf Ollama Library.

Modell starten und chatten

ollama run llama3.2

Du befindest dich jetzt im interaktiven Chat-Modus.

Ollama als API nutzen

Ollama bietet eine einfache REST-API:

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.2",
  "prompt": "Warum ist der Himmel blau?"
}'

Tipps & Best Practices

Modelle verwalten: ollama list zeigt alle installierten Modelle
Modelle löschen: ollama rm <modell-name>
Port konfigurieren: Umgebungsvariable OLLAMA_HOST=0.0.0.0:11434
GPU nutzen: NVIDIA-Benutzer sollten CUDA aktivieren für schnellere Inferenz

Fazit

Ollama ist der einfachste Weg, um leistungsstarke KI-Modelle lokal zu betreiben. Die Installation dauert weniger als eine Minute, und du kannst sofort mit dem Chatten beginnen – sicher, privat und ohne laufende Kosten.

Probier es aus! Installiere Ollama heute und entdecke die Welt der lokalen KI-Modelle.

Becker Julian

Schreibe einen Kommentar Antwort abbrechen