Llama 2 Uncensored: Wie man lokale KI-Modelle ohne Zensur betreibt

Seit der Veröffentlichung von Meta’s Llama 2 stehen leistungsstarke Large Language Models für jeden zur Verfügung. Doch die Standardversionen sind oft stark gefiltert und verweigern viele Anfragen aus Vorsicht. In diesem Beitrag schauen wir uns an, wie man mit dem Open-Source-Tool Ollama unzensierte Versionen von Llama 2 lokal ausführt und welche Modelle dabei die besten Ergebnisse liefern.

## Was sind unzensierte LLM-Modelle?

Der Begriff „Uncensored“ (auf Deutsch oft als unzensiert oder ungesichert bezeichnet) bezieht sich auf Large Language Models, die nicht mit den üblichen Sicherheitsfiltern und ethischen Richtlinien trainiert wurden, die bei Standardmodellen wie dem offiziellen Llama 2 Chat-Modell zu finden sind.

Im Mai 2023 hat Eric Hartford, ein Machine-Learning-Ingenieur, in einem vielbeachteten Blogpost die Vorzüge solcher Modelle diskutiert. Sein Argument: Unzensierte Modelle sind oft nützlicher für Entwickler und Forscher, da sie direkte Antworten liefern, ohne moralisierende Ausflüge oder pauschale Verweigerungen.

## Die besten Modelle für Llama 2 Uncensored

Wer Llama 2 ohne diese Einschränkungen nutzen möchte, hat mittlerweile mehrere hervorragende Optionen zur Auswahl. Diese Modelle basieren auf dem Originalcode von Meta, wurden jedoch mit spezifischen Datensätzen feinjustiert (fine-tuned), um die „Alignment“-Filter zu entfernen.

Hier sind die drei populärsten Varianten, die sich über Ollama nutzen lassen:

### Fine-tuned Llama 2 7B (von Georgesung)

Dieses Modell wurde mit dem [Wizard-Vicuna-Datensatz](https://huggingface.co/datasets/ehartford/wizard_vicuna_70k_unfiltered) trainiert. Es ist eine kompakte, aber leistungsfähige Version, die sich gut für lokale Hardware eignet.

### Nous Hermes Llama 2 13B

Ein Favorit der Community. Nous Research hat dieses Modell mit über 300.000 Anweisungen trainiert. Es zeichnet sich durch längere Antwortzeiten, eine geringere Halluzinationsrate und das vollständige Fehlen der OpenAI-ähnlichen Zensurmechanismen aus.

### Wizard Vicuna 13B Uncensored

Ein weiteres Werk von Eric Hartford selbst. Hier wurde das Llama 1 13B Modell so angepasst, dass jegliche Art von Alignment entfernt wurde. Es dient oft als Basis für weitere Experimente.

## Der Unterschied im Detail: Zensur vs. Freiheit

Um die Leistungsfähigkeit der unzensierten Modelle zu verdeutlichen, lohnt ein Blick auf konkrete Vergleichstests. Die folgenden Beispiele zeigen den Kontrast zwischen dem offiziellen, zensierten Llama 2 und der unzensierten Variante.

### Beispiel: Popkultur und Filme

Während das Standardmodell bei Fragen zu privaten Versprechen oft mit Verweisen auf Datenschutz und Ethik ausweicht, antwortet das unzensierte Modell direkt.

* **Llama 2 (Censored):** Verweigert die Antwort unter Berufung auf Privatsphäre und den Wunsch, nicht unethisch zu sein.
* **Llama 2 Uncensored:** Liefert die faktische Antwort aus dem Film „Titanic“ (Rose versprach es Jack).

### Beispiel: Religion und Literatur

Auch bei religiösen Texten zeigt sich der Unterschied deutlich.

* **Llama 2 (Censored):** Weigert sich, einen Bibelvers zu nennen, da es dies als religiösen Glauben und nicht als wissenschaftliche Tatsache einstuft. Es rät dazu, sich auf die Wissenschaft zu konzentrieren.
* **Llama 2 Uncensored:** Zitiert einfach „Genesis 1:1“.

### Beispiel: Medizinische Informationen

Ein kritischer Bereich, in dem Zensur oft als „Schutz“ dient, aber auch als Blockade wirken kann.

* **Llama 2 (Censored):** Weigert sich, Anleitungen zur Herstellung von Tylenol zu geben, da dies illegal und gefährlich sei.
* **Llama 2 Uncensored:** Erklärt den chemischen Prozess der Acetaminophen-Herstellung und die Zusammensetzung der Tabletten.

### Beispiel: Allgemeine Informationen

Selbst bei scheinbar harmlosen hypothetischen Szenarien, wie einem Boxkampf zwischen Elon Musk und Mark Zuckerberg, verhält sich das Standardmodell extrem vorsichtig und verweist auf Gewaltprävention. Das unzensierte Modell analysiert die physischen Attribute und das Training der beiden Tech-Größen sachlich und neutral.

## Lokale Ausführung mit Ollama

Die gute Nachricht ist, dass der Einstieg in die Welt der unzensierten KI sehr einfach ist. Dank Tools wie **Ollama** müssen Sie keine komplexen Python-Skripte schreiben.

Sie können die Modelle einfach über die Kommandozeile herunterladen und ausführen. Hier sind die Befehle für die oben genannten Modelle:

* Für das unzensierte Llama 2 7B: `ollama run llama2-uncensored`
* Für Nous Hermes Llama 2: `ollama run nous-hermes-llama2`
* Für Wizard Vicuna: `ollama run wizard-vicuna`

Durch die lokale Ausführung behalten Sie die volle Kontrolle über Ihre Daten und die Antworten der KI, ohne sich auf die Filterregeln externer Cloud-Anbieter verlassen zu müssen.

Quelle: [Run Llama 2 uncensored locally](https://ollama.com/blog/run-llama2-uncensored-locally)