{"id":4356,"date":"2026-05-01T12:22:11","date_gmt":"2026-05-01T09:22:11","guid":{"rendered":"https:\/\/demensdeum.com\/blog\/2026\/05\/01\/local-ai-vibecoding\/"},"modified":"2026-05-01T12:36:27","modified_gmt":"2026-05-01T09:36:27","slug":"local-ai-vibecoding","status":"publish","type":"post","link":"https:\/\/demensdeum.com\/blog\/de\/2026\/05\/01\/local-ai-vibecoding\/","title":{"rendered":"Lokale Vibe-Codierung: LM Studio, VS Code und Weiter"},"content":{"rendered":"<p>Wenn Sie den Wunsch hatten, neuronale Netze zum Schreiben von Code zu verwenden (sog. Vibe-Codierung), und \u00fcber einen recht leistungsstarken Computer verf\u00fcgen, beispielsweise mit einer Nvidia RTX-Grafikkarte, k\u00f6nnen Sie die gesamte Umgebung v\u00f6llig kostenlos auf Ihrem Computer bereitstellen. Dadurch werden Probleme mit kostenpflichtigen Abonnements gel\u00f6st und Sie k\u00f6nnen sicher mit Projekten unter NDA arbeiten, da Ihr Code nirgendwohin gesendet wird. In diesem Beitrag beschreibe ich, wie man ein lokales Bundle aus LM Studio, VS Code und der Continue-Erweiterung zusammenstellt.<\/p>\n<h2>Tools f\u00fcr die lokale Vibe-Codierung<\/h2>\n<p>F\u00fcr komfortables Arbeiten ben\u00f6tigen wir drei Hauptkomponenten:<br \/>\n&#8211; <b>LM Studio:<\/b> eine praktische Anwendung zum Herunterladen und Ausf\u00fchren lokaler LLMs. Es \u00fcbernimmt die gesamte Komplexit\u00e4t der Arbeit mit GGUF-Modellen und stellt einen lokalen Server bereit, der mit der OpenAI-API kompatibel ist.<br \/>\n&#8211; <b>VS Code:<\/b> ein beliebter und bekannter Code-Editor.<br \/>\n&#8211; <b>Continue:<\/b> Erweiterung f\u00fcr VS Code, die neuronale Netze direkt in die Arbeitsumgebung integriert. Erm\u00f6glicht das Chatten, das Hervorheben von Code f\u00fcr die Umgestaltung und unterst\u00fctzt die automatische Vervollst\u00e4ndigung.<\/p>\n<h2>Hardwareanforderungen<\/h2>\n<p>Lokale Sprachmodelle sind speicherintensiv:<br \/>\n&#8211; <b>Grafikkarte (GPU):<\/b> Nvidia mit 8 GB VRAM oder h\u00f6her (f\u00fcr komfortables Arbeiten mit Modellen mit 7\u20138 Milliarden Parametern). Schwerere Modelle ben\u00f6tigen 16 GB VRAM.<br \/>\n&#8211; <b>Speicherplatz:<\/b> ca. 500 GB zum Speichern verschiedener heruntergeladener Modelle.<\/p>\n<h2>Link konfigurieren<\/h2>\n<p>Der Einrichtungsprozess ist recht einfach und erfordert keine komplexen Manipulationen im Terminal:<br \/>\n1. Laden Sie LM Studio herunter und installieren Sie es. Verwenden Sie die integrierte Suche, um ein leichtes Modell wie <b>Qwen Coder<\/b> oder <b>gemma3:12b<\/b> zu finden.<br \/>\n2. Gehen Sie in LM Studio zur Registerkarte Lokaler Server und klicken Sie auf Server starten. Standardm\u00e4\u00dfig startet es unter \u201ehttp:\/\/localhost:1234\/v1\u201c.<br \/>\n3. \u00d6ffnen Sie VS Code und installieren Sie die Erweiterung <b>Continue<\/b> aus dem Plugin-Store.<br \/>\n4. \u00d6ffnen Sie die Continue-Konfigurationsdatei und f\u00fcgen Sie ein neues Modell hinzu. Geben Sie dabei den \u201eopenai\u201c-Anbieter und die Adresse Ihres lokalen Servers aus LM Studio an.<\/p>\n<p>Anschlie\u00dfend k\u00f6nnen Sie direkt in der Seitenleiste \u201eWeiter\u201c mit Ihrem lokalen LLM kommunizieren, Fragen zu Ihrem Code stellen und neue Komponenten generieren.<\/p>\n<h2>Warum funktioniert das?<\/h2>\n<p>Wie ich bereits geschrieben habe, schneiden LLMs mit flacher Struktur und WET-Code (Write Everything Twice) besser ab. Lokale Parametermodelle sind m\u00f6glicherweise Giganten wie GPT-4 unterlegen, wenn es um den Entwurf komplexer Architekturen geht, aber sie sind mehr als in der Lage, Boilerplate-Code zu generieren, einfache Funktionen umzugestalten und schnelle Prototypen zu erstellen.<\/p>\n<p>Dar\u00fcber hinaus verl\u00e4sst Ihr Code bei der lokalen Vibe-Codierung nie die Maschine. Damit ist diese Kombination ideal f\u00fcr die Unternehmensentwicklung und die Arbeit mit sensiblen Daten.<\/p>\n<h2>Ausgabe<\/h2>\n<p>Lokale neuronale Netze sind nicht in der Lage, einen Programmierer vollst\u00e4ndig zu ersetzen oder ein komplexes System zu entwerfen. Die Kombination aus LM Studio + VS Code + Continue sorgt jedoch f\u00fcr Unabh\u00e4ngigkeit von Cloud-Diensten und wahrt die Privatsph\u00e4re. Dies ist ein voll funktionsf\u00e4higes Hilfsmittel f\u00fcr Routineaufgaben, wenn Sie bereit sind, die Einschr\u00e4nkungen kleiner Modelle in Kauf zu nehmen und die Projektarchitektur selbstst\u00e4ndig zu steuern.<\/p>\n<h2>Links<\/h2>\n<p><a href=\"https:\/\/code.visualstudio.com\/\" rel=\"noopener\" target=\"_blank\">https:\/\/code.visualstudio.com\/<\/a><br \/>\n<a href=\"https:\/\/lmstudio.ai\/\" rel=\"noopener\" target=\"_blank\">https:\/\/lmstudio.ai\/<\/a><br \/>\n<a href=\"https:\/\/continue.dev\/\" rel=\"noopener\" target=\"_blank\">https:\/\/continue.dev\/<\/a><\/p>\n<h2>Quellen<\/h2>\n<p><a href=\"https:\/\/youtu.be\/IqqCwhG46jY\" rel=\"noopener\" target=\"_blank\">https:\/\/youtu.be\/IqqCwhG46jY<\/a><br \/>\n<a href=\"https:\/\/www.youtube.com\/watch?v=7AImkA96mE8\" rel=\"noopener\" target=\"_blank\">https:\/\/www.youtube.com\/watch?v=7AImkA96mE8<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wenn Sie den Wunsch hatten, neuronale Netze zum Schreiben von Code zu verwenden (sog. Vibe-Codierung), und \u00fcber einen recht leistungsstarken Computer verf\u00fcgen, beispielsweise mit einer Nvidia RTX-Grafikkarte, k\u00f6nnen Sie die gesamte Umgebung v\u00f6llig kostenlos auf Ihrem Computer bereitstellen. Dadurch werden Probleme mit kostenpflichtigen Abonnements gel\u00f6st und Sie k\u00f6nnen sicher mit Projekten unter NDA arbeiten, da<a class=\"more-link\" href=\"https:\/\/demensdeum.com\/blog\/de\/2026\/05\/01\/local-ai-vibecoding\/\">Continue reading <span class=\"screen-reader-text\">&#8220;Lokale Vibe-Codierung: LM Studio, VS Code und Weiter&#8221;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[61,52],"tags":[],"class_list":["post-4356","post","type-post","status-publish","format-standard","hentry","category-techie","category-tutorials","entry"],"translation":{"provider":"WPGlobus","version":"3.0.2","language":"de","enabled_languages":["en","ru","zh","de","fr","ja","pt","hi"],"languages":{"en":{"title":true,"content":true,"excerpt":false},"ru":{"title":true,"content":true,"excerpt":false},"zh":{"title":true,"content":true,"excerpt":false},"de":{"title":true,"content":true,"excerpt":false},"fr":{"title":true,"content":true,"excerpt":false},"ja":{"title":true,"content":true,"excerpt":false},"pt":{"title":true,"content":true,"excerpt":false},"hi":{"title":true,"content":true,"excerpt":false}}},"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/posts\/4356","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/comments?post=4356"}],"version-history":[{"count":1,"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/posts\/4356\/revisions"}],"predecessor-version":[{"id":4358,"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/posts\/4356\/revisions\/4358"}],"wp:attachment":[{"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/media?parent=4356"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/categories?post=4356"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/demensdeum.com\/blog\/de\/wp-json\/wp\/v2\/tags?post=4356"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}