appel ollama

Si vous utilisez Ollama et que vous ne souhaitez pas écrire votre propre wrapper API à chaque fois,
le projet ollama_call simplifie considérablement le travail.

Il s’agit d’une petite bibliothèque Python qui vous permet d’envoyer une requête à un LLM local avec une seule fonction
et recevez immédiatement une réponse, y compris au format JSON.

Installation

pip install ollama-call

Pourquoi est-ce nécessaire

  • code minimal pour travailler avec le modèle ;
  • Réponse JSON structurée pour un traitement ultérieur ;
  • pratique pour les prototypes rapides et les MVP ;
  • prend en charge la sortie en streaming si nécessaire.

Utiliser un exemple

from ollama_call import ollama_call

response = ollama_call(
    user_prompt="Hello, how are you?",
    format="json",
    model="gemma3:12b"
)

print(response)

Quand c’est particulièrement utile

  • vous écrivez des scripts ou des services sur Ollama ;
  • besoin d’un format de réponse prévisible ;
  • il n’y a aucune volonté de connecter des frameworks lourds.

Total

ollama_call est un wrapper léger et clair pour travailler avec Ollama de Python.
Un bon choix si la simplicité et la rapidité des résultats sont importantes.

GitHub
https://github.com/demensdeum/ollama_call