Si vous utilisez Ollama et que vous ne souhaitez pas écrire votre propre wrapper API à chaque fois,
le projet ollama_call simplifie considérablement le travail.
Il s’agit d’une petite bibliothèque Python qui vous permet d’envoyer une requête à un LLM local avec une seule fonction
et recevez immédiatement une réponse, y compris au format JSON.
Installation
pip install ollama-call
Pourquoi est-ce nécessaire
- code minimal pour travailler avec le modèle ;
- Réponse JSON structurée pour un traitement ultérieur ;
- pratique pour les prototypes rapides et les MVP ;
- prend en charge la sortie en streaming si nécessaire.
Utiliser un exemple
from ollama_call import ollama_call
response = ollama_call(
user_prompt="Hello, how are you?",
format="json",
model="gemma3:12b"
)
print(response)
Quand c’est particulièrement utile
- vous écrivez des scripts ou des services sur Ollama ;
- besoin d’un format de réponse prévisible ;
- il n’y a aucune volonté de connecter des frameworks lourds.
Total
ollama_call est un wrapper léger et clair pour travailler avec Ollama de Python.
Un bon choix si la simplicité et la rapidité des résultats sont importantes.
GitHub
https://github.com/demensdeum/ollama_call