Atualmente, todos os provedores populares de serviços LLM usam ajuste fino usando arquivos JSONL, que descrevem as entradas e saídas do modelo, com pequenas variações, por exemplo, para Gemini, OpenAI, o formato é um pouco diferente.
Após o download de um arquivo JSONL especialmente formado, o processo de especialização do modelo LLM no conjunto de dados especificado começa, para todos os provedores de LLM bem conhecidos atuais, este serviço é pago.
Para ajustar uma máquina local usando Ollama, recomendo confiar em um vídeo detalhado da tecnologia de canal do YouTube com a maneira mais fácil de ajustar um LLM e nós com Alloma:
https://www.youtube.com/watch?v=pTaSDVz0gok
Um exemplo de um laptop Jupyter com a preparação do conjunto de dados JSONL a partir de exportações de todas as mensagens do Telegram e o lançamento do processo de ajuste fino local está disponível aqui:
https://github.com/demensdeum/llm-train-example