html 🔗 Integrações | Nullcore
Pule para o conteúdo principal

🔗 Integrações

🐋 Run Deepseek R1 Dynamic 1,58 bit com llama.cpp

Um grande grito para a Unslothai por seus esforços incríveis! Graças ao seu trabalho duro, agora podemos executar o modelo de parâmetro FullEek-R1 671B completo em sua forma quantizada dinâmica de 1,58 bits (compactada a apenas 131 GB) no llama.cpp! E a melhor parte? Você não precisa mais se desesperar em precisar de GPUs ou servidores de classe empresarial maciça-é possível executar esse modelo em sua máquina pessoal (embora lentamente para a maioria dos hardware de consumo).