@IlkanAkten@UnslothAI Yes Moe with MTP I get 73 tok/sec and without 63 tok/sec. But with MTP I use a lot more vRam I have to shrink the context size a lot !
Arthur Mensch (Mistral) : "aujourd'hui les ingénieurs logiciels chez Mistral n'écrivent plus de ligne de code", ce sont des "managers d'agents" ; la productivité est énorme pour un individu, mais au niveau d'une grande entreprise il reste un goulot d'étranglement organisationnel.