COMO ASSIM? Caiado afirma que Felipe Sestaro, que é formado em medicina, não tem o direito de opinar contra a vacina da covid e diz que o Podcast não pode entrar na área da ciência. Não gostei desse posicionamento do governador.
Mulher 'adotada' ao fingir ter 12 anos conheceu vítimas na igreja e 'sequestrou emocionalmente a família', diz polícia de SC https://t.co/FkHPcJG4Go #g1
NOVIDADES NO PCA DO CONCURSO DO TJPR
A comissão respondeu as alegações formuladas contra o certame, vedaram o vade M*G3, expôs prints de publicidade institucional de esquema de peças bem como videos do dono e do professor falando sobre o uso do índice remissivo, oque acham?
Congrats to the @googlegemma team on the Gemma 4 12B launch 🎉 Day-0 support on vLLM is ready to go.
It's an encoder-free unified multimodal model — text, image, audio, and video all project straight into the LLM's embedding space, no separate vision or audio towers. 256K context, built-in thinking, native tool calling.
Reasoning + tool parsers (`gemma4`), vision, and audio all served through the OpenAI-compatible API.
🔗 Recipe: https://t.co/MGJcoQkwzz
i just ran Google's brand new Unsloth Gemma4 12B dense GGUF on my RTX 4060 using llama.cpp + CUDA 13.2
21 tokens per second. on a budget consumer GPU. locally.
no API. no cloud. no subscription.
and the benchmarks are absolutely cooked
# first let's talk architecture because this is genuinely different
every multimodal model you've used has a frozen vision encoder + frozen audio encoder + LLM backbone glued together
Gemma 4 12B is different
it's a single decoder only transformer. that's it. vision? raw 48×48 pixel patches → one matmul → projected directly into the LLM
audio? raw 16kHz signal sliced into 40ms frames → linear projection → same LLM input space
no encoder tax. no latency penalty. no fragmented memory
to put the encoder savings in perspective:
old Gemma 4 26B approach:
- 550M param vision encoder (frozen)
- 300M param audio encoder (frozen)
- LLM backbone
Gemma 4 12B:
- 35M param vision embedder (a single matmul)
- no audio encoder at all
- LLM backbone handles EVERYTHING 550M → 35M for vision alone. that's a 15x reduction
this is why the gemma-4-12b-it-Q4_K_M.gguf is just 6.6 GBs!!!
and it has 256K native context context
# Benchmarks:
AIME 2026 (math olympiad): 77.5%
GPQA Diamond (expert science): 78.8% LiveCodeBench v6 (real code): 72%
Codeforces ELO: 1659
MMLU Pro: 77.2%
MATH-Vision: 79.7%
BigBench Extra Hard: 53%
inference → llama.cpp, LM Studio, vLLM, SGLang
llamacpp flags:
-m "gemma-4-12b-it-Q4_K_M.gguf" -ngl 99 -c 8000 -v --port 8080
Available on huggingface now! Link below
“Pequena Amanda”: mulher que fingia ser criança de 12 anos em SC ganhou até Mounjaro
Conforme a Polícia Civil, a mulher de 37 anos viveu mais de um ano como uma criança de 12 na casa de um casal em Joinville, que pagou comida, moradia e até o tratamento com Mounjaro.
“For us, it’s always been privacy season.” - @vikrantnyc
Catch the rest of this interview between Vik and @sandmark_news on how the shift toward financial privacy isn't slowing down. 🤝
https://t.co/qx9GB6m2PH
TODOS OS COMANDOS DO CLAUDE CODE
em uma imagem só.
72 atalhos, 9 categorias, em português.
contexto, código, automação, paralelo.
salva pra consultar depois.
qual você nunca tinha usado?