O Gemini é muito bom (e isso é um problema)
0o Gemini tá bom demais e isso é um problema um baita problema Por que que isso é um problema por conta do Facebook Meta Pera mas não faz sentido O Facebook Meta não tem nada a ver com o Google Concordo Toda essa conversa surgiu por causa do Twitter que é o ex agora Eu Grock Tudo que eu falei é sério e eu não tô brincando Eu vou explicar para vocês certinho nesse vídeo Inteligência artificial é uma coisa boa no momento é muito bem feita muito mais avançada do que era dois anos atrás só que assim ela tá excessivamente boa no momento A gente teve alguns testes agora recentes que deixaram muito claro que se a gente de fato confiar num serviço totalmente online no servidor de outra pessoa fazendo funcionamento à distância no servidor do Google do Facebook e tudo mais em algum momento algum desses serviços vai cobrar pra gente um preço bem alto Eu vou explicar porquê Bora desse ano a gente teve uma competição muito pesada com o Grock da XAI Grock é um modelo de inteligência artificial se escreve grok e é um modelo muito poderoso No primeiro momento quando Grock começou a ser disponibilizado para testes públicos ele bateu o primeiro lugar de aia mais inteligente que estava decompondo melhores problemas e entregando as melhores respostas E isso é uma coisa que eu pensei cara genial é muito bom porque o modelo foi muito bem feito Só que depois os canais especializados de AI que eu costumo assistir começaram a mostrar que os números estavam caindo Eu achei esquisito Falei: “Ué não faz não faz muito sentido” E a resposta simples é: quando você dá muito tempo para ir a funcionar e você coloca os melhores modelos com as melhores máquinas o servidor de alguém nossa edição vai colocar qualquer servidor aqui O Google já mostrou imagens dos servidores deles que é computador computador computador computador São quilômetros assim de computadores e fios e coisas e tudo mais um calor dos infernos e tal Quando você coloca essas coisas para trabalhar elas gastam muito dinheiro muita energia e tudo mais e tal É interessante você gastar menos dinheiro Qualquer um diria isso né então o pessoal da XAI deu uma diminuída no quanto de potência no quantos modelos poderiam entregar Então houve uma queda na performance em relação ao primeiro momento em que todos os itens estavam batendo a melhor performance possível E isso acende aquele alerta Pera quando eu uso uma inteligência artificial na verdade eu só estou me conectando ao computador de outra pessoa No caso é uma empresa mas é o computador de outra pessoa E esse exemplo é só mais recente Aconteceu isso antes já O que aconteceu chat GPT já teve outras versões 3 4 enfim quem tá mexendo nas versões hoje tem a versão 4 por exemplo que é a versão OMI que ela faz de tudo ao mesmo tempo inclusive gera as imagens que o pessoal gerou bastante com ele Só que tem a versão O1 O2 O3 São outras versões que não geram imagens mas são modelos que ficam fazendo o vai e volta de informação que é o reasoning que fica raciocinando fica fazendo várias etapas de raciocínio para te entregar uma resposta mais elaborada Esse monte de modelo são os que estão disponíveis hoje Já teve modelos anteriores que foram descontinuados Cadê você consegue acessar o GPT 2 o 3 o 3.5 não só tem os modelos 4atro E tem muita coisa que os modelos 3,5 enfim eram mais rápidos por um exemplo ou faziam de um jeito que a pessoa gostava contava a história de um jeito mais envolvente ou contava as coisas de jeito um pouquinho mais bem estruturado e você perdeu o acesso deles recentemente porque a família de modelos que está disponível no chat GPT ou nas APIs de acesso ao servidor chatt são só modelos quatro em diante Uma outra coisa que serve de exemplo também perplexity é um serviço agnóstico de AI Eles chamam isso de agnóstico de AI porque eles usam todas as AI disponíveis dentro do serviço Ou seja eles assinam o chat GPT eles assinam o Gemini eles assinam Grock as coisas tal e você pode acessar através do Perplexity qualquer serviço que eles tenham feito parceria ou assinado entendeu então por isso que eles chamam em inglês de agnostic AI Eles usam todas as reais ao mesmo tempo Enfim E teve uma polêmica lá atrás no início do Perplexity que o pessoal assinou ele porque ele dava acesso ao Clou Opus Hoje o Clou tá usando só os modelos Sonet Sonet você escreve assim S O N E T Sonet de Soneto E Opus Opus era de grande obra Sim É tudo a ver com música É Opus Sonet e Haiku Haiku é mais pequenininho que é um um poeminha Enfim o modelo OPS ele era caríssimo para rodar Então o Perplex te ofereceu pr as pessoas acessarem o serviço de intel artificial deles para que eles tivessem acesso a qualquer coisa e poderia se escolher ali Eu quero que você responda através do serviço da Antropic que usa o Cloud na sua versão Opus caríssimo Do nada sem um grande aviso eles limitaram o número de usos do Cloue Opus por dia E isso deu uma explosão O fórum deles assim virou só isso limite opus Cloue não sei o que não sei o que não sei o quê Daí foi indo foi indo foi indo e não existe mais Você vê lá que é o Cloud Sonet Se você abrir hoje o Perplexity na data desse vídeo aparece o R1 Gemini modelo de reasoning ou ou enfim da Open AI e o Cloud 3.6 Sonet se eu não me engano no modo de reasoning de raciocínio avançado porque o Opus foi depreciado foi colocado para trás foi descontinuado e tudo mais Era um modelo caro um modelo mais lento e tal mas ele não está mais disponível Então até mesmo isso que já foi uma polêmica do passado nem mesmo existe para você consultar Aí você entra no título desse vídeo O Gemini tá muito bom O Gemini 2.5 hoje para quem assina os modelos pagos acho que é R$ 90 por mês que tem todo o kit do Google One e também dá para dividir com cinco familiares Enfim o Gemini 2.5 5 Pro que tá como experimental ainda na data desse vídeo ele dá respostas absurdamente boas ele justifica muito bem o modo de pesquisa profunda dele entregou um relatório de teste aqui num cenário que a gente simulou aqui em cima no canal de 35 páginas sobre uma cidade que a gente estava usando de testes Tem que ser uma coisa você conhece para bater né se tá tudo certo E era sobre um campus uma cidade inteira e tava certinha a informação 35 páginas de relatório numa consulta e tava tudo muito bem escrito Aí eu falei: “Cara o Gemini tá muito bom e isso é um problema Por quê?” Aí que eu contei essa história toda Antropic já descontinuou modelo Chat GPT já descontinuou modelo Perplexity que nem mesmo usava modelos próprios Hoje eles usam também modelos open source que eles adaptam mas eles já descontinuaram acesso a serviços de terceiros ou limitaram Grock tinha um modelo que estava com uma potência computacional lá em cima e todo mundo falou incrível e depois de um temp falou: “Ixe as respostas degradaram de qualidade” Sim Então quem foi nele depois se decepcionou com a continuidade do serviço E mais do que isso temos o efeito Netflix Você já assinou o Netflix em algum momento ou Max ou Disney Plus ou qualquer serviço de streaming tem lá um filme muito legal Nossa edição vai colocar a capa do do Zatura uma aventura no espaço Por quê porque Zatura fez 20 anos 20 fucking anos agora em 2025 Zatura Exatamente isso Zatura Você quer assistir Zatura e tá no Netflix daqui a um mês ele saiu porque o serviço não é seu Serviço do Netflix serviço do Max serviço da Disney Plus enfim eles colocam no catálogo que eles querem por quanto tempo eles querem e depois de um tempo se eles quiserem eles removem o acesso Você pagou por um mês usou por um mês próximo mês a história muda cara Você pode parar de pagar e deixar de usar o serviço Ninguém está te segurando lá Nada te impede A IA funciona assim o Google funciona assim Meta funciona assim Grock funciona assim Cloud funciona assim Perplex funciona assim É streaming de conhecimento O Netflix é streaming de vídeos de informações audiovisuais E a é streaming de conhecimento resposta cálculo e raciocínio Mesma coisa eles podem tirar do ar no mês que vem e você fica sem E você pode parar de assinar simples assim Por que que o título desse vídeo é que o Geminis tá muito bom isso é um problema Porque o Google tem um histórico de descontinuação muito grande dos produtos e ele coloca tal como a Apple tudo num bundle Você pode assinar para ter backup do seu celular para ter acesso a um Gmail melhor a um Google Meet melhor ao Notebook LM com uma IA avançada com o acesso ao Gemini com acesso ao Gemini do celular Só que quando você faz uma pergunta pro celular você vê que é o Gemini 2.0 flash Quando você abre o aplicativo você pode selecionar o Gemini 2.5 Pro mas quando você entra no Notebook LM é uma outra versão de inteligência não necessariamente o Gemini mas a versão do notebook LM que usa algum modelo do Gemini e tem os modelos menores que são os GMA Então você fala: “Pera pera pera pera tem submodelos tem subcoisas sub sim tem o 2.0 2.5 as versões os outros serviços.” Aí você fala: “Cara é muita coisa” Exato Nesse é muita coisa É uma questão de que se o Google quiser em algum momento ele pode tornar tudo isso muito melhor ou pior ele pode simplesmente simplificar todos eles diminuir a capacidade de todos eles Isso pode ser feito porque é deles não tem um problema disso Agora se você usa só isso e não se preparou para essa possibilidade aí é um problema seu Eu vou dar como exemplo final aqui o que aconteceu com a meta Meta é Facebook ou seja WhatsApp e Instagram No seu WhatsApp você já viu aquela barrinha escrito meta AI ou inteligência artificial ou pergunte ao WhatsApp pergunte ao lhama enfim aquele símbolo de inteligência artificial é o lhama É o modelo de IA da meta do Facebook Eles lançaram o lhama 3 eu não lembro até onde foi 3.3.2 3.5 enfim a família 3 do lama E era um modelo muito bom com limitações mas open source não é livre para qualquer tipo de uso comercial mas é open source Enfim isso é uma outra discussão é licença mas é open source E eles lançaram recentemente o próximo modelo Eu não lembro se oficialmente ficou como lhama 4 porque eles estavam ainda mostrando o modelo de médio tamanho ia ter o de grande tamanho ainda e tudo mais Mas enfim modelos equivalentes da geração 3 e 4 mostraram que a geração 4 ficou pior E não é sacanagem necessariamente porque você pode simplesmente tentar lançar um modelo mais eficiente que ele não é tão bom em respostas mas ele responde em um décimo do tempo Um segundo ele respondeu: “É ele ficou menos inteligente mas ele é muito mais rápido E agora eu quero levar um modelo muito rápido comigo para qualquer lugar ou eu exijo ter um modelo que sempre tá online mas ele é lento?” Hum Então esse tipo de escolha pode mudar o produto E no caso do lhama não foi nem isso Existem estudos de A de que existem ganhos diminutivos ganhos que retrocedem em relação ao quanto ele fica mais complexo porque ele começa a ficar com tanta coisa na cabeça que ele começa a perder performance e começa a ficar meio confuso na hora de responder Então muitas razões técnicas ou financeiras ou de objetivo de engenharia podem piorar um modelo ou um serviço E o Gemini entrou nisso sabe o Chromecast Chromecast foi descontinuado deu um pau assim violento recentemente né que o certificado dele inspirou e parou de funcionar E se o Gemini fica tão bom e por estar em tudo por ser do Google tá no Gmail tá no trabalho porque Google tem muito workspace tem muitas empresas que usam toda a suitch de trabalho do Google tá nos Chromebooks tá nos PCs com Windows que usam de algum navegador que tem alguma coisa Google ou o próprio Chrome No Android de todos Geminar com o aplicativo para todo mundo inclusive pro iOS todo mundo começa a usar Qualquer tropeço piora bug ou degradação do produto todo mundo vai por água baixo ao mesmo tempo Então o aviso é: o geminis tá muito bom Cuidado Teste todas as Ias tenha planos offline Existem IAS offline instaláveis no seu computador no seu celular Não conte apenas com a inteligência artificial para fazer o seu trabalho Saiba fazer sem É 10 vezes mais rápido você compilar coisas com a IA comilá Não tô falando de código tô falando de textos e de informações tá gente mas também saiba fazer Veja como ela faz Peça para a IAT ensinar o passo a passo de como ela faz Ela ensina ela mostra ela não esconde nada Esteja pronto para caso ela pare de funcionar ou ela degrade com o passar do tempo e tenha problemas É normal Eu vou dar um exemplo final aqui Ainda existe um negócio que se chama destilação Quer dizer destilação né porque em inglês é destil mas em português é destilar né destilar um modelo basicamente seria o seguinte Olá cinegrafista Breno Como vai você na tarde de hoje meu amigo tudo bem meu apresentador Adriano Pô legal mano Por gentileza que objeto é aquele aquele ali que parece um guarda-chuva Isso aqui é um balão de mês que a gente tem pra luz Ah isso é para a luz Pr luz Puxa vida como eu faço para abri-lo Breno você pode me ensinar você precisa de espaço Por que você precisa de espaço que louco mano Aqui basicamente você só precisa fazer essa pressão para baixo para ele poder flexionar aqui da forma que você quer E aí ele vai ele tem um arame lá dentro ó Ohó Caraca mano Muito louco Você é muito gentil Você me ensina muito bem cara Esse processo de raciocínio passo a passo onde você demonstra explica pensa é assim que o chat GPT na versão original é Ele tem muita informação e ele tem que pensar moldar e trazer a coisa para você Só que depois de um tempo você pode destilar o modelo Destilar o modelo em comparação ao que você acabou de ver o Breno ensinando seria exatamente isso aqui Vamos para o Breno destilado Cara como que você pá faz assim isso resumiria como um modelo destilado funcionaria Por quê depois de um tempo explicando demonstrando falando todas as conexões e raciocínios necessários entregam um resultado Se o resultado é esse aqui você não precisa necessariamente fazer o certo que é explicar pensar e raciocinar tudo até ali Se a qualquer custo ele te disser meramente toma É assim você destilou o modelo de todo o raciocínio que fazia ele inteligente que fazia dele uma coisa com experiência para ser só um decorador de respostas certas Se você me ensinar isso daqui do jeito que o Breno ensinou eu vou conseguir repetir isso aqui algumas vezes Mas se eu tiver que montar uma luz que eu nunca vi na vida eu não vou conseguir Os nossos cinegrafistas do canal vão porque eles têm o raciocínio e a vivência real Então a partir do que eles sabem e t de conhecimento eles podem inferir novas coisas e inferir outras adaptações para situações que eles não estavam prontos Eles vão raciocinar e vão cumprir tarefas fora da única coisa que eu sei fazer O modelo deste lado de qualquer inteligência artificial é mais limitado só que ele é muito mais barato ele é muito mais rápido ele é só um decorador de resposta pronta em comparação ao modelo original que gerou ele mesmo Só que eu se fosse uma empresa que gasta milhões por mês e quisesse economizar dinheiro eu destilaria todos os meus modelos e aos poucos colocaria eles para entregar É o GPT7 é o GPT8 Sim claro É a versão destilada Eu fui colocando ela no lugar Ela dá respostas muito boas mas ela não é a mesma versão Portanto quando você pensa em chat GPT quando você pensa em copilot você pensa em alguma coisa versão 7 8 9 10 e de repente a versão que tá rodando ainda é a 10 ainda é a 11 não sei o que mas a versão destilada pode ser que você nem perceba mas você nota uma degradação das respostas tudo tá muito rápido os modelos estão gratuitos mas não é a mesma coisa porque do outro lado eu tô cortando custos Então esse vídeo tem a ver com a técnica tem a ver com a limitação dos modelos tem a ver com as decisões de economia tem a ver com os problemas de mercado tem a ver com a própria tecnologia dizendo que o Gemini 2.5 tá muito bom e isso pode ser um problema Então parabéns ao Google por ter feito o Gemini Eu tenho usado bastante É surpreendente o quanto o Gemini foi de o modelo mais fraco da IA para o modelo mais poderoso da IA nos testes que aconteceram pelo mês 4 e o mês 3 Por que eu digo isso porque o a vida continua a Antropic continua melhorando o Cloud que é um dos melhores A Open AI lançou um modelo de geração de imagem que passou do Google mas como modelo de texto do Google que tava enfim é uma bagunça é todo to todo mês tem um novo campeão Mas parabéns ao Google por ter passado de lá de trás da fila para lá pro topo da cabeça da fila em algum momento outra empresa vai passar ou já passou no dia desse vídeo que você tá assistindo só que é um serviço online E esse exemplo que eu dei aqui ele é para ilustrar que por questões de economia pode ser um problema depender de uma IA que é muito boa Por questões de tecnologia como foi o caso da do lama 4 pode ser um problema depender de uma IA muito boa e da evolução dela que não necessariamente vai entregar o que você usa da IA como melhor Pode ser que ela degrade pela natureza tech dela Ou pode ser simplesmente como o caso que o Grock teve no início do ano no fim do ano onde o corte de custo simplesmente tira tempo de processamento e poder de processamento sem ter que fazer nada que a gente falou mas entrega respostas inferiores ou um tempo muito grande de espera e você ficou com serviço degradado Esteja pronto tem um plano B