Elon Musk, fundador da empresa de inteligência artificial (IA) xAI, anunciou um novo recurso para Grok na segunda-feira. O chatbot interno de IA agora está obtendo capacidade de compreensão de imagem que permite processar e analisar o conteúdo de uma imagem. Os usuários agora podem fazer upload de uma imagem e fazer perguntas à IA com base nela. Notavelmente, a xAI lançou o modelo Grok-2 AI em agosto. Na época, a empresa anunciou que o modelo de IA em breve suportaria diversas modalidades.
Grok AI obtém capacidade de compreensão de imagens
Em um publicar no X (anteriormente conhecido como Twitter), o identificador oficial do Grok anunciou o novo recurso de compreensão de imagem para o chatbot de IA. A compreensão de imagens, também conhecida como visão computacional, permite que um sistema de IA veja e processe dados visuais dentro de uma imagem ou vídeo. Atualmente, esse recurso está disponível apenas para imagens estáticas.
Almíscar também postado sobre o novo recurso, destacando que o chatbot AI pode fazer uma análise mais profunda da imagem e até explicar o significado de uma piada visual. Compartilhando um exemplo, o bilionário pediu a Grok que explicasse uma piada em uma imagem. A IA foi capaz de explicar a premissa da piada, a reviravolta e a piada visual nela contida.
No entanto, a visão computacional não é um recurso novo para sistemas de IA, e quase todos os principais modelos de IA oferecem esse recurso, incluindo Gemini, ChatGPT, Copilot, Claude e muito mais. Um usuário do X destacou isso e levantou a preocupação de que ainda faltam muitos recursos básicos no Grok.
Em um comentário à postagem de Musk, o usuário disse que o chatbot AI ainda não possui capacidade de upload de arquivos e geração de imagens. O empresário bilionário respondeu: “Não por muito tempo. Estamos concluindo em meses o que todo mundo levou anos.” Esses recursos poderão ser adicionados ao Grok em um futuro próximo.
Em agosto, a xAI lançou os modelos Grok-2 e Grok-2 Mini AI, como uma atualização para a versão piloto do modelo de linguagem grande (LLM). Ambos os modelos estão disponíveis no chatbot Grok para usuários X Premium e X Premium+. A empresa afirmou que superou os modelos Claude 2.5 Sonnet e GPT-4 Turbo AI.
source – www.gadgets360.com