É um fato bem conhecido que um modelo de IA é tão bom quanto os dados que são alimentados. A IA baseada em modelo é julgada em relação a conjuntos de dados de referência e comparada com parâmetros específicos. A maioria dos pesquisadores depende da melhoria algorítmica e não da qualidade dos dados. A maioria das empresas hesita em adotar a IA devido a esse motivo – falta de bons dados. Andrew Ng, o proeminente pesquisador de IA, acredita que a IA centrada em dados transformará esse jogo de cabeça para baixo. E há muitas boas razões para esta proposição.
Um ciclo de IA envolve, em sua maior parte, a preparação de dados de alta qualidade, o que representa pelo menos 80% do ciclo de vida da IA. Embora o treinamento do modelo de IA constitua 20% do treinamento do modelo, também tem sido o centro do foco para pesquisadores e empresas.
Os benefícios de uma abordagem centrada em dados vão além dessa vantagem única. Por exemplo, rotular dados que são basicamente feitos por humanos vem com certas inconsistências. Introduz ruído nos dados que pode ser prejudicial para o ciclo de IA. Isso acontece por causa de diferenças nas diretrizes de interpretação. Andrew diz que, ao identificar os pontos de desacordo para rotulagem, as discrepâncias podem ser reduzidas em grande medida. Quando um modelo é ajustado com base em dados defeituosos, é provável que tenha menor precisão. Em uma abordagem centrada em dados, como os dados são pré-projetados para projetar um modelo, pode-se esperar a precisão dos dados além da otimização do modelo.
A engenharia de dados tem muito a ver com a correção de dados ruidosos. Na maioria dos casos, os projetos de IA não conseguem ver a luz devido à falta de dados suficientes. Quando um pequeno conjunto de dados é usado para um modelo, ele abre espaço para muito ruído e, portanto, erros. Quando você tem um conjunto de dados pré-modelado, o nível de ruído pode ser reduzido significativamente. A IA centrada em dados aborda todos os casos marginais com dados claramente definidos com foco na arquitetura do modelo.
Mais histórias em alta
- Shiba Inu está pronto para atingir US$ 0,000017 em julho! Mas não vai superar isso
- Google excluirá dados confidenciais do histórico de localização dos usuários após revogação do Roe
- Livros quase perdendo direitos autorais recebem um NFT Twist para preservar seu status
- A ‘IA democrática’ da Deepmind distribui dinheiro público! Pode fazer um governo de IA
- Modelos de IA da Fundação, como DALL.E e GPT-3, precisam de normas da comunidade antes que prejudiquem
- Os 10 hackers éticos mais famosos da Índia para conhecer em 2022
- O dumping de papel comercial pode ajudar a Tether a ganhar confiança no dólar americano?
O post Data Engineering for AI, a Real Game-Changer apareceu primeiro em .
source – www.analyticsinsight.net