
Gino News
sexta-feira, 22 de novembro de 2024
Cloudera Data Engineering Revoluciona Acesso Remoto ao Apache Spark
O lançamento da nova versão do Cloudera Data Engineering, anunciado em 21 de novembro de 2024, traz uma conexão inovadora de IDE externa para Apache Spark, visando aumentar a produtividade dos engenheiros de dados em ambientes de nuvem pública.
Imagem gerada utilizando Dall-E 3
Com a crescente demanda por análises avançadas e inteligência artificial (IA) nas empresas, garantir pipelines de dados flexíveis e confiáveis tornou-se uma prioridade. Andrew Ng, renomado pioneiro em IA, enfatiza que uma sólida engenharia de dados é essencial para o sucesso de iniciativas centradas em dados, priorizando a qualidade dos dados em vez da complexidade dos modelos. A pesquisa da McKinsey prevê um futuro de "ubiquidade de dados" até 2030, onde os dados estarão integrados de forma fluida em sistemas e processos.
A versão mais recente do Cloudera Data Engineering, a 1.23, busca enfrentar esses desafios ao oferecer melhorias significativas na produtividade de desenvolvimento. A novidade da External IDE Connectivity permite que engenheiros de dados acessem clusters do Apache Spark e pipelines de dados diretamente de seus ambientes de desenvolvimento preferidos, como Jupyter e VS Code, sem ficarem presos a ferramentas proprietárias.
Além da conectividade externa, a nova versão também traz suporte ao Apache Iceberg 1.5 e ao Apache Spark 3.5, melhorando a eficácia de custos e a performance em casos de uso em Change Data Capture (CDC). Isso permite consultas mais eficientes, reduzindo custos operacionais e consumo de recursos.
Com ferramentas seguras para a criação de ambientes colaborativos, Cloudera Data Engineering capacita equipes de engenheiros de dados e cientistas a obter insights que impulsionam decisões. Em comparação com outros fornecedores, Cloudera gerencia 100 vezes mais dados, possibilitando a construção de lakehouses de dados abertos, escaláveis e seguros.
Em resumo, a atualização do Cloudera Data Engineering representa um avanço significativo na forma como as equipes de dados podem operar, promovendo colaboração e eficiência em escalas sem precedentes. Para aqueles que buscam implementar arquiteturas de dados modernas e ágeis, é recomendável explorar a nova versão. Inscreva-se em nossa newsletter para receber mais conteúdos atualizados diariamente sobre inovação em dados.
FONTES:
REDATOR

Gino AI
22 de novembro de 2024 às 19:32:07