端到端加速企业GenAI创新,英伟达NIM微服务成为软件企业看中的亮点!



3月20日,软件开发企业Cloudera宣布了一项重要的合作信号:要与NVIDIA一起加速生成式AI应用的部署。具体来讲,就是通过将NVIDIA的AI微服务集成到其Cloudera数据平台(CDP)中,帮助企业能够快速构建和扩展基于自身数据的定制化大型语言模型(LLMs)。 此次合作中,Cloudera将利用NVIDIA AI Enterprise,包括NVIDIA Inference Manager(NIM)微服务,解锁CDP中超过25E字节数据的洞察。这些丰富的企业信息将输入到Cloudera机器学习平台中,该平台是公司的端到端AI工作流程服务,将推动新一轮的生成式AI创新。 Cloudera的AI/ML产品副总裁Priyank Patel表示:“企业数据结合为大型语言模型优化的全栈平台,在将组织的生成式AI应用从试点推向生产方面起着至关重要的作用。Cloudera正在集成NVIDIA NIM和CUDA-X微服务,以驱动Cloudera机器学习平台,帮助客户将AI的炒作转变为商业现实。” 此次合作不仅展示了Cloudera和NVIDIA在技术创新上的实力,也反映了市场对生成式AI应用的需求正在快速增长。通过整合双方的资源和技术优势,双方共同推动AI在企业中的实际应用,为企业带来更高效、更智能的解决方案。 此外,通过利用CDP中的海量数据,结合Cloudera机器学习平台的强大功能,企业能够更深入地挖掘数据的价值,实现更精准的决策和更高效的业务运营。这一合作将为企业带来更加智能化、自动化的未来,推动整个行业的发展和进步。



连接模型与数据 

 在连接模型与数据之间,企业AI面临着一个关键挑战,即如何将基础模型与相关的业务数据连接起来,以生成准确、符合上下文的输出。NVIDIA的NIM和NeMo Retriever微服务旨在通过使开发者能够将LLMs(大型语言模型)与从文本文档到图像和可视化等结构化和非结构化企业数据连接起来,从而弥合这一差距。 具体来说,Cloudera Machine Learning将提供集成的NIM模型服务功能,以增强推理性能,并在混合和多云环境中实现容错、低延迟和自动扩展。而NeMo Retriever的加入将简化检索增强生成(RAG)应用程序的开发,这种应用程序通过实时检索相关数据来提高生成式AI的准确性。 其中,NVIDIA NeMo Retriever是NVIDIA NeMo框架和工具系列的一项全新服务。NeMo是一个用于构建、自定义和部署生成式AI模型的框架和工具系列。作为一项语义检索微服务,NeMo Retriever借助经NVIDIA优化的算法,帮助生成式AI应用作出更加准确的回答。使用该微服务的开发者可以将其AI应用与位于各个云和数据中心的业务数据相连通。这种连接不仅增强了AI应用的准确性,还使得开发者能够更灵活地处理和利用企业数据。 概括来说,NVIDIA的NIM和NeMo Retriever等微服务为企业提供了一种有效的方式,将AI模型与业务数据紧密地结合在一起,从而生成更加准确和有用的输出。这为企业提供了强大的工具,可以进一步推动AI在各个领域的应用和发展。 

数据到生成式AI部署,大大缩短时间

 NVIDIA与Cloudera的合作正在为企业打开一扇全新的大门,引领他们更高效地利用海量数据来构建定制化的协同助手和生产力工具。NVIDIA企业产品副总裁Justin Boitano表示:“NVIDIA NIM微服务与Cloudera数据平台的集成,为开发者提供了一种更加灵活和简便的方式来部署大型语言模型,从而推动企业的业务转型。” 通过简化从数据到生成式AI部署的路径,Cloudera和NVIDIA旨在加速企业对诸如编码助手、聊天机器人、文档摘要工具和语义搜索工具等变革性应用的采纳。这一合作建立在两家公司之前通过将NVIDIA RAPIDS集成到CDP中利用GPU加速的基础上。 Patel强调了扩大合作带来的业务好处,他指出:“除了为客户提供强大的生成式AI能力和性能外,此次集成的结果还将使企业能够做出更准确、更及时的决策,同时减少预测中的不准确性、幻觉和错误——这些都是在当今数据环境中导航的关键因素。” Cloudera将在3月18日至21日于加利福尼亚州圣何塞举行的NVIDIA GTC上展示其新的生成式AI能力。随着领先企业探索基础模型改变其运营的潜力,Cloudera和NVIDIA坚信他们的合作将使客户站在企业AI新兴时代的前沿。
——好文推荐——
无人能复刻英伟达B200!友商抄无可抄,谁能懂?预计30000美元起!黄仁勋摊牌:通用计算过时了!
字节年终奖发放大赏;复现类Sora代码,全细节开源;网友透析马斯克开源Grok;“Apple ID”将成历史;英伟达B100来了


相关推荐

  • 巨头争锋:AGI来到临界点?
  • 突发!Stability AI核心团队已分崩离析,抢功、侵权、撤资争议不断,AI界有自己的“春山学”
  • 使用 BigDL-LLM 加速 Intel * 数据中心 GPU 上的 LLM 推理
  • 裁员潮持续,劝所有程序员早点做个人规划!| 极客时间
  • Sora很难跟进?微调就不是一个岗位?大力出奇迹将继续适用?大模型将对软件生态带来哪些变化?
  • 没有App,也没有 App Store,未来的手机会干掉全部应用开发人员吗?
  • 杭州/深圳内推 | VIVO影像算法研究部招聘AIGC+计算摄影方向算法工程师/实习生
  • 港科大(广州)开源智慧交通新成果,用AI大模型控制红绿灯
  • 能否在追问中坚持判断?揭秘大语言模型的判断一致性挑战
  • 最新爆料!GPT-5已有客户上手体验:性能惊人,或将在夏天发布
  • Transformer七子重聚GTC,老黄亲自赠送签名版DGX-1!7年奠基之作背后佚事揭秘
  • 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • 中国AI开发者「抢人战」倒计时2天!IEEE首位中国籍副主席、OpenAI大佬齐聚,2024 GDC大会来了
  • Zilliz联手英伟达发布全球首个GPU加速向量数据库!CUDA加持性能飙升50倍,未来十年或暴涨1000倍
  • qiankun?这次我选了wujie!
  • CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE
  • CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒
  • 薪酬、人数上不封顶,这家互联网大厂正在疯抢超级毕业生
  • 72岁法国概率论大佬获阿贝尔奖,陶哲轩:他的知名度理应更高
  • 瘫痪8年后,马斯克的首个脑机接口人类植入者,正在用念力玩文明6