网页客服,欢迎咨询
联系我们
      工作时间
  • 周一至周五:09:00-17:30
  • 周六至周日:10:00-16:00
英伟达,又一单收购
2024-09-18 17:50:27 4
  • 收藏
  • 管理

    (原标题:英伟达,又一单收购)

    如果您希望可以时常见面,欢迎标星收藏哦~

    来源:内容来自半导体行业观察综合,谢谢。

    据 The Information 报道, Nvidia正在商谈收购软件初创公司 OctoAI。

    该新闻媒体援引 OctoAI 发给股东的一份文件称,这家由黄仁勋领导的芯片制造商已向这家位于西雅图的初创公司出价约 1.65 亿美元,该公司销售软件供客户使用,并使其人工智能模型以更高效的方式运行。OctoAI 的股东包括 Tiger Global Management、Madrona Venture Group 和 Amplify Partners。

    Nvidia 尚未立即回应 Seeking Alpha 的评论请求。周二午后交易中,英伟达股价下跌 1.4%。

    OctoAI 希望利用 OctoStack 简化私有 AI 模型的部署

    今年四月,OctoAI(前身为 OctoML)宣布推出 OctoStack,这是其新的端到端解决方案,用于在公司的私有云中部署生成式 AI 模型,无论是在本地还是在来自主要供应商之一的虚拟私有云中,包括 AWS、谷歌、微软和 Azure,以及 CoreWeave、Lambda Labs、Snowflake 等。

    在早期,OctoAI 几乎只专注于优化模型,使其运行更有效。基于Apache TVM机器学习编译器框架,该公司随后推出了 TVM 即服务平台,并随着时间的推移,将其扩展为一个成熟的模型服务产品,将其优化功能与 DevOps 平台相结合。随着生成式人工智能的兴起,该团队随后推出了完全托管的 OctoAI 平台,帮助其用户服务和微调现有模型。OctoStack 的核心就是 OctoAI 平台,但用于私人部署。

    OctoAI 首席执行官兼联合创始人Luis Ceze告诉我,该公司平台上有超过 25,000 名开发人员和数百名在生产中使用该平台的付费客户。Ceze 说,这些公司中很多都是 GenAI 原生公司。不过,想要采用生成式 AI 的传统企业市场要大得多,因此 OctoAI 现在也通过 OctoStack 向这些企业发起挑战也许并不奇怪。

    “有一点很明显,那就是,随着企业市场从去年的试验转向部署,首先,所有企业都在四处寻找,因为他们对通过 API 发送数据感到紧张,”Ceze 说。“其次:他们中的许多人也投入了自己的计算能力,那么当我已经有了自己的计算能力时,为什么还要购买 API?第三,无论你获得什么认证,无论你有多大的名气,他们都觉得他们的人工智能就像他们的数据一样珍贵,他们不想把它发送过来。因此,企业确实需要将部署置于你的控制之下。”

    Ceze 指出,该团队一直在构建架构以提供其 SaaS 和托管平台。虽然 SaaS 平台针对 Nvidia 硬件进行了优化,但 OctoStack 可以支持更广泛的硬件,包括 AMD GPU 和AWS 的 Inferentia加速器,这反过来使优化挑战变得更加困难(同时也发挥了 OctoAI 的优势)。

    对于大多数企业来说,部署 OctoStack 应该很简单,因为 OctoAI 为平台提供了即用型容器及其相关的 Helm 图表以供部署。对于开发人员来说,无论他们的目标是 SaaS 产品还是私有云中的 OctoAI,API 都保持不变。

    规范的企业用例仍然使用文本摘要和 RAG 来允许用户与其内部文档进行聊天,但一些公司也在其内部代码库上对这些模型进行微调以运行自己的代码生成模型(类似于 GitHub 现在向Copilot Enterprise 用户提供的服务)。

    对于许多企业来说,能够在严格控制的安全环境中做到这一点,使他们能够将这些技术投入到员工和客户的生产中。

    Apate AI创始人兼首席执行官 Dali Kaafar 表示:“对于我们注重性能和安全的用例,处理调用数据的模型必须在具有灵活性、规模和安全性的环境中运行。OctoStack让我们能够在我们选择的环境中轻松高效地运行所需的定制模型,并提供客户所需的规模。”

    半导体精品公众号推荐

    专注半导体领域更多原创内容

    关注全球半导体产业动向与趋势

    *免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

    今天是《半导体行业观察》为您分享的第3888内容,欢迎关注。

    『半导体第一垂直媒体』

    实时 专业 原创 深度

    公众号ID:icbank

    喜欢我们的内容就点“在看”分享给小伙伴哦




    上一页:几纳米毫无意义,但芯片大有可为 下一页:台积电、博通等追逐的CPO,是什么?
    全部评论(0)