1. 首页 > TMT资讯

华为轮值董事长胡厚崑:盘古大模型3.0即将发布

    盈媒网7月6日消息,在2023世界人工智能大会上,华为轮值董事长胡厚崑发表演讲中表示,在明天举行的华为云开发者大会上,盘古大模型3.0即将发布。华为从通用大模型走向行业大模型。今天,盘古大模型已深耕行业10+,业务场景400+。

0d6a-67a219a9e24ffd22ed0aab0aef32cf9c.png

  胡厚崑表示,ChatGPT出现,把人工智能推向了新风口。人工智能将帮助我们改写身边的一切。华为在人工智能方面布局,推动人工智能走深向实:深耕算力;从通用大模型到行业大模型,服务好千行百业。

  在深耕算力方面,包括:架构创新,发展生态,共建算力。让算力不再成为人工智能发展的瓶颈。架构创新上,重新定义计算架构,对等平构架构节点性能提升30%,昇腾AI集群效率提升10%;发展生态上,鲲鹏/昇腾合作伙伴5700+,硬件合作伙伴30+,场景化系列AI硬件100+,近一半国内大模型创新使能,孵化/适配大模型30+,鲲鹏/昇腾开发者380万+。共建算力上,构建城市算力基础设施,帮助各地政府打造了25个昇腾人工智能计算中心。

  据悉,盘古大模型于 2020 年 11 月在华为云内部立项成功。2021 年 4 月,盘古大模型正式对外发布。其中,盘古 NLP 大模型是首个干亿参数中文预训练大模型,CV 大模型则首次达到 30 亿参数。2022 年 4 月,华为盘古升级到 2.0,发布层次化开发方案 ( LO, L1,L2) ,打造工业级盘古大模型。作为华为公司旗下的一款聊天机器人产品,“盘古 Chat”将基于 GPT 技术进行研发。该技术是目前最先进的自然语言处理技术之一,具有优秀的语义理解、生成和对话管理等功能。通过 GPT 技术,用户可以与“盘古 Chat”进行更加自然、流畅、准确的对话交流。

2-230604111434234.jpeg

  据浙商证券此前披露,在训练千亿参数的盘古大模型时,华为团队调用了超过 2000 块的昇腾 910 芯片,进行了超 2 个月的数据训练能力。华为内部称,每年大模型训练调用 GPU/TPU 卡超过 4000 片,3 年的大模型算力成本高达 9.6 亿元。据华为公司相关人士介绍,“盘古 Chat”将主要面向个人用户和企业客户两个市场。 

本文不代表盈媒网立场,转载联系作者并注明出处:https://www.yingpost.com/tmt/512.html

联系我们

微信:yingpost2023

Email:396500216@qq.com