中文 | EN

hth下载地址:对话腾讯云VP许华彬:AI搜索还在早期阶段AI成为云计算第二增长点公司新闻    发布时间2024-12-24 12:01:56 |来源:hth在线下载| 作者:hth手机


  今年,是AI大模型落地应用元年。企业对AI大模型寄予厚望,落地场景越来越多样、纵深,并正在以结构性的力量对产业进行重塑。

  9月6日,2024腾讯全球数字生态大会互联网AI应用专场在深圳举行。科创南方来到活动现场,并在会后参与对话腾讯云副总裁许华彬。

  在这前一天,腾讯正式对外发布新一代大模型“混元Turbo”,效果在多个基准测试上对标GPT-4o,推理效率提升100%,推理成本降低50%,第三方测评居国内第一。据了解,目前腾讯内部近700个业务及场景已接入,包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等。

  据了解,目前腾讯云AI产品已覆盖超过400家互联网头部企业,累计服务超过12万家互联网客户。

  以混元为代表的AI大模型驱动着产业创新发展,在业务高效创新上展现出了更强势的产品力,并且不断给用户所带来全新的体验。现场介绍,值得买科技、燧原科技、趣丸、猎聘、腾讯新闻等,都在混元大模型、腾讯云的基础上,开展了一系列互联网AI应用实践,要么用以提升业务效率,要么用以创造用户新体验。

  当生成式AI成为大热门,云有什么变化?在许华彬看来,生成式AI带来更大规模的数据交互,更高的能耗以及不同的运维体系。

  同时,面对大模型浪潮到来下企业需求的变化,许华彬告诉科创南方,AI很有几率会成为未来的第二增长曲线,云行业客户的真实需求从早期的视觉领域拓展到数字人的应用等方面,而在这一过程中,腾讯云在AI基础设施上的能力也慢慢的变成熟,以适应行业的发展需求。

  AI搜索,能够说是离我们生活最近的AI应用之一了。我们每天不能离开搜索,那如果AI和搜索结合起来,会如何重塑我们的搜索使用习惯?在值得买科技首席技术官王云峰看来,人与搜索工具的使用的过程,其实就是一个相关驯化的过程。早期,我们用傻瓜式提问期待搜索引擎做出全面回答,但是当时技术并不支持;如今,当AI搜索出现后,我们却反而是用关键词去向AI进行提问。

  在和腾讯云副总裁许华彬、值得买科技首席技术官王云峰的对话中,我们对云+AI的发展、生成式AI在泛互联网行业的落地趋势等方面有了更深入的了解。

  问题:现在Chat GPT发布一年多了,大型的云厂商也逐渐构建起了比较完善的AI产品服务体系,并且每个运营厂商有自己的特点,有的主打开放生态,有的是闭源生态,也有专注于工具层的。腾讯云走的是什么路线?为何需要走这种路线?

  许华彬:作为云厂商我们侧重两个方面,第一是我们做好基础的设施,各位明白算力是最基本的要素,包括训练数据的存储、网络,这是一个基本点。第二是站在运营商的角度看,对每家模型我们本身是比较开放的,大家看见我们的平台,其实结合了多家的模型,除了腾讯自己的混元大模型,也有国内的各个厂商的大模型。

  问题:在大模型兴起之前的、传统的云,和现在生成式AI的云,它的需求和需要的能力有什么不同?

  许华彬:传统云业务的数据流量比较小,而生成式AI的云业务,尤其是训练集群,涉及多台机器间的大规模数据交互,流量通常达到T级别以上。因此,这两者在数据需求上存在非常明显差异。此外,功耗需求也不同,生成式AI所需的H级机柜在大多数情况下要几千瓦甚至更高的电力支持。同时,运维体系也存在区别。

  其实腾讯早已在AI领域展开了实践,在OpenAI发布ChatGPT之前,腾讯已经开发了自己的模型,虽然当时的模型可能与现在的大模型不一样,但这一领域的探索已经持续多年。

  问题:AI搜索是现在比较热的话题,都说有搜索框的地方就有AI搜索,您怎么样看待AI搜索的?

  王云峰:我最初的工作是在搜狗,负责搜索相关的业务。我有特别深的一个感触——当年用户向搜索引擎提出的问题,正是我们现在想让他们向AI提出的问题。

  AI对话刚推出时,很多用户使用它的方式其实和他们使用搜索引擎的方式很相似。若用户像20年前那样使用搜索引擎——明白准确地提出自己的问题并期待答案——我们反而会更高兴。那时候,用户会直接表达他们的问题,并希望从搜索引擎得到解答。然而,现在人们更多地依赖关键词搜索。

  这种变化体现了搜索引擎和用户之间的一种“互相驯化”。早期,人们期望通过简单提问从搜索引擎获取答案,但技术水平有限,无法完全满足需求。而现在,AI具备了更强的理解能力,但用户的习惯已经被关键词搜索固化了。

  在我看来,云计算和AI的发展规律类似,是一个使用者和工具相互适应的过程。工具的能力会影响用户的使用方式,反过来,用户也会学会怎么样更好地使用这一些工具。

  AI对搜索引擎的影响尤其明显。过去,人们通过提问寻找答案,而如今,AI不但可以提供答案,还能结合新的检索技术,逐步提升准确性。当然,AI在某些方面任旧存在局限性,比如数据时效性的问题,但搜索引擎的检索技术能很好地弥补这一点。所以,我认为,AI和搜索的结合,将为用户所带来更加优质的体验。

  问题:现在很多公司都在做AI搜索,你们觉得可能哪些特质的公司最后跑出来成为AI时代做AI搜索的赢家?

  王云峰:我认为,目前AI搜索还处于早期阶段,此阶段很像当年搜索引擎刚起步的时候。回想Google的早期版本,很多人觉得它的搜索效果并不好,每次更新后结果都会不一样,规律难以把握。但随着一直在优化,它逐渐慢慢的变好。AI搜索也处在类似的发展阶段。虽然搜索本身在信息获取上有局限性,但并非所有问题都能通过信息获取解决。

  能够在AI搜索领域脱颖而出的公司应该具备两方面的特质。首先,此公司需要对产品有极强的追求。就像当年搜索引擎经历了多年的调优过程,AI搜索同样要一直调整和改进。只有在产品上持续追求卓越,才能在这样的领域取得成功。

  其次,成功的公司一定要在信息检索方面有一定的积累。我特别强调信息检索,因为这不仅仅是搜索技术本身的积累,还包括整体搜索体验的积累。比如,在一些通用领域,可能传统的搜索方式已经能够很好的满足需求,但在更为专业的垂直领域,公司需要对这些领域有深入的理解,才能为用户更好的提供真正有用的答案。

  正因为如此,我认为积累深厚的公司更容易找到比较合适的合作伙伴,并在AI搜索领域取得成功。毕竟,覆盖所有领域是不现实的,但对某些领域的深刻认知和积累能够在一定程度上帮助他们走得更远。

  问题:因为您之前一直就是负责云业务,在这一波大模型浪潮来了之后,感觉客户的真实需求跟之前有什么改变,遇到的最大的挑战是什么?

  许华彬:随着大模型浪潮的来临,客户的真实需求相较以前有了显著的变化。AI很有几率会成为未来的第二增长曲线,我所负责的云行业客户围绕AI的需求明显增多。过去,AI需求大多分布在在视觉领域,比如OCR、图片识别、图文识别以及语音识别和合成等应用。近年来,随着大模型的发展,数字人的应用也变得更广泛和成熟,需求也从原来的脚本编写扩展到利用语言模型驱动的应用。

  腾讯云不仅在模型开发上发力,还提供了覆盖整个数据处理链条的服务,包括数据清洗、数据存储、数据库能力、数据湖能力等工具。同时,云服务的底座基于多种异构化选择,使得腾讯云在AIGC时代有较强的准备能力。此外,云服务在上线过程中,内容风控也是至关重要的一环。腾讯云可提供从前端到后端的全面云场景能力输出,实现用户的多样化需求。

  数据中心时代,云服务的一个显著优点是“开箱即用”。无论是整体解决方案、局部服务还是插件,客户都可以按需下单使用,享受云服务带来的弹性伸缩、研发便利性以及资源规模化效应。

  虽然AI的应用前景广阔,但仍然面临许多挑战。尤其是从去年开始,业界对大模型的预期非常高,但在实现过程中,存在不少技术上的困难。过去,大家已经关注文本和语言模型技术多年,但由于参数受限,进展相对缓慢。然而,随着OpenAI推出ChatGPT后,市场的需求和期望变得更复杂。

  我还想起来,在2022年底或2023年初时,很多公司都在构建训练集群,而算力设备易发生故障,导致训练中断。为了应对这样的一个问题,腾讯云花费时间优化了故障恢复的效率,从最初的30分钟缩短到20分钟,直到如今可以在10分钟甚至几分钟内恢复训练进度。这些持续的优化让腾讯云在AI基础设施上的能力慢慢的变成熟,适应行业的发展需求。

  问题:关于混元大模型,腾讯云最近上线了多模态的MOE模型,想问下为什么选MOE这个架构,出于什么考虑?

  选择MOE架构并不是最近才做出的决定,早在2022年甚至更早,腾讯混元团队就已经在使用MOE模型,并在此基础上一直在升级。选择MOE架构是基于多方面的考虑。

  一方面,很多场景中希望模型的参数越大越好,MOE模型能够很好地平衡参数规模与不同专家领域的知识储备需求。其次,MOE模型在成本控制方面表现优异,特别是在全推理场景中,计算成本通常非常高,而MOE模型能够在提供大规模参数的同时,降低推理成本。

  另一方面,是在成本上。关于大模型和小模型的各种争议一直存在,但总体来说,模型参数越大,结果往往会更好。然而,在实际应用中,还需根据不同场景灵活调整。例如,在腾讯会议中,AI总结和会议纪要等功能的使用量非常大,因此就需要在效果、成本和可持续发展之间找到平衡。有时候,会通过蒸馏技术将大模型压缩为较小的模型,以应对高成本压力。所以我们要既考虑效果,又要考虑成本,也要考虑持续性健康的发展,最终选择了MOE架构。

上一篇:2024-04-21 下一篇:云计算是什么概念

推荐资讯-hth下载地址