“亚马逊云科技认为不能依赖一个万能的、单一的大模型来应对各种任务,正确的做法是客户可以访问多个模型,然后根据自身需求来定制自己的模型。总结来说,我们并不认为有一个所谓的万能大模型,且由某一方掌握,应该是在大模型的基础上,确保以私密、安全的方式让用户定制满足自身需求的模型。”近日,在2023亚马逊云科技中国峰会期间,亚马逊云科技全球产品副总裁Matt Wood在接受《中国经营报》记者采访时如是说道。
Matt Wood在亚马逊拥有近十五年的职业经历,主要擅长机器学习和大数据,他最早加入的是亚马逊云科技欧洲公司,后搬至亚马逊全球总部所在地美国西雅图,是亚马逊云科技较为早期的员工之一。
【资料图】
对于亚马逊云科技入局生成式AI的时机问题,以及日益激烈的AI大模型竞赛,Matt Wood在采访时正面回应道:“生成式AI目前处于一个非常初期的阶段,就像一场马拉松比赛。当比赛刚开始,如果只跑了三四步就断言某某会赢得这场比赛,这显然是不科学的。这是一场长期的竞争,要拭目以待,相信当接近终点的时候,每个人都能看到亚马逊云科技为客户在生成式AI应用构建方面提供简单易用、经济实惠及安全合规的服务。”
“单一大模型包办一切”不太可能出现
《中国经营报》:当下围绕AI大模型的竞争非常热闹,你怎么看这种竞争趋势?
Matt Wood:亚马逊云科技并不认为一个单一的大模型可以包办一切,从数据安全的角度,用户不能依赖一个万能的大型语言模型来应对各种任务。基于此,亚马逊云科技推出的Amazon Bedrock平台上,用户可以通过API接口访问亚马逊云科技自研的预训练Titan基础模型及包括Anthropic、Stability AI等第三方合作伙伴的大模型,由此降低自身在构建模型及扩展生成式AI应用的门槛。
《中国经营报》:什么样的第三方AI大模型可以接入Bedrock平台?平台的最终形态会变为一个大模型市场吗?
Matt Wood:Amazon Bedrock对于托管第三方模型是保持开放心态的。现在有许多行业模型在平台上进行训练,客户根据自己的行业选择相应的基础模型,然后对模型进行训练,并且根据自身业务需求与实际来补充添加独有的、私有的信息,从而使模型的输出结果与问题和需求高度匹配。可以预见,未来会有越来越多的第三方模型出现,既有自研的第三方模型,也会有开源模型,同时Amazon Titan模型也会保持迭代更新。不过需要指出的是,亚马逊云科技不会将Amazon Bedrock做成类似应用市场那样的模型商店,相反会选择更高效、更低时延、更具备普惠价值的大模型。最终在Amazon Bedrock上可能会有数十个“拳头”型的模型产品。
《中国经营报》:大模型的训练成本过高,对于企业客户尤其是中小企业如何享受到新技术红利,你有什么建议?
Matt Wood:AI大模型的训练门槛非常高,无论是硬件还是软件,训练时间和成本都是非常昂贵的。事实上,绝大多数客户并不需要从零开始训练模型,亚马逊云科技可以提供已经训练过的或者预训练模型,客户可以直接使用这些模型,构建自己需要的应用程序或者搭建自己的专用模型。
我想提供几条使用数据开始生成式AI的建议。第一是要基于自己现有的数据战略去做构建;第二需要看如何在组织内部更广泛地、更安全地做生成式AI的探索与实验,目前生成式AI因处于早期阶段,谁也不知道它的边界在哪里,因此组织既要建立一些基础性的规则,要又保持自由度,及时推陈出新;第三则是为需求场景定制化模型,与亚马逊云科技携手共同探讨生成式AI的机会,选择想要攻克的场景或方向后就大力推进。
认识并应对生成式AI的局限性
《中国经营报》:包括OpenAI在内的一些企业在训练AI大模型面临数据授权或版权的问题,亚马逊云科技Titan模型在预训练中使用的是什么数据?
Matt Wood:亚马逊云科技在训练Amazon Titan基础模型过程中使用的数据可以划分为两个类别,一类是公开可获得的数据,另一类是经过授权或者获得了使用许可的数据,这能够确保在训练基础模型时遵守版权要求及相关法律。
《中国经营报》:亚马逊云科技前几日宣布了投资1亿美元成立生成式AI创新中心的消息,该中心在公司战略中担当什么样的角色?
Matt Wood:生成式AI创新中心会集结亚马逊云科技在机器学习方面的资深科学家来开展工作,他们当中许多在机器学习、人工智能领域拥有超过20年的工作经验。同时,亚马逊云科技积极地与生态内伙伴进行合作,共同推动生成式AI产品、服务和流程的创新落地。目前从客户反馈来看,他们对这一新举措感到兴奋,因为这与他们加速使用新技术来提供创新产品、拓展商业模型、改善用户体验等的需求是契合的。
事实上,在过去五年多时间里,亚马逊云科技在多个层面与客户积极合作,其中我参与创立了机器学习解决方案实验室,实验室多年来所提供的解决方案涉及健康医疗、生命科学、金融服务、保险、工业制造、体育等各行各业,已经在提升产品质量、改善业务流程方面释放出社会价值与商业价值。
《中国经营报》:生成式AI在火爆的同时也引发了广泛的争议与担忧,引起了各国监管机构的关注和应对,你怎么看这种担忧的声音?
Matt Wood:从用户视角,在使用生成AI产品及服务时,应该先具备一些基本概念,这就是说,在某些情景中,生成式AI是存在局限性的。例如,在生成文本时,AI可能会给出一个完全错误的答案,但却会表现得非常自信,让人产生一种完全错误的幻觉。这是一个相当困难的问题,尤其是当用户本身并不知道答案的情况下,往往很难辨别AI提供答案的准确性,无法判断AI模型给出的结果是对还是错,这是当前生成式AI面临的一个共同挑战。当然,一个好消息是,如果用户使用Amazon Bedrock的话,那种“自信满满却回答全错”的发展概率会降低。这是因为,亚马逊云科技在内容筛选与信息过滤方面做了很多努力,注重负责任地运行这些AI模型,以确保它给出的答案、解决方案不会对用户产生伤害。
下一篇:最后一页
X 关闭
X 关闭
5月20日,在建的广西最长跨海大桥——龙门大桥东主塔顺利封顶。至此,龙门大桥东、西两岸主塔全部实现封顶,标志着该桥进入缆索系统施工阶
中新网上海3月30日电 (记者 陈静)上海正面临常态化防控以来疫情形势最严峻复杂的挑战,单日新增阳性感染者数量不断刷新纪录。记者30日获
中新网3月30日电 据国家地震台网官方微博消息,中国地震台网正式测定:3月30日18时14分在新疆和田地区皮山县(北纬36 01度,东经77 89度)发
上海市委常委会今天上午(3月30日)举行会议,听取当前疫情应急处置和核酸筛查相关工作汇报,研究部署下一步疫情防控重点工作。市委书记
(抗击新冠肺炎)江苏无锡一男子隐匿行程轨迹被警方立案侦查 中新网无锡3月30日电 (记者 孙权)3月30日,无锡市在“应检尽检”人员核
(抗击新冠肺炎)官方称吉林市疫情扩散势头得到遏制 中新网吉林3月30日电 (记者 石洪宇)记者30日从吉林市政府新闻办召开的疫情防控
中新网唐山3月30日电 (白云水 孟潮)3月30日,河北省唐山市召开新冠肺炎疫情防控工作新闻发布会通报称,3月29日0时至24时,唐山市新增
浙江省嘉兴市秀洲区新型冠状病毒感染肺炎疫情防控指挥部办公室发布通告: 3月30日上午,秀洲区发现1例新冠肺炎阳性感染者,该感染者
今天(3月30日)下午,新疆乌鲁木齐市人民政府新闻办公室召开疫情防控新闻发布会,通报乌鲁木齐市新冠肺炎疫情和疫情防控最新情况。会上
中新网天津3月30日电 (记者 王君妍)记者30日从天津市水务局获悉,为充分发挥河湖长制优势,近日,天津市将南水北调中线天津干线(天津