行业分类:
加载中...
头条分类:
加载中...
震荡一年后,阿里稳了吗
文|《中国企业家》记者 邓双琳 编辑|李薇 图片来源|视觉中国 2024年5月14日晚,阿里公布2024财年四季度(2024年1月~3月)及全年(2023年4月1日~2024年3月31日)业绩报告。四季度内,阿里实现收入2218.74亿元,同比增长7%;全年收入9411.68亿元,同比增长8%。 值得注意的是,四季度淘天GMV双位数增长,在此之前,该业务已经连续几个季度增长乏力,淘天甚至一度放弃宣传GMV口径;阿里云公共云产品收入双位数增长,AI相关收入三位数增长;海外电商业务收入同比增长45%。 可见,阿里最新财报讲述了一个关于“增长保卫战”的故事。 以淘天为例。去年11月底,阿里市值首次被拼多多超过,管理层痛定思痛,在内部采取一系列反击动作,几乎对拼多多“拳拳到肉”:执行低价策略和“退货自由”,先后推出加码百亿补贴、实行仅退款政策、取消预售等。 一个月前,阿里巴巴创始人马云在内网分享长文,他认为过去这一年阿里最核心的变化,不是去追赶KPI,而是认清自己,重回客户价值轨道。 阿里巴巴集团董事会主席蔡崇信此前在访谈中也复盘过类似问题:“阿里落后了,因为我们忘记了真正的客户是谁……某种程度上我们有点自食其果。”阿里巴巴集团CEO吴泳铭也多次强调阿里最新的两大战略重心:用户为先,AI驱动。 创始人们显然已经吹响号角,阿里也已经从去年错综复杂的组织变化中走出,聚焦精力全力夺回用户心智,保卫增长。 但保证用户体验就意味着付出大量成本投入,短期内不免带来账面压力。四季度阿里净利润仅为9.19亿元,同比下降96%。 对此,阿里给出三方面解释:1.集团加大了对电商业务的投入;2.授予菜鸟员工的留任激励;3.投资的上市公司市值下降,投资损益的净利润有所下降。 若不考虑股权激励费用、投资的收益(损失)、无形资产减值以及其他若干项目,阿里巴巴四季度非公认会计准则净利润为244.18亿元,同比下降11%。 01 淘天的关键战役 从财报上看,在一系列措施下,淘天大盘基本稳住,但营收增速势头依然较弱。 四季度内,淘天收入同比增长4%至人民币932.16亿元(129.10亿美元),对阿里总体拉动作用没有太大突破;利润方面,季度内淘天经调整EBITA微降1.3%至385.01亿元,原因是增设了更多提高用户体验的项目,造成了成本项上升。 但淘天的GMV和订单量可圈可点,均实现同比两位数增长,整体活跃用户数和消费频次也明显提高。从去年年中开始,阿里一直在强调“回归电商主业”,从结果看,战略收获一定成效。 在低价策略上,今年2月,据晚点LatePost报道,淘特商家的主要经营阵地将转移到淘宝,商品保留曾经的销量、评价等各类数据标签。有了低价商品的填充,淘宝APP首页出现了多个“百亿补贴”和“秒杀”的入口。 用户权益上,去年12月底开始,淘宝陆续推行一系列政策,包括仅退款、新疆包邮、先用后付、88VIP无限次退货包运费等。今年“618”淘天甚至取消了预售,试图更快抢跑,还捡起来尘封多年的淘宝网以及“淘江湖”论坛。 但这也影响了淘天的利润。目前来看,虽然该季度有收获成效,但仍然是通过牺牲毛利率来为增长做铺垫。 另一个值得注意的是,淘天CMR(客户管理收入)增长只有5%,低于GMV增速。 财报电话会上,吴泳铭对此解释:“我们认为在淘宝这样的平台,投资商品竞争力、商品效率、客户服务体验、用户消费体验等,从而带来GMV与用户消费频次增长是我们今年的首要任务。只有在这项首要任务实现更好增长的前提下,如何去提升CMR才会是水到渠成的过程。” 过去几年,拼多多凭借超高的人效以及对买家的重视,对阿里步步紧逼。最新财报显示,2023年拼多多集团营收为2476亿元,较上一年增长了90%,而淘天集团此前的增速却弱于中国电商大盘增速。引以为傲的电商基本盘不再有绝对优势,这是阿里最大的风险点。 纵观整个电商市场,拼多多增速连续多个季度保持在三位数,京东全力推进“低价策略”让利幅度不低于淘天,抖音、快手也在努力瓜分电商市场份额,淘天能否扭转局势,“618”将成为关键一役。 而淘天的一系列措施,真正起效的时间节点将在今年3月~6月,显然,下一份财报才是真正检验这些措施是否见效的时刻。 02 新的增长引擎 阿里国际数字商业集团和菜鸟集团已经取代淘天和阿里云,成为阿里新的增长引擎。 四季度内,阿里国际数字商业集团收入274.48亿元,相比去年同期的189.15亿元同比提升45%;菜鸟集团也凭借245.57亿元的收入实现了同比增长30%的涨幅。 阿里国际数字商业集团表示,旗下零售平台整体订单同比增长了20%,并透露本季度Lazada每单亏损同比收窄。业绩主要由跨境业务增长驱动,尤其是Choice(速卖通全托管/半托管模式)业务。今年4月,Choice占速卖通整体订单的70%左右。 海外本地电商层面,Trendyol继续保持订单双位数增长,除土耳其外,Trendyol进一步将业务扩展至海湾地区,并在本季度成为海湾地区下载量最多的电商APP之一。 菜鸟虽然在四季度撤回IPO,但在与速卖通的协同之下,跨境包裹5日及10日配送妥投率均同比翻倍。 在营收增速上,阿里国际数字商业和菜鸟虽然已是阿里整个集团的排头兵,但两者单季仍然处于亏损。 阿里国际数字商业集团CEO蒋凡在电话会上解释了国际商业亏损扩大:“上个季度主要有两个原因导致我们的业务投入比较大:一、上个季度我们在一些新兴市场有比较激进的投入,尤其是在中东,Trendyol平台开始在海湾地区拓展业务,这些都会有比较大规模的投入;第二,AE Choice商业模式的占比一直在爬升,这种商业模式在切换的过程中,本身的盈利能力还需要时间,我们现在也在快速优化效率。” 受AI收入提振拉动影响,四季度内阿里云智能集团收入同比增长3%至255.95亿元,经调整EBITA(息税折旧摊销前利润)同比增长45%至14.32亿元。也就是说,阿里云是四季度内,阿里整个集团内经调整EBITA同比增幅最大的业务板块。 季度内,本地生活集团收入同比增长19%达到146.28亿元;经调整EBITA为亏损31.98亿元,同比收窄21.2%;饿了么和高德订单增长,是推动本地生活集团收入增长的动力。而亏损收窄的核心原因之一,是饿了么到家业务的亏损状况有所优化。 风波中的高鑫零售、银泰、盒马被统一划归到所有其他业务部分,与灵犀互娱、飞猪、夸克等并列,在当季收入占比为23.19%,但收入增速同比下降3%,且为负增长。 总的来看,阿里最新成绩单虽然稳健,但惊喜不足,整体处于守势状态。经历去年的一系列动荡后,阿里正处于新秩序的建立中,目前的重点是保卫电商大盘、拓展海外业务,以牺牲短期盈利换取战略性增长。接下来的三个季度,才是验证结果的时刻。
马斯克脑机公司早知人体试验问题,为何不重新设计?
Neuralink 凤凰网科技讯 北京时间5月15日,埃隆·马斯克(Elon Musk)旗下脑机接口公司Neuralink上周披露,其第一位人体试验患者大脑内的细微电极线脱落。但是据五位知情人士透露,这是一个Neuralink早已知道多年的问题。 知情人士称,早在Neuralink去年获准进行人体试验前,该公司就已从动物试验中得知,这种电极线可能会收缩,会带走解码大脑信号的敏感电极。但是,Neuralink认为这种风险足够低,以至于不值得重新设计。 Neuralink植入物使用的细电极线比人的头发还细。该公司在上周表示,在其首次人体试验中,患者大脑中的电极线出现了收缩问题,导致测量大脑信号的电极减少。这些信号被转化为动作,比如在电脑屏幕上移动鼠标光标。Neuralink表示,他们通过修改算法增加灵敏度等调整,成功恢复了植入物监测患者脑信号的能力。 知情人士透露,美国食品和药物管理局(FDA)知道这种电极线存在的潜在问题,因为Neuralink在申请开始人体试验时向FDA分享了动物试验结果。FDA拒绝就是否知道这个问题或其潜在显著性发表评论。该机构告诉路透社,它将继续监测Neuralink人体试验患者的安全性。 为何不重新设计? 知情人士称,如果Neuralink在不重新设计的情况下继续试验,一旦更多的电极线脱落,其对算法的调整不足以解决问题,那么它可能会面临挑战。但是,重新设计电极线也有其自身风险。例如,如果将电极线固定在大脑中,一旦它们脱落或公司需要移除设备,可能会导致患者脑组织损伤。 Neuralink现任和前任员工表示,该公司在设计电极线时一直希望能够做到无缝移除这些电极线,这样植入物就可以随着技术的进步而随时更新。 外部研究人员以及曾在Neuralink和其他医疗设备公司工作过的知情人士称,医疗设备公司在动物试验期间对不同的设计进行故障排除,以及在动物和临床试验期间出现问题,这是很常见的。 研究大脑植入物的专家说,电极线脱落的问题很难解决,部分原因是大脑在颅骨内的运动机制。匹兹堡大学神经工程师罗伯特·冈特(Robert Gaunt)表示,手术后这么快就看到电极线的脱落令人失望,但这并非不可预见。“在植入手术后的几天、几周、几个月时间里,这可能是最脆弱的时期。”他表示。 路透社在去年报道称,2022年,FDA最初拒绝了Neuralink开始人体试验的申请,并提出了对电极线的安全担忧。为了解决这些问题,Neuralink进行了额外的动物试验,FDA去年批准该公司开始进行人体试验。 三位知情人士提供的信息和公司记录显示,Neuralink发现,一部分植入其设备的猪出现了一种被称为肉芽肿的大脑炎症,引发了Neuralink研究人员的担忧。他们认为电极线可能是导致这种炎症的原因。肉芽肿是一种炎性组织反应,可在异物或感染周围形成。 至少在一个案例中,一只猪出现了严重的病情。路透社查阅的公司记录显示,这只猪在手术后出现发烧和呕吐症状。直到对猪的尸体进行解剖并检查了大脑后,Neuralink的研究人员才意识到问题的严重程度。 据知情人士透露,在Neuralink内部,研究人员讨论了如何纠正这个问题,并开始了长达数月的调查。最终,该公司无法确定肉芽肿的原因,但得出的结论是,植入物及其附带的电极线不是罪魁祸首。 截至发稿,Neuralink及其高管尚未就此置评。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
小米又一产品大涨117%,冲进全球前5,华为却没上榜
2024年,小米似乎越来越强了,手机方面,小米也是大涨,一季度增长34%,是前五大品牌中,除传音外增长最快的。 哪怕在竞争最为激烈的中国市场,小米涨了8.6%,可以说是表现突出。 不仅是手机,汽车一发布就是王炸,创下了前无古人,后人也难以打破的历史纪录,27分钟,订单破5万…… 事实上,这些都只是关注最高的产品而已,小米还有很多品牌,不管是在国内,还是在全球市场,排名都是非常靠前的。 比如TWS耳机,2024年一季度,小米大增61%,已经排全球第二名,超过了三星,仅次于苹果了,而华为只排在第5名。 而近日,随着TechInsights发布了一份2024年全球一季度平板销量数据,我们发现小米这次又猛增117%,进入全球前五名了。 如上图所示,苹果是遥遥领先,达到了35%的份额,这个并不意外,毕竟iPad自诞生之后,就一直是王者地位,最早的时候达到80%的,如今在众多安卓平板的围剿之下,有35%已经很厉害了。 第二名自然是三星,份额为21%,三星作为全球排名第一的手机巨头,平板销量好也不奇怪,因为平板就是大号手机嘛。 第三则是中国厂商联想,联想是全球第一大PC厂商,所以很多人也认可联想,买它的平板,毕竟平板也算是电脑的一种。 第四名是亚马逊,这个电商企业推出的平板,在北美市场还是非常畅销的,虽然下滑了18%,但依然还是第四名。 第五名就是小米了,销量增长了117%,相比于去年同期,直接就增加了一倍多,所以也冲进了全球前五名。 而华为没有上榜,排名在第5名开外。 从这个数据也可以看出来,国产手机厂商们,不管是手机,还是平板等产品,如果要想在全球市场表现给力,那必须在海外市场也给力,单靠国内市场还不行。 华为平板在中国市场是相当给力的,但在全球排不上号。小米在中国市场不那么给力,但在全球能够进前5名,所以国产厂商加油吧,别只在国内卷,还要到海外市场去卷才行。
追觅发布六款新品洗地机 三大技术解决用户痛点
凤凰网科技讯(作者/周文浩)5月15日,智能清洁品牌追觅科技在“满分之选”全球新品发布会上,发布了六款新品,包括H20系列的H20 Pro旋锋版、H20 Ultra旋锋版、H20 Ultra Mix、H20 Ultra Station;以及H30系列的H30 Ultra旋锋版、H30 Ultra Mix。 本次发布的新品,推出了“主动式0缠毛”“100°C沸水自清洁”“5分钟轻音恒温烘干”等一系列追觅首创技术。 主动式0缠毛系统,通过恒压梳齿搭配瑞士PPA割毛齿刃技术,真正实现清洁0缠绕,即使长达50cm的头发也能轻松吸入。据悉,该技术已获得来自全球知名第三方检测机构南德TÜV实验室的权威认证。 100°C沸水自清洁功能,将热水自清洁技术推向了新的高度。通过底部PTC对水进行加热至100℃,高温热水破坏、溶解滚刷上的污垢,实现深度清洁除菌。经南德TÜV实验室权威检测,该技术对老抽等顽固污渍的一次性去污率高达100%,除菌率高达99.9999%。 5分钟轻音恒温烘干技术,采用600W高效功率发热元件,搭配16000转/分钟高速轴流风机,实现滚刷5分钟高效蓬松速干。此外,该技术还采用软硬件协同温控技术,烘干阶段的噪音为63dBA。 追觅H20 Ultra Station上下水基站,拥有追觅首创加压排污技术,10000Pa强力高压排污,搭载追觅首创污水箱爆破净洗技术,实现100%洗净污水箱。此外,该基站也是追觅首创的超薄自动上下水全能基站,高度25cm,重量3.6kg,更好的适配家里的场景。
业务向上、股价向下,阿里本季财报怎么看?
昨晚,阿里巴巴发布了截止2024年3月底的季度财报:营业收入同比增长7%,Non-GAAP净利润同比下降11%。虽然收入和利润大致处于市场预期的中位数附近,但是股价下跌了6%。这一方面是由于Non-GAAP净利润同比下滑了,毕竟目前市场相对于收入更看重利润;另一方面则与近期的市场趋势有关。自从4月中旬以来,港股及互联网中概股迎来了一波强劲的上升,主要是由于投资者对宏观经济转暖的乐观预期,以及海外机构开始增加对中概股的配置。以阿里巴巴为例,从4月19日到5月13日,股价累计上涨了约25%;尤其是财报发布之前超过5%的大涨,很大程度上缘于投资者提前折现了乐观预期。资本市场是一个“反身性”游戏:预期的变化速度一般远远快于基本面的变化速度,市场情绪总是在极度乐观和极度悲观之间摇摆,但两个极端都是不可取的。 比起单纯的短期财务数字,我更关心那些长期的、与核心主营业务相关的信息。在我看来,本期阿里财报有三组业务数据尤其值得关注: 淘天集团的收入同比增长4%,其中客户管理收入同比增长5%。本季度线上GMV和订单量均实现了同比两位数的增长;88VIP会员也实现了两位数增长,达到3500万人。 云智能集团的收入同比增长3%,其中核心公共云产品的收入实现了同比两位数增长,AI相关收入更是取得了同比三位数的增长。 海外电商(AIDC)收入同比增长45%,在各大业务集团中增长最快。 此时此刻,距离阿里组织架构变革、提出“用户为先、AI驱动”的战略,差不多整整过去了一年。我认为上面三组业务数据比较充分地体现了上述战略的初步执行效果,沿着这条路线继续推行下去,是有可能在长期带来更快、可持续的增长的。当然,无论是提升用户体验还是发展AI技术,都需要投入,所以阿里整体的营业利润率和Non-GAAP利润率受到了一定的影响——但从业务成长角度看,这些投入是有价值的。与以前相比,现在的阿里在投入上更加聚焦、更加重视长期的战略意义,这一点十分值得肯定。下面展开论述一下我的上面三项业务的看法。 首先是淘天,它是整个阿里集团的基石和现金牛,也是投资者最关心的核心业务。当前国内零售电商市场的竞争非常激烈,消费者不但对价格更加敏感,对服务的要求也比以前更高了。此前投资者和媒体一度怀疑,淘宝天猫是不是已经失去了对用户需求的理解能力,或者理解了也没有能力做到。但是,最近一年,淘宝天猫勇敢地走出了“舒适区”,围绕着用户体验做出了一系列改革: “万能的淘宝”是最核心的用户价值,强化商品供给优势,在保持丰富性的基础上,对动销率高的商品提高效率,将用户价值、消费趋势与平台优势做更高效的结合。 88VIP会员权益升级,合作品牌数量大幅增加;推出“无限次退货包运费”;以前只能兑换实物的88VIP积分现在也能换现金了。 新增店铺标签体系,包括“退款拒绝率”“退货运费险”“承诺时效”“送货上门”等用户关心的指标,具备好服务标签的商户会获得平台流量倾斜。 对大促的超长预售期做出限制,今年618干脆宣布取消预售,商家参与流程也比往年大幅简化。 俗话说“触动利益比触动灵魂还难”,上述改革真可谓大幅触动平台自身利益了。例如618、双11等大促预售,以前是做高GMV数字的良好手段,现在说取消就取消了;88VIP会员权益升级,增强高品质消费者粘性,也是需要平台拿出真金白银投入的。所以,如果仅仅关注短期利润数字,那么上述改革似乎不应该实行;可是如果不能在价格和服务上实现良好的用户体验,平台的长期竞争力就会不可避免地衰落——皮之不存,毛将焉附? 在商品的丰富性和多元化方面,淘宝天猫从未失去领先地位。我的一位长期研究电商行业的朋友曾感叹:“阿里对货的理解还是国内第一的,中国电商的‘货场’在杭州,这一点仍然没有改变。”淘宝还是那个“万能的淘宝”,只要坚持把用户体验放在第一位,通过对价格力和服务的投入获得用户反馈,那么收入和利润增长总归是会回来的。这是一个长期的过程,不能一蹴而就,关键是要走在正确的方向上。 其次是云计算,尤其是AI。应当承认,在国内互联网大厂当中,阿里的生成式AI生态最为完善:既有商用闭源大模型又有开源大模型;阿里云拥有足够的算力资源,建立了庞大完整的AI开发平台供企业客户使用;通义千问的技术已经广泛应用到淘宝、钉钉、夸克等阿里旗下的大型应用当中。对于生成式AI的重要性,怎么高估都不算过分,它是一个足以与互联网本身相提并论的重大科技创新,必将在未来数十年中持续大放异彩。阿里能够在这个浪潮当中位居国内领先地位,离不开过去对云计算、大数据和AI技术的多年如一日的投入积累。 在本季度财报电话会上,阿里管理层表示:把通义千问大模型与阿里云的基础设施进行软硬件协同优化,来为中国企业提供大模型推理服务,这里面有非常大的机会。我认为,通义千问的开源生态尤其重要——国内的开源大模型不少,例如百川、GLM都有开源版本,但通义千问是迄今国内唯一由大型互联网平台推出、有庞大的云平台算力和技术基建为支持的开源大模型。在美国,生成式AI开发的算力和技术基建服务主要是微软、亚马逊和谷歌提供的,最流行的开源大模型则是由Meta开发的;在国内,阿里则同时承担了上述二者的使命,企业客户使用通义千问的开源大模型进行二次开发时,自然会首先选择阿里云的服务。这个协同效应在长期可能是关键的! 当然,我们需要意识到,生成式AI在国内的应用道路还很漫长。因为基数较小,即使阿里云的AI相关收入实现了同比三位数的增长,对整体收入的促进作用也不是一时半会能体现出来的。按照吴泳铭的说法,在调整业务结构之后,阿里云来自外部客户的营收可以在2025财年的下半年(即2024年10月至2025年3月之间)重返同比两位数的增长。如果能通过一些重要企业客户打造标杆案例,国内企业应用生成式AI的步伐有可能大幅加快;这样的标杆案例也可以来自阿里内部,例如上文提到的通义千问在淘宝、钉钉、夸克当中的应用。让我们拭目以待。 再说海外电商业务,尤其是速卖通Choice业务的快速增长,是海外电商的一个重要支点;今年4月,Choice贡献了速卖通整体订单量的70%!本季度,菜鸟的5日达、10日达等优先物流服务的覆盖范围已经扩大到了14个国家,而且肯定还会进一步扩大。在速卖通的跨境物流履约服务需求推动下,菜鸟本季度的收入也实现了同比30%的增长。事实上,过去两个季度,海外电商和菜鸟都是阿里旗下收入增速最快的两个业务集团。 因此我们能够理解,为何今年3月阿里撤回了菜鸟的港股上市申请,并且决定从外部投资者手中回购菜鸟股份。按照蔡崇信的说法::“阿里集团认为持有快递公司的股份具有战略意义,目前没有出售股份的计划。与快递业务相关的投资被视为核心资产,不会考虑出售。” 其实,哪怕阿里进一步增加在物流快递行业的投入,我也不会感到奇怪,因为履约能力对电商平台而言太重要了。阿里显然清晰地知道现在应该做什么,宝贵的资源应该用到什么地方。 附带说一句,阿里各项业务的内部协同效应不仅体现在海外电商和菜鸟之间,也体现在许多其他方面。例如前面提到的88VIP,因为附送饿了么会员,导致我过去多年一直是饿了么的忠实用户(相信跟我有类似经历的人不在少数)。又例如淘天优化用户体验、提高物流配送效率,同样要建立在菜鸟的物流基础设施之上。过去多年,阿里对外进行了许多投资并购,内部孵化了很多新兴业务,其出发点都是为了形成多层次、立体化的内部协同效应;不过在实际执行过程中,并非所有投入都达到了效果。现在阿里强调“聚焦主业”,按照我的理解,就是聚焦于那些更能真实地产生协同效应的业务。符合这一原则的,就是该花钱的地方,就应该眼睛都不眨地花钱;不符合这一原则的,就是该省钱的地方,要毫不犹豫地省钱。一边回购菜鸟股份、一边减持非核心资产,就体现了阿里的这种坚决态度。 除了业务本身,我还想谈一谈股东回报问题——这是目前市场最关心的问题。在当前复杂的宏观和市场环境下,投资者不仅需要未来增长的预期,还需要确定性的现金回报。本季度阿里在公开市场的股票回购金额达到了48亿美元(相当于约340亿人民币)。这是什么概念?同一时期,腾讯的股票回购金额是135亿人民币,相当于阿里的约40%,而且已经是港股市场非常罕见的“高回购公司”了。整个2024财年(截止日期为3月底),阿里的股票回购金额累计达到125亿美元,使得流通股净减少约5.1%。不论在中概股当中,还是在整个美股科技行业当中,上述数字都是相当惊人的。在本季度财报当中,阿里还公布了总额高达40亿美元的定期股息和特别现金股息计划。 在如此积极地向股东返还现金的情况下,本季度末阿里的账面上仍然有价值2481亿人民币的现金及现金等价物,以及价值2630亿人民币的短期投资。在财报电话会议上,阿里管理层表示,目前账面上可以用于股票回购的资金还有约300亿美元;从财务报表的角度看,这个说法是合理的。作为一家现金储备充裕、现金流强劲的公司,阿里完全可以同时做到既坚持对核心业务的投入,又坚持乃至加大对股东的现金回报,从而比较全面地达到资本市场的要求。 市场看短期企业的赚钱能力,并对此给出反应,这无可厚非,但在长期,任何公司的价值归根结底都是由基本面决定的,这个基本面就是业务本身。站在战略角度,我相信目前阿里的“用户优先、AI驱动”以及重新聚焦主业的道路是正确的,但这不表示一切目标能够自然而然地实现。战略是需要人来执行的,任何变革都是漫长的过程,前面还有很多硬仗要打。希望阿里能够打好今后的硬仗!
资本寒冬中的暖阳,未来长期价值看极氪
如果给极氪定一个关键词:外界会称它“快”。这个成立才3年的智能出行科技公司,是最具成长性的全球化汽车科技公司。而这个从传统车企独立的品牌,也是进军新能源领域中销量提升最快的汽车品牌之一。 如今,它走向了上市。从2021年4月15日发布到上市,极氪只用了短短的三年时间。对比之下特斯拉用了7年,小鹏汽车用了6年,理想汽车用了5年,蔚来用了4年。极氪成为继“蔚小理”之后,第四家赴美上市的中国造车新势力。 二级市场对极氪反应颇为热烈。昨日,极氪迎来了在美国纽交所挂牌上市的第二个交易日,开盘每股报价30美元,较上一个交易日收盘上涨超6%,较发行价大幅上涨近43%,市值达75亿美元。 极氪的速度在二级市场得到了最直观的数据展现,而这也意味着资本对新能源市场的认可正在进一步加深。但在新能源市场的硝烟中,上市并不意味着极氪能够停下脚步,反而要以上市为起点,进入了下一场“修行”。 01 极氪为新能源市场投下了一枚“炸弹” 不同于“蔚小理”上市时,资本对新能源投资的火热,极氪上市的背景是市场从狂热归于了冷静。 看向市场的整体变化,随着电动化到智能化的推进,新技术每天都在快速迭代,与此同时,激烈的竞争让整个汽车市场陷入了迷茫,大盘销量的增势一度被价格战的硝烟所影响。这就导致残酷的淘汰赛来临,一些头部造车新势力也感受到了寒意。 众所周知造车是个重资产生意,亏钱卖车是大部分新势力企业必须迈过的一道门槛,在价格战愈演愈烈的背景下,国内新能源车企中,除比亚迪与理想,蔚来、小鹏等多家车企依旧陷在亏损的泥潭中。 但不同于其他造车新势力,极氪从诞生之时,就依托于吉利控股集团这个“巨人”,在重资产赋能的加持下,极氪品牌能够将更多的精力投入到研发、产品、渠道、服务上。而且这种模式也让极氪拥有了在新能源市场中立足的底气。 在同时宣布造车的小米在搭建工厂时,极氪已经推出了多款车型,包括001、007、009、X等。正如吉利在招股书中提到的那样,“我们依赖并获利于吉利集团的技术、研发、车辆生产与交付、采购能力,及其资金支持和市场地位。” 得益于吉利的支撑,极氪从2021年10月开启首次交付,2021年全年交付6007辆,因此车辆销售收入在全年营收中的占比较低。2022年、2023年,极氪分布交付71941辆、118685辆,迅速跻身第一梯队。 而根据招股书显示,从2021到2023年,极氪的汽车销售收入快速增加,分别达到了15.4亿元、196.7亿元、339.1亿元,在总营收中的占比分别达到了23.6%、61.7%、65.6%。 整体毛利率是衡量其发展的重要指标之一,2021到2023年极氪的毛利率分别为15.9%、7.7%和13.3%。作为对比,2023年,蔚来、小鹏、理想、特斯拉的毛利率分别为9.5%、-1.6%、21.5%、18.2%。极氪的毛利率维持在较高水平。 这股力量一直带领着极氪向前。就在今年前4个月,极氪销量近5万辆,实现了同比翻倍以上增长,夺得20万元以上高端纯电市场的中国品牌魁首。 可以说早期的极氪是吉利向新能源市场投下的一颗重磅“炸弹”,但随着极氪的上市,其也证明了吉利在新能源市场策略的正确性,它意味着传统汽车品牌正在突破固有的偏见,走向更大的市场。 02 用产品去驱动品牌 当吉利控股集团总裁、极氪智能科技CEO安聪慧被媒体问到关于“流量为王”时代的看法时,他依旧坚持作为一家车企的“1号位”,需要把自己的时间更多地用在产品、技术、业务上。 技术坚守和研发投入,是极氪弯道超车,创下新的“极氪速度”的关键,在这背后,极氪所坚守的一直是用产品去驱动品牌。 根据招股书数据显示,2021年至2023年,极氪研究及开发费用分别为31.6亿元、54.5亿元,以及83.7亿元,三年累计达到169.7亿元。而另一个值得关注的数据是,根据招股书,极氪IPO募集所得资金净额的约45%将用于研发更先进的纯电动汽车技术与扩大产品组合,研发投入依然是融资大头。 在“真金白银”砸向研发时,极氪自研创新成果显著,全球量产首发了四电机分布式电驱,行业量产首发了ZVC四轮扭矩矢量控制技术,引入了全球首个大型一体式压铸L4级智慧产线,引领造车工艺变革。 而更值得一提的是SEA浩瀚架构,这是吉利集团于2020年9月23日发布的纯电平台架构,SEA浩瀚架构的研发历时四年,投入资金达到200亿元,是专门为生产纯电动汽车而打造的平台。该架构的研发与发布由时任吉利控股集团总裁安聪慧主导,而安聪慧也在极氪品牌成立后一直兼任着极氪的CEO一职。 浩瀚架构的出现意味着极氪能够实现架构式造车的路线,这不仅能够助力极氪提升研发效率,“造得快、造得好”,也能随着车型的丰富和销量的提升,充分发挥其规模化优势,实现快速盈利的目的。 所以说,技术让极氪在产品的研发上有了打磨和另辟蹊径的底气。极氪的第一辆车型001属于猎装车,而在中国,猎装旅行车的市场份额常年低至1%。 极氪001的推出颠覆了这个细分市场,自2021年10月首款车型极氪001开启交付后,这款平均订单金额超过30万元的豪华猎装轿跑一直是极氪的销量主力。 而在2023年中国销售的所有猎装车型,每卖出10台至少有6台是极氪001。今年全新极氪001上市后,累计大定订单已近4万单。 成立至今,极氪已经推出包括极氪001、极氪009、极氪X、极氪007等在内的五款车型,覆盖了多个细分市场。值得一提的是在已经交付的超24万辆中,极氪电池实现了零自燃,其刚强度的车身更是被人称为“公路坦氪”。 此外,围绕产品的服务和基建,极氪也并未忽视。比如在用户生态构建上,极氪坚持直营模式,坚持自建补能。再比如,在补能体系上,极氪目前车型全系量产800伏,旗下金砖电池也是量产充电速度全球领先的800伏磷酸铁锂电池,截至四月底,其超快充桩数量突破2500。 03 做最快的长期主义者 随着价格战愈演愈烈,新能源汽车行业的竞争不断加剧,新能源车企的发展之路将充满艰难险阻。但价格战背后实则是核心技术、规模、供应链和成本管控等综合实力的比拼。 而价格战的另一层含义在于,如果一家汽车公司长期不盈利,便会被认为无法实现可持续发展。也就是说,当下资本市场对汽车公司的评估,已经开始回到盈利指标等基本面上。 看向招股书,近三年极氪一直处于净亏损状态,2021年至2023年净亏损分别为人民币45.14亿元、人民币76.55亿元和人民币82.64亿元。 但亏损是暂时的。截至2024年4月底,从盈利能力看,极氪创立首年整车毛利率即为正,2023年毛利率更是高达15%。与此同时,吉利汽车集团副CFO戴永此前表示,在销量提升、毛利上涨的前提下,2024年极氪将力争实现扭亏为盈(按香港财务报告准则)。 根据此前极氪提交的红鲱鱼版招股书显示,本次IPO将发行1750万股ADS(美国存托股),每份ADS对应10股普通股。5月9日,极氪宣布了首次公开募股定价为每股21美元,处于定价区间的上限,共筹集4.41亿美元。 这个数据一方面印证了市场对极氪销量持续增长的认可,其市场表现显示极氪已经进入了新能源汽车领域的第一梯队。另一方面则意味着市场对极氪充满信心,随着车型的完善和技术的复用,其未来边际效益会实现更高的水平,而围绕极氪打造的三电产业链生态具有更广阔的前景。 此外,从招股书来看,本次极氪上市的募集资金,约45%将用于研发更先进的纯电动汽车技术与扩大产品组合;约45%将用于销售、营销以及扩大服务与充电网络;约10%将用于一般企业用途,包括营运资金需求,以支持业务运营。这些资金的去向指向的核心目标即为:盈利。 与此同时,上市对于极氪品牌本身而言能创造一个独立对接全球市场的窗口。 2024年,极氪出海欧洲的版图将增加至8个国家,计划2026年进入大部分西欧地区,并同步进入东南亚、中东、南美等新兴市场,预计今年年底将在50个国家开展销售业务。海外市场的扩大意味着极氪必定迎来更大的增量空间,而这也为其盈利写下了成功的注脚。 新能源发展就像一阵阵的“龙卷风”,极氪是这场新旧能源转换风暴中的一个特例,它在激烈的竞争中率先突出重围,但上市既是一个重要的里程碑,也是一个新的起点,新的机会。 正如吉利控股集团CEO李东辉所言:极氪IPO是吉利控股整体战略规划的一个缩影。“我们通过IPO增加企业治理的透明度和规范性,提升子业务集团经营核算的独立性和完整性,提高运行效率,以负责任的态度,更好地同用户、行业、监管机构、投资机构沟通,推动企业全球合规治理。”
特斯拉自动驾驶团队再遭重创,顶尖AI工程师离职另起炉灶
IT之家 5 月 15 日消息,特斯拉近日又损失了一位自动驾驶领域的顶尖 AI 工程师 ——Paril Jain,Jain 此前担任特斯拉人工智能团队的“规划、模仿学习和强化学习”部门的技术负责人。他的离职正值特斯拉大规模裁员以及员工士气低迷之际,引发了外界对特斯拉自动驾驶项目前景的担忧。 IT之家注意到,过去几周,特斯拉公司在各个部门进行了数轮裁员。除了裁员之外,还有报道指出部分员工因士气低落而选择离开公司。种种迹象表明,特斯拉正处于人才流失潮之中。 Paril Jain 在特斯拉工作了九年,是公司自动驾驶项目的重要成员,他最近领导的团队负责“构建可扩展至汽车和人形机器人平台的自动驾驶基础模型”、“利用数百万英里的驾驶数据和干预信息构建鲁棒可扩展的端到端学习自动驾驶系统”等等关键工作。 Jain 今日宣布离开特斯拉,与 Twitch 和 Cruise 的联合创始人 Kyle Vogt 共同创立了一家名为“The Bot Company” 的机器人创业公司。Jain 表示,他和 Vogt 将致力于让人们的生活变得更加轻松便捷。 尽管 Jain 对特斯拉团队表达了赞赏,称其打造了“市场上最好的自动驾驶产品”,并对即将发布的 V12 版本和“真正智能召唤”功能充满期待,但其离职仍然显示出特斯拉自动驾驶团队的领导层正在出现人才流失的迹象。这对于特斯拉自动驾驶技术能否取得突破性进展,以及其此前作出的诸多承诺能否兑现,都蒙上了一层阴影。
I/O 2024,Google吹响通用AI反击号角
记者 | 张勇毅 编辑 | 高宇雷 有了 24 小时前 OpenAI 用 GPT-4o 带来的炸场之后,今年的 Google I/O 还未开始,似乎就被架在了一个相当尴尬的地位,即使每个人都知道 Google 将发布足够多的新 AI 内容,但有了 GPT-4o 的珠玉在前,即使是 Google 也不得不面临巨大的压力。 这种奇怪的气氛贯穿了今年 Google I/O 主题演讲始终,除了 CEO 皮查伊演讲少了很多自信、多了一些此前少见的不自然感与口误之外,今年 Google I/O 还贡献了历年最奇怪的暖场活动,是以一次 AI 工具的翻车为开场:一位从舞台上的茶杯中钻出的 DJ,在台上使用 Google 内部开发的一款 AI DJ 小工具 —— MusicFX DJ,在舞台上现场用随机生成的关键词,来创造出一首曲目。 虽然创作出的曲调很糟糕,甚至现场效果还有点魔幻,在社交媒体上遭到大量猝不及防的开发者一致吐槽,但好在 Google 还是用两个小时的时间,给这个世界再一次带来了足够多的惊喜 —— 以及对 OpenAI 与微软的反击。 开场首先,皮查伊先带我们回顾了过去一年 Google AI 主打产品 —— Gemini 的主要进展,如果说全年 I/O 全场出现频率最高的词是 AI 的话,今年毫无意外将变成 Gemini;首先是 Gemini Advanced 在发布三个月之后就已经获得了超过一百万用户;以及两个月之前发布、最高支持一百万 Token 上下文识别(通行计算方法中约等于 50 万中文字符)。的 Gemini 1.5 Pro,今天起将面向全球用户正式推送。 不仅如此,Gemini 1.5 Pro 还从原本的一百万 Token 上下文升级至两百万 Token 上下文识别。这意味着在多模态处理中能处理超过三万行代码,或是超过一小时的视频文件。 在介绍了 Gemini 本身之后,就到了 Gemini 真正的长处 —— 应用内整合体验中,皮查伊先是演示了整合在相册中的功能,在停车并给车拍了照片之后,当你找不到停车的位置,可以直接问 Gemini “我的车在哪”,它就能帮你自动识别相关照片中的信息,提示你车停在了哪里。 这个功能被称为。Ask Photos,将于今年正式发布。 在 Google 办公套件中,如今也迎来了 Gemini 更深度的整合,不仅能在 Gmail 中生成线上会议纪要、在所有邮件中提取关键信息。还能与 Google 表格联动,自动整理邮件中包括的表格文件,甚至是生成一个数据分析表格。 为了提升用户日常处理工作内容的办公效率,Google 还将 Gemini 的功能包装成了一个 AI 员工—— AI Teammate,来充当你工作中的一个人工智能助理,帮你整理各种信息并借助大模型来实现更智能的反馈,例如从邮件中提炼信息,甚至是会议录音中的关键信息。 除了办公套件之外 去年作为探索项目登场的 Notebook LM 今年也公布了新进展:作为 Google 生成式 AI 直面教育应用场景的项目,这被外界看作是对 OpenAI”撞车“最直接的回应。 在现场的演示中,NotebookLM 不仅能很好地充当一个老师的身份、讲述一组简单的物理课程,还能模拟两个演讲者,生成一个类似对话的讲解内容。在用户提问“你能举个例子吗”这样的问题时,实时给出一个准确的回答。让你能够更准确地掌握物理原理中的细节。 Google 同时还针对去年发布、在 Android 手机上实现画圈搜索功能的“Circle to Search”功能加入了更多教育相关的使用场景:现在这个功能已经支持识别画面中的数学题以及符号公示等复杂的内容。 在 AI 行业早期,除了 OpenAI 之外,还存在着另外一个聚集了业界大量人才的组织 —— 那就是如今已经被 Google 收购并整合的 DeepMind。 但在过去十余年时间中,DeepMind 长期以一种低调的印象示人:以研究成果定胜负,而不是像 OpenAI 管理层一样,在各种演讲中抛头露面发表言论。 但在今年 I/O 上,DeepMind 创始人哈萨比斯第一次出现在 Google I/O 舞台上,来给金主“救火”,Alphabet 内部对 AI 的紧迫性可见一斑。 这位 AI 行业举足轻重的大牛上台,却看似轻飘飘地发布了一个针对端侧的模型 —— Gemini 1.5 Flash,甚至现场观众都有些没反应过来他是在卖什么关子,直到哈萨比斯说出他们的最终目的 —— 打造通用强人工智能。 实现这个目标的具体步骤,就是哈萨比斯介绍的新项目 —— Project Astra,探索通用人工智能如何在日常生活中为我们提供真正日常生活所必须的帮助。 作为对这个问题的直接回应,哈萨比斯现场展示了 Astra 的一个使用视频:操作者以智能手机为媒介,让大模型实时收集环境中的各种信息,并在围绕着办公室转了一圈后突然提问:你记得眼镜在哪里吗“。 在正常的环境中,即使是两个正常人类之间对话,也可能会忽视掉这些细节,但演示中的 AI 却精准地从众多环境信息中捕捉到了眼镜的位置,并给出了正确的方位提示。这种强悍的通用语言与环境理解能力将现场气氛推向了最高潮,也再一次向外界展示了 Deepmind 作为传统 AI 强手实力的冰山一角。 哈萨比斯还特别提到,这些演示项目并非刻意实现、“仅供参考”的演示效果,两个短片中的所有实现效果都是一次完成。这意味着当前 Project Astra 已经能非常流畅地实现这些效果。 除了对通用人工智能的探索之外,哈萨比斯还介绍了 Deepmind 在多模态领域的新进展:将在图像、音频以及视频三个主要内容领域全方位出击。分别是能够生成超过 60 秒、画质为 1080p 的视频片段的视觉模型 Voe、文生图模型 Imagen 3、以及面向专业音乐创作者的音乐合成工具 Music AI Sandbox。 TPU 硬件的更新也是 Google I/O 主题眼镜中的保留项目,每次伴随着 AI 新技术发布,TPU 作为驱动软件的硬件引擎都会随着更新迭代。 这次主题演讲中 Google 发布了代号为 Trilium 的第六代 TPU 硬件,计算能力相比前代提升 4.7 倍,预计将在 2024 年年底面向用户推出,本次发布会中出现的 Veo、Gemini 1.5 Pro 等几乎所有产品,都是在这些新硬件上计算而来。 Android 也不能免俗,将 AI 功能更新作为今年介绍的重点。尤其是 Gemini 在 Android 系统中更深度的整合。 实际上今年的 Android 15 当然也不只有 AI 功能,但 Google 为了给 AI 功能让路,在首日的主题演讲中介绍的都是 Android 15 中与 AI 相关的动态,剩余的内容被挤到了次日的分会场演讲中。 Gemini 作为一个独立 App 在 Android 端已经存在一段时间了,这次 Google 终于进一步发挥了“主场”优势,将 Gemini 进一步整合进操作系统中:现在在 Gemini 对话中生成的图像可以被直接拖拽到其他应用中使用。 这次 Gemini 在 Android 上的最新进展是 Gemini Live,主打使用语音的双向流畅对话体验,在对话过程中你甚至可以像现实与真人对话一样,通过打断对话、提出新问题的方式来更高效的沟通。Google 同时预告基于 Project Astra 实现的摄像视频识别功能也将在今年年内发布。 这个功能实现的原理,是将视频内容逐帧拆解并交给 Gemini 识别,在效果上实现接近“理解世界”的效果。例如当你不会用某款相机时,用手机镜头对准相机并提问,Gemini 就能够从画面中识别出相机的型号,并根据你的问题,搜索相关内容给出使用教程。 另一个重要功能更新是 Android 15 中的 Gemini 支持了 YouTube 视频内容识别,Gemini 在视频播放界面可以直接提取视频相关的信息,并回答用户各种关于视频的问题,甚至是生成视频内容摘要。YouTube 上数十亿个视频都可以使用这个功能。 除了这些联网功能更新,去年发布的、完全基于端侧算力实现的 Gemini Nano 则是更多本地功能的基础;基于本地模型实现的功能不仅能更快速地实现诸如画面内容识别等无障碍功能,还能在更多隐私需求更高的应用场景中,比如这次新发布的基于本地语音模型、通过对话内容,判断出对方是否可能是诈骗电话。 通过 Gemini Nano 模型本地实时处理,在检测到诸如“银行”“转账”等关键字眼以及上下文之后,手机的通话界面会弹出一个“这可能是诈骗电话”的提示,并给出诸如“银行不会要求你通过电话转账”这种可能的理由。 毫无疑问,在智能手机端,端侧模型的潜力还有巨大的挖掘空间,这次模型本身能力也得到了加强,Gemini Nano 在原本仅支持文本识别的基础上,将于今年内增加视觉、听觉与口语的识别支持。 去年在 OpenAI 改变世界之后,Google 也只是被改变的一部分:2023 I/O 中即使充满了各种 AI,也很容易给人一种“凑数”的观感:以至于“演讲中出现了多少次 AI”的恶搞视频,反而在主题演讲结束后,成为社交媒体上被疯传最多的内容。 到了 2024,即使 OpenAI 还想在复刻一把“偷袭”,但 Google 这次的准备显然更加充足自信,甚至 Google 官方也还玩了去年的梗,主动问了观众“我们今年说了多少次 AI”? 对于这个问题,皮查伊的回答是将演讲的文稿直接扔给 Gemini,让它提取文本中内容来回答,答案是 120 次,然后在说出这句话的同时,数字变成了 121。 这个小小的幽默其实也揭示了 Google 对 AI 的开放态度:任何问题都尝试用 AI 来回答。皮查伊还重新强调了 Google 在 AI 领域的目标”整理世界所有的信息为你所用“,Google 在软件侧的所有软件更新几乎都是在践行这一目标。 从这一点来讲,有着广泛应用生态与用户的 Google 生态,仍然有着巨大的先手优势。加上本次 I/O 中展示的既有当下就能立即使用到的 Gemini 更新,也有类似 Project Astra 这样极具野心的前沿探索项目,一系列组合拳之下,Google 在 AI 领域的第一梯队位置再一次得到了稳固。 至少从这次 I/O 我们看到新内容的分量来讲,Google 仍然是 OpenAI 最强力的竞争对手,即使它曾经短暂地落于下风。
谷歌硬刚OpenAI,硅谷大战继续升级
记者 | 闫俊文 编辑 | 李薇 一场科技竞赛正在美国硅谷上演。 5月15日,谷歌举办了2024年I/O开发者大会,AI是全场的主题,谷歌CEO桑达尔·皮查伊和他的同事们发布了Gemini 1.5 Pro的新版本,在100万Tokens的窗口能力上,进一步扩大至200万Tokens,它们的最终目标是无限上下文。 谷歌还展示了新的搜索产品,比如从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。此外,谷歌还推出了新的TPU,第六代TPU芯片Trillium,较上一代芯片的算力表现翻4.7倍。 就在这场发布会前一天,OpenAI举行了春季发布会,发布最新GPT-4o多模态大模型,相较于GPT-4 Trubo速度更快、价格也更便宜。接下来的一个月里,硅谷还将迎来两家科技巨头的重磅大会——5月21日左右,微软将举行Build年度开发者大会;6月10日左右,苹果将举办全球开发者大会。一场有关AI的大比拼在大洋彼岸开赛。 伴随着OpenAI的崛起,以及谷歌在AR眼镜等失利,外界一度评价谷歌已经成为一家为“赚钱”打造的机器,失去了创新激情。 不过,谷歌仍然拥有谷歌搜索、YouTube、云服务、Gmail、Android以及自动驾驶Waymo等业务,仅YouTube就有20亿月活用户,Android也拥有20亿月活用户,可以说,谷歌掌握着全球最多的用户场景、数据以及设备接口。 谷歌发布更新产品后,谷歌-C股价微涨0.6%,收盘价为171.93美元,市值2.12万亿美元,股价较2024年开年上涨了23%。 在刚刚过去的财季,谷歌展现出强有力的竞争力。2024年第一季度,谷歌实现营收805.39亿美元,同比增长15%,非美国通用会计准则下净利润为236.62亿美元,同比增长57%。 谷歌艰难守阵地 大会一开场,皮查伊就介绍说,现在已经有超过150万开发者正在使用谷歌的原生多模态大模型Gemini。Gemini在2023年12月上线,它被认为超过了GPT-4。 皮查伊宣布,Gemini 1.5 Pro向全球所有开发者开放,并支持200万Tokens的Gemini 1.5 Pro模型的预览,他们的目标是“无限上下文”。 此次开发者大会,谷歌着墨最多的是搜索,这是谷歌的起家业务,现在谷歌要重新定义搜索,它要把搜索做成多轮对话的推理,用户只需要问就可以了。 皮查伊以“重新定义搜索”的架势,连续上线多款基于Gemini的产品,比如总结谷歌搜索引擎结果的“AI概览”功能,支持用户存储图片的AI搜索Ask Photos。 以练瑜伽为例,谷歌会帮用户找到排名更靠前的工作室,并介绍他们的服务,可以看到每个门店的距离。谷歌搜索会把更大的问题分解成各个部分的问题,比如排名、评论、营业时间以及其他更多的研究。 但“重新定义搜索”的最大主动权可能不在谷歌手里,而在OpenAI这边。今年年初有传言说,OpenAI计划上线AI搜索业务,不过在5月14日OpenAI的发布会上,并没有展现该业务,这可能与算力成本有关系。 成熟大公司对待创新公司的崛起仍然毫无办法。对标OpenAI,谷歌仍在努力显示自己的存在。 在此次发布会上,谷歌还展示了一个名为Astra的项目,这是谷歌开发的通用人工助理,在演示视频中,Astra通过手机摄像头能识别真实环境中的物体,实现了能看、能说、能听。这与前一天OpenAI上线的GPT-4o功能类似,都实现了人机交互的新形式。但谷歌似乎不满足于此,Astra更强调指向人、机器与现实世界的三重交互。 大模型最大的挑战是解决响应时间的问题。谷歌介绍说,它们在Gemini模型的基础上,开发了通过连续编码视频帧,更快地处理信息的代理,同时,将视频和语音输入组合到事件的时间线中,捕捉并有效记忆。这些代理可以更好地理解用户所处的环境,并在对话中快速响应,使交互的速度和质量更加自然。 Gemini也将支持语音实时交互,同时今年晚些时候还将上线实时视频交互功能。未来几个月内,谷歌也将推出类似于GPTs的自定义AI助手Gems。它将能与“谷歌全家桶”进行交互。 “Gems易于创建,它们可以充当你的瑜伽闺蜜、你的私人副主厨、聪明的微积分导师、代码的同行评审员。”谷歌的相关负责人说。 谷歌发布会上还宣布了安卓生态的AI新进展,今年晚些时候,能够在本地运行的多模态Gemini Nano模型将登陆Pixel手机,它更智能,更注重隐私保护,比如,如果用户接到诈骗电话,将会提醒用户。 如果没有OpenAI,上述谷歌的创新技术可以称得上可圈可点,但奈何“既生瑜,何生亮”。 硅谷科技竞赛升级 在发布会上,谷歌只提到一家科技大公司,那就是英伟达。皮查伊发布了第六代TPU(张量处理器,谷歌为机器学习定制的专用芯片)芯片Trillium,较上一代芯片的算力表现翻4.7倍,TPU是谷歌自己研发的GPU芯片。 同时,皮查伊说,谷歌云将在2025年初,用上英伟达的最新Blackwell架构GPU。在过去数年,谷歌投资了200万英里的地面和海底光纤。 今年3月,英伟达发布了基于“Blackwell”架构的B100芯片与B200 GPU加速器,英伟达创始人黄仁勋说,这是迄今为止,英伟达最强大的GPU芯片,在生产出首批服务器之后,黄仁勋将一台服务器送给了OpenAI。 GPU在过去一年多时间成为堪比黄金的硬通货,各大科技公司不得不排队数月来等货,这让黄仁勋成为硅谷最受欢迎的CEO,人们争相排队和他见面,英伟达也是所有科技公司的合作伙伴。 而在GPU大热的背后,硅谷正在进入新一轮的科技竞赛。 2022年底,OpenAI发布ChatGPT开始,整个硅谷进入亢奋状态,这里甚至诞生了AI一条街,五六个人就可以组建一个公司,依靠一个想法获得融资,比如斯坦福博士生郭文景和同学创办的Pika,短短数月间就完成5500万美元融资,并推出了视频生成器Pika1.0。 科技巨头之间的关系变得异常紧张,主要是AI重构了边界,大公司重新变得野心勃勃: 微软重新盯上了搜索,扶持Bing发展;Meta向第三方硬件制造商开放VR头显操作系统Meta Horizon OS,进一步蚕食苹果生态;为应对OpenAI的崛起,苹果不得不放弃数十年的造车计划,集中资源搞AI。 进化以群体聚集的形式在硅谷上演,大公司你追我赶,它们之间的合纵连横也让AI竞赛变得复杂。 苹果公司计划和OpenAI合作,将OpenAI的技术引入iPhone之中,但微软是OpenAI的最大出资方;谷歌正和OpenAI酣战,支持其开源系统Android的AI进化,以展开和苹果iOS系统之间的竞争。 席卷全球的这次科技竞赛浪潮颇有点20世纪七八十年代硅谷的意味。那时,原生技术层出不穷,1968年,英特尔成立;1969年,AMD成立;1976年,乔布斯创办苹果电脑;1977年,甲骨文成立;1984年,思科公司成立。 只不过,50年前,是芯片等硬件造就了创业潮,创造了财富;现在,AI以及产品化则是最新的动力。 在AI时代,中国互联网同样也迎来了新发展机会,但正如大部分中国AI创业者所说,虽然一家又一家公司会在这次浪潮中转型甚至退场,但是千万不要低估中国创业者的生命力。
谷歌I/O大会,眼花缭乱,但缺王炸
作者 | 毕安娣 编辑 | 王靖 五月真热闹,OpenAI才开了春季发布会,谷歌I/O大会也如期召开了。 实话实说,观看主题演讲直播的过程中,脑海不禁会浮现曾被谷歌内部员工泄露的梗图——谷歌AI产品和项目一个又一个不同又相似的名字令人头大。 主题演讲的关键词仍旧是AI,谷歌还自己在现场给出了提到“AI”的次数,在120次以上。 在万众瞩目的AI领域,谷歌宣布了若干新消息。 AI大模型升级了两个,Gemini 1.5 Pro双下文窗口拓展到200万令牌、Gemini Nano增加多模态理解能力;新发布了三个,更轻更快的Gemini 1.5 Flash、新架下的Gemma 2.0,以及视觉语言模型PaliGemma。 另有文生图模型迭代至Imagen 3,还新发布了一个文生视频模型Veo。 AI的具体应用延展上,谷歌这次憋了不少招。 谷歌的核心产品搜索中,发布AI Overviews,加强版AI搜索摘要功能将率先上架美国。谷歌搜索中还将加入制定计划、视频搜索等多重AI驱动的功能。 此外,Gemini还被塞进谷歌照片以及即时通讯应用Google Messages等产品中。 让人联想到OpenAI才发布的GPT-4o的,是谷歌旨在打造未来通用AI助理的新项目Project Astra,以及Gemin的新功能Live。Gemini Live支持与AI语音聊天,年内预计加入相机功能,和AI实时“视频通话”。 有点尴尬的是,在第三方拉流的直播间里,观众直呼“无聊”,并对眼花缭乱的名字感到困惑。CNET的评论员指出,谷歌需要精进讲故事的能力,而不是一上来就将各个部分尽数展开。 01 OpenAI赶在谷歌I/O大会前一天开春季发布会,原本盛传的搜索产品没来,但“人类级别响应”的GPT-4o让人一窥新一代AI助理大战的轮廓。 难以想象要是没有OpenAI的狙击,谷歌会有多开朗。 本次谷歌I/O大会上,原本最具惊喜的也是AI助理方面的进展。 首先,谷歌公布了一个新项目,名为Project Astra。用谷歌Deepmind负责人哈萨比斯(Demis Hassabis)的话说,这是真正通向AGI的万能助手项目。 相比于谷歌上一代AI助手Google Assistant,Project Astra的AI助手模式多样,且能实时交互。没有烦人的唤醒词,也没有尴尬的延迟。看你所看,为你排忧解难。 演示视频中,用户打开手机摄像头,对准任意物品,AI可以准确说出物品的名称,如“这是一个音响”。用户可以实时视频的同时,在屏幕上涂画、进一步向AI提问,如画一个箭头指向音响的某个部分,询问是什么。当用户将镜头对准窗外时,AI则直接根据景色猜测出用户所在的地点。 在摄像头匆匆扫过场景的情况下,用户求助“眼镜放在哪儿”,助手准确识别并回答“你的眼镜在红苹果的旁边”。 去年12月,Gemini就曾发布通过视频和AI互动的视频,但事后承认视频经过剪辑,谷歌为此没少被戳脊梁骨。 有意思的是,这次在演示视频的一开头,谷歌就郑重承诺,视频是实时、一次性拍摄的。 不过,谷歌尚未针对Project Astra给出明确的时间线,只是含糊地表示今年晚些时候其中的一些功能将更新到Gemini及其他应用中。 谷歌在AI助手方面还有更看得见、摸得着的进展——Gemini Live,也就是对Gemini产品进行多模态功能拓展。Gemini Advanced用户将可以用语音和Gemini进行对话,对话更流畅自然,延迟更低,可以随时打断,预计夏天上线。谷歌还表示,今年年内将加入相机功能,实现实时视频。 可以说这一次,谷歌被OpenAI精准狙击——GPT-4o不仅早一天发布,而且现场演示,未来几周就会开放给全部用户。 02 近日外界都在盛传OpenAI将推出搜索类产品,与谷歌一战,但这样的情况并没有发生,而谷歌自己也已经马不停蹄地升级了谷歌搜索。 搜索作为谷歌的核心产品,即将迎来一次大升级——搜索摘要功能AI Overview,同时包含多步推理功能Multi-Step Reasoning、在搜索中做计划Planning in Search,以及用视频提问Ask With Video。 AI Overview,顾名思义,是指用户键入文本、点击搜索之后,出现在最上方的将是AI帮忙整理的信息摘要。其中包含用自然语言对搜索结果的总结和概括,以及推荐的链接。从前这被谷歌称为“搜索生成式体验(SGE)”。 多步推理Multi-step reasoning则可以用来做计划。当用户在搜索框键入“附近最好的瑜伽馆”时,AI摘要会将附近瑜伽馆依照评分、课程、距离等信息分类成块,更清晰地展示给用户。Planning in Search则允许用户直接用谷歌搜索做计划,如在搜索框中键入饮食计划的需求,搜索引擎会给你自动生成一份。 想要搜索商品的时候,AI同样会发挥作用,在搜索框键入“有上下坡的五英里通勤自行车”,搜索引擎会在上方给出选购自行车的思路建议,并给出若干商品推荐。 从一个又一个详尽的演示不难看出,谷歌已经下定决心重塑搜索体验。 不过,AI搜索在很多竞品中都已经被应用,更有专做AI搜索的Perplexity.AI。谷歌对搜索体验作出的重大升级,放在2024年的5月已经不大能带来新鲜感。 应用生态的其他新动作更像是补齐,如Gmail邮箱、Google Messages通讯、谷歌照片等,Gemini逐渐拓展到越来越多的谷歌应用中,大有“Gemini无处不在”的态势。 03 AI背后的模型,谷歌这次也是大手一挥,升级的升级,新发布的新发布,Gemini家族不断壮大。 三个月前发布的Gemini 1.5 Pro终于“发货”了,即日起正式开放给订阅了Gemini Advanced(类似ChatGPT Plus)的用户。 Gemini 1.5 Pro支持100万token的上下文窗口,今年晚些时候将会增加到200万token。更形象地说,升级后的Gemini 1.5 Pro能同时处理22小时音频、2小时视频、超过60000行代码或140万个单词。 新发布的模型中,Gemini 1.5 Flash原本有明星潜质,但被OpenAI狙击。GPT-4o驱动的ChatGPT狙击Project Astra和Gemini Live,GPT-4o狙击Gemini Flash。 Gemini 1.5 Flash主打更轻更快,反应速度和效率是其主打特色,拥有多模态推理能力,擅长总结、聊天、图像、文档数据提取、视频字幕等。但这些特点,显然和GPT-4o撞车了。 除此之外,谷歌的开源模型Gemma也发布了新版本,Gemma 2.0有270亿参数,并拓展出多模态版本PaliGemma。 多模态生成式模型,谷歌在I/O大会上公布了三个,涵盖图像、音乐和视频。 文生图模型谷歌此前就有,此次做了迭代,发布Imagen 3。Imagen 3对提示词的理解更加准确细致,可以生成更逼真的图像。在演示中,Imagen3从一长段提示词中提取了8个细节信息,并在生成的图像中一一体现。 音乐生成模型Music AI Sandbox是全新的,用户可以用小段Demo拓展延长,也可以按照文本提示对音乐进行再创作,改变和调整音乐风格等。鉴于谷歌旗下还有YouTube等UGC平台,此类模型将很好地服务于创作者。 更惹眼的其实是谷歌此次新发布的文生视频模型Veo。 谷歌Veo可接收文本、图像和视频提示,生成1080p规格、60s的高质量长视频。 年初OpenAI曾发布Sora,虽未正式对公众开放使用,但演示视频和小范围的测试已经让Sora获得了不小的追捧。从演示的效果来看,Veo可与Sora一战。 这届I/O大会,谷歌交出了诚意满满的“成就清单”,大模型仍在进步和创新中,AI应用生态也不断发展。 但新名词轰炸之后,能留给人深刻印象的东西并不多。比起前一天发布GPT-4o让外界感叹科幻电影照进现实的OpenAI,谷歌到底还是缺一个王炸。
两小时“吼出”121次AI,谷歌背后埋伏着Open AI的幽灵
作者 | 魏琳华 谷歌和Open AI的又一次对阵,刚刚落幕了。 北京时间5月14日凌晨,OpenAI发布端到端多模态AI大模型GPT-4o,酷似科幻电影《Her》的AI语音对话迅速成为关注焦点。 24小时后,携新版Gemini AI大模型等产品,谷歌在北京时间5月15日凌晨1点的I/O 2024大会上重振旗鼓,试图在AI赛道上重新夺回主动权。 在过往一年中,多次被Open AI抢走风头的谷歌,能否打一个翻身仗? 不到两小时,提到121次AI 将近两个小时的发布会上,关键词“AI”贯穿了谷歌全场的演讲展示。 “我猜想现场一定有人想数一数今天的发布会上有多少次提到AI。”在I/O发布会现场,谷歌CEO桑德拉·皮查伊打趣道,观众席内响起一片笑声。 这个答案由谷歌AI现场完成统计,“一共提到了120次。”皮查伊说。话音刚落,屏幕上的数字跳到了121次。 不到两小时的发布会,谷歌讲了121次AI 图源:谷歌发布会 由皮查伊开场,谷歌在发布会上先后介绍了他们在软件、硬件等方面的AI布局。可以说,关注前沿发展的谷歌,在人们今年所能见到的AI应用方向上均有涉猎。 作为基础架构的大模型Gemini发布1.5 Pro型号,再次打破100万tokens(文本中最小语义单元)的纪录,原版相当于一次可以处理长达1500页文本、30000行代码或是长达1小时的视频,现在新模型将上下文窗口扩大一倍,达到200万tokens。 聚焦于自有模型的能力突破之外,谷歌还面向开发者推出了轻量级模型Gemini 1.5 Flash,相较于旧有模型,Gemini Flash实现了低延迟响应并降低使用成本,其100万tokens只要0.35美元。比前一天发布的GPT-4o更加便宜。 谷歌披露大模型API的最新定价 图源:谷歌发布会 在多模态模型布局上,谷歌一口气发布了图片生成模型imagen和视频生成模型Veo。其中,Veo支持生成60秒以上的1080P视频,它被人们视为对标Open AI的视频生成模型Sora。 “生成视频的难点在于解决物品在空间中的移动,并且随着时间的推移需要保持一致性。”谷歌DeepMind负责人道格说。“AI发展15年,我们就知道它会改变一切,现在已经到了实现它的时刻。” 现场展示中,Veo发布了多个演示视频:在草地上奔跑的猎豹、穿梭在星际之间的宇宙飞船等。在演示片中,谷歌展示了他们和影视从业者的合作实践。初步看起来,它拥有不输于Sora的流畅体验,但同样不对外开放使用。 由Voe生成的视频,汽车在公路上飞驰 图源:谷歌发布会 发布会现场,皮查伊多次提及“Making AI more helpful for everyone ”,借助大模型Gemini的能力,谷歌开发了一系列AI功能。比如支持用搜索方式查找手机图片的Ask Photo、AI助理Project Astra。 让人眼前一亮的是Project Astra,在演示视频中,通过手机和AR眼镜的联合使用,AI能够在目之所及的范围内完成和用户的实时交互。它不仅成功识别并向用户解释了圈出来的硬件,还能帮助用户在桌子上找眼镜、解答白板上的题目。Project Astra也被视为GPT-4o的对手。 Gemini准确识别出电脑上的代码用于加密和解密 图源:谷歌发布会 谷歌还将Gemini集成在包括搜索引擎、Gmail、Maps等在内的AI全家桶产品中。 备受关注的是,在这次发布会上,谷歌正式宣布推出AI搜索功能,目前仅支持向美国地区开放。在演示中,谷歌的AI搜索在解决复杂问题上应用“多步推理”,以往需要搜索十次才能获得的答案,合并到一个问题解决。比如一次性纳入用户的通勤和时间安排,通过AI搜索为用户推荐适合的瑜伽馆。 应用“AI Overview”推荐店铺 图源:谷歌发布会 谷歌秀的肌肉,连自家员工也瞧不上 在谷歌这场秀肌肉的发布会上,Open AI依然是那个站在巨头背后的幽灵。 从ChatGPT开启新一轮人工智能浪潮的时候,它就给了谷歌重重一击。自GPT-4发布之后,人们关注的目光更是开始向Open AI倾斜。 野心勃勃的Open AI CEO萨姆·阿尔特曼也将谷歌视为头号竞争对手。从宣传时间的选择到产品发布战略,Open AI的枪口多次瞄向谷歌。 一年以来,谷歌已经在与Open AI的对阵中多次尝到苦果: 2月15日,Gemini 1.5 Pro 发布。同一天,Open AI发布Sora,虽然目前仍然处于无法测试使用的状态,但Sora实现文生视频的流畅性和画面表现震惊科技圈。对比之下,Gemini的重大更新几乎无人问津。 本次,Open AI刚刚举办的春季发布会同样是一次有备而来的伏击。Open AI将发布会时间由5月9日挪到了5月13日,刚好是谷歌举办I/O发布会的前一天。 在昨日的发布会上,Open AI只用了半个小时,就押到了谷歌今天的两个重点。 一是轻量级模型的发布,Open AI推出的GPT-4o同样以低成本、快速响应的方式实现,官网介绍,GPT-4o达到了媲美GPT-4 Turbo的各项能力,但成本仅为后者的一半。 另一个是AI助手,Open AI CTO米拉·穆拉蒂现场演示了如何和手机上运行的模型GPT-4o完成交谈。“它对人类的情绪、语气理解得十分自然精准,如同与一个真正的人类朋友或助理在聊天。” 在这段实时演示中,GPT-4o准确识别了人类的情绪,它会开玩笑,调侃人类的呼吸声音太大;它能依照用户要求,更改说话的语气,比如用更夸张的戏剧腔代替冰冷的电子音;它还能实现同声传译,准确地把意大利语翻译成英文。 正如阿尔特曼在X中提前预告的那样,科幻电影《Her》中的剧情走入现实,人类和AI实时对话的设想已经具备实现的雏形。 电影《Her》讲述人类和AI恋爱的故事 为了防御对手,谷歌曾经一个月发布5次大模型。今年2月,谷歌曾先后发布Gemini功能更新、推出Ultra版本、发布Gemini 1.5 Pro,并发布开源模型Gemma和世界模型Genie。 但这些不痛不痒的更新不仅没有起到防御作用,甚至还引发了负面反馈。谷歌内部流传出的图片曾毫不留情地吐槽,“连内部员工都记不住这些大模型的名字”。 保守败于疯狂,只剩一张“生态牌” 回顾过往,人工智能曾在2014年、2017年多次引起科技界的关注,而在几次浪潮中,谷歌都扮演着先驱者的角色。 追溯至2011年,谷歌就已经在公司内部成立了“谷歌大脑”(Google Brain),专注于深度学习和神经网络研究,目标是“让机器也能拥有理解和学习的能力”。 2014年,谷歌斥资4亿美元收购英国AI公司DeepMind,进一步夯实了在深度学习领域的实力,孕育出了具有里程碑意义的AlphaGo(阿尔法围棋)。次年,谷歌将机器学习系统TensorFlow开源,并启动研发AI芯片TPU,在算力层面为后续训练大模型打下硬件基础。 2016年,皮查伊在当年的I/O开发者大会上宣布,将AI置于公司首要发展战略,正式向AI First转型。在提出Transformer架构,并发布LaMda大模型后,从搜索、助理到Pixel手机、Nest家居等,谷歌开始全面把AI能力植入产品线。 谷歌更倾向于让AI扮演一个辅助角色,对AI的态度偏保守。随着时间轴滑向2023年,谷歌的风头慢慢被Open AI压过一筹。谷歌的前瞻性布局和先发优势,被Open AI的疯狂打败了。 在技术成熟的情况下,后起创业公司Open AI使用的核心技术正是由谷歌发明的。GPT的“T”就来源于2017年谷歌发布论文中研究的Transformer架构。Open AI烧了大把的钱,砸出了训练大模型的可行方向。 ChatGPT在2022年底发布之时,谷歌可能也注意到了这家初创公司,但未能引起足够的重视和警惕。2023年1月,谷歌AI负责人Jeff Dean在一个内部会议中表示,虽然谷歌拥有做AI产品的技术和能力,但和小型初创公司相比,谷歌做出决策必须更加保守。 直到2023年2月,ChatGPT引起巨大反响,被视为冲击搜索引擎的新出口。谷歌匆忙应战,推出大模型Bard,却因常识性失误引发口碑崩盘——在发布会现场,Bard将智利超大望远镜首次拍摄系外行星的功劳记在了詹姆斯·韦伯太空望远镜上,间接引发谷歌母公司市值暴跌1000亿美元。 在之后的表现中,谷歌逐渐消磨掉了人们的信任。Gemini Ultra版本发布一天后被质疑造假,有内部员工表示“这(视频)是不切实际的”,谷歌最后也承认演示视频是经剪辑制作的效果。 多次犯下致命失误后,谷歌AI产品的信服力越降越低。谷歌正在尽力追赶并弥补过失。从这次发布会的动作来看,谷歌的策略调整为:以大而全的方式布局所有AI细分赛道的机会。 对于算力、算法和人才储备充足,技术功底深厚的谷歌而言,借助于自家生态的优势,谷歌将Gemini集成在方方面面,凭借数据积累,谷歌自有生态构建的护城河壁垒,是Open AI所无法取代的。 “谷歌最坚固的护城河是分销,Gemini 不必成为最好的模型,也能成为世界上最常用的模型。”英伟达高级研究科学家范麟熙(Jim Fan)在X上评价。 不再领先的谷歌,只好握紧生态的优势牌。
华为刚刚发布的新品,手上用的家里装的都有,还覆盖了全年龄段
紧接着一周前的迪拜发布会,华为今天也在国内召开了夏季全场景新品发布会,不仅将先前已经在海外发布的几个新品带回国内,还带来了一系列穿戴、家具和全屋智能新品,以及一个绘画 App。 听起来发了不少东西?本文带你速览华为新品都有哪些亮点。 「天生会画」App:画画这件事,华为是认真的 发布会上的第一个新品,不是平板,不是笔记本,而是一个应用。 这个预热已久的「天生会画」App,由华为联合中国美术学院自研,为自家平板 MatePad 系列带来了杀手级绘画应用。 天生会画提供 100 多种笔刷和 70 多种可供定义的笔刷参数,以及「拟真画布」自定义绘画画布材质,在专业性上拉满。 作为「科技」和「艺术」的结合,天生会画还支持 AI 智能选区,可选中绘画中的元素和主体,进行变形或者自由放置。 可以说,天生会画就是为挑战苹果 iPad 上的专业绘图应用「Procreate」而来。 而比起 Procreate 这个「外来的和尚」,可以预想联手中国美术学院的天生会画,会在「国画」创作的支持上更加到位。发布会上,不少展示的作品就是水墨为主的国画作品。 天生会画对绘画小白也非常友好,提供大量的初学者教程,华为终端 BG CEO 何刚就在发布会上展示了作为小白的他,用天生会画用时 10 分钟画出来的油画作品,效果惊艳。 ▲ 何刚展示自己用「天生会画」创作的作品 天生会画也于 15 日开始了公测,在 MatePad Pro 13.2 平板上率先发布,未来也会登陆更多华为平板设备。 在屏幕上大做文章的全新 MatePad 和 MateBook 14 两款此前在迪拜先行发布的设备:MatePad 11.5″S 平板和全新 MateBook 14 笔记本,这次也迎来了国行版。 华为 MatePad 11.5″S 搭载了全新「云晰柔光屏」,也就是迪拜介绍的「PaperMatte」中文版,采用了防眩光纳米蚀刻技术,号称能够消除 99% 的干扰光,在户外能防太阳光,在室内能防灯光。 除了更加清晰,云晰柔光屏也在「护眼」上开卷,搭配多层纳米磁控光学镀膜技术,护眼同时降低 60% 屏幕反射率,提升观看舒适度。 「云晰柔光屏」不仅仅看起来更好,如果在这块屏幕上使用华为 M-Pencil 3 手写笔,还能提供类似真实纸感的书写体验。 为了配合这块「好写」的屏幕,华为推出了华为笔记更新,素材集市和 AI 字迹调整大大降低了做出美观实用笔记的门槛,录音笔记同步让笔记回顾更加方便。 这块好屏幕的具体参数也不可小觑:144Hz 高刷新率,3:2 比例,2.8K 高清分辨率,还支持 P3 广色域。 其他配置上,MatePad 11.5″S 搭载了 8800 mAh 电池,支持 22.5W 快充,配备四扬声器和华为 Histen 8.1 声音算法,系统为 HarmonyOS 4.2。 华为 MatePad 11.5″S 柔光版 8GB+256GB 版本售价 2599 元,华为还提供了不带云晰柔光屏的版本,8GB+128GB 售价 2099 元。 笔记本新品 MateBook 14 也搭载了一块亮点满满的好屏幕。 这块 14.2 英寸的 OLED 屏幕,支持包括 sRGB、P3 和 Adobe RGB 在内的多种色域模式,精度达到 ΔE < 1,以及 120 Hz 高刷新率,屏幕比例为 3:2,屏占比达 91%。 护眼能力上,MateBook 14 这块屏幕支持 1920Hz 高频调光,据介绍,在低亮度环境使用可以降低疲劳感。 更重要的是,这块屏幕还是华为笔记本史上第一次支持手写笔,可搭配华为 M-Pencil 3 使用。 即使不用手写笔,这块支持 10 点触控的屏幕也能够满足日常使用。 性能上,MateBook 14 搭载英特尔®酷睿 Ultra 处理器,配备了全新鲨鱼鳍风扇系统,并且支持 SuperTurbo 性能模式,开启后打开 PowerPoint 文件速度快 22.8%,打开 Excel 文件速度提升 14.9%。 在 MateBook Pro X 上亮相过的盘古大模型也来到了 MateBook 14 上,不仅支持 AI 概要功能,还内置 AI 空间,可选超过 100 个智能体。 虽然不如 MateBook X Pro 般惊艳,但 MateBook 14 机身 1.31 千克和 14.5 毫米的厚度也足够轻薄。 价格上,Ultra 5 处理器+16GB+1TB 的版本售价为 6499 元,提供皓月银和深空灰两种配色,32GB 版本提供原野绿配色。 好马配好鞍,华为还发布了第二代无线鼠标,支持星闪连接,精度最高可达 12000 DPI,价格 229 元。 全新设计的 Watch FIT 3 更加时尚了 迪拜发布会上亮相的华为 Watch FIT 3,也正式推出了国行版本。 Watch FIT 3 采用了全新的圆角方形设计,和前两代更为方正和长条的设计相比,新设计更加时尚年轻,还搭载了以往圆形表才有的圆形表冠。 这款手表擅长的两大领域可以这么形容:「吃」和「动」,支持卡路里、营养素记录分析,以及超 100 种运动模式和 6 种运动模式自动识别。 续航上,Watch FIT 3 搭载 400mAh 电池,常规使用下能够坚持 7 天,而最长续航达到 10 天,启用 AOD 的续航为 4 天。 Watch FIT 3 在尺寸和重量上的表现堪称惊艳。手表表身采用铝合金材质,厚度仅为 9.9 毫米,重量为 26 克。屏幕为 1.82 英寸的 AMOLED 屏幕,屏占比达 77.4%,最高亮度达 1500 尼特。 Watch FIT 3 提供六种配色,氟橡胶及尼龙表带版售价 999 元。 除了面向成年人的手表,华为还带来了儿童手表 5 Pro,支持楼层定位,在没网、关机 5 天的状态下也能定位,售价 1198 元。还有一款「青春版」儿童手表 5 新耀版,价格 698 元。 「未来感」十足的智能家居和全屋智能 除了手上用的数码产品,本次华为发布会的下半场重点放在了智能家居和全屋智能上。 此前已经开启预售的华为 Vision 智慧屏 4 也在这场发布会上正式发布,这块智慧屏搭载了一块 4K 超清全面屏,支持 240HZ 鸿鹄画质,边框仅为 1.5 毫米,屏占比达 98%。 投屏已经是当下非常重要的智能显示屏使用场景,华为 Vision 智慧屏 4 支持哔哩哔哩、腾讯视频等多个平台的 4K 投屏,手机一碰就能投,连弹幕都不会卡。 Vision 智慧屏 4 的「智慧」首先体现在灵犀遥控体验的大升级上,遥控器指哪点哪,精准触控,体验上尽力还原手机操控。 通过灵犀遥控和超级桌面,HarmonyOS 手机应用还能全量登上这块大屏。 这块大屏幕还搭载了 AI 摄像头,不仅能够实现通话人像追踪等智慧功能,还能识别儿童坐姿和距离。 华为 Vision 智慧屏 4 提供 65 英寸、75 英寸和 86 英寸三种尺寸,起售价 5499 元。 觉得价格还是太贵?华为还推出了「青春版」Vision 智慧屏 4 SE,也支持 4K 一碰投屏,屏幕刷新率为 120 Hz,提供 55 英寸、65 英寸、75 英寸三个尺寸,起售价 2699 元。 何刚也在发布会中预告,下半年华为将会有 100 多英寸的超大尺寸旗舰产品发布。 2022 年发布的「美好记忆保险柜」华为家庭存储也推出了更新,行业首发应用数据备份功能。例如,针对微信聊天记录可以实现全量备份,并一键恢复指定记录。 比智能家居更上一层楼的「全屋智能」场景,华为也带来了新品。 「AI 辅助康养传感器」主打以 AI 重塑关怀,通过毫米波雷达,对人体姿态、精准的位置和呼吸频率进行检测和判定,支持跌倒、坠床、睡眠三大场景,可以及时分级别告警摔倒、坠床等异常状态,还能生成睡眠报告。 AI 辅助康养传感器并不搭载摄像头,以毫米波雷达进行检测,无成像能力,数据也只在本地处理,也无需佩戴智能设备,保护用户隐私,定价 1399 元。 而新一代超薄吸顶音箱对比上一代厚度减少 49%,来到 8cm,音质上低音、低频和高音也均有所增强,主打「音乐跨空间流转」和「多氛围场景歌单」。 在发布会上,华为也介绍了其智能照明系统,亮度色温随心控,丰富照明模式,且通过 PLC 群控调光实现一驱多灯。 新品介绍完了,华为还全新推出了「未来之家」,有点类似全屋智能的「样板间」,将会在各大城市商圈、公园等场景中推出。未来还会有未来酒店、未来民宿、未来医院等场景。 「可变空间」则更加科幻,在这个智能家场景下,小房子也能变出「大空间」。据介绍,2 万元的造价就可以创造出 15 平米的可变空间。 货真价实的「全场景」发布会 整场发布会看下来,可以发现华为发布了种类非常丰富的产品,既有 3C 数码的平板和笔记本,也有智能穿戴的手表,更有智能家居全屋智能产品。 涵盖的人群也非常丰富:下至儿童手表,上至老人康养传感器;既有面向学生群体的平板电脑,也有面向商务人士的笔记本。 因此,华为这个发布会是货真价实的「全场景」新品发布会,而能做到全场景,正是因为底层都是自家已经迭代四个版本的系统 HarmonyOS。 下个月,华为还将举行 HDC 2024 开发者大会,为 HarmonyOS 描绘下一步蓝图,爱范儿也会持续进行关注。
谷歌深夜发布“AI超级全家桶”,但最大的创新却被OpenAI狙击了
昨晚,谷歌发布“AI超级全家桶”,但最大的创新却被OpenAI狙击了 作者 | 郑玥、芯芯 编辑 | 郑玄 不出预料,谷歌是被 OpenAI 狙击了。 一连串烟雾弹后,昨天 OpenAI 用一个可以看到、听到真实世界,并可以实时无延迟对话的 AI 智能助手「GPT-4o」震撼了世界。而把发布 4o 的时间点特别选在谷歌 I/O 大会开幕前一天,当时就有媒体预测,OpenAI 这是在狙击谷歌。 果不其然,美国当地时间 14 日上午 10 点举行的谷歌 I/O 大会主题演讲上,虽然谷歌发布了一系列基于 Gemini 的「AI 全家桶」——包括升级 200 万 tokens 上下文的 Gemini 1.5 Pro、新模型 Gemini 1.5 flash、类 Sora 的新视频大模型 Veo,以及包括 AI 搜索、AI + Gmail 在内的多个 AI 应用。 但最受关注的,还是谷歌 DeepMind 负责人兼谷歌 AI 领导者 Demis Hassabis 口中,真正通向 AGI 的万能助手项目——「Project Astra」。以及面向 Gemini Advanced 订阅者新推出的语音聊天功能 Live,后者预计还将在年内加入相机功能,让 AI 可以基于用户所处的真实环境展开对话。 这两个产品都有点像「GPT-4o」,但先不论三者的真实效果到底如何,从产品进展来看 OpenAI 已经领先一筹。不过这也不意味着 OpenAI 注定成为最后的赢家,目前来看手机依然是这些超级智能助手最重要的硬件载体,掌握安卓系统的谷歌有着天然的优势。从这个角度看,前段时间苹果与 OpenAI 的合作传闻,可能正是来源于二者对抗谷歌因而各取所需。 不论如何,具备「真实世界感知 Input」+「低延迟语音 Output」的超级智能助手,已经成为下一阶段 AI 公司军备竞赛的关键。接下来更多大模型公司、云计算平台,甚至手机公司、AI 应用开发者都会卷入其中。 01.Project Astra——实时视频问答,发誓没有造假 I/O 大会上,谷歌发了一段非常惊艳的 AI 助手演示视频,这次还了发誓,没有以任何方式伪造或篡改。 Demis Hassabis 说,Project Astra 是自己期待了几十年的 AI 助手的雏形,是 AI 助手的未来。 Project Astra 是一个实时、多模式的人工智能助手,通过接收信息、记住它所看到的内容、处理该信息和理解上下文细节来与周围的世界进行交互,它的语音交互比当前形式的 Google Assistant 更自然,没有延迟或延迟,可以回答问题或帮助你做几乎任何事情。 演示视频中,用户要求 Project Astra 在看到发出声音的东西时告诉她,助手回答说,它可以看到一个发出声音的扬声器。 交互是实时语音进行的,且并没有「嘿,Google、Gemini」等唤起词,用户问 Project Astra 视频中显示器上的代码有什么作用,Project Astra 没有一丝延迟地进行了解释。 Project Astra 记住了一闪而过的眼镜|图片来源:谷歌 Project Astra 关于视觉的处理甚至算整场发布会最大的亮点。「你记得我把眼睛放哪了吗?」「你的眼镜在桌子上的红苹果旁边。」Project Astra 甚至通过镜头记住了一闪而过的眼镜,并准确回答出在苹果旁。这里可能夹带了一点「私货」,这副眼镜上或许也有 Project Astra。 从演示看,Project Astra 可以很快处理收到的信息,可以通过连续编码视频帧并将视频和语音组合成事件时间线来做到这一点,然后缓存信息以供回忆。谷歌表示,其中一些功能将在今年晚些时候添加到 Gemini 应用程序和其他产品中。 Project Astra 给这个乐队起名为金色条纹|图片来源:谷歌 谷歌称 DeepMind 团队还在研究如何最好地将多模态模型整合在一起,以及如何平衡超大型通用模型与更小、更集中的模型。 昨天刚发布 GPT-4o 的 OpenAI 最重大的突破也在多模态上,看下来似乎昨日重现。最大的一个区别在视觉处理上,是目前 GPT-4o 只能处理静态图像,Astra 已经可以处理视频。 Project Astra 背后的 Gemini 系列大模型能力也有更新。上个月举办的 Google Cloud Next 2024 大会上发布,发布的 Gemini 1.5 Pro,具有原生音频理解、系统指令、JSON 模式等,可提供 100 万长文本能力,宣布已经向全球开发者开放。 这次宣布推出的 Gemini 1.5 Flash 模型,解决了关键的成本问题。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间,主要面向开发者。会上详细介绍了 Gemini 1.5 Pro 和 Flash 的定价。Gemini 1.5 Flash 的价格定为每 100 万个 token 35 美分,这比 GPT-4o 的每 100 万个 token 5 美元的价格要便宜得多。 Gemini 1.5 Flash|图片来源:极客公园 谷歌还预告了接下来的动作,宣布今年晚些时候将模型的现有上下文窗口增加一倍,达到 200 万个 token。这将使其能够同时处理 2 小时的视频、22 小时的音频、超过 60,000 行代码或超过 140 万个单词。 Gemini 1.5 Pro |图片来源:极客公园 谷歌去年 12 月发布的一个预录演示遭到「造假」质疑,通过剪辑误导人们高估 Gemini 的视频处理能力,不过现在,这些能力都是真的了。 02. 基于大模型的 AI 应用生态方面的进展 在这次 I/O 大会上,谷歌基于大模型的 AI 应用生态也有所升级,涵盖搜索、照片、创作、工具以及工作应用等方方面面。 搜索是谷歌 25 年前的创世产品。在一年前,谷歌表示,搜索的未来是 AI。现在,谷歌搜索中的 AI 真的来了,主打一个——「让谷歌帮你谷歌。」 谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在 I/O 大会上宣布,人工智能生成的搜索摘要,现在被称为「人工智能概述」,将在「本周」向美国的所有人推出,更多国家/地区即将推出。 相比从前,AI 搜索可以处理更复杂的问题。谷歌提供了一个例子,也许用户在寻找一个新的瑜伽工作室,要求这个工作室既要在当地很受欢迎,也要方便通勤,还要有折扣,只需一次搜索就能实现。 另外,用户还可以调整已经生成的 AI 摘要,或者选择简化版本,或者选择查看更多细节。 这一切是谷歌通过定制的 Gemini 模型来实现的,其将多步推理、规划和多模态与搜索系统结合,总结网络内容并展示答案,据称还是 AI 来设计和填充结果页面。 但一个问题是,如果是 AI 为用户捕获搜索结果,谷歌的竞价广告业务往哪放? 据谷歌高管称,与传统查询出的网页列表相比,AI 摘要中包含的链接会获得更多点击。「与以往一样,广告将继续出现在页面的专用位置上,并通过清晰的标签区分有机结果和赞助结果。」 除了提问,谷歌 AI 搜索还能制定计划,从饮食到旅行计划,比如搜索「创建一个容易准备的团体 3 天饮食计划」,AI 就会定制计划,然后用户可以将某份晚餐调整成素食,随后导出到文档或者谷歌邮箱里。 搜索还不仅仅是文本框中的文字,谷歌的视觉搜索也进化了,可以用视频提问。比如,用户有台二手唱片机,上面带针的金属部件漂移了,不知道怎么回事,可以直接用视频搜索,即能得到有解决步骤的 AI 摘要和相关链接,省去描述问题所需要的正确术语的时间和麻烦。 使用谷歌 AI 搜索,直接制定饮食计划 |图片来源:谷歌 谷歌照片应用也将进化。桑达尔·皮查伊在演示中称,9 年前他们推出了这个应用,现在每天有超过 60 亿张照片和视频被上传到这里。 该应用在未来几个月将推出「询问照片(Ask Photos)」功能,也是基于 Gemini 模型,可以让用户以自然语言搜索照片和视频中的人物、宠物、地点等,它能理解照片的上下文和主题,找到特定的回忆信息,无需滑动屏幕。 例如,「向我展示我参观过的每个国家公园的最好看的照片」「去年我在哪里露营?」「我的优惠券什么时候到期?」「露西娅什么时候学会游泳的?」「显示露西娅的游泳进步情况」「莉娜的生日派对是什么主题?」最后,它还能撰写旅行亮点或者个性化的标题,供用户在社交媒体上分享。 谷歌还称,「除非在极少数情况下是为了解决虐待或伤害问题,我们不会使用这些个人数据训练 Google Photos 之外的任何生成式 AI 产品,包括其他 Gemini 模型和产品。」 使用询问照片功能,询问生日派对细节|图片来源:谷歌 在创作工具方面,谷歌在 I/O 大会上还推出了 AI 生成视频的工具 VideoFX,并更新了 AI 图像和 AI 音乐创作工具 ImageFX 和 MusicFX。 VideoFX 可以让电影制作人编写提示来构建电影镜头,ImageFX 添加了图像编辑控件,而 MusicFX 出了一个新的 DJ 模式。 其中,新工具 VideoFX 由 Veo 提供动力,Veo 是谷歌 DeepMind 最强的生成式视频模型。这个新工具配备了一个故事板模式,可以逐个场景地进行迭代,并向最终视频添加音乐。 据谷歌高管称,Veo 能理解「延时拍摄」等电影术语,可以生成各种电影和视觉风格的 1080p 分辨率视频,时间还可以超过一分钟。Veo 将通过候补名单提供预览版。 另外值得注意的是,VideoFX、ImageFX 和 MusicFX 生成的所有内容都被数字水印 SynthID 标记,主要是为了防止 AI 内容滥用和虚假信息传播问题。 使用谷歌 AI 生成视频工具 VideoFX |图片来源:谷歌 除了创作工具,谷歌日常工作应用的进化也值得关注。包括 Gmail 邮箱、日历、文档、表格、幻灯片、云端硬盘等在内谷歌 Workspace 应用,将引入最新的 AI 模型 Gemini 1.5 Pro,位于侧边栏,作为一个虚拟助手。 当用户点击侧边栏的 Gemini 图标时,Gmail 中的 Gemini 将提供「总结此电子邮件」「列出下一步操作」「建议回复」等选项。用户可以让它总结小孩学校的邮件,获得需要行动的信息,起草回复。 Gmail 侧面板中的 Gemini 总结电子邮件 |图片来源:谷歌 另外,在昨天 OpenAI 发布的 GPT-4o 演示中,其中有个教育场景,GPT-4o 直接化身家教,逐步教一个青少年解决几何数学问题。 谷歌也宣布推出 LearnLM,这是一组基于 Gemini 的微调模型,专为学习教育而设计,同时演示了一些在搜索、YouTube 应用上的 AI 教育学习场景。 比如,在 YouTube 上,用户可以在观看视频时提问,也可以针对视频提后续问题。在 Android 上,可以用画圈搜索(Circle to Search)尝试解决数学和物理题目里的特定困难。 针对 YouTube 学习视频进行提问 |图片来源:谷歌 在这场 AI 公司的军备竞赛中,谷歌追赶 OpenAI 的其中一大优势「老本」,在于其掌握手机安卓系统,以及庞大的应用生态。 但当生成式 AI 真的全方位进入谷歌的生态应用,直接接管搜索,帮人回忆过去,制定出行计划,取代真人家教等等,其准确性是否真的可靠?我们拭目以待。
字节大模型发布!“比行业价格低99%”,对话火山引擎总裁谭待
作者 | 三北 编辑 | 云鹏 智东西5月15日报道,今日,在火山引擎原动力大会上,字节跳动豆包大模型正式开启对外服务。 豆包大模型家族在会上首次亮相,目前包括通用模型Pro、通用模型Lite、角色扮演模型、语音识别模型、语音合成模型、声音复刻模型、文生图模型、Function Call模型、向量化模型九款模型。 在定价方面,火山引擎正推动大模型从“以分计价”进入“以厘计价”阶段。豆包通用模型Pro 128k版模型推理输入价格为0.005元/千Tokens,据称比行业价格低95.8%。 豆包通用模型Pro 32k版模型推理输入价格为0.0008元/千Tokens,比行业价格低99.3%。换句话说,一元钱就能买到豆包主力模型的125万Tokens,相当于三本《三国演义》。 ▲火山引擎总裁谭待在解读豆包主力大模型的定价 同时,火山引擎宣布推出火山方舟2.0平台,发布联网插件、内容插件、知识库插件三个重要插件。火山方舟2.0平台可提供万卡GPU资源池支撑训练,支持3分钟内完成千卡扩容,在系统承载力、安全与服务能力上实现提升。 此外,火山引擎还宣布推出扣子专业版,提供企业级AI应用开发平台;发布了数据洞察AI助手ChatBI、智能创作云2.0、AI 助手 Sales Copilot;联合多家行业伙伴成立智能终端大模型联盟、汽车大模型生态联盟。 在会后,智东西等少数媒体与火山引擎总裁谭待进行了面对面对话。 团队在豆包大模型的定价方面有什么样的想法和思考? 谭待说,不同尺寸、性能的模型价格不一样,字节这次是能力最强的主力模型的定价都比行业价格低99%,这是非常惊人的。 背后的原因有两点:一是团队能做到,团队在技术上有非常多优化手段,包括通过模型结构的优化调整,把成本做低、效果做好,通过分布式推理、混合调度大幅度降低部署成本等;二是团队需要怎么做,今年大模型的应用变得更加重要,同时大模型创新的风险依然很高,因此大家需要把试错成本降得非常低,才能够让大模型广泛地应用起来。 豆包大模型在价格降低的同时性能怎么样? 根据谭待在现场的解答,豆包主力模型是要跟市面上所有的主力模型去对比,虽然模型参数、基准测试表现在会上没有特别披露,但在它开放后大家马上就会看到很多第三方测试结果出来,团队自信接受用户使用之后的测评。第二是普通用户去用豆包App后会有自己的感受,它的巨大的使用量也是模型能力很好的证明。 ▲火山引擎大模型服务全矩阵图(智东西现场拍摄) 谭待透露,豆包大模型目前日均处理1200亿Tokens文本,生成3000万张图片。而豆包App下载总量截至目前已达1亿,双端月活跃用户达2600万。 一、推出全栈AI服务,豆包大模型开启对外服务 谭待说,大模型的发展与每个人、每家企业都息息相关,而当下企业落地大模型面临着模型效果、推理成本和落地难度等关键挑战。 为此,火山引擎宣布推出全栈AI服务,提供更低成本、更易落地的更好模型,助力企业AI转型。 同时,豆包大模型正式开启对外服务。谭待透露,经过一年时间的迭代和市场验证,豆包大模型目前日均处理1200亿Tokens文本,生成3000万张图片。 豆包通用模型Pro具备理解、生成、逻辑、记忆等强综合能力, 支持128k长文本精调,且支持问答、总结、分类、创作等丰富的场景。 豆包通用模型Lite是更具性价比的通用模型,千Tokens成本降低84%,延迟降低50%,它支持闲聊、天气及实时信息查询、音乐视频播放、导航等场景,效果领先传统语音处理50%以上。 豆包角色扮演模型支持角色高度定制,能够基于上下文感知自适应用户扮演或陪伴需求,且具有强剧情推动能力,能够持续引导聊天。 在豆包语音系列模型,豆包语音识别模型具有高准确率和个性化特征,支持多语种识别;豆包合成模型具有自然、多情绪和多演绎特征;豆包声音复刻模型支持5秒复刻,跨语种迁移,与原声具有高相似度。 此外,豆包大模型还包括文生图模型、Function Call模型、向量化模型等其他细分领域模型。 会上,字节跳动产品和战略副总裁朱骏结合豆包的案例解读字节在大模型产品设计上的思考。 朱骏谈道,豆包的设计有几条基本原则,第一是足够拟人化,比如“豆包”这一名字就体现了拟人化特征。 第二是离用户近。豆包的功能定位包括随身携带的“语音百事通”、桌面端文案创作小助手等,主要嵌入用户现有的使用环境,以拉进与用户的距离。 第三是遵循个性化。在智能体的世界,每个人都有个性化的需求和情感,因此在豆包上每个普通用户都可以“捏”一个专属自己的智能体。豆包还支持打造更高阶的智能体定义能力,比如打造个性化的辅导老师等。 截至目前,豆包App下载总量已达1亿,双端月活跃用户达2600万,智能体总创建数达800万。 二、火山方舟2.0平台发布,万卡GPU资源池支撑,三大插件升级 今日,火山引擎还宣布推出火山方舟2.0平台,发布联网插件、内容插件、知识库插件三个重要插件。 其中,联网插件支持实时联网信源,提供抖音、今日头条同款搜索能力,并支持多模态交互及意图识别检索。 内容插件支持海量内容调取,独家上架抖音内容插件,提供抖音丰富视频和图文内容,丰富大模型和用户的交互过程,并支持内容策略定制。 平台知识库插件支持企业调用内部知识库,内置了字节自主研发的搜索引擎,支持毫秒级、百亿规模检索,且搜索更新快、搜索相关性高。 除了插件升级,火山方舟2.0平台在系统承载力、安全与服务能力上实现提升。 谭待称,平台可提供万卡GPU资源池支撑训练,3分钟内完成千卡扩容,运维体验和安全合规增强,助力AI场景落地的最后一公里。 三、扣子专业版发布,推出AI助手ChatBI,智能创作云2.0升级 今日,火山引擎推出扣子专业版,提供企业级AI应用开发平台。 据悉,扣子是字节推出的新一代AI应用开发平台,具有低门槛、个性化、实时性和多模态等特征,具备海量的AI资源、丰富的发布渠道,并支持一键自定义API服务。 目前,扣子专业版已集成在火山引擎的大模型服务平台“火山方舟”上。招商银行、海底捞火锅、超级猩猩、猎聘等企业,已在扣子上搭建了智能体。复旦大学、浙江大学等名校也为课程和实验搭建AI“助教”。 今日,火山引擎智能数据洞察DataWind正式发布AI助手ChatBI,用户可通过自然语言交互生成指标,用于图表制作、数据查询,还可进行深度数据分析,且ChatBI支持IM交互,可多端应用,随时随地自助分析,有望大幅降低数据消费门槛。 面向营销场景,火山引擎进行了智能创作云2.0的升级,成为从内容创作、矩阵分发、广告投放到数据洞察一站式的企业内容营销增长方案;不仅提供多模态的理解与生成能力,助力视频创作效率提升25倍,更上线抖音话题、POI、小程序等营销工具,使门店页面曝光提升600%。 面向销售场景,火山引擎发布了销售AI 助手 Sales Copilot,能够高效跟进客户需求,随时辅助销售解答复杂的产品问题。此外,它还能通过角色扮演的方式模拟不同风格的对客演练,并提供优秀话术学习,提升销售沟通质量。 此外,火山引擎今日与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟;与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商,宣布成立汽车大模型生态联盟。 结语:大模型产业新的价格战打响 当下,全球大模型产的的价格战已经打响。那厢,国外OpenAI最新推出的旗舰模型GPT-4o刚刚宣布API定价降低一半;这厢,国内的字节跳动豆包大模型将价格打爆,主力模型相比行业价格降低99%。 随着豆包大模型家族首亮相,我们看到字节做大模型具有强应用导向的特征。在应用需求的导向下,字节跳动及火山引擎关注模型效果、成本和易用等多个维度的平衡。本次豆包大模型的一大特征是远低于行业市场的定价,模型的实际使用性能和体验如何,我们持续关注用户和开发者体验后的进一步反馈。
谷歌开发者大会暗藏玄机:30秒视频暗示 十年前失败的AR眼镜即将复活
财联社5月15日讯(编辑 刘蕊)在谷歌I/O开发者大会上,谷歌发布的万能AI助手——Project Astra吸引了最多的目光。 值得注意的是,在这一AI项目的展示视频中,除了Project Astra的种种强大功能以外,谷歌也在暗示,其十年前宣告失败的AR眼镜项目即将重新出山。 谷歌AR眼镜项目复活? 2012年,谷歌推出首款AR眼镜“Google Project Glass”,在当时一度引发业界惊叹。 但由于这款产品的价格高昂、应用不足,这款产品的市场反响冷淡,最终在2015年1月19日,谷歌停止了谷歌眼镜的“探索者”项目,标志着这一项目的失败。 尽管在那之后,谷歌又上架了面向企业的企业版AR眼镜,但市场反馈依旧不如人意,这款企业版产品在去年也停产了。 然而如今,借助人工智能的技术支持,谷歌似乎准备重新推出这款产品。 在Project Astra的演示视频中,尽管在视频的大部分时间内,演示者都是用手机拍摄画面并与AI助手互动。但在演示中途,演示者突然问Gemini:“你还记得在哪里看到过我的眼镜吗?”,Gemini立刻回答:“是的,我记得。你的眼镜放在桌子上,就是苹果的旁边”。 紧接着,演示者戴上了眼镜,并在视频中展示了戴上眼镜后的视角画面。 这段约半分钟的画面中,演示者可以继续向AI助手提问。很显然,这副眼镜上搭载了智能摄像头以帮助它了解周围的环境,并且可以回答使用者的问题。 视频中展示了戴上眼镜后的视角画面 尽管视频中并未详细介绍这款可穿戴设备,但这一演示内容显然是在暗示,Project Astra可以应用于眼镜。而在发布会后,谷歌的高管们也对外证实了这一猜测。 谷歌高管证实:谷歌眼镜将是AI助手的完美应用 在发布会后,谷歌DeepMind首席执行官杰米斯·哈萨比斯(Demis Hassabis)和谷歌联合创始人谢尔盖·布林(Sergey Brin)接受采访时证实,该公司正在试验为“Project Astra ”制造眼镜的想法。 “显然,它在手机上的效果非常好,”哈萨比斯表示,“但整个硅谷都在讨论这个问题——当这些系统完全开发出来时,可能还需要其他形式的载体。在我看来,谷歌眼镜是一个显而易见的选择。” 布林称,Project Astra是人工智能眼镜的“杀手级应用”,并补充说,谷歌进入这个领域的时间早了10年,“这很有趣,因为它就像是完美的硬件。” “我们的想法是要解放双手,”布林表示,“在很多场景下,比如你正在做饭或做一些运动时,或者你想要这个东西帮助你时,在这些时候,如果还必须用手拿着手机,就会很尴尬。” 哪怕谷歌眼镜是在十年前发布的,但10年后的今天,布林仍然认为这款产品的外形“非常酷”,“不幸的是,我们在(发布)时点上搞砸了,我有点希望我能把握好一点时间。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。