科大讯飞回应“套壳”，AI大模型狂潮祛魅-当前短讯

2023-06-06 06:04:26 来源：蓝鲸财经

“星火大模型与OpenAI，是什么关系？”

“我和OpenAI没有关系，我是讯飞星火认知大模型，我是由科大讯飞优秀的人工智能科学家、工程师和语言学家等组成的团队自主研发的。”

当「商业秀」在星火认知大模型输入以上问题后，它很快给出了答复。这与近期讯飞星火大模型的一则传言不符。

(资料图)

近日有网友发现，讯飞星火大模型在有些“问答”中会出现“我是由OpenAI开发的”等内容，由此一则关于“讯飞星火大模型被质疑‘套壳OpenAI的ChatGPT’”的消息传播开来。

5月11日，科大讯飞在最新披露的投资者关系活动记录表中表示，星火大模型“套壳OpenAI的ChatGPT”既不符合事实，也不符合逻辑。

科大讯飞具体表示，如果是套壳 ChatGPT，就不可能出现讯飞星火大模型的响应速度比ChatGPT还快；更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。

我们有理由相信，此时的科大讯飞，比任何一家公司都需要大模型的故事，而非“套壳”事故。且先不论大模型本身的优劣，光看科大讯飞迅速辟谣这一行径，足见星火大模型对其之重要。至少在挽救股价层面，大模型的影响无出其右，就在这个季度乃至更漫长的一段时间内，均是如此。

今年4月底，科大讯飞发布了2022年财报和2023年一季度报，财报显示，净利润出现大幅下滑态势，市场似乎对其瞬间丧失了大部分信心，股价一路下跌。直到5月6月（星期六），科大讯飞发布星火大模型，在5月8日开盘后，其股价才开始拉升10%，此后数日，一度呈现上涨趋势。市场对这家公司，似乎又恢复了信心。

推出大模型，再经历被质疑“套壳OpenAI”事件，科大讯飞也必须面对共同的AI话题：大模型纷纷扎堆，是时候该理性祛魅了。

在这个大模型横空出世的时代，科大讯飞并非“孤勇者”。自ChatGPT发布以来，掀起的科技军备竞赛就一直没有停息，其余威在国内也愈演愈烈，各家公司在AI领域“卷”个不停，前段时间大模型集中爆发，被评价为“颇有十年前互联网‘百团大战’甚至‘千团大战’的气势”。

据不完全统计，在ChatGPT发布后的短短4个月时间里，至少已经有30多个国内研发机构和企业，在ChatGPT发布之后纷纷推出了自己品牌的大模型和相关产品。

一时间，整个科技圈“类ChatGPT”比比皆是，声称“国内首发”的企业更是不少，资本市场风起云涌。与大模型相关的媒体报道铺天盖地，随后又陷入一阵短暂的沉寂。而下一波，大概率还在来的路上。

大模型带来的机遇不言而喻，但在这场疯狂的竞赛中，谁又能真正走到最后？决战未来，各家真正的核心竞争力又是什么？

从商业发展的历史规律来看，喧嚣过后，市场终会挤破泡沫，大模型狂潮不可能永远持续。只有冷静思考大模型能够带来的内核性改变，才能真正抓住这场由AI技术带来的产业变革机会。

01 超越了ChatGPT？

“目前星火认知大模型在国内明显遥遥领先，中文已经超越ChatGPT，英文已接近。”在科大讯飞星火认知大模型发布会上，刘庆峰自信满满地说道。

作为继百度、阿里、商汤、昆仑万维后，第五家正式发布大模型的公司，科大讯飞一上场，就迫不及待展示自己的强大能力。

刘庆峰更是全程主持发布会，并与科大讯飞研究院院长刘聪现场展示了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力等多项能力。

在现场演示环节，刘聪提问：“你为什么叫星火 ”“如果有个小伙子跟女朋友吵架了，那他应该宁死不屈还是能屈能伸？” “孔子在2008年北京奥运会上说了什么？”等各类稀奇古怪的问题，星火迅速“接招”，并给出了恰如其分的回答。

在数学能力方面，刘聪也抛出了“花坛里有三种花，一共88朵，其中月季花的数量是菊花的4倍，牡丹花的数量是菊花的5倍少2朵，那么请问花坛里一共有多少朵牡丹花？”这类计算问题。星火也很快给出了答案，并罗列了相关解题步骤。

刘庆峰随即表示，数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先，也超过了ChatGPT。

对此，「商业秀」也进行了多轮“挖坑式”测试，例如询问“姚明在几几年获得了亚洲足球先生的称号？” “范志毅在NBA服役多少年？斩获了多少个进球？”等问题。星火都准确识别出了人为“陷阱”，并给出了恰当的回答。

这表明，在常识性问题上，星火都进行了一定的训练，并具备一定的纠错能力。

相同的问题，「商业秀」也通过ChatGPT-3进行了测试，其同样也给出了恰当的回答，但在信息丰富度上不及星火全面。

在数理能力上，「商业秀」也测试了“鸡兔同笼，鸡兔一共有25只，笼子里脚一共有74只，请问分别有多少只鸡和多少只兔子？”“一支股票今天涨10%，明天跌10%，请问赚还是赔？”等问题，星火也迅速给出了正确回答。

「商业秀」将同样的数理问题抛给了ChatGPT-3，在这方面，结果显示ChatGPT-3的回答更有逻辑性。后者先给出了结论，再给出了具体实例，并且还会有延伸的问题，配合原问题答疑解惑。

星火还支持语音提问和输出，即可通过语音提问，模型输出的答案也能转换为语音，并能通过持续对话调整语音风格。

「商业秀」通过语音询问“鸡兔同笼，笼里一共有35只，一共有94只脚，问一共有多少只鸡和多少只兔子” “中国拿到网球大满贯职业选手是谁”等问题。星火也准确识别了语音内容，并给出了相应的答案。

但这个操作，要求提问者的语速要很慢，并且能一字一句以标准普通话说出，否则星火可能无法准确识别出相应文字，或文字识别不准确导致回答有误。

经过多轮测试，「商业秀」认为，星火具备了一定的大语言模型能力，并且能够在某些特定领域输出自己的商业价值。

在发布会上，科大讯飞还发布了一系列结合星火大模型的产品，例如讯飞智能办公本能将语音实时转写与墨水屏纸感书写相结合，对会议记录内容形成一份精简的会议纪要；“星火大模型+智能座舱”为数千个车型提供多轮、多人、多区域、多模态的语音交互；基于大模型的生成式RPA（机器人流程自动化），让数字员工更智能……

但星火也不是没有缺点，刘庆峰自己也在发布会上坦言，“大模型技术目前还存在不少待攻克的缺陷。包括新知识难以及时更新、事实类问答容易‘张冠李戴’，史实、传统典籍等容易‘编造情节’等问题。”他随之提及，上述问题在今年会有明显的改进。

据了解，星火认知大模型始于2022年12月。彼时，科大讯飞启动了“1+N”大模型技术攻关。其中，“1”是通用认知智能大模型算法研发及高效训练方案底座平台，“N”是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。

不到半年时间，星火认知大模型正式面世，研发时间之短暂、模型发布之匆忙，这直接导致包括科大讯飞在内的很多企业被外界质疑。

确实，在这么短的时间内，星火的面世仅仅是一个开始，它仍需经过多轮迭代优化。刘庆峰在发布会上公布了星火认知大模型的发展规划：今年6月9日，星火大模型将突破开放式问答，多轮对话能力和数学能力再升级；8月15日，星火认知大模型将突破代码能力，多模态交互再升级；10月24日，星火认知大模型通用模型将直接对标ChatGPT，其中中文能力超越后者，英文能力与后者相当。

从这份规划日期来看，科大讯飞甚至细化到了哪一天，这从侧面或许表明其急于想将大模型能力落地应用，从而推进商业化。业内认为，这或许与近几年科大讯飞的商业化能力不佳有关。

02 急需大模型“提振信心”

此前，科大讯飞优异的业绩与赚钱能力常被业内称赞，但在经历了连续10年的增长后，神话基本结束于2022年。

科大讯飞2022年财报显示，该公司实现营收188.2亿元，同比微增2.77%；毛利为76.84亿元，同比微增2%；归母净利润5.61亿元，同比下滑63.94%；扣非净利润4.18亿元，同比下滑57.31%。

这还是科大讯飞录入政府补贴后的数据，2022年，科大讯飞政府补贴金额为11亿元。与此同时，这也是近五年来科大讯飞净利润同比增长率首次出现下滑。数据显示，从2018年到2022年，科大讯飞的净利润增长率分别为24.71%、51.12%、66.48%、14.13%和﹣63.94%。

资本市场对这一成绩单颇感失望，在财报发布后，科大讯飞股价下跌超9%。

对于业绩出现如此大幅变动，科大讯飞方面给出了三个原因。

首先是大环境的影响，科大讯飞表示“受到去年12月份和今年1月份特殊的社会经济客观环境，以及春节假期影响，导致部分项目无法顺利及时推进”。

其次，继2019年被列入美国实体清单，2022年10月7日被再次极限施压，由于调整供应链和相关合同签署等工作影响了当季订单节奏。

最后一点，与星火大模型有关。科大讯飞提到，去年12月启动的“1+N认知智能大模型专项攻关”影响了当期利润，这从侧面印证科大讯飞在大模型上的投入很大。

来到今年，这三大原因仍持续影响科大讯飞的业绩。

数据显示，2023年一季度，科大讯飞实现营收28.88亿元，同比下降17.64%；净亏损5789.5万元，上年同期净利润1.1亿元；扣非后归母净亏损3.38亿元，上年同期净利润1.46亿元。

据界面新闻报道，科大讯飞总裁吴晓如透露，2022年和2023年一季度讯飞净利润下滑严重主要在于公司在教育、医疗等持续运营型业务的合作平台拓展投入、新产品研发以及核心技术自主可控和国产化适配等方向新增投入约8亿元。

不过，科大讯飞对业绩下滑的情况似乎不太担心。在业绩会上表示目前基于在国产替代和业务开拓上的进展，预计从今年二季度开始将实现收入和毛利正向增长，并有信心实现全年高质量增长的目标。

科大讯飞的主营业务分别包括教育产品与服务、信息工程和开放平台。其中教育产品是其主要营收来源，占到总营收比例的32.74%。

科大讯飞还构建了面向G端、B端和C端三类客户的业务体系：G端主要是面向地市县等区域，涵盖区域内各类学校和用户的因材施教解决方案；B端主要是面向学校的大数据精准教学、英语听说课堂、智慧作业等；C端主要以面向家长的AI学习机、个性化学习手册、课后服务课程服务等产品。

财报显示，G端业务目前已累计在 50 多个市、区(县)级应用；B端业务中的讯飞课后服务业务已覆盖超300区县、12000余所学校；C端的AI学习机该年销售额增长超50%，但并未透露出具体销售数量与金额。

而实际上，其业绩与目标业绩尚相差甚远。科大讯飞曾在2022年初的公告中提到，各项根据地业务预计保持50%的增长。同时提到，2022年个性化学习手册业务预计营收增长超70%，AI学习机收入目标增长200%+，目标十四五做到年收入100 亿元。

除了主营业务未达预期外，科大讯飞的智慧城市、开放平台及消费者业务、智慧汽车、智慧医疗等业务表现也较为一般。

财报显示，智慧城市下属的信息工程、数字政府行业应用、智慧政法行业应用三大板块与开放平台业务均呈现同比下降态势。智慧汽车、智慧医疗与智慧金融业务虽然呈同比增长态势，例如智慧金融同比增长19.33%，但在整体营收规模中的占比实在少得可怜，智慧金融仅占比1.25%，智慧汽车与智慧医疗分别占比2.47%和2.48%。

如此看来，科大讯飞的主营业务表现不佳，创新业务又还远未达到大规模营收的阶段。此时的科大讯飞，必须要抓住大模型带来的巨大价值，为各项业务增加更多商业竞争力。

但如今处于风口浪尖的大模型，能否帮助科大讯飞实现目标，还需要时间去验证。

03 大模型狂潮祛魅时分

今年数月以来，全球的科技企业们处于一种近乎疯狂当中。放眼国内外，围绕大模型发布的浪潮迭起，尤其是国内的科技巨头们接连推出了自己的大模型产品。

据「商业秀」不完全统计，目前已推出大模型产品的公司有百度文心一言、阿里通义千问、华为盘古、商汤日日新、昆仑万维天工以及科大讯飞星火，同时王慧文、王小川等互联网大佬创立的大模型公司也迅速获得了融资。

但这么多大模型都能顺利跑出来吗？大模型的核心竞争价值到底是什么？大模型还能带来哪些颠覆性机会？

疯狂的大模型浪潮，也该到了理性审视的祛魅阶段。

“现在涌现出很多大模型产品，但围绕大模型的训练和调试成本投入非常高，一般公司真烧不起，同时对中小企业来说自研经济性较低，未来竞争更大可能发生在巨头之间。”某风投机构投资经理董浩对「商业秀」表示。

英伟达的研究表示，GPT3最大规模的模型需要使用到175 Billions的参数量，需要使用512颗V100显卡训练7个月时间，或者使用1024颗A100芯片训练长达一个月的时间。每月大模型训练成本在数百万美元以上量级。

上月，由中国人工智能学会主办的人工智能大模型技术高峰论坛上，华为云人工智能领域首席科学家田奇发表的演讲中也提到，大模型开发和训练的单次费用高达1200万美元。

大模型开发成本如此高昂，但应用成本（收费）很低。OpenAI在今年3月开放API(应用程序接口)，允许第三方开发者通过API将ChatGPT集成至应用程序和服务中。其将接口服务定价为0.002美元/每1000 tokens，这一定价较GPT 3.5模型便宜约90%。

从经济角度考虑，这一定价很难将巨额研发投入赚回来，更不用说盈利了。所以这终究不是中小企业耗得起的生意，只有巨头才有资金、资源投入，抢占未来的一席之地。

或许正因如此，目前已发布大模型产品的企业，都将大模型能力内置到了自身已有的成熟产品中。“这一做法既能提高现有产品的AI能力，又可吸引更多客户为具体产品买单，而不是仅收取接口服务费。”一位业内人士告诉「商业秀」。

但即便如此，国内大模型的竞争也极为激烈。作为大模型应用较为成熟的办公领域，就有多家企业推出了相关产品，如百度“文心一言”具备制作PPT的能力；钉钉接入阿里“通义千问”后可唤起10多项AI能力；字节跳动旗下办公应用飞书也将上线AI助手“MY AI”；金山办公也推出“WPS AI”应用等。

这一次，科大讯飞在星火大模型发布会上也发布了录音笔、翻译笔、办公本等办公产品，意在抢占更多办公场景的用户。但是否真的能掘金成功，还要看接下来用户的实际反馈情况。

“虽然大模型竞争主要在巨头之间，但巨头也难以做到一家独大，这其中的关键就在于数据。不同玩家积累的数据不一，就可能在特定领域建立自己的核心优势与独有场景。”董浩进一步表示。

举例来说，阿里有天猫、淘宝的电商数据，菜鸟系的物流数据，这是其他企业无法获取的独有数据，同样科大讯飞在教育领域深耕多年，也积累了自己的独有数据。这些数据，或许就是真正拉开企业差距的关键。

也就是说，那些没有持续资金支持的中小公司，或许很难做出真正的通用大模型产品，而各个大厂推出的通用大模型产品，已经在急于考虑商业变现，缺乏研发耐心与技术突破。

董浩直言，“这一切都来得太快了，还没几个月，各家大模型似乎都成熟可商用了，但事实上这其中必然存在诸多泡沫。”

眼下这场狂热的大模型竞赛才刚刚开始，在巨头和企业疯狂入局与厮杀的同时，不少业内人士也疾呼：是时候该回归初心，对技术保持敬畏，对商业保持探索，而不是一味追求速度、规模与效率，才能迎来大模型最好的时代。

（文中对话者均为化名）

责任编辑：

关键词：