科大讯飞发布讯飞星火4.0 Turbo 董事长刘庆峰:大模型落地进入更复杂的深水区

10月24日,在“第七届世界声博会暨2024科大讯飞全球1024开发者节”开幕式上,科大讯飞(SZ002230,股价44.81元,市值1036亿元)董事长刘庆峰正式发布讯飞星火4.0 Turbo。

《每日经济新闻》记者现场获悉,此次发布的最新版本大模型,七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中实现9项第一。与此同时,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。

刘庆峰认为,大模型落地进入到更复杂的深水区。“当我们推出新模型时,必须有对应的场景让大家看得见摸得着。我们已经开放大部分底座能力,并且不断提升对标全球最好的水平。”

数学、代码能力超过GPT-4o

记者现场了解到,讯飞星火大模型4.0 Turbo在数学能力、代码能力上超过了GPT-4o。在由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0 Turbo在其中9项测试集中实现超越,效率相对提升50%。

根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类OpenAI o1大模型的高难度数学能力显著提升。

科大讯飞还展示了大模型在多模态交互能力上的进展。据了解,讯飞星火4.0 Turbo在原有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力,实现语音、视频、图文全部联动的多模态交互。

此外,发布会还首发了星火多语言大模型,除中英文外,可支持俄、日、德、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。

图片来源:企业供图

在产品硬件端,星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏等也在会上发布。

大模型进入应用深水区

眼下,各家企业均在用力冲破大模型的商业化之困,寻找合适的变现方式。

在刘庆峰看来,目前已经进入通用模型与专业模型结合、专业模型与云端模型结合、软件与硬件相结合形成的全新大模型落地时代。

“当我们推出新模型时,必须有对应的场景让大家看得见摸得着。接下来,我们将进行下一步操作,我们已经开放大部分底座能力,并且不断提升对标全球最好的水平。我们必须针对真实应用场景做到全球最好,并且不断扩大语种范围。”刘庆峰说。

今年上半年,科大讯飞实现营业收入93.25亿元,虽然同比有所增长,但是净利润由盈转亏。在业绩说明会上,刘庆峰明确提出战略聚焦的思路,砍掉不赚钱的小业务,做大战略业务。

在此次发布会上,他谈到,今年1—9月,讯飞星火智能硬件GMV(商品交易总额)同比提升50%,截至10月23日,“双11”大促全渠道GMV同比增长280%。

刘庆峰还透露,科大讯飞将牵头成立AI基金,用5亿元创业基金推动大模型、人工智能相关的创业孵化。科大讯飞试图通过这样的方式帮助创业者提供可行的落地实现。

此外,发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。