提供最具价值的商业资讯

讯飞星火深度推理模型X1发布:中文数学能力国内第一,率先落地真实场景


紫金财经1月15日消息 科大讯飞今天发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。

同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。

此外,作为国内智能翻译领域的佼佼者,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒。

发布会上,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

过程中,讯飞星火X1充分展现深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

值得一提的是,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果,多项指标国内第一。

目前,讯飞星火X1率先在教育等真实场景中实现了应用落地。去年1024,科大讯飞联合中国教育科学研究院发布了基于“问题链”的高中数学智能教师助手。同时也正面向全国百个试点区域、联合千名优秀教研员和老师打造上万个优秀案例。

医疗领域,讯飞星火X1的模型策略已取得初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达90%。发布会上,科大讯飞还宣布将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

除了上述讯飞星火X1,讯飞星火4.0 Turbo底座能力实现了全新升级,七大核心能力全面提升,全面对标OpenAI 最新版的GPT-4o。此次升级最重要的特点,是针对行业、企业的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现提升。

讯飞星火4.0 Turbo图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试表明,讯飞星火4.0 Turbo的图文识别能力显著领先国内外顶尖竞品。

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了10倍以上。对于一份500页的项目文件,从扫描、识别到解析的全过程,仅需2分钟即可全部完成。

基于“技术+应用”的不断正向循环,讯飞星火4.0 Turbo的行业能力全面提升,金融、油气、能源、电力、钢铁、 航司等领域综合能力的绝对提升全部超过10%,可以说是“最懂行业的大模型”。

此外,科大讯飞还带来了在智能翻译领域又一突破:针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平,同时星火语音同传大模型还可以最快实现仅5秒的同传时延,达到人类专家译员的水平。

除了端到端的语音同传能力,星火语音同传大模型还促进了语音到文字翻译效果的提升,使得科大讯飞全系产品的翻译能力都得到显著提升,在日常对话、单人演讲、影视节目,包括场景更复杂、翻译难度更高的多人会议等场景以及医疗等专业领域,为各种国际交流场景提供高质量翻译服务。

转载请注明来源:华夏商业网_华夏财经_华夏资讯 » 讯飞星火深度推理模型X1发布:中文数学能力国内第一,率先落地真实场景
分享到: 更多 (0)