上新啦!讯飞首个支持长文本、长图文、长语音的大模型发布

IDC预测,全球数据信息产生和复制量将在2025年达到175ZB(1ZB相当于1万亿GB)。假设每个人的大脑功能记忆容量约为1.25TB,那么需要超过280亿个人脑来处理这些信息,相当于全球人口的4倍。

4月26日,讯飞星火V3.5春季上新,科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能。让每个人对知识的萃取与使用,都拥有全新的可能。

作为首个全国产算力训练的完全自主知识产权的大模型,讯飞星火本次正式上新长文本、长图文与长语音能力,首发星火图文识别大模型,快速识别和学习多类型海量知识,行业场景下的回答更专业、更精准。

同时,“多情感超拟人合成”和“一句话声音复刻”首发,实现更生动、更具个性化的表达,带来更有温度的人工智能体验。
 

长文本、长图文、长语音 首个全支持的大模型


1964年,著名传播学家马歇尔·麦克卢汉写道,“人类曾经以采集食物为生,而如今他们重新要以采集信息为生”。

自讯飞星火发布以来,一直践行“解放生产力 释放想象力”的目标。在知识问答、文本总结与图片生成等领域,讯飞星火在国内众多大模型相当“能打”,稳居头部梯队,星火APP安卓下载量位居国内工具类大模型APP顶流。

今天,讯飞星火上线长文本、长图文、长语音能力,让信息采集变得轻而易举。

  • 长文本能力全新升级

随着应用的深入,越来越多的用户希望,借助大模型实现面对海量文本时的快速知识学习和获取,以及在专业领域内问答的准确率问题。

讯飞星火实现了长文本能力全新升级。目前星火大模型通用长文本能力,包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等,总体已经达到GPT-4 Turbo 今年4月最新长文本版本的97%的水平,而在多个垂直领域的知识问答任务上,星火大模型长文本总体水平已经超过GPT-4 Turbo。

对追求效率的用户和企业来说,长文本处理的效率是影响体验的重要要素。通过“剪枝”和“蒸馏”,讯飞推出了业界最高性能的13B,130亿的模型来处理长文本。在效果损失仅3%以内的情况下,使文档上传解析、知识问答的首响时间以及文字生成上获得极大效率提升,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本,星火大模型的上述性能均为业界最优。

例如,上传《星火相传》一书后,可以基于书本内容向大模型输出指令,进行提问和内容再创作。

目前,讯飞星火可实现对不同格式(pdf、txt、doc、docx、markdown)的多文档同时解析,单个文档处理大小可达100M。

借助讯飞星火的长文本功能,文学研究专家可以快速阅读上百万字的史诗级著作,提出自己关注的问题;高校学生面对多个论文,能快速总结关键信息,成为帮助自己学习上的最佳辅助。此前面对长文档的一筹莫展、费时费力,在长文本功能面前都烟消云散。

  • 长图文能力升级

俗话说,“百闻不如一见”。视觉是我们认知世界的重要方式。各种票据、随手拍下的PPT和课堂板书、书籍、APP截图,这些图片、图文信息也是我们日常生活中需要处理的知识载体之一。

在图文识别、公式识别等领域,讯飞连续多年在国际性专业权威比赛中获得冠军。基于核心技术的突破和积累,星火图文识别大模型发布,可实现复杂版面的高精度解析、融合篇章语义的文字识别、覆盖更多领域的专业符号识别。

复杂版面的高精度解析:覆盖31个场景(教育类书籍、学术论文、报纸、PPT等)、18类关键要素(页眉、页脚、表格等),多层级关系预测,符合人类自然阅读顺序
融合篇章语义的文字识别:基于篇章上下文端到端建模,深层次理解语义,识别更精准
覆盖更多领域的专业符号识别:面向教育、金融、科研等专业领域深度优化
效果方面,国际公开的权威英文测试集以及典型场景的识别效果均显示讯飞星火图文识别功能处于业界领先。

在长文本、长图文、长语音加持下,讯飞星火将在多个专业场景,推动行业进步,促进生产力提升。助力智能评标助手全面升级,评标更便捷、更高效、更准确,在国家能源集团已评审5.7万余单,评审准确率达97%。

本次发布会上,基于大模型的知识获取和学习能力的提升,星火合同助手正式上线。在装修、租赁或购买房屋、与客户签约合同等场景下,星火合同助手可以通过关键要素提取,帮你识别潜在的风险漏洞,同时还可对合同进行总结、生成合同,不仅能提高办公效率,更是大大降低了我们日常生活工作权益保护的门槛。

  • 长语音能力升级

《中国网络视听发展研究报告(2024)》提到,截至2023年12月,我国网络视听用户规模达10.74亿人,排互联网应用首位。图文之外,音视频也是如今我们获取知识内容的重要途径。

与文本相比,音视频的信息量和数据量更大。无论是学生上网课、职场人士参加会议、还是记者外出参访,当需要对音视频信息进行再次处理时,往往会耗费大量时间和精力。

结合讯飞领先的语音识别和翻译技术,讯飞星火长语音能力升级,支持长音视频一键总结,快速获取其中的内容。

借助长语音能力,学生可以轻松总结网课内容,应对备考;记者可以在短时间内总结访谈内容,提高出稿效率;职场人士开会时不必手忙脚乱,会议记录和重点可在会后快速总结。

句话声音复刻 拥有你的赛博声优


2024年1月30日,讯飞就正式发布了星火语音大模型,可实现超拟人对话,超拟人语音合成拟人度达到83%+。

经过持续迭代,讯飞星火对情绪表达的可感知度达到85%以上,让高兴、抱歉、安慰、撒娇、困惑等语气表达更生动,让冰冷的AI大模型变得生动活泼。

曾经,讯飞凭借语音合成的深厚积累,通过1个小时的语音为导航软件定制各种个性化声音,让淘云故事机实现5分钟复刻爸爸妈妈的声音讲故事。

现在,使用星火APP可实现一句话声音复刻!只需录制一句话,通过讯飞星火大模型训练目标发音人的特征,合成出目标发音人音色相同的语音,操作简单、省时省力。

当普通人都能轻松利用AI复刻自己声音时,亲情与陪伴将可以穿越时空限制,弥补身隔两地的遗憾。


常年在外工作不能陪在孩子身边的父母,复刻你的声音,为远在家乡的孩子讲睡前故事,让你的声音陪伴他们入眠;在异地的游子,你的声音可为空巢的父母读书、解惑,提醒他们注意身体健康。

开发者生态蓬勃发展 超过50%应用企业刚需场景


自2023年发布以来,星火大模型开发者生态持续蓬勃发展。2024年1月30日至今,仅三个月,开发者团队就新增超55万,其中超过50%的应用服务于企业刚需场景。

企业是解放生产力的重要主体,如何帮助企业更快地构建智能体,更好地使用大模型的能力?

全新的智能体构建的平台:讯飞星火智能体平台,正式推出!

星火智能体平台以讯飞星火为底座能力,解决了任务解析及规划、匹配任务工具、内外部知识信息源打通和任务执行及汇总的关键环节。


“未来的主流是:线上线下结合、虚拟现实结合、人和机器的结合”,科大讯飞董事长刘庆峰表示。

讯飞星火要通过技术进步,解决企业知识学习和获取的最后一公里问题。让每一个人都拥有属于自己的智能体助手,解放每个人的生产力,释放出更多精力做更有想象力、更代表未来的工作。

星火APP支持助手创建 零代码定制AI助手


400多年前,英国哲学家弗兰西斯·培根说:“知识就是力量,但更重要的是运用知识的技能”。400多年后的今天,讯飞星火正在成为每个人获取知识、学习知识的“超级助手”,成为解放生产力、释放想象力的“超级杠杆”。

自2023年6月,讯飞星火助手上线,已覆盖职场、创作、营销、编程、学习、旅行等十多种场景,让2400万+用户拥有了一个24小时待命的全能助手。助手被来自千行百业的开发者创建,其中9700+助手已经开放使用。

今天,星火助手功能焕新,支持移动端创建。无论是上下班路上还是旅行途中,用户都可随时拿出手机,简单几步,迅速生成一个AI助手。

无需编写专业代码,只需填写角色设定、目标任务、需求说明、风格设定等结构化指令,用户即可快速创建出专业的助手。

One More Thing

“让科技有情怀,让公益暖人心”,2017年,讯飞开放平台启动了“三声有幸”公益计划。坚持开放先进技术和能力为公益特殊群体服务,用AI给予特殊群体更多力所能及地关注和爱护。

三声有幸A.I.公益计划正式面向公益开发者免费开放最高100亿讯飞星火 API tokens,用星火助力AI公益,让大模型普惠每个人。访问讯飞开放平台官网,进入AI公益官网页面,提交相关资料即可申请参与。


迈向未来,人工智能已成为绕不开的重要地标!根据益普索的最新调查显示,过去一年中,认为人工智能将在未来三到五年内深刻改变其生活的受访者比例从60%跃升至66%。

作为国产大模型头部梯队,讯飞星火保持持续升级,不断缩减与国际大型模型企业间的差距,加速大模型技术的应用落地。

春季上新,次第花开,刘庆峰最后透露:今年6月27日,讯飞星火V4.0将正式发布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/576201.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

安卓NetworkStatsManager使用及demo

目录 一、TrafficStats类简介二、demo示例 一、TrafficStats类简介 TrafficStats Android API 8提供了android.net.TrafficStats类。 通过此类能获取设备重启以来网络信息,部分函数如下所示: static long getMobileRxBytes() //获取通过移动数据网络…

[C++]STL---unordered_set与unordered_map的模拟实现

目录 前言 哈希桶的改造 哈希桶的初步改造 迭代器的模拟实现 operator() 类互相typedef时的前置声明 友元声明 迭代器的出口 插入Insert() 查找Find() 哈希表的最终改造 unordered_set的模拟实现 unordered_map的模拟实现 前言 unordered_set与set的区…

嵌入式系统中的实时操作系统(RTOS)深入应用与优化

引言 实时操作系统(RTOS)在嵌入式系统中扮演着至关重要的角色,特别是在需要快速响应和高度可靠性的应用中。 我将探讨如何在STM32单片机上实现RTOS,包括任务管理、内存管理以及中断处理,以提高系统的效率和响应速度。…

C++:const成员和取地址操作符

目录 一、const成员 二、取地址及const取地址操作符重载 一、const成员 将const修饰的“成员函数”称之为const成员函数,const修饰类成员函数,实际修饰该成员函数 隐含的this指针,表明在该成员函数中不能对类的任何成员进行修改。 注&…

JavaScript+B/S架构云LIS系统源码C# 6.0+MVC+SQLSugar医院版检验科云LIS系统源码 可提供演示

JavaScriptB/S架构云LIS系统源码MVCSQLSugar医院版检验科云LIS系统源码 可提供演示随着医疗技术的不断发展,医疗机构对于信息化、智能化的需求也越来越高。特别是对于检验科这样的核心科室,如何提高工作效率、降低误差率、提高数据安全性成为了亟待解决的…

2024年【安全生产监管人员】考试技巧及安全生产监管人员模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 2024年【安全生产监管人员】考试技巧及安全生产监管人员模拟考试,包含安全生产监管人员考试技巧答案和解析及安全生产监管人员模拟考试练习。安全生产模拟考试一点通结合国家安全生产监管人员考试最新大纲…

Type-C接口取电IC6500:优势与应用场景的深度解析

Type-C接口PD芯片取电IC的优势 随着科技的不断进步和移动设备在日常生活中的广泛应用,充电技术的革新变得愈发重要。Type-C接口PD芯片取电IC作为现代充电技术的关键组件,其优势日益凸显,为移动设备充电带来了革命性的改变。本文将深入探讨Ty…

(三)登录和注册(handle_auto.go)

登录和注册(handle_auto.go) 文章目录 登录和注册(handle_auto.go)一、所需要的结构体信息二、注册三、登录四、退出 一、所需要的结构体信息 type UserAuth struct{}type LoginReq struct {Username string json:"username" binding:"required"Password …

【汇编语言】直接定址表

【汇编语言】直接定址表 文章目录 【汇编语言】直接定址表前言一、移位指令移位指令过程逻辑移位指令shl 和 shr 二、操作显存数据显示的原理显示缓冲区的结构显示信息的一种“直接”方式 三、描述内存单元的标号关于标号去了冒号的数据标号数据标号同时描述内存地址和单元长度…

前端JS必用工具【js-tool-big-box】,防抖和节流的方法调用学习

这一小节,我们针对前端工具包(npm)js-tool-big-box的使用做一些讲解,主要是防抖和节流方面的。 目录 前言 1 安装和引入 2 防抖的调用学习 3 节流的调用学习 4 使用方法总结 前言 在前端项目中,经常涉及到防抖…

CNAS软件测评报告收费标准

随着信息技术的快速发展,软件测评在保障软件质量、提升用户体验等方面扮演着越来越重要的角色。CNAS(中国合格评定国家认可委员会)作为国内权威的认可机构,其软件测评报告收费标准受到了广泛关注。本文旨在解析CNAS软件测评报告的…

[华为OD]幼儿园两个班的小朋友 100

题目: 幼儿园两个班的小朋友在排队时混在了一起,每位小朋友都知道自己是否与前面一位小朋友 是否同班,请你帮忙把同班的小朋友找出来。 小朋友的编号为整数,与前一位小朋友同班用 Y 表示,不同班用 N 表示。 输入描…

索引【MySQL】

文章目录 什么是索引测试表 磁盘和 MySQL 的交互了解磁盘MySQL 的工作原理Buffer Pool 理解索引引入Page 的结构页内目录(Page Directory)多页情况B 树和 B树聚簇索引和非聚簇索引 主键索引创建 唯一索引主要特点与主键索引的区别使用场景创建 联合索引工…

思维+数学期望,CF 1525E Assimilation IV

目录 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 二、解题报告 1、思路分析 2、复杂度 3、代码详解 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 Problem - 1525E - Codeforces 二、解题报告 1、思路分析 看数据量盲猜O(…

树的层序遍历(详解)

下面以一道力扣题为例: 代码和解释如下: /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(…

零基础HTML教程(31)--HTML5多媒体

文章目录 1. 背景2. audio音频3. video视频4. audio与video常用属性5. 小结 1. 背景 在H5之前,我们要在网页上播放音频、视频,需要借助第三方插件。 这些插件里面最火的就是Flash了,使用它有几个问题: 首先要单独安装Flash&…

华为Pura 70系列,一种关于世界之美的可能

1874年,莫奈创作了《印象日出》的油画,在艺术界掀起了一场革命。当时的主流艺术,是追求细节写实,追求场面宏大的学院派。他们称莫奈等人是“印象派”,认为莫奈的画追求光影表达,追求描绘抽象的意境&#xf…

echarts地图叠加百度地图底板实现数据可视化

这里写自定义目录标题 echarts地图叠加百度地图实现数据可视化echarts地图叠加百度地图实现数据可视化 实现数据可视化时,个别情况下需要在地图上实现数据的可视化,echarts加载geojson数据可以实现以地图形式展示数据,例如分层设色或者鼠标hover展示指标值,但如果要将echa…

【Redis 开发】一人一单,超卖问题(悲观锁,乐观锁,分布式锁)

锁 悲观锁乐观锁第一种:版本号法第二种:CAS法实现乐观锁 悲观锁与乐观锁的比较 一人一单分布式锁Redis实现分布式锁 悲观锁 认为线程问题一定会发生,因此在操作数据库之前先获取锁,确保线程串行执行,例如Synchronized…

好的猫咪主食冻干到底该咋选?品控稳定的主食冻干推荐

315中国之声报道的河北省邢台市南和区某宠粮代工厂的“行业潜规则”,给各位铲屎官拉响了警钟。配料表上写的鸡肉含量为52%,新鲜鸡小胸含量为20%,所谓的鲜鸡肉其实就是鸡肉粉。本来养宠物是为了让自己身心愉悦,但这样的行业乱象弄得…
最新文章