您好,欢迎来到江南体育网
全国服务热线0755-27678100
13510073758
自动化
技能为底座 科大讯飞三大AIGC才能赋能多范畴使用落地
来源:江南体育网    发布时间:2024-03-15 22:01:20

  经过了2022年AIGC元年的“C位出道”,现在AIGC现已稳步进入开展快车道,无论是底层技能仍是详细落地使用都更结实和丰厚,也一次又一次让人类宣布赞赏,2023年被称为AIGC大年,有多个方面数据显现,本年我国AIGC市场规模可达170亿元,到2030年我国AIGC市场规模将到达1.15万亿元,面临如此远景和实践使用含义,很多公司纷繁入局,其间便有我国头部科技公司科大讯飞。

  在3月29日由量子位主办的我国AIGC工业峰会上,科大讯飞AI研究院常务副院长高建清对讯飞在AIGC范畴的全体布局进行了共享。从文本发明到音频发明再到视觉发明,科大讯飞均有触及,一起立异产出AIGC相关使用和产品。

  以往咱们在看电子书时,可能会翻开体系自带的朗诵功用,但总是会被比siri还要“严寒无情”的机器声响所劝退。在音频发明范畴,经过研制虚拟声响主动发明体系,讯飞现已完成了语义可控的声响发明,用户输入一个人设,体系便能够生成该人设声响,除此之外,多风格多情感语音组成体系SMART-TTS是科大讯飞的一大杀手锏,11种情感、20档强弱度不同的调理功用,让组成语音更实在,中止、重音、语速等能要害声响元素也能够有用的进行随心调理。

  《红楼梦》中,未见其人、先闻其声的王熙凤一出场便让人知道她是一个风风火火的人,声响是人设的特色之一,然后面人物的视觉相貌也让人设愈加详细。在视觉发明方面,科大讯飞也相同带来了惊喜。从2018年首发多语种虚拟人口唇驱动,到2021年首发2D真人捏脸体系,现在科大讯飞已形成了从3D虚拟形象口唇表情和动作的AI驱动到AI贯穿3D形象构建的全流程,“徒手捏人”不再是女娲的专属技能,一起讯飞经过对语音节奏、韵律领会和语义了解,让虚拟人能够每时每刻、流畅地切换动作,具有愈加天然的身体语言,讯飞研究院还打造了个性化3D虚拟人复刻体系,一张人像、一句线D虚拟形象。

  现在科大讯飞在AIGC范畴打造了AIGC内容发明基地,包含讯飞智作和讯飞音乐“词曲家”渠道等立异产品,讯飞智作能够为用户更好的供给方便的音视频制造,根据讯飞在虚拟人的技能根底,2D/3D形象可替代真人主播,从文本到视频能够一键转化。讯飞智作的内容出产现已大范围的使用于媒体、金融、才智文旅、企业数字化、才智政务、IP运营多个范畴。词曲家渠道则供给了辅佐作词、辅佐作曲和歌曲试音、质量剖析等AI辅佐工具,为广阔词曲作者和采买方供给一个愈加智能、通明和安全的词曲发明交易渠道。

  高建清在我国AIGC工业峰会上表明,“底座+才能+使用”是科大讯飞AIGC全体布局的三层架构:以文本预练习、多模态预练习、多元异构根底资源构建、异构集群构建及大模型练习套件为技能底座,形成了音频发明、视觉发明、文本发明三大AIGC才能,从而衍生出在教育、医疗、人机交互等范畴的丰厚使用。

  从技能到使用,AIGC不是置之不理的概念,也不是稍纵即逝的空谈,其底层技能和工业形状已形成了新的格式,而科大讯飞对AIGC使用落地的推进让更多人实在感触到了年代开展的最新力气。

相关产品
深鑫产品分类Products