看到这些进展我内心的成就感

# 体育新闻 2023-09-24 09:20 0 来源：晨曦时尚网

经济观察报记者任晓宁实习记者陶思羽贾磊身上的标签看起来似乎并不在一个次元。他是百度技术首席架构师，是...

看到这些进展我内心的成就感

经济观察报记者任晓宁实习记者陶思羽

贾磊身上的标签看起来似乎并不在一个次元。

他是百度技术首席架构师，是国内稀缺的语音大模型带头人。与此同时，围绕在他身上的另一组标签，是中国互联网行业首位 " 全国劳动模范 "，在外界看来这是百度 " 狼性工作 " 的经典写照。

贾磊在百度负责语音技术研发，他刚来百度时，语音技术在百度处于开拓期，那段时间，他 " 每天只要睁开眼睛就是工作，连走路坐车的时间都用来思考 "，他一个人组建团队，写代码、建模、搭系统，6 个月后，百度上线了自主研发的语音搜索系统，这套系统也意味着中国的语音搜索技术实现突破，从无到有地跻身世界前列。

在国内 AI 语音领域，贾磊都是带头人，2023 年他获得吴文俊人工智能科技进步奖特等奖。今年 3 月文心一言发布会上李彦宏展示的方言语音合成，以及文字生成视频中的语音生成能力，都由贾磊团队研发。

但最近他正在做一些更不一样的事情。

攻克难题

" 旁白：掌柜的是一名老者，他正坐在柜前喝着酒。厅前还有个女孩擦拭桌椅，她见沈况进来，便礼貌的开口。

清脆女声：客人吃饭还是住店。

少年男声；住店。

旁白（伴随着轻柔音乐）：那女孩年岁不大，估摸着比沈况小了几岁。见沈况进来，老者微微的睁了开眼。

老年男子声音：哈哈，一把好剑！…… "

贾磊向经济观察报记者展示了这段 2 分钟的声音，这是他带领的百度语音团队最新研究成果。这段合成声音，展示的是混杂各种背景音及 4 个人的声情并茂的对话声音的一个小说对话过程。这段语音对话背后，是对互联网音频大数据的识别、理解、分析和合成的综合应用。

语音大模型做好之后的效果大概是，你把一本小说喂给它，它能迅速生成电影质感音频，不需要任何人工操作。

当下无论国内还是国外，无论是 ChatGPT 还是百度，人们使用最多、体验最多的都是文生文、文生图大模型，很少听到语音大模型的进展。贾磊很坦然地承认，这一波 AI 技术新浪潮中，世界范围内看，AI 语音大模型技术的确慢了一步，" 是人家图文先实现了突破。"

不过对此，他觉得也正常，技术之路总是此消彼长，此起彼伏。在上一波由深度学习技术突破而带来的 AI 浪潮中，就是语音技术先做了突破，然后图文技术再跟上。

算上中科院自动化所博士学习的时间，贾磊在 AI 语音这条路上已经走了 20 年。看到当下大模型的进展，他很感慨：技术变化真的太快了。

2021 年至今，各种深度学习模型技术交替登场，贾磊所在的语音领域，也曾经尝试使用自然语言处理的方法做预训练和语音大模型，但是这比大语言模型更难。语音大模型在实际使用中，一直解决不了快速实时的模型计算问题。

最近在 NLP 领域的大模型技术发展的牵引下，贾磊打开了思路，通过对语音大模型的模型结构和训练算法的创新，实现了语音在线服务中的模型体积增加几十倍的突破，他告诉经济观察报记者，这个创新在世界范围内十分领先。

技术改变中国人

采访贾磊是在一个夏天的午后，他从百度科技园的办公室匆匆走出来，会议室里聊了一个多小时后，他又匆匆赶回办公室，道别时他特意为这种匆忙解释：" 我得回去工作了。"

做 AI 研发是一件枯燥又压力极大的事情，对此贾磊并不讳言。现在的他，每天时间都花在处理、调试模型，设计实验，看论文，写程序这些事情上。上班就是工作，下班回家就是睡觉，20 年如一日，循环往复，他调侃自己：感觉人生就是同一种模式。

这种人生模式早在 20 年前，他在中科院读博时就已经预知，但他乐此不疲。

贾磊选择语音是兴趣驱动的。贾磊硕士毕业后，考入中科院自动化所攻读博士学学位。他最初的研发方向是图像处理，涉猎了模式识别各学科方方面面的知识，也综合比较了图像、语音和 NLP 等学科的学科差异等。之后他逐渐开始对语音技术产生兴趣。贾磊师从现任中科院自动化研究所所长徐波，做广播语音识别、广播语音翻译，把电视节目经过语音识别翻译成英语，由此踏上 AI 语音的 20 年之路。

现在回看，贾磊很感激中科院自动化所宽松的研究氛围，带他进入了一个美丽新世界，这个世界竞争激烈但又成就感满满，" 有些东西别人都没做出来，你做出来了，而且确实很有用，这种快乐其实是能超越很多事情的。" 贾磊说。

发表评论

加载中...

晨曦时尚网 2017-7-5 10:21:32

晨曦时尚网感谢大家的支持

 晨曦时尚网 2017-7-5 10:20:33

晨曦时尚网感谢大家的支持

 晨曦时尚网 2018-10-7 20:37:50

晨曦时尚网感谢大家的支持

 bobdive2022@gmx.com 2024-3-26 19:37:59

admin