ChatGPT专员099 发表于 2023-9-10 19:08:40

搜狗秒收技术是什么(搜狗输入法如何自动发送消息)

<p>
<img image_type="1" img_height="245" img_width="455" mime_type="image/jpeg" src="https://p3-sign.toutiaoimg.com/11fe00040f2f6b2611d5~tplv-tt-origin-asy2:5aS05p2hQOeskeeskeeahOWlh-aAneWmmeaDsw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693836049&amp;x-signature=GtZDl1VkimvXLN3H1NmvMPQj2pM%3D" web_uri="11fe00040f2f6b2611d5"/>
</p><p>
    11月17日,搜狗CEO王小川在第三届世界互联网大会上作演讲。
   </p><p>
    当他说到“搜索的未来就是人工智能时代的皇冠”时,屏幕同步显示出英文:“In the future, search will be the Crown of the AI Era”。
   </p><p>
    这不是事先安排好的字幕投射,而是利用搜狗最新的翻译技术,同步翻译出的英文句子。
   </p><p>
<img image_type="1" img_height="382" img_width="507" mime_type="image/jpeg" src="https://p3-sign.toutiaoimg.com/11f6000344c3a802f5e6~tplv-tt-origin-asy2:5aS05p2hQOeskeeskeeahOWlh-aAneWmmeaDsw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693836049&amp;x-signature=GyR398lcyUtwPV6nt1Ki1SzYuSA%3D" web_uri="11f6000344c3a802f5e6"/>
</p><p>
    这是全球首次基于神经网络的实时机器翻译技术在大型活动上展示。就在上周,Google刚刚宣布神经网络机器翻译系统GNMT正式应用到谷歌翻译中。
   </p><p>
    王小川这次使用的语音实时翻译技术,主要基于搜狗今年8月发布的知音引擎,搜狗内部赋予它的口号是“更自然的语音交互”。
   </p><p>
    搜狗语音交互中心技术负责人陈伟告诉小白,从今年下半年开始,搜狗基于已有的深度学习平台和技术,搭建了机器语音的翻译技术,这是从无到有的技术。目前,搜狗在机器翻译领域,包括对话、口语、旅游方面,跟国内其他公司相比有明显的优势。
   </p><p>
    实际上,在Google上周发布基于神经网络翻译的技术之前,搜狗已经把这个技术用在后台,而且从口语来看,其技术甚至比Google都要强一些。
   </p><p>
    过去三个月,搜狗的语音识别请求规模增加到1.9亿次,用户每天的语音从此前的近12万小时增加到16万小时。从数据规模来看,搜狗语音识别在国内单个语音单品APP上的数据优势、规模优势都是最大的。
   </p><p>
    陈伟称,通过在深入学习技术上的优化,搜狗在线翻译的错误率降低了10%左右。
   </p><p>
<strong>
   语音实时翻译原理
    </strong>
</p><p>
    语音实时翻译的整个技术框架,包括了语音识别、机器翻译两个大方向,和以前的语音识别相比,需要做更多的细节优化和系统调优。
   </p><p>
    在这个大框架之下,具体再分为语音断句、语音识别、文本断句、机器翻译等好几个环节。
   </p><p>
<img image_type="1" img_height="377" img_width="508" mime_type="image/jpeg" src="https://p3-sign.toutiaoimg.com/11ff00028b1bd0c2fae2~tplv-tt-origin-asy2:5aS05p2hQOeskeeskeeahOWlh-aAneWmmeaDsw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693836049&amp;x-signature=GQo624HTYb1Yn4WBSqfzpTxiDUQ%3D" web_uri="11ff00028b1bd0c2fae2"/>
</p><p class="pgc-img-caption">
<br/>
</p><p>
    第一个系统功能就是语音断句,有一个特别长的语音信号时,要判断什么时候是静音、什么时候是有效的语音。
   </p><p>
    第二就是基于深度学习模型的判断,通过大量的数据进行建模,建模之后可以通过模型自动检测。
   </p><p>
    语音识别的流程就是做完信号处理通到一个解码器上,一个是语言模型、一个是声学模型,共同输出一个文本结果,叫搜狗语音。
   </p><p>
    搜狗从2012年开始,逐步用到这种系统框架以后,目前比较稳定的线上系统是一个复合的神经网络结构。
   </p><p>
<strong>
   搜狗“端到端”
    </strong>
</p><p>
    那么,搜狗的神经网络结构与其他公司的语音识别翻译技术有何不同呢?
   </p><p>
<strong>
   最牛之处在于结合了目前深度学习的发展,模式从非常复杂的流程变换成一个非常清爽、单一的结构。
    </strong>
</p><p>
    对于语音识别或机器翻译来说,终极的梦想是能不能输入一个语音,直接出对应的结果,中间所有的事情都交给模型去做。
   </p><p>
    之前不是这样的,之前是基于统计的MSD技术,更多把整个建模流程分成很多模型,比如第一个模型,要做对齐模型、分层模型、基于词和词之间的影射模型,每个模型完成一个特定的小功能,最后把这个东西串起来以后完成非常复杂的机器翻译系统。
   </p><p>
<strong>
   “端到端技术是将来人工智能基于学习重要的发展趋势。”陈伟说,有了这样的结构,便可省去非常烦琐的模型训练过程。
    </strong>
    搜狗整个同传两厢的技术就是机器翻译技术,跟国内的几家小伙伴产品PK后,证明它在该领域已经处于引领地位。
   </p><p>
<img image_type="1" img_height="378" img_width="510" mime_type="image/jpeg" src="https://p3-sign.toutiaoimg.com/11f60003459c8e0b566b~tplv-tt-origin-asy2:5aS05p2hQOeskeeskeeahOWlh-aAneWmmeaDsw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693836049&amp;x-signature=tuYz7imKhM1zNUu1AybAYghKYmI%3D" web_uri="11f60003459c8e0b566b"/>
</p><p class="pgc-img-caption">
<br/>
</p><p>
    全世界一共有5000多种语言,使用人数超1000万的语言有81种。以前的方法更多是把整个翻译切分成单词、短语,把中文、英文短语之间的影射关系建立起来,解决的是对齐的问题,这个翻译就是基于短语的技术。
   </p><p>
    最近机器翻译逐渐迁移到了基于神经网络的技术,就是一个端到端的影射。之后是进入对齐都交给模型去做,模型告诉你哪些词和哪些词可以对应在一起,是自己学习出来的。当把这些词语的特征贡献到解码端以后就会出来文本,起到一个端到端的影射作用。
   </p><p>
<img image_type="1" img_height="378" img_width="508" mime_type="image/jpeg" src="https://p3-sign.toutiaoimg.com/11f6000345cb4387ee2e~tplv-tt-origin-asy2:5aS05p2hQOeskeeskeeahOWlh-aAneWmmeaDsw==.image?_iz=58558&amp;from=article.pc_detail&amp;x-expires=1693836049&amp;x-signature=WxkWThp5GtBhG6HXCM1%2FXEPpthM%3D" web_uri="11f6000345cb4387ee2e"/>
</p><p>
    关于深入学习,除了技术以外,还有一个关键点就是数据。
   </p><p>
    搜狗每天的语音请求次数在1.9亿次,意味着每天可以收回来16万小时数据。在这些数据的基础上,通过学习技术,使得搜狗在语音识别上能取得比较好的效果,这也是搜狗语音实时翻译成功的重要因素。
   </p><p>
<strong>
   实用场景大猜想
    </strong>
</p><p>
    那么,这项技术究竟有什么价值呢?
   </p><p>
    搜狗语音交互中心负责人王砚峰认为,从用户角度,语音的需求有两个点,一是人和机器之间的沟通,二是人和人之间的沟通,大家互相发语音之前是微信解决的,包括通过语音识别把文字发给对方。人跟人之间另外一种沟通就是跨语音沟通,比如旅游产品、写作辅助类产品,都是搜狗语音识别翻译技术的应用场景。
   </p><p>
    接下来,搜狗将与旅游产品相结合,这边输中文,那边就出来英文或者日文、韩文,这是一个方向。
   </p><p>
    另外一个方向就是放在输入法里面去,起到辅助的方式,能够帮用户实时的翻译。
   </p><p>
    此外,搜狗语音已经找到车载、智能家居、户外可穿戴设备等三方面的运用场景。其中车载场景已经发布。
   </p><p>
    搜狗还跟魅族共同发布魅族盒子,在魅族的遥控器上使用了搜狗的语音识别技术,以及后台的语音理解,相当于把语音助手的能力放在了魅族的盒子上面。
   </p><p>
    同时,搜狗跟国内比较大的电视厂商合作做语音助手以及语音遥控器,还有现在跟大白遥控器专门做智能遥控的解决方案。后续大家会陆续看到搜狗知音引擎在电视上面的解决方案。
   </p><p>
    搜狗在腾讯手表上做了超系统合作,把目前的语音识别、语音合成的能力集成到手表的解决方案上来。
   </p><p>
    再想一想,当实时语音识别出来,速记这个行当受到了很大的挑战。
   </p><p>
    此番实时语音翻译技术进入实用环节,似乎同传这个职业也要消失了。
   </p>

z0ItL631527 发表于 2023-9-11 04:13:22

学习了,不错,讲得太有道理了

U24CF332317 发表于 2023-9-12 14:53:09

前排支持下

aRUiT68750 发表于 2024-2-21 01:19:24

难得一见的好帖

Z1LHH40221 发表于 2024-2-21 01:19:54

学习了,谢谢分享、、、

OReoI419909 发表于 2024-3-27 19:07:17

不错,支持下楼主

54OqQ265901 发表于 2024-4-3 10:47:33

有竞争才有进步嘛

CghfC904653 发表于 2024-4-3 20:21:28

看帖回帖是美德!:lol

mkyrN982402 发表于 2024-4-3 20:21:28

好好 学习了 确实不错

uozv9323879 发表于 2024-4-11 19:30:33

这真是不错,顶给需要的人
页: [1] 2
查看完整版本: 搜狗秒收技术是什么(搜狗输入法如何自动发送消息)