Board logo

标题: Google新技术可能将加速进入中国的步伐 [打印本页]

作者: jun4rui    时间: 2018-4-13 07:31     标题: Google新技术可能将加速进入中国的步伐

posted by wap, platform: GOOGLE Nexus 4

利用机器学习技术,在视频中挑选出特定的声音,注意,这不是指区分人声和环境噪音(虽然也可以做到这个),这玩意甚至可以做到两个人同时说话的时候,某个人的声音。所以,也可以识别视频中,是谁说的话。

视频找油炸土鳖,不过Google自己把最好的那个视频删了
作者: BigBangBang    时间: 2018-4-13 08:22

posted by wap, platform: Android
以前别人说1984是硬科幻,我还不信。
作者: linchen0_0    时间: 2018-4-13 10:11

这个科大讯飞应该也可以,毕竟专注语音三十年!
作者: 卖哥    时间: 2018-4-13 10:22

posted by wap, platform: Meizu M9
引用:
原帖由 @BigBangBang  于 2018-4-13 08:22 发表
以前别人说1984是硬科幻,我还不信。
硬科幻的特点是以技术导出话题,描述上注重技术细节,1984不具备。
作者: jun4rui    时间: 2018-4-13 13:08

posted by wap, platform: iPhone
引用:
原帖由 @linchen0_0  于 2018-4-12 14:11 发表
这个科大讯飞应该也可以,毕竟专注语音三十年!
讯飞这个不行,多个人同时说话它根本分辨不出,声音都混杂在一起了,更别说识别到是哪个人说的
作者: baggio635193    时间: 2018-4-13 13:34

百度输入法有个会议记录,先分别识别,之后文字记录能分开
作者: jun4rui    时间: 2018-4-13 13:43

posted by wap, platform: iPhone
引用:
原帖由 @baggio635193  于 2018-4-12 17:34 发表
百度输入法有个会议记录,先分别识别,之后文字记录能分开
同时说话的能识别?
作者: baggio635193    时间: 2018-4-13 14:05

宣传是这样,我没有具体试
作者: limboking    时间: 2018-4-13 14:29

百度那个能同时识别 但必须声音差异比较大,靠频率区分,之前别的厂商也有过
Google这个完全是算法和机器学习来区分多个对话同时播放,技术领先太多
前一阵博鳌上腾讯的AI翻译就因为这个翻车了,说话的同时一有干扰就乱了




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0