Board logo

标题: [数码手机] 随便谈谈IP4S的语音助理功能 [打印本页]

作者: iceliking    时间: 2011-10-8 11:19     标题: 随便谈谈IP4S的语音助理功能

技术并不高端,本质还是语音识别技术,然后通过一定的算法和数据库分析数据的含义。连算法也不用很高级,随着内存和cpu的提升,暴力搜索估计都可以。感觉类似搜索引擎,谷歌开发这个说不定更靠谱点。

中文不支持很好理解,因为中文的语法和语境和英文是有区别的,好在区别并不太大,同样的开发人员,至少比日语肯定要快。

但这种技术还是很有用的,因为文字信息,说话永远是最快捷和方便的输入方式。这种技术的关键在于优化,也就是各种语境和和口音都应该能考虑到。所以不管能不能用先推出来是对的,到3.0、4.0以后一定好用了
作者: 泄娜    时间: 2011-10-8 11:20

期待进化。。
作者: jun4rui    时间: 2011-10-8 11:22

这套玩意其实Google内建的语音识别已经用蛮久了,虽说功能上有点不如这么来福,相信今后又是一个发展趋势。

不过真不要说iPhone又重新发明了语音识别,口述导航、添加闹钟备忘、发短信打电话、搜索内容什么的,真的早就有了……
作者: Gabrie_l    时间: 2011-10-8 11:36

傻逼们连语音识别和语义分析都不能辨别

说以前都有的去试试
What is the weather in Beijing?
再接着问一句What about Shanghai?
作者: 战神blog    时间: 2011-10-8 11:51

引用:
原帖由 iceliking 于 2011-10-7 19:19 发表
技术并不高端,本质还是语音识别技术,然后通过一定的算法和数据库分析数据的含义。连算法也不用很高级,随着内存和cpu的提升,暴力搜索估计都可以。感觉类似搜索引擎,谷歌开发这个说不定更靠谱点。

中文不支持很 ...
我用过win7的语音,很不靠谱。
作者: ooo    时间: 2011-10-8 11:51

引用:
原帖由 Gabrie_l 于 2011-10-8 11:36 发表
傻逼们连语音识别和语义分析都不能辨别

说以前都有的去试试
What is the weather in Beijing?
再接着问一句What about Shanghai?
这个时候他们就妥妥IDC了
作者: hudihutian    时间: 2011-10-8 11:59

引用:
原帖由 Gabrie_l 于 2011-10-8 11:36 发表
傻逼们连语音识别和语义分析都不能辨别

说以前都有的去试试
What is the weather in Beijing?
再接着问一句What about Shanghai?
麻烦果青能不能捋直了舌头跟我学:现在北京什么天气?

看看你跟美国人花一样甚至更多钱买来的IP4S能不能了解what are you talking about?
作者: foxhounds    时间: 2011-10-8 11:59

win7语音操作都不靠谱。 我早发帖,可惜不够来福没人讨论
作者: beterhans    时间: 2011-10-8 12:04

这次 Siri 真正革新的是 对话 上下文联系. Context

话说 语音识别是老技术
识别出来的文字 用 Google 搜索 也是可以办到的

但是 搜索是 单次的 没有上下文联系 但这次 Siri 在演示大会上 的演示 明显是会联系 上下文关系的 这也算一个重大的进步吧

[ 本帖最后由 beterhans 于 2011-10-8 12:07 编辑 ]
作者: LTFYH    时间: 2011-10-8 12:10

P4S这个绝不可能是啥语义识别,肯定还是以词语为主的,要很能识别自然语言的语义,演示时就肯定是用各种含义类似的语句来执行同一个功能。不信出来时到时走着瞧。
作者: jun4rui    时间: 2011-10-8 12:15

引用:
原帖由 Gabrie_l 于 2011-10-8 11:36 发表
傻逼们连语音识别和语义分析都不能辨别

说以前都有的去试试
What is the weather in Beijing?
再接着问一句What about Shanghai?
我不是有发国外网站整理的Siri可识别的语法列表吗?

不要想得太牛逼了,都是设定好的
作者: jun4rui    时间: 2011-10-8 12:18

iPhone 4s发布会现场苹果演示的Siri技术相当神奇,机器可以根据人的语音自动发起各种动作并将应用和数据信息提供到屏幕上,那么Siri目前能实现多少功能,有多少命令可以被识别呢,TUAW整理了一份命令列表大家可以关注下:

http://bbs.tgfcer.com/viewthread ... ighlight=%2Bjun4rui

这玩意也只是把最常用的例句识别出来罢了。智能识别?现在还真没这种技术,毕竟siri来源N开头的公司产品早就遍布全球了,国内也有很多企业用,你几时见过有这玩意?
作者: Gabrie_l    时间: 2011-10-8 12:19

引用:
原帖由 LTFYH 于 2011-10-8 12:10 发表
P4S这个绝不可能是啥语义识别,肯定还是以词语为主的,要很能识别自然语言的语义,演示时就肯定是用各种含义类似的语句来执行同一个功能。不信出来时到时走着瞧。
怎么不是语义识别了,走着瞧啥啊,自己去看发布会和宣传片去

虽然不期待siri能搞得有多了不起,但尼玛傻逼呵呵拿个语音识别就出来轮了某些狗粉也就这智商了
不服你就试试刚才两个问题

What is the weather like in Beijing?
What about Shanghai?

懂不懂这个What about的意义啊,这东西是跟上下文有关的,单独问个what about没有意义,需要上下文赋予其意义。
懂了么?某些傻逼们
作者: Gabrie_l    时间: 2011-10-8 12:20

引用:
原帖由 jun4rui 于 2011-10-8 12:18 发表
iPhone 4s发布会现场苹果演示的Siri技术相当神奇,机器可以根据人的语音自动发起各种动作并将应用和数据信息提供到屏幕上,那么Siri目前能实现多少功能,有多少命令可以被识别呢,TUAW整理了一份命令列表大家可以关注 ...
你个智商也就只能想到穷举这一种办法了
作者: jun4rui    时间: 2011-10-8 12:24

引用:
原帖由 Gabrie_l 于 2011-10-8 12:20 发表


你个智商也就只能想到穷举这一种办法了
你错了啊,这是全球知名的苹果爱好者网站 TUAW (TUAW - The Unofficial Apple Weblog) 整理的,试试用你的智商挑战一下吧?
作者: LTFYH    时间: 2011-10-8 12:27

好吧,果青又赢了,再次改变世界了,自动翻译机马上就要被苹果攻克了。
这玩意同传统词语识别的区别估计就是能够利用所谓的云计算了,手机将语音转成词汇,然后上传到服务端,服务端建立有海量的神经网络词库模型,然后根据关键词的关联情况给出匹配的关联命令,下发到手机上,我估计是这种模式。

[ 本帖最后由 LTFYH 于 2011-10-8 12:31 编辑 ]
作者: Running82    时间: 2011-10-8 12:32

你们还相信siri???

你们太naive了,真的。
语音识别这东西不靠谱的~
作者: beterhans    时间: 2011-10-8 12:33

引用:
原帖由 LTFYH 于 2011-10-8 12:10 发表
P4S这个绝不可能是啥语义识别,肯定还是以词语为主的,要很能识别自然语言的语义,演示时就肯定是用各种含义类似的语句来执行同一个功能。不信出来时到时走着瞧。
语音当然是靠 词组来表达的..... 只是看怎么和其他词组组合.

Google 搜索其实也有 语义 搜索. 有时候第一个结果 很可能没有你找的关键字 但是 确实是你要的内容.
作者: auric    时间: 2011-10-8 12:34

不知道这位果青一口一个傻逼的ip4s能听懂么
作者: fatehe    时间: 2011-10-8 12:34

posted by wap, platform: SAMSUNG (Galaxy S II)

我想会出评测的,现在搞不清什么技术。
作者: LTFYH    时间: 2011-10-8 12:38

语音当然是靠 词组来表达的..... 只是看怎么和其他词组组合.
Google 搜索其实也有 语义 搜索. 有时候第一个结果 很可能没有你找的关键字 但是 确实是你要的内容.

----我的意思是这玩意根本不可能去从语法和结构上去分析语义,还是局限于关键词,通过关键词之间的关联和匹配来找命令,这完全是不同层次上的东西。
作者: Gabrie_l    时间: 2011-10-8 12:40

引用:
原帖由 auric 于 2011-10-8 12:34 发表
不知道这位果青一口一个傻逼的ip4s能听懂么
siri听不懂没关系,你听得懂就行了
作者: 绯雨流    时间: 2011-10-8 12:41

引用:
原帖由 jun4rui 于 2011-10-8 11:22 发表
这套玩意其实Google内建的语音识别已经用蛮久了,虽说功能上有点不如这么来福,相信今后又是一个发展趋势。

不过真不要说iPhone又重新发明了语音识别,口述导航、添加闹钟备忘、发短信打电话、搜索内容什么的,真 ...
siri没你想的那么初级
作者: Gabrie_l    时间: 2011-10-8 12:43

引用:
原帖由 LTFYH 于 2011-10-8 12:38 发表
语音当然是靠 词组来表达的..... 只是看怎么和其他词组组合.
Google 搜索其实也有 语义 搜索. 有时候第一个结果 很可能没有你找的关键字 但是 确实是你要的内容.

----我的意思是这玩意根本不可能去从语法和结构上 ...
机器通过weather这个词理解所关联的东西是什么
和你通过天气这个词理解所要问的东西是什么

这个过程是相似的
作者: FoxfoO    时间: 2011-10-8 12:43

posted by wap, platform: iPad

不要有太高期待
其实我觉得连期待都不必有
量子计算机商用前不必考虑语义分析了,苹果这次叫做实在没市场卖点了,才拿这个加强版的语音识别说事,没本质区别。
就算乔布斯仍在,也没办法跨越技术壁垒。
作者: jun4rui    时间: 2011-10-8 12:43

引用:
原帖由 绯雨流 于 2011-10-8 12:41 发表

siri没你想的那么初级
也许?演示中只看到这么多,如果真机出来还有新的特性那应该赞。

不过我觉得那么久的演示应该吧特性介绍完毕了
作者: Gabrie_l    时间: 2011-10-8 12:49

引用:
原帖由 FoxfoO 于 2011-10-8 12:43 发表
posted by wap, platform: iPad

不要有太高期待
其实我觉得连期待都不必有
量子计算机商用前不必考虑语义分析了,苹果这次叫做实在没市场卖点了,才拿这个加强版的语音识别说事,没本质区别。
就算乔布斯仍在,也 ...
基本差不多,不必有很大的期望,自然语言分析是很有挑战性的领域
如果这方面可以做的很完善,为什么不先应用在程序设计语言上,把机器语言设计的跟自然语言更相近一些
但是说尽管做不到特别完善,一定程度的分析还是可以实现的.
这跟单纯的语音识别真是有很大区别
作者: jun4rui    时间: 2011-10-8 12:56

引用:
原帖由 Gabrie_l 于 2011-10-8 12:49 发表


基本差不多,不必有很大的期望,自然语言分析是很有挑战性的领域
如果这方面可以做的很完善,为什么不先应用在程序设计语言上,把机器语言设计的跟自然语言更相近一些
但是说尽管做不到特别完善,一定程度的分 ...
在语音输入技术都不乐观的现况下,谈语音识别有点缘木求鱼啊。那个胡和who的笑话不是空穴来风
作者: 糖滕蛋    时间: 2011-10-8 13:00

都说人工智能好,我们卢瑟是用不起的

那个流量啊
作者: FoxfoO    时间: 2011-10-8 13:00

posted by wap, platform: iPad
引用:
原帖由 @Gabrie_l  于 2011-10-8 12:49 发表
基本差不多,不必有很大的期望,自然语言分析是很有挑战性的领域
如果这方面可以做的很完善,为什么不先应用在程序设计语言上,把机器语言设计的跟自然语言更相近一些
但是说尽管做不到特别完善,一定程度的分析还 ...
人类对语义的分析是基于海量存储,模糊查询及非线性计算上,这方面,电子计算机肯定不行。
我觉得乔布斯去世影响真的很大
以前苹果给我的感觉是做不好的宁可不做,继任者没如此偏执以说服董事会,3年后苹果最好也就是三星的水准,这就是我遗憾的原因。
作者: yang117    时间: 2011-10-8 13:02

posted by wap, platform: iPhone

还没出来。YY什么阿
不过苹果出的实用性肯定高
作者: loveCK    时间: 2011-10-8 13:14

posted by wap, platform: iPad
引用:
原帖由 @意大利面  于 2011-10-8 13:00 发表
有些人想太高了,语义分析已经上升到人机对话的高度了,这个靠手机的处理器是绝对不可能达到的,哪怕用云也做不到,也就是关键词组合反馈而已,其实中文化很简单,比如天气好了,把“天气”“城市名”记住就行,然后 ...
它还真是回答的 不,明天上海不下雨。 详情参考发布会siri演示。
作者: 星之尘    时间: 2011-10-8 13:32

做单纯的语言识别没前途,关键是人工智能的程度,机器再怎么识别也是死的,不能真正理解你的意思。
作者: ooo    时间: 2011-10-8 16:01

下周各种评测就海量出来了,试目以待
作者: ooo    时间: 2011-10-8 16:02

再说了,这功能现在还是beta,仅支持三种语言
作者: yangzhicai    时间: 2011-10-8 16:13

如果真能做到按照语境,相当口语化的来那的确是个大进步。但是如果仍有严格的对话规范的话,和别家的区别就不是很大了。

另外微软那个tellme的宣传片感觉也挺来福的,不知道能实现多少
作者: LTFYH    时间: 2011-10-8 18:04

既然大家都认同这玩意不可能基于语法和结构来解析语义那就说明技术上没什么本质的进步。最多就是判断关键词之间的关联方式要智能一些,比如是基于云端的海量词汇,采用神经网络等可自调节的算法等,但再智能也只是分析关键词之间的关系而已,这种方式不可能真正的解析语义
作者: jun4rui    时间: 2011-10-8 18:19

posted by wap, platform: Android

我觉得这玩意最多相当于一个搜索引擎+MSN机器人那种东东,也许这个机器人识别率和词汇量更高,而且还可以积累用户输入数据提高精确度。

这是目前最可行的办法之一。

但是语音识别这个技术还真不会太准,即使99%,实际用起来还是不会爽。
作者: shersa0    时间: 2011-10-8 18:30

真心感觉Siri不靠谱,其实就是一软件嘛,通过云的话可能会好很多。Siri有的功能亚马逊和google也肯定有能力做出来。
真心觉得如果语音想做的好的话找IBM,IBM这几年绝壁在这上面研究很多了,沃森移动版我看行。但是苹果和google肯定也不愿找IBM。
作者: yang_yii    时间: 2011-10-8 18:42

posted by wap, platform: iPad

喷了
语音识别很多年前就成熟了,人家李开复以前都有做过。现在随便国内找个大学的研究生都能搞定。
但是siri还有很重要的一特性,语法分析词法分析。如果没有这块,不就是金利手机么?
作者: jun4rui    时间: 2011-10-8 18:48

posted by wap, platform: Android

你们说的语法分析,词发分析之类的,聊天机器人就可以做到了。苹果的演示还不如聊天机器人牛逼。

关键是语音识别这块,目前根本没什么太完善的技术,最牛逼的人工识别都不太靠谱,要不人家在印度雇那么多人搞人工识别不是吃饱撑的?
作者: 82MK2    时间: 2011-10-9 06:08

posted by wap, platform: iOS

@82MK2 mark
作者: 7    时间: 2011-10-9 08:04

posted by wap
引用:
原帖由 @shersa0  于 2011-10-8 18:30 发表
真心感觉Siri不靠谱,其实就是一软件嘛,通过云的话可能会好很多。Siri有的功能亚马逊和google也肯定有能力做出来。
真心觉得如果语音想做的好的话找IBM,IBM这几年绝壁在这上面研究很多了,沃森移动版我看行。但是 ...
IBM撤出个人电子消费用品这几年,应该是攒下不少货真价实的东西,期待其回归
作者: cc0128    时间: 2011-10-9 09:20

posted by wap, platform: SAMSUNG (Nexus S)

siri看上去不错啊。语音有上下文方便很多的。
作者: milk    时间: 2011-10-9 09:31

引用:
原帖由 auric 于 2011-10-8 12:34 发表
不知道这位果青一口一个傻逼的ip4s能听懂么
堪忧。
我到觉得Gabrie_l是这里最大的傻屄。
作者: masterfish    时间: 2011-10-9 09:39

我觉得大家还在纠结于siri是否是重大的技术突破实在是有点不着调,大家都忘了jobs的设计哲学了吗?或者想想iphone、ipad里面到底哪些技术是别人没有的?
归根结底,jobs关注的是人机交互的体验而已
结合到siri,最关键的是现在语音识别有上下文相关和选择了,这虽然技术上可能没什么,但是在易用性上绝对是巨大的飞跃
作者: jun4rui    时间: 2011-10-9 09:43

引用:
原帖由 masterfish 于 2011-10-9 09:39 发表
我觉得大家还在纠结于siri是否是重大的技术突破实在是有点不着调,大家都忘了jobs的设计哲学了吗?或者想想iphone、ipad里面到底哪些技术是别人没有的?
归根结底,jobs关注的是人机交互的体验而已
结合到siri,最 ...
其实还是分成语音识别和内容交互两个部分,内容交互的部分十年前AI和人类对话就已经有较高的可用度了,什么小Q机器人以前也流行过,技术完全不成问题,关键是语音识别。
作者: Gabrie_l    时间: 2011-10-9 09:48

引用:
原帖由 jun4rui 于 2011-10-9 09:43 发表



其实还是分成语音识别和内容交互两个部分,内容交互的部分十年前AI和人类对话就已经有较高的可用度了,什么小Q机器人以前也流行过,技术完全不成问题,关键是语音识别。
小Q和语义识别是一回事么
什么也不懂,别上窜下跳的了行不
作者: bseye520    时间: 2011-10-9 12:42

posted by wap, platform: UC

某些果青又湿了一裤裆了。233




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0