小黑屋
深夜惊魂之headtrack 其实就讲了近两年的所见所闻, 题目可能并不恰当 | Johnny Lee的wiimote headtracking 一切都是从两年前johnny Lee在youtube发布的这段视频开始 Johnny Lee.jpg (15.01 KB) 28/3/2009 00:26 这个视频造成了轰动性的效应,包括国内各大IT网站在内的世界范围内IT媒体都对这个技术作了介绍 根据最新情报,Johnny Lee在推出这个视频不久,立即被Microsoft招安到旗下游戏部门行研发(根据个人估计应该是应用到下一代主机上) 其实,Headtracking并不是Johnny Lee的发明,在更早之前,使用电脑玩模拟游戏的玩家就开始使用各种形式的头部动作捕捉,例如下面这个视频: http://www.youtube.com/watch?v=HIu87lKxZsI track ir.jpg (29.13 KB) 28/3/2009 00:26 那么,也许会有人问,既然早就有了headtracking,Johnny Lee的贡献在哪里? | 进入正题:Johnny Lee headtracking技术的思路 通过上面的两个视频,相信大家也可以得出两个结论: 1、Headtracking并不是Johnny Lee的发明 2、Johnny Lee是应用headtracking这个技术,把软件应用带到了更高的层面——虚拟3D 以往,人们观察电脑屏幕,人头部动作、位置的变化并不会造成显示内容的任何改变,这是一切“平面图象”的基本属性 而实际上,现实生活中,有“横看成岭侧成峰 远近高低各不同”的说法,因为观察角度不同我们都会看到不一样的景致 Johnny Lee最大的贡献——他利用一个已经成熟的技术,也就是headtracking,来实现了“立体观察”3D物件的原理 是的,Johnny Lee胜在他对Headtracking的应用思路上 | J.L式Headtracking应用,对于3D呈像的贡献 第一,我们通过红蓝眼镜、分时眼镜等方式,以左右眼不同角度的交错图实现了视觉上的立体纵深感 第二,J.L通过Headtracking实现了电脑内部处理3D物件在观察形式上的立体感 想象一下当这两种技术结合在一起——电脑呈像技术将进入“准全息”时代 这就是我在上一张帖子里提到的“S3D+headtracking是未来3D的趋势”,而这贴就是向不了解这个技术的朋友作入门介绍 我把这两个技术提到一起来比较,还有两个原因: 1、他们在技术上实际上都已经相当成熟,只是缺乏大众广泛的认识 2、他们实现的成本实际上都可以做到很低,普及的可实施性很大 | 要实现Headtracking,成本可以做到多低? Johnny Lee视频在发布之处,很多人着迷于利用wiimote来实现headtracking,因为这样的技术比之前使用track ir成本低了不少 不久之后,就有更逆天的技术出现了,请见下面的视频: http://www.youtube.com/watch?v=Q-nrmxNKt84 webcam track.jpg (21.36 KB) 28/3/2009 00:34 实际上,在J.L视频之后一个月左右,我就看到国外有高手利用webcam(也就是很常见的网络摄像头)实现了J.L视频一模一样的效果 这种技术被称为webcam track 其成本可以想象——从人民币20元起价到100多元,电脑城遍地都有这种产品买 | Webcam Track的原理 仅仅靠摄像头,如何判断人头部在显示器之前空间内的三维位置呢? 这是托IBM(或者是Intel?)一个叫Open CV的开源项目的福 这个项目中提供一个关键性技术——人类面部识别,这个技术允许电脑通过分析webcam捕捉到的图象,得到人类面部的信息,并通过对这张脸大小变化、眼鼻嘴相对位置的变化,来解读人脸距离摄像头远近、高低、左右的信息 远近、高低、左右——这实际上包括了三维空间中的关键性维度,在这个层面的三维追踪被称为6dof(6 degrees of freedom) 也就是通过这个技术,利用普通摄像头webcam电脑也能判断出用户脑袋和显示器的相对位置——从而实现了headtrack,头部动作捕捉和追踪 webcam headtrack实验性应用的网络游戏,想象一下headtrack + S3D的效果 http://www.youtube.com/watch?v=SewngkDJCyY&NR=1 | Webcam Track的其他应用 既然提到webcam track,就顺带介绍一下主流利用webcam来捕捉、追踪的利用形式: 1、头部动作捕捉,headtrack,前面已经提到了,主要用在模拟游戏驾驶仓模拟观察以及3D物体立体观察,另外一个没提到的应用是这个:http://www.youtube.com/watch?v=f6caQ0IxBIo 2、红外线捕捉,leaser track,利用摄像头一样可以捕捉红外线,可以用于鼠标模拟,当然也有把红外发射器绑在帽子上来实现头部动作捕捉的 3、形状捕捉,分析webcam拍摄下的特定形状,如蓝色方块、红色方块等,根据方块的形状、大小变化来分析解度三维空间数据,基于这个技术的有camspace提供的用色块替代手柄的软件,还有日本人开发的虚拟女仆(Camspace:http://www.youtube.com/watch?v=v0srY37kkMw , 虚拟女仆:http://www.geishatokyo.com/jp/ar-figure/figure.html) 4、多点触碰捕捉,网上有高手在摄像头前设置毛玻璃一块,当手指点到毛玻璃的另外一面,摄像头捕捉到手指的黑色阴影,并将其转换成多点触碰的信号,国内有达人用此来diy了microsoft的surface互动桌面技术(surface的视频:http://www.youtube.com/watch?v=rP5y7yp06n0) | 前景展望 很多技术其实已经存在很多年,只是一直缺乏推广 例如nintendo在nds上加入的触摸屏,在wii上加入的leaser track和动作感应(nintedo早年还有一个失败的尝试,vitual boy,实际上就是如今我们玩的3D游戏眼镜的远古版本),实际上都是成型多年的老技术,得到厂商推广后立即风起云涌,从这个角度上来说,wii最早被命名为revolution,改变的不仅仅是一时市场占有率,更让所有厂商和玩家(可能不包括“从小玩FC长大的资深高级非样板戏不玩高品位玩家”)转换了思路,让竞争对手也意识到原来主机的发展还有很多方向,技术发展之路上的未来明星技术还有很多被遗落在了身后、缺乏伯乐的赏识,等待人们去开发 现在而言,3D立体呈像技术在nvidia的推动下已经初具规模,接下来我仅期望能有有识之士能让J.L试headtrack发扬光大起来,这样我们就可以早日进入“准全息3D游戏时代”了[
查看详细资料
TOP
原帖由 BD 于 2009-6-3 20:31 发表 小回一帖,那些缺乏基本常识,混淆概念的人就不要继续秀下线了。 LZ所说的和我所说的没有实质性的冲突,LZ说的很多可实现的部分都是基于现场Show的。我也说了,现场Show的内容并没有超出现实,说白了也就是Eyetoy级 ...
* Natal的技术,包括wiimote的技术,都有人做事后诸葛亮,说是老技术,不过总得有商业机构或者军事机构来将这些技术请出研究院,怎么整合、怎么应用才是关键 * Natal的精彩之处,至少一半在于其“网络社交”层面的应用,影象识别只是Natal大计划中的一部分而已,而Natal的其他部分也赋予影象识别技术更大的活力和发展空间,仅仅靠游戏应用来推广和普及——以当今所谓CU玩家狭隘的包容能力和游戏制作厂商的胆量来看,是不太现实的
原帖由 RestlessDream 于 2009-6-4 00:23 发表 3DV的技术也很棒。但是 Natal 完全是微软自己研制的,和3DV的技术没有一点关系
原帖由 倍舒爽 于 2009-6-4 11:56 发表 我认为这很有难度,这里存在于一个时间响应的问题~ 物理控制器可以产生0的反应时间,但这个却一定要存在识别的演算时间~ 尤其是摄像头仅仅以30fps的扫描帧率~ ms发布会上足见此点,动作同步效果并不高~ ...
原帖由 ffcactus 于 2009-6-4 11:56 发表 轻微动动鼠标的事情, 却要用这个肢体去比划, 或者需要开口讲话, 这估计这套早已出现的技术至今不是主流的原因。而且开口讲话或者肢体动作来代替鼠标键盘, 就更有乐趣?
原帖由 ffcactus 于 2009-6-4 13:07 发表 本人学的电子信息科学与技术, 很看不惯外行冲内行YY到高潮。小台妹。
原帖由 ffcactus 于 2009-6-4 13:26 发表 技术不是什么新技术。我们楼下就是做视频抄牌的。 但是把技术整合也算是一种进步。 机器人技术、视频识别、语音识别、动作捕捉、专家系统早已不是什么新鲜玩意。为什么计算机技术日新月异,但是输入设备依然是键盘+鼠标,因为这已经能够满足绝大多数的需求。你以为别人是傻子,不知道整合就MS想得到? 关键是这个不必要,不实际。更别说MS的这个纯粹是控制, 一点反馈都没有就更有局限性了。
微软是computer vision研究方面如果说第二,没人敢说第一。
原帖由 ffcactus 于 2009-6-4 13:37 发表 原来你连楼主想说什么都没看明白。
原帖由 ffcactus 于 2009-6-4 13:42 发表 并不需要完全知道别人具体是如何编程实现的, 用的什么高级可编程硬件技术, IP核又是怎样, 也能对他的总体有所了解。 真要像某些人吹嘘的那样神乎其神, MS怎么不在WINDOWS 7的发布会上演示呢。
原帖由 ffcactus 于 2009-6-4 13:47 发表 我可没说我要来点内行的, 但是却可以看出别人是不是内行。 要不你来解释下, 为什么windows 7都没能采纳的高级控制技术, xbox360却可以实现呢?