
撰文/苏珊·库钦斯考什(Susan Kuchinskas)
2006年11月,任天堂的Wii游戏机首次与公众见面,其独具匠心的运动感应手柄“Wiimote”将玩家从沙发上拽起来,以站立的姿态体验电玩游戏带来的乐趣。现如今,微软希望通过彻底摒弃手柄来超越竞争对手。2010年1月,微软透露了“Natal”项目的一些细节,这一技术将让Xbox 360的玩家可以通过自然的肢体运动来控制屏幕上的人物。在机器学习技术的帮助下,玩家们只须在起居室中挥舞手脚,就能控制游戏人物完成踢足球、打手球等动作。
微软公司于2009年6月公布了雄心勃勃的Xbox升级计划,但目前仍未明确发布日期。许多观察家预计能在今年年底看到Natal上市。Natal将由空间传感器、摄像头和麦克风这几部分组成:空间传感器可以利用红外信号创建玩家身体的三维数字模型,摄像头则能精确捕捉诸如面部表情之类的细节,麦克风可用于识别和定位每个人的声音。
人体各关节位置的组合几乎有无限多种可能性,编程让游戏系统识别这些组合是一个可怕的计算问题。微软Xbox 360创新主管亚历克斯·基普曼(Alex Kipman)解释说:“肢体的每一个简单运动都是一种不同的输入信号,因此你需要编制近乎无限多的动作响应。”
微软没有采用这种预先编制动作响应的方法,他们决定另辟蹊径,教游戏系统像人那样利用经验来实时分辨人体姿态。微软英国剑桥研究院的杰米·肖顿(Jamie Shotton)为此设计了一套机器学习算法。它还可以实时识别玩家姿态,并以每秒30帧的速率显示在游戏屏幕上,从而获得连续平滑的动画图像。简单地说,配备了Natal的Xbox将能实时捕捉动作,而不像传统动作捕捉技术那样需要模特穿上镶满小镜片的紧身衣。
训练Natal完成这项任务,要求微软积累大量的计量生物学数据。基普曼说,微软将派观察员到全球各地的家庭中,在那里录制人们日常生活中的基本动作,比如转动方向盘和接球等。接下来,微软的研究人员从这些录像片断中手工选择出关键帧,并标出每个人的每个关节。基普曼和他的团队还到好莱坞的动作捕捉工作室收集了更专业的特技动作的数据。
肖顿解释说:“在‘训练’过程中,我们需要给算法提供两类输入数据:经过合成的逼真图像以及每个像素点对应的人体部位。”这种算法则负责处理这些数据,调整不同参数的取值以获得最佳的效果。
为了将数据量控制在可以处理的范围,研究人员必须搞清楚哪些数据是与训练结果最相关的。比如,该系统并不需要识别人体的所有部位,只需要定位模型的骨骼关节。将数据削减到最简之后,研究人员再将每个独特的姿态映射到12个不同的模型身上,这些模型分别对应于不同的年龄、性别和身材类型。
最后得到的,是一个由视频画面构成的庞大数据库,画面中人物的关节都被标示出来。这些数据中有20%被用来训练游戏系统,以识别人类动作。剩余的80%被用作“基准数据”来测试Natal的识别准确率。系统对姿态识别得越准确,玩游戏时就会越有趣。
当然,微软不是唯一一家研制人机姿态交互的公司。2009年5月,索尼公布了一套基于立体摄像头和深度传感器的原型系统,据称用户可以通过姿态直接控制计算机鼠标、游戏人物甚至机器人。制作计算机视觉硬件的Canesta公司已经演示了一套系统,能够让电视观众通过挥舞手臂来遥控电视。这家公司已经和计算机制造商日立公司和GestureTek公司展开合作,开发适合于个人电脑应用的姿态控制器。
不过,美国麻省理工学院多媒体实验室实物媒体研究组负责人石井裕(Hiroshi Ishii)说,传统控制器并不会彻底消失,“我坚信我们需要一些能实实在在握在手里的东西”。此外,Wii的运动感应手柄能提供震动或阻力之类的触觉反馈,使游戏中的动作感觉更真实。石井裕指出,哪怕是在Natal演示的足球类弹跳游戏当中,没有遥控器,玩家可能也无法获得接触到实物的感觉。
不过,微软欧洲游戏工作室的创新主管彼得·莫利纽克斯(Peter Molyneux)在期待新一代电子游戏的问世,因为彻底摒弃游戏控制器为游戏设计带来了更广阔的创新空间。他说:“Natal迫使像我这样的游戏设计者转变思路,把自己当成是玩家与这种技术之间的纽带,我们正努力创造一些感觉起来栩栩如生的东西。”
2006年11月,任天堂的Wii游戏机首次与公众见面,其独具匠心的运动感应手柄“Wiimote”将玩家从沙发上拽起来,以站立的姿态体验电玩游戏带来的乐趣。现如今,微软希望通过彻底摒弃手柄来超越竞争对手。2010年1月,微软透露了“Natal”项目的一些细节,这一技术将让Xbox 360的玩家可以通过自然的肢体运动来控制屏幕上的人物。在机器学习技术的帮助下,玩家们只须在起居室中挥舞手脚,就能控制游戏人物完成踢足球、打手球等动作。
微软公司于2009年6月公布了雄心勃勃的Xbox升级计划,但目前仍未明确发布日期。许多观察家预计能在今年年底看到Natal上市。Natal将由空间传感器、摄像头和麦克风这几部分组成:空间传感器可以利用红外信号创建玩家身体的三维数字模型,摄像头则能精确捕捉诸如面部表情之类的细节,麦克风可用于识别和定位每个人的声音。
人体各关节位置的组合几乎有无限多种可能性,编程让游戏系统识别这些组合是一个可怕的计算问题。微软Xbox 360创新主管亚历克斯·基普曼(Alex Kipman)解释说:“肢体的每一个简单运动都是一种不同的输入信号,因此你需要编制近乎无限多的动作响应。”
微软没有采用这种预先编制动作响应的方法,他们决定另辟蹊径,教游戏系统像人那样利用经验来实时分辨人体姿态。微软英国剑桥研究院的杰米·肖顿(Jamie Shotton)为此设计了一套机器学习算法。它还可以实时识别玩家姿态,并以每秒30帧的速率显示在游戏屏幕上,从而获得连续平滑的动画图像。简单地说,配备了Natal的Xbox将能实时捕捉动作,而不像传统动作捕捉技术那样需要模特穿上镶满小镜片的紧身衣。
训练Natal完成这项任务,要求微软积累大量的计量生物学数据。基普曼说,微软将派观察员到全球各地的家庭中,在那里录制人们日常生活中的基本动作,比如转动方向盘和接球等。接下来,微软的研究人员从这些录像片断中手工选择出关键帧,并标出每个人的每个关节。基普曼和他的团队还到好莱坞的动作捕捉工作室收集了更专业的特技动作的数据。
肖顿解释说:“在‘训练’过程中,我们需要给算法提供两类输入数据:经过合成的逼真图像以及每个像素点对应的人体部位。”这种算法则负责处理这些数据,调整不同参数的取值以获得最佳的效果。
为了将数据量控制在可以处理的范围,研究人员必须搞清楚哪些数据是与训练结果最相关的。比如,该系统并不需要识别人体的所有部位,只需要定位模型的骨骼关节。将数据削减到最简之后,研究人员再将每个独特的姿态映射到12个不同的模型身上,这些模型分别对应于不同的年龄、性别和身材类型。
最后得到的,是一个由视频画面构成的庞大数据库,画面中人物的关节都被标示出来。这些数据中有20%被用来训练游戏系统,以识别人类动作。剩余的80%被用作“基准数据”来测试Natal的识别准确率。系统对姿态识别得越准确,玩游戏时就会越有趣。
当然,微软不是唯一一家研制人机姿态交互的公司。2009年5月,索尼公布了一套基于立体摄像头和深度传感器的原型系统,据称用户可以通过姿态直接控制计算机鼠标、游戏人物甚至机器人。制作计算机视觉硬件的Canesta公司已经演示了一套系统,能够让电视观众通过挥舞手臂来遥控电视。这家公司已经和计算机制造商日立公司和GestureTek公司展开合作,开发适合于个人电脑应用的姿态控制器。
不过,美国麻省理工学院多媒体实验室实物媒体研究组负责人石井裕(Hiroshi Ishii)说,传统控制器并不会彻底消失,“我坚信我们需要一些能实实在在握在手里的东西”。此外,Wii的运动感应手柄能提供震动或阻力之类的触觉反馈,使游戏中的动作感觉更真实。石井裕指出,哪怕是在Natal演示的足球类弹跳游戏当中,没有遥控器,玩家可能也无法获得接触到实物的感觉。
不过,微软欧洲游戏工作室的创新主管彼得·莫利纽克斯(Peter Molyneux)在期待新一代电子游戏的问世,因为彻底摒弃游戏控制器为游戏设计带来了更广阔的创新空间。他说:“Natal迫使像我这样的游戏设计者转变思路,把自己当成是玩家与这种技术之间的纽带,我们正努力创造一些感觉起来栩栩如生的东西。”
(译/崔琳琳 校/虞骏)
玩游戏有好处
网络游戏可以鼓励儿童吃健康食品
虽然接触网络游戏只有10分钟,但小孩会选择广告游戏中宣传的零食,不管健康与否。
玩电脑游戏实际上有益于保护眼睛,美国罗切斯特大学的科学家发现,每天坚持玩几个小时动作类电脑游戏,1个月之后,孩子的视力会提升20%左右。