EEJournal

专题文章
现在就订阅

信号和打

手势和动作技术的承诺和局限性

你几乎可以想象一个我爱露西”阴谋。露西和瑞奇正在努力赶上别人的邪恶的东西。他们打扮的像个假私人调查π的帽子,翻起衣领(pre-bro),一个假胡子。他们房间的两侧在隐身模式下,只有手势交流。他们已经研究出一套复杂的信号,包括“右手鼻子意味着我们进入3…2…1…”和“左手鼻子意味着什么是不正确的;推迟。”

他们站在那里准备行动,苍蝇落在露西的鼻子。她用右手打它,瑞奇准备发射。然后她刷了左手,他恐慌和备份,不确定该怎么做。当然,她是完全无视她的混合信息。

我不知道这一幕结束,因为它不是真正的事件,每个人都知道的情况下很容易觉得有趣但很难算出(或在)他们如何结束。所以我把它的优点。

但它引入了我们的脆弱的世界的姿态和动作,第二天的会议上触摸,手势,动作由IMS研究。不像触摸技术,所以与所需的技术意义上触摸,手势和动作并不是那么复杂的从感知的角度来看:你有惯性测量单元(艾莫斯)感觉运动或者相机看到发生了什么。你可能会2 d或3 d视觉(通过立体视觉或其他类型的深度传感器)。

但大多数这不是关于传感;这是关于软件。它需要大量的处理视觉场景和覆盖在其上意义。但意义很大程度上取决于目标的水平。这就是我们所说的核心问题:手势和动作之间的区别是什么?毕竟,手势运动。

我早期的思考——这是支持(选择性?)我见过各种各样的东西,读——是运动与使用艾莫斯和手势与使用视觉的东西。换句话说,Wii运动和Kinect动作。

但我们进一步进入演示,清晰——最终被显式地明显,这是完全错误的。手势是有限的,预先定义的运动,就像一个令牌的信息。他们是离散的,数量有限,有特定的含义。他们面向的指挥和控制,他们面向事件的,与一个特定的机器反应后一个手势。

运动,另一方面,是任何动作。它可能有也可能没有意义,但它肯定不是离散——它是连续的。很明显运动检测以确定一个手势,手势识别谎言/运动,但从应用程序的角度看,他们认为是分开的。就像声音和讲话:无限范围的声音,和一个麦克风,音箱,扬声器可以忠实地呈现。识别和解释那些讲话的声音,然而,很多不同的困难。

手势是一个重要的部分人类/机接口的新方法。一家公司向光学接口的“领导”,给我的印象是一个夸张的“手势是否好一些事情他们必须是最好的一切!“评论——技术驱动的解决方案。

不同的报告指出,语音控制没有真正接管,因为人们不舒服,尤其是公共场合。而不是接受这个现实,外卖是“社会再造”需要让人们舒服——再一次,技术迫使一个解决方案。

与联系,我们有一些工作要做,以确保我们保持能力选择合适的工具做合适的事,而不是一个工具应用到一切。

菲利普斯指出其他一些挑战的姿态,最重要的是,手势是文化——他们并不普遍直观的。此外,如果你想完全控制一些复杂的使用手势,那么你可能会有一个非常大的姿态词汇记忆——这是不可能吸引群众。也有模棱两可的问题:当你的手势“打开”,这是否意味着光或电视吗?

它实际上发生在我写这篇文章时,许多手势的问题可以得到解决,如果系统能识别,如果每个人都学会了手语。当然…还有不同的符号语言…很多…但是…

运动提出了一套独立的问题,特别是当它涉及到实际的应用程序。最明显的运动我们现在的应用程序相关的活动。模拟高尔夫、足球等等,很有趣的家庭安慰自己的客厅,从床上爬起来。

但视频美化运动的未来也显示了一些诱人的,完全不可能(恕我直言)。例如,使用运动控制,说,你的手机。这不是一个手势的应用;相机看你的手指在空中舞蹈作为macro-phone如果你拨号。这样的场景通常描述标准手机界面轻率地后所有的手势在半空中。真的吗?

足以让一个触摸屏很难解释我的胖手指的正确位置;在空气中,如果我选择一个应用程序从一个4×8矩阵的小图标,我只是会点空气,点击正确的?我不这么认为。如果应用程序提供视觉反馈,跟踪你的手指在屏幕上,那么(这些细节从来都不是这样的一部分视频…也许我需要放松和放手,假设他们会算出来的第一个原型)。

更可笑的,如果我可以蜡Ludditic,场景的人玩air-violin或空气钢琴。一定是由人认为作为一个主人在空气吉他让你能够真正地弹吉他。或者认为自动调谐的人把他们变成了伟大的歌手。

问任何一个音乐家是否让他们听起来仅仅通过把手指或手在正确的时间在正确的地点,他们会告诉你,这只是开始。压力很重要。弯曲的笔记很重要。攻击和衰减问题。这是非常微妙的,而不是宏观运动,很容易被觉察和不可见的执行时在口中管乐器。

之前无论如何…这变成了一个成熟的咆哮,在其核心,是一个宣传视频,而不是实际的技术…(也许有人会把这个当作一个挑战来创建一个真正air-motion-only乐器微妙和细微差别的真实乐器…)沿着…

有一个组织已经开始组装视觉技术信息在一个地方;它被称为嵌入式视觉联盟。在BDTi启动和运行的人,这个网站似乎相当多的信息产业,应用程序和技术。当然,这包括手势和动作。

一般来说,姿态和运动的发展进展迅速,的主要挑战之一将是最好弄清楚他们在哪里工作和其他形式更好的工作。这是一个微妙的世界,不同的微妙的噪音将是一个挑战。坦率地说,这种结合似乎什么巨大进步在阅读大脑可以帮助建立的意图,从而过滤噪音。(另一方面,如果大脑阅读就好,我们不需要姿态。)

无论我们解决它,露西和瑞奇肯定会受益于技术,帮助他们决定是否一个特定的手势的真正含义,“我们。”

更多信息:

嵌入式视觉联盟

2对“信号和猛击”的想法

  1. Air-motion-only乐器=电子琴?

    但点。为什么人们想挥手要控制他们的电话吗?电话在哪里当所有这只手挥舞着是怎么回事?大喊大叫,控制电视——这是我的目标!

留下一个回复

有特色的博客
2023年5月12日
你知道多少关于艺术大师工作室吗?这是真或假的问题的答案我们清单每周节奏的社会媒体渠道。看2023年每星期五一个新的问题。了解更多关于艺术大师工作室的优势。节奏大师工作室啊……
2023年5月9日
在舒适的硅谷2023,我们举办了一个小组在芯片设计的人工智能,探索如何AI-enabled EDA工具简化SoC设计,加速验证等等。邮局什么在芯片设计的未来人工智能吗?第一次出现在芯片设计的新视野....
2023年5月8日
如果你计划去土耳其在不远的将来,然后我有一个忙问....

有特色的视频

自动化PCB不任务设计在几分钟内

节奏设计系统

发现如何让一个戏剧性的减少设计时间通过自动化你的位置,电源平面生成和关键网络路由与节奏®快板®X的人工智能技术。建立在通过快速的访问X设计平台,快板X AI减少不任务从天分钟以同等或更高质量与手工板而设计的。

点击这里获取更多信息

以注入式教学法亚博里的电子竞技

4.0产业:从概念到价值的一代
4.0行业带来了很多激动人心的创新制造和工业工厂在世界各地,但让你的下一个IIoT设计从概念到现实可以是一个挑战性的过程。在这节课中粉笔的谈话,Adithya 亚博里的电子竞技Madanahalli Wurth Elektronik和阿米莉亚道尔顿探讨Wurth Elektronik下IIoT设计可以帮助你开始。
2023年4月17日
3720的浏览量
Baidu