EEJournal

专题文章
现在就订阅

电话/身体分离

把你和手机区分开来

在美国,假期可能是一个充满挑战的时刻。尤其是对那些不喜欢购物的人来说,这不是一年中最喜欢的时候。算上男性人口中很大一部分不幸的灵魂,他们鼓起勇气,走进当地商场的瘴气中。

所以你坐在商场停车场的车里,看着源源不断的人流空手而入,带着战利品而出。这就是你的竞争对手。如果他们买的比你多,你就输了。如果你不抓紧时间,他们就会买很酷的东西——而你会损失更多。

你的保温瓶——直到你到达停车场才打开——含有超过soupçon的东西,你希望它能让你挺直脊梁,帮助你从车里出来,但它并没有真正起作用。尽管你一直在努力。在某个时刻,你昏昏沉沉地意识到你需要像个男人一样走进去,履行你的职责。你在车的侧面摸索着,终于找到了打开车门的把手,把你释放到商业的掠夺中。

三次说服自己,是的,你锁上了车,你步履艰难地朝一个入口走去。和大多数遇到这种情况的人一样,你已经有所准备。对你来说,没有“购物是娱乐”的说法:你确切地知道你要买什么,哪些商店会提供这些商品。你只是不知道这些商店在商场的什么地方。

但你知道你的手机可以追踪这些东西,你有一个应用程序可以帮助你到达目的地。你走进那扇门,得意洋洋地拿出手机,启动应用程序,开始在它自信的指引下向前走。

走到走廊一半的时候,你突然意识到自己像个傻瓜,手里拿着手机走来走去。你的下一个转弯还有一段路要走,也许,也许,你能记住它,所以你把手机放在后面的口袋里,以备将来参考。

当你走到你认为应该转弯的地方时,你决定把手机拿出来仔细检查一下。毕竟,你手机里的运动传感器一直在跟踪你的运动,所以它应该告诉你你是否在正确的位置。

只是,你根本就没有在正确的地方。它把你带回了商场入口。在这种心态下,你不需要看到这些。你心甘情愿地把自己置身于商场这只野兽的肚子里,除了液体灵感和一个指引你的手机应用,什么都没有。显然这手机让你失望了。完成购买不再是目标:仅仅是生存才是。现在你唯一的参照系都抛弃了你你要怎么离开这里?你的视野开始变窄,一种白噪音开始逼近……

……你会在一身冷汗中醒来,知道你的行人导航算法仍然存在问题。

这个最简单的例子出了什么问题?我在这里假设一个场景,我们用手机作为我们自己的代理——我们去哪里,我们的手机去哪里,所以我们和他们是一体的。

但我们不是。当这位被困的顾客把手机放进后口袋时,他把手机屏幕放在了他的天然坐垫上。换句话说,手机是朝后的。这个人把手机放在前面,走了半个大厅,然后把手机朝另一个方向放在口袋里——手机显然是一个粗糙的算法,它认为这意味着,“啊,我已经转身了。”和持续的向前因为剩下的一半走廊会把你放在你开始的入口附近在手机的视野中,它会认为你在转身后是在往回走。

这说明了我们是我们的手机。然而,我们仍然想用手机作为一种代理。你的手机所经历的运动是(a)你携带手机时身体所做的任何运动,以及(b)手机相对于你身体的位置和方向的变化。你甚至可以用一种方式取消另一种方式:把手机放在伸出的手臂上站着,向前迈一脚,同时把手臂收一脚。从理论上讲,手机没有移动,但这掩盖了很多信息——你的个人位置发生了变化,手机相对于你的位置也发生了变化。

我把这个问题称为“手机/身体脱钩”——从智能手机的整体运动中推断出你的个人运动和独立的手机运动是什么。这只是整个热门话题“上下文感知”的一小部分。与基本运动不同,基本运动是“简单的”a数学问题在美国,这个问题和其他上下文问题一样,有很多解决方法。

现在,你可能会像我一样,漫不经心地开始思考如何使用一些规则来帮助区分手机和身体动作。有一些简单的想法——比如,当手机转弯时,看看旋转的中心,以确定是身体还是手机转动。但问题是,人是邋遢的,他们不喜欢像机器人一样走来走去(即使你看起来像个呆子,你的手臂也会累),有很多简化的假设,人类通常拒绝遵守。总有人是异类。你不能把这些异常值一笔勾销。

所以我想调查一些人,看看他们是如何做到的。显然,考虑到这是一场激烈的竞争,他们只能说这么多,但比较方法是有趣的。

这里有两个问题:你的手机如何处理卷积的手机/身体运动,以及这些算法是如何推导出来的?

让我们先从第一个开始。我和四家公司谈过,其中三家在这里很熟悉——Movea、Hillcrest Labs和Sensor Platforms——还有一家我们没有经常提到过:可信定位。我从他们身上听到了不同和相似之处。

让我们从一个相似之处开始:这不是无关紧要的事情。所有公司都在试图收集所有可能的线索和线索,以区分不同的运动来源。没有人试图完全依赖手机。例如,可信定位公司将在消费电子展上做一个关于智能手表和手机相互通信以改善结果的演示。它提供了两个观点,不仅有助于避免漂移错误(Trusted Positioning的Chris Goodall表示,每个增加的传感器将漂移提高1.5-1.8倍),而且还有助于区分令人困惑的上下文信号。正如我们将看到的,这些额外的传感器在现场操作和在实验室推导算法时都有帮助。

收集约束

在这次讨论中,有一个词反复出现:约束。从一个测量集(原始手机)中提取两组运动数据(你的和你的手机相对于你的)的方法是约束解空间。

一个明显的约束可以总结为“身体力学”。人体的运动方式只有那么多种;手机的握持方式只有这么多种。事实上,你可能会认为手机只能拿在手里,这就忽略了那些罕见的人,他们没有手,但却能灵活地使用他们的脚。所以身体力学很重要,但你必须小心过于简单的假设。

Movea和Trusted Positioning都将机制转变为简单的“地图”。可信定位有三种基本的位置类别:在你耳边(打电话时),在你口袋里,还有一种他称之为“一般”的位置。Movea有四个这样的桶:耳朵、口袋、在你手中摇摆,以及在你面前伸出来。它们还初始化假设手机在前面启动。

显然,这些是对复杂得多的运动的粗略简化,但对于某些问题,它们已经足够了。一旦他们决定了其中一个桶,那么他们就可以应用特定于所选桶的过滤器和算法,如果手机位置在不同的桶中,这可能就没有用处了。

这就引出了另一个观察结果:在某种意义上,我们现在看到的是决策树之母。实际上,它实际上是所有状态机之母,因为上下文通常意味着状态,但是从状态到状态的每次转换都涉及大量的决策集。

因此,提高效率的关键在于精简这个状态机,这样问题就可以在小型、耗电的设备上实时处理。这就是为什么使用粗桶是有用的:处于该“状态”的决策树现在可以删除与该状态无关的任何内容,简化事情,并可能为进一步细化腾出空间。我在这里举个例子:一旦手机决定它在口袋里,它可能能够完善这个决定,以确定它在哪个口袋里。

Hillcrest实验室也使用身体力学,他们提到了另一个考虑因素。它来自于他们在遥控器方面的传统,在早期,他们意识到他们必须弄清楚如何避免手部震颤。他们发现,“有意”运动的频率往往比“无意”运动的频率低。

当然,在我们的例子中,我们试图区分各种不同类型的有意运动,所以事情没有那么简单。但希尔克雷斯特实验室的查克·格里顿愿意承认,频率是他们的一个重要考虑因素。

电话功能

我们有身体力学和频率作为约束或参数的例子。它们的另一个词是“特性”,事实上,这才是真正的黄金所在。我与Sensor Platforms的Kevin Shaw的谈话更多地是关于如何识别这些功能,而不是具体地依赖于哪些功能。事实上,这些功能是皇冠上的宝石,任何一个公司有而别人没有想到的有用的东西都是有价值的。他们当然不会告诉我任何不明显的特征。

我不能说Movea、Hillcrest Labs和Trusted Positioning所使用的流程是什么,但是,至少在概念上,很难想象他们没有做类似的事情。

这里真正的问题(对于这个和其他类似的背景研究)是,如何获取传感器信号并识别足够具体的综合征和特征,以高保真度确定特定的运动或位置(或其他),同时又足够普遍和健壮,可以与不同体型、年龄和文化的广泛人群一起工作,谁知道还有什么可能会让毫无怀疑的算法出错呢?这里没有具体的数字——你无法指定手臂有多长;你只能从统计上显示它可能有多长,以及在这个长度下,关节通常是如何工作的。“典型”意味着这方面也没有硬性规定。

这就变成了一个庞大的数据收集过程。假设你招募了一大群数据收集人员。凯文用了10000这个数字;我不知道这是现实的还是只是一个数字,但关键是,你需要大量的数据。和任何实验一样,你需要控制那些可以控制的东西,随机化那些不能控制的东西。这意味着你需要一个广泛的样本来捕捉所有这些极端情况。

Kevin建议有三种可能的方法来解决这个问题:

  • 让人们过他们的日常生活,做他们做的事情,把数据流给你分析。明显的弱点:你可以看到所有的信号,但你无法将它们与活动联系起来,因为你不知道数据被采集时人们在做什么。
  • 让这些人来找你,做一些特定的事情,比如坐下、站起来、转身等。现在您有了特定的活动和与之相关的数据。问题是,很明显,当你这样做的时候,人们表现得不自然。所以他们坐下来做实验的方式和他们平常坐的方式不一样。
  • 使用一种中间的方法,你让人们只是做他们的事情,同时使用视频或其他方式观察他们在做什么,这样就不会让他们感到难为情。

显然,为了使第三种方法更实用,仍然涉及一些商业秘密,但这是一般的方法。

您从中得到的是大量数据流到服务器。然后对这些数据进行分析,以找到“聚类”——这听起来类似于我们在营销时代所说的“因素分析”。在没有人为干预的情况下,这样的算法会仔细研究数据以找到相关性。

除了能够处理大量数据外,该算法自动化的好处是它没有任何语义偏差。我们可能认为气压与我们面对的方向没有任何关系,所以我们可能不会在那里寻找线索。但是计算机并不关心——它只是另一个变量,如果它发现了一个信号,它会毫不掩饰地让你知道。

当然,这并不全是数据处理。输出是一个n维矩阵,如果你愿意,它大部分是稀疏的,有数据点集群。理想情况下,每个集群应该是相对紧密的,有明确的边界,与邻近的集群有足够的分离,这样就不会混淆。但如果真的那么容易……

您遇到的一个风险是混淆的特征:表示不同特征的交叉集群,但您无法区分它们。在过去,这个问题的答案很简单:增加更多的传感器。然而,这在手机上是行不通的:你得到了你得到的。加上可穿戴设备,比如智能手表,它就变得站得住脚了。

除了另一个传感器,这是真正的人类可以进入这个过程的地方:分析人员查看数据并试图锐化集群。有时,这意味着重新分析现有数据以提取新的鉴别特征。但是这种优化还必须考虑到两个重要的实际问题:计算和功率。这就需要节俭。

每一组都代表了一些因素甚至状态的组合。但是每个聚类可以定义的特征可能比所有可能的特征都要少得多,而且在不破坏聚类的情况下,这些特征被修剪得越多,计算就越简单。让我想起了在卡诺图中消除“不在乎”变量。这些决定还必须在电池的帮助下实现——可能是永远开机。

有趣的是,特别是由于这最后一个人工步骤,四家不同的公司可能会做四个类似的实验,得到四个不同的答案。显然,它们必须有相似之处,但在许多情况下,算法不会基于明显的东西获胜——这将是决定哪个算法最好的角落。

因此,这四家公司中的任何一家都不太可能表现得如此糟糕,以至于让你的假日购物之旅完全倒退。没有什么是那么粗糙的。(是吗?)行人导航不仅仅是运动——地图、信标和其他信号都可以提供帮助。但对于动作部分,真正的诀窍是找一个不太“正常”的人(我讨厌这个词),然后把他们送进去。他或她会真正胜利,带着礼物,毫发无损地逃脱吗?

关于“手机/身体脱钩”的一种思考

留下回复

有特色的博客
2023年3月31日
了解半导体行业如何(以及为什么)正在向芯片支持的多模系统发展,我们的研究文章在麻省理工学院的技术评论见解。文章《全行业看向多晶片系统的发展》首先出现在新视野芯片设计....上
2023年3月31日
Verisium Debug平台针对可伸缩性进行了优化,支持模拟运行和仿真的调试,其中必须支持加载大型源文件和处理大量探测数据。加入这个免费的Cadence培训网络研讨会,学习如何自动化你…
2023年3月30日
您是否迫切需要一个项目经理来启动一个新项目或挽救一个正在失控的现有项目?

有特色的视频

第一个CXL 2.0 IP互操作性演示与遵从性测试

Synopsys对此

在本视频中,高级研发工程师Rehan Iqbal将指导您通过Synopsys CXL IP通过合规测试,并演示我们与Teladyne LeCroy Z516锻炼器的无缝互操作性。这个首创的互操作性演示证明了Synopsys致力于提供可靠的IP解决方案。

点击这里了解更多关于Synopsys CXL的信息

特色粉笔谈话亚博里的电子竞技

dsPIC33CH DSCs:单芯片上的两个dspic33c
在本集Chalk Talk中,Micr亚博里的电子竞技ochip公司的Vijay Bapu和Amelia Dalton探讨了双核数字信号控制器的好处。他们讨论了涉及单核和双核dsc时应牢记的关键规范,以及如何缩短开发时间,节省电路板空间和成本,并保持Microchip dsPIC33CH dsc所需的性能和隔离。
2023年1月24日
9444的浏览量
Baidu