苹果最新专利忙着研究AI图像合成,视觉灵敏度抑制算法精准获取人眼疲劳度!
知情郎·眼|侃透公司专利事儿今天聊聊苹果的新专利。看看苹果的工程师最近忙着解决哪些技术难点问题,尤其在AI领域,有啥新进展。最近苹果日子过的不大顺当,新产品iPhone?14因为郑州富士康疫情也延迟交货了
知情郎·眼|
侃透公司专利事儿
今天聊聊苹果的新专利。
看看苹果的工程师最近忙着解决哪些技术难点问题,尤其在AI领域,有啥新进展。
最近苹果日子过的不大顺当,新产品iPhone?14因为郑州富士康疫情也延迟交货了。
01苹果近期在忙啥
苹果最近忙着搞生产!
人家集中精力忙iPhone?14产线如何恢复,帮着友商处理郑州富士康问题。
众所周知,郑州富士康园区是 iPhone 14 Pro 和 iPhone 14 Pro Max 的主要组装工厂。
库克老爷子对iPhone 14 Pro系列寄予厚望,希望新品上市发光发财,延续苹果在高端机的统治力。
可吆喝了半天,帮苹果组装手机的富士康出了篓子。
这些天,郑州富士康员工因疫情逃亡厂区的段子满天飞,郑州园区2万人确诊疫情的消息,吓坏了当地。
这恐怖疫情吓怂了园区,当地员工纷纷跑路!
网友调侃,疫情拖累了产能,郭台铭也许现在焦虑的吃不下饭了!
要知道,郑州园区是生产苹果iPhone?14的主力部队,国内订单大多数都由此地生产,现在园区隔离的隔离,封禁的封禁,一屁股地方,工人吃喝拉撒睡都在一起,搞得疫情感染人数都难统计了,还咋开工。
更惨的是,库克新品发布会刚吆喝半天苹果14性能有多牛,然后就没下文了。
现在园区产线鸡飞蛋打,也不知道何时能复工。
没办法,苹果再牛,也得为疫情让道,得照顾大陆园区员工的情绪,也只有延后订单生产,支持富士康宽慰工人!
人家日前发了公告表示支持富士康抗疫,优先保障员工健康。
这局势,估计明年苹果,富士康转向印度越南的举措会更激进,一向以稳定、执行力强的大陆园区都出篓子了,还不积极分拆供应链。
哎,制造业不容易啊,富士康的工人更不容易,为这5000薪水拼死拼活!
02苹果最新公开专利在研究啥
聊完业务动态,聊专利。
下面苹果关于AI方面的最新八个公开专利,多数围绕姿态识别、视频音频AI检测还原、影像数据合成等领域。
最近,知情郎很关注AI技术,所以就找各大科技公司这方面的专利!看看人家工程师忙着处理哪些AI技术难点!
序号标题标题 (英文)解决的技术问题公开号
1
使用多个传感器的基于机器学习的姿势识别
MACHINE-LEARNING BASED GESTURE RECOGNITION USING MULTIPLE SENSORS
针对现有基于惯性传感器的人体运动姿态识别中涉及特征较多、常用姿态识别方法不全面、识别精度不足等问题,专利提供了手势姿态识别及修正算法研究,通过特征提取与建库、特征筛选、姿态识别与修正等过程进行手势轨迹、姿态判定,提高识别准确率。
US20220351086A1
2
基于AI检测或分类结果的变化的视听压缩
VARYING AUDIO VISUAL COMPRESSION BASED ON AI DETECTION OR CLASSIFICATION RESULTS
图像压缩是数据压缩(Data Compression)的一种,因为图像压缩减少了编码图像所需的数据位,但同时又保留了图像细节。基于深度学习的图像压缩算法的先进技术,包括多层感知器、卷积神经网络和生成对抗网络已发展多年,该专利提供一种AI模型算法,可帮助构建并精细化处理图像和压缩模型,也方便迅速锁定目标图像。
US20220353458A1
3
用于空间音频再现的时域神经网络
Time domain neural networks for spatial audio reproduction
语音增强涉及将目标语音信号与干扰性背景区分开来。尽管近年来使用变异自动编码器或生成对抗网络(GANs)的生成方法已被越来越多地使用,但弊端也不少。该专利提供了一种新的技术方案来强化捕捉麦克风声音并强化了多音道信号,让过去的音频效果还原度更高!
US11490218B1
4
利用反向网生成更真实的合成数据
Generating more realistic synthetic data with adversarial nets
为了修改合成数据使得鉴别网络不能可靠地辨别细化的合成数据和真实数据之间的差别,可以在对抗设置中学习生成网络。生成网络和判别网络可以一起工作,以学习如何以降低的计算成本产生更真实的合成数据。该专利提供了一种技术而方案,让合成数据更加逼近真实,难以被鉴别。
US11475276B1
5
使用基于图像捕获条件选择的先验概率分布的计算机视觉
Computer vision
using a prior probability distribution selected based on an image capture condition
训练机器学习(ML)模型并将其用于产生与计算机视觉任务相关联的概率分布。ML模型使用与基于传感器数据确定的特定图像捕获条件相关联的先验概率分布。因此,机器学习模型被给予图像作为输入以及特定图像捕获设备条件的先验概率分布。使用先验概率分布可以提高用于计算机视觉任务的ML学习模型的准确性,效率或有效性。
US11468275B1
6
在部分潮湿条件下检测显示器上的触摸用户界面
Detecting touch user interface on a display under partial wet conditions
当液体存在于显示器上时,会导致接触不灵。触摸屏或带有触摸输入组件的显示器通常使用电容技术,通过测量由触摸输入引起的静电场的变化来检测触摸输入或用户输入到触摸屏的位置。在某些情况下,无论是否检测到触摸输入,液体都会引起静电场的变化。结果,液体降低了触摸输入组件准确检测触摸输入位置的能力,并且在某些情况下,触摸输入组件根本无法检测触摸输入。然而,本专利提供的技术方案可克服这些问题。
US11422689B1
7
用于图像创建的分类
Classification for image creation
各种技术被用于生成图像内容。例如,一些技术使用生成性对抗性神经网络(GAN)来生成图像内容,以提供看起来像可信场景的内容。但是,基于回归的技术所生成的内容还可能遭受边缘处不希望的锐度缺乏、结构中缺乏锐度或清晰度、或者以其他方式呈现模糊,从而降低内容的真实性。专利提供了使用基于分类的机器学习来为图像的缺失部分(例如,一些或全部)生成感知上可信的内容的系统和方法。
US11423308B1
8
自主车辆运动控制的决策
Decision making for autonomous vehicle motion control
一种用于车辆的行为规划器使用树搜索算法和从一个或多个机器学习模型获得的试探法来生成车辆的多个条件动作序列。每个序列对应于车辆的预期状态序列。至少一些动作序列被提供给车辆的运动选择器。运动选择器基于接收到的条件动作序列和从车辆的一个或多个传感器接收到的数据来生成运动控制指令,并将指令发送到车辆的控制子系统。
US11403526B2
03检测眨眼提高视觉舒适度方案
上面的专利其实具体解读起来都较复杂,涉及AI算法,大量的数据公式。
给大家解读一个相对简单易懂、实用性强的专利。
专利名:具有基于眼睛活动的显示器操作的电子设备(CN115167664A),该专利提供了一种用于头显的眼睛监测系统,专门检测用户的眼睛扫视(saccade)和眨眼。
专利摘要:在扫视和眨眼期间,用户的视觉灵敏度被暂时抑制。电子设备中的控制电路可利用对用户的视觉灵敏度的暂时抑制来对显示器的操作进行调节。例如,控制电路可协调显示器的操作与扫视和眨眼所关联的视觉灵敏度抑制时间段,以降低功率消耗和/或进行可能突兀的图像变化。通过在视觉灵敏度抑制时间段内进行调节,可向电子设备的用户隐藏这些调节。
简单说,这个技术方案就是检测用户眼部状态,用算法解析视觉灵敏抑制时间线变化,让头显等设备调节画面亮度时,尽量配合用户眼部状态。
即,尽量不要在用户眨眼、闭眼时,变化显示器亮度或者可能突兀的图像变化。强光、强画面变化会加剧用户眼部的不适度。所以要避免!
亮点在哪?
这个专利最大的亮点是如何确定用户眼睛处于视觉敏度抑制状态。
人类眨眼闭合是可以被机器捕捉并观察的,最后能用数据曲线体现。
人类视网膜的光受体分布是不均匀的,因此视敏度随着与具有最高光受体密度的视网膜位置的距离而下降,该位置通常被称为中央凹。扫视是快速、急促且大多为弹道式的眼睛旋转。人类每秒进行几次扫视眼睛运动,以利用视网膜的该最高分辨率部分来观察所关注的对象。
眨眼是眼睑完全或部分地短暂闭合,以清洁、润湿角膜以及对角膜供氧。眨眼是半自动的行为,大部分是反射性地做出以避免刺激物,或例行地将泪液铺展在角膜表面上。人类根据各种条件每分钟眨眼许多次。
苹果的工程师就利用上述人类眼睛的特性,通过硬件设备采集用户眼睛活动如眨眼眼睑位置变化以及对光亮的反应度,并用算法理解人眼的视觉灵敏抑制期对光的忍耐度,从而调整显示设备。
举个例子,眼睑完全闭合可导致入射到用户眼睛视网膜上的光减少500倍以上。眨眼的持续时间(例如,眼睑开始其闭合运动和它们完全打开时之间的时间间隔)在约200ms至500ms的范围内。由于眼睑闭合而造成的光损失可被视为“被动”抑制;用户的视觉系统在该部分中不发挥作用,它仅仅是由于光的物理遮挡而发生的。
除了由于眼睑闭合而造成的光损失之外,在眨眼事件期间,视觉灵敏度被用户的大脑主动抑制。
因此,通常存在约100ms-200ms的时间,在此期间,对显示器的操作的改变可能不会被用户在视觉上察觉。视觉灵敏度的扫视抑制可在扫视(其可持续约20至100ms)期间,以及在扫视稍稍前后(例如,在每次扫视前50ms和之后高达200ms)发生。
眨眼往往以大约每分钟10-20次眨眼的速率发生,由于光在眨眼期间被用户的眼睑遮挡,可与较强的视觉灵敏度损失相关联。因此,在尝试对用户掩蔽可能具有破坏性的显示器调节(例如,在扫视期间可能被感测到的亮度调节和其他调节)时,可能特别有益的是利用眨眼诱发的视觉灵敏度抑制。
一般来讲,控制电路可在与眼睛事件(例如,由系统检测到的扫视和/或系统检测到的眨眼)相关联的视觉灵敏度降低的任何适当时间段内进行显示器操作调节。
总的来说,这个专利就在讲如何根据眼睛眼睑闭合张开状态来确定用户的视觉光敏反应度,当用户处于视觉灵敏抑制状态,就要对显示器的亮度、图像变化进行微调,使其处于低功率状态,尽量避免影响用户视觉不适,乃至产生关联的晕动症、甚至恶心。
【转载请注明德高行·知情郎】
原文标题 : 苹果最新专利忙着研究AI图像合成,视觉灵敏度抑制算法精准获取人眼疲劳度!